API Python Coding - 搜索 News

1 天

Claude Code“隐形技术栈”被扒出来了！2430次测试揭秘工具偏好清单

研究团队表示，三款模型基于相同的基础训练数据集，高一致率的结果符合预期。真正具备研究价值的是模型间25%的分歧部分，这种差异大概率并非源于模型对工具质量的独立判断，而是由基于人类反馈的强化学习（RLHF）调优策略不同，以及生成环节的专属微调差异导致。

腾讯网

130万次下载，2万Star开源项目CC Switch，36岁转行程序员Jason的第一个作品

这个功能本来是为了支持热切换和故障转移，因为 Claude Code 在 2.49 版本之前没有热切换，改了供应商必须重启终端才能生效。比如 Plan 或者执行就用 Opus 4.6（现在是 4.5），如果是 debug 或者 read 代码就用 ...

腾讯网

SWE-AGI基准评测：中大型软件在全新语言上的批量生成成功率已达80%

近日，OpenAI 早期核心成员之一，Vibe Coding 概念提出者 Andrej Karpathy 在社交媒体 X 上(原 Twitter）提出了关于 LLM 正在改变软件开发的“约束结构”（constraints ...

3 天

OpenClaw 爆红内幕：Peter 首谈 Meta / OpenAI 争夺战，Agent 自修改代码意味 ...

2026 年开年，技术圈真正的核爆点，不是某个新模型参数翻倍，而是全球第一播客一场 3 小时的深度对谈。主角是 Peter Steinberger ——OpenClaw 的创始人。主持人是 Lex Fridman ——技术播客顶流。

什么值得买社区频道 on MSN

讯飞星辰 MAAS 白嫖 GLM5 踩坑记录

最近发现讯飞星辰 MaaS 平台有免费的 GLM-5 大模型，尝试接入了自己的 NEW-api 分发平台踩了几个文档里不会告诉你的坑。本文记录完整的 ...

GitHub

MangoTestingPlatform 芒果测试平台

芒果测试平台是一款集UI、API和Pytest于一体的低代码测试平台。通过简单的配置即可完成UI和API自动化测试，无需编写代码，简单易用！

1 天

给Claude装上“眼睛”！Anthropic斥资收购Vercept：高精度 UI 识别碾压 ...

Anthropic正在加速补齐其在 AI 智能体（Agent）领域的最后一块短板。2026年2月26日，据报道，Anthropic已正式完成对西雅图 AI 初创公司 Vercept 的收购。这次收购的核心目标非常明确:通过 Vercept 顶级的视觉理解技术，让Claude能够像人类一样，真正“看懂”屏幕并精准操控各类软件。

6 天

英伟达“AI盒子”升级发布软件和服务，黄仁勋打造物理世界的数字副本

去年的SIGGRAPH，英伟达推出GH200、L40S显卡、ChatUSD轮番登场。而今年的主角，是英伟达在生成式AI时代的新王牌—— “Nvidia NIM”全新升级，并且通过NIM 将生成式 AI 应用于 USD（通用场景描述），拓宽AI在3D世界的可能性。

14 天

Agent、图像、视频全是大版本升级：春晚还没开，豆包AI就火了

在技术报告中，字节表示，豆包 2.0 专为在大规模生产环境中提供最佳用户体验而设计，优先考虑了大规模在线部署环境下的用户体验。因此，模型针对最直接影响交互体验的视觉和多模态查询、推理延迟与复杂指令可靠性三个方面进行了着重加强： ...

InfoQ中国 on MSN

大神Karpathy最新推文：AI技术栈长出了新的⼀层，叫Claw

今年春节档的票房统治者莫过于《飞驰人生3》。大年初一以4亿票房强势登顶，贡献档期超30%份额；次日更是逆势增长破10亿，较第二名《惊蛰无声》拉开近4倍差距。来到2月21日，票房已破20亿元（含预售）。延续前作热血赛车与幽默风格，电影讲述了主人公张驰（沈腾饰）在赢得巴音布鲁克拉力赛冠军后，面临团队解散，赞助撤离和AI新能源赛车冲击的困境。一次意外邀约，张弛的赛车梦再次被点燃。

Opinion

虎嗅网Opinion

人工智能，能治工人

知名 AI 编程软件 Windsurf在发布 4个月内用户数破百万、年度经常性收入（ARR）超过1亿美元、企业客户数量超过1000家。Windsurf的团队仅有不到160人，最终以30亿美元的估值卖身OpenAI，这也成为OpenAI史上规模最大的收购 [1] 。

14 天

春节大模型混战升级：豆包2.0冲击最强多模态Agent，超级AI牛马搞定 ...

此次基于豆包2.0实现的Agent体验令人惊艳，实际效果证明，AI是真的可以成为超级AI打工人，深入企业的。在诸多能力加持下， Agent已经不再是生产噱头性内容的“玩具”，而是真正拥有变革生产力潜力的强大工具。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果