最近,AI大神 Andrej Karpathy 开源了AI 自主进化的科研循环系统 autoresearch ,能够让 AI 智能体自己读指令、改代码、跑实验、评测结果、保留进步、丢弃失败,循环往复一整夜。让研究者们能够从重复的机械性工作中解放,专注于更具创造性的科研思考。这个项目上线数小时,X 平台发布帖浏览量破百万,GitHub 仓库目前已斩获 26.5k Stars,被不少开发者视为 AI ...
每次实验的预算被固定为5分钟,无论使用何种GPU,AI如何修改代码,每次实验都能在相同时间内完成。这样的设计不仅确保了实验的可比性,还让不同的模型、batch size和优化器之间的效果一目了然。
如果你有一块 NVIDIA GPU,睡前启动一个脚本,第二天早上醒来就能收获一百次 LLM 训练实验的结果,其中一部分还确实比你手动调参调得更好,是不是听起来有些难以置信?但这就是 Andrej Karpathy 今天凌晨开源的新项目 ...
但这就是 Andrej Karpathy 今天凌晨开源的新项目 autoresearch 所做的事。项目上线不到几个小时,他在 X(原 Twitter)上的发布帖浏览量突破百万,GitHub 仓库迅速收获超过 2,500 ...
【新智元导读】Karpathy让Agent通宵跑了110次实验把模型练强后说了句「去桑拿了」,然后开源630行代码的autoresearch,一块GPU就能拥有一个永不下班的AI研究实验室——人类研究员的新工作,是写好提示词然后去蒸桑拿。
在12小时不间断运行中,AI代理完成了110次代码提交,将模型验证损失从0.862降至0.858。这个看似微小的进步背后,是系统严格执行的优化规则:任何改进必须同时满足损失降低或训练加速的条件。某次提交虽成功降低损失,但因训练时间延长0.7秒被自动回滚,彰显出AI代理对优化目标的精准把控。
先不论这个未来是光明还是危险,智能体自动化研究的能力已经逐渐走向了成熟。春节期间,一个名为 FARS 的自动化研究系统,每隔约 2 小时就有一篇论文产出,共生成 244 个研究假设,「肝」出了 100 篇短论文。
一点资讯 on MSN
88岁图灵奖得主,用Claude一小时破解30年数学悬案
88岁的图灵奖得主、计算机科学奠基人Donald Knuth(高德纳)最近发文,惊呼Shock! Shock!。 在他的短文《Claude’s Cycles》中,他记录了一件难以置信的事: ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果