暂无菜单项

【开源推荐】autoresearch:86K+ Stars!Karpathy开源AI自主研究工具,让Agent通宵帮你优化LLM训练

发布于
2
🔥 GitHub 热门 AI 开源项目

autoresearch

AI Agent 自主运行 LLM 训练研究 · Karpathy 出品

🤖 AI Agent
🧠 深度学习
⚡ 单GPU
🔬 自动研究

📌项目简介

autoresearch 是 AI 大神 Andrej Karpathy(前 Tesla AI 总监、OpenAI 创始成员)开源的颠覆性项目——让 AI Agent 在单张 GPU 上自主运行深度学习实验,自动修改代码、训练模型、评估结果,通宵跑完 100+ 实验,早上起来收报告。这不是科幻,是现在就能用的真实工具。

⚙️安装要求和过程

1
环境要求

单张 NVIDIA GPU(测试过 H100)、Python 3.10+、uv 包管理器

2
快速安装(4步搞定)
# 1. 安装 uv(如果还没有)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 安装依赖
uv sync

# 3. 下载训练数据 + 训练 BPE 分词器(一次性,约2分钟)
uv run prepare.py

# 4. 手动跑一次训练实验(约5分钟)
uv run train.py
3
启动 AI Agent 自主研究

在仓库目录下启动 Claude Code / Codex 等 AI Agent(关闭所有权限确认),然后发送提示:

Hi have a look at program.md and let's kick off a new experiment!
let's do the setup first.
4
低配设备适配

没有 H100?社区已有 macOSMLXWindows RTX 等 Fork,MacBook 也能跑!

核心功能

🤖
AI Agent 自主研究

Agent 自动修改 train.py,训练5分钟,检查 val_bpb 是否下降,保留或丢弃改动,不断迭代。你只需要睡前启动,早上收实验日志。

⏱️
固定时间预算(公平对比)

每次实验固定5分钟(wall clock),不管 Agent 怎么改模型架构、batch size,所有实验都可直接对比。约12次实验/小时,通宵可跑100+次。

📁
极简设计(只改一个文件)

整个仓库只有3个核心文件:prepare.py(固定)、train.py(Agent 修改)、program.md(人类修改)。diff 清晰可审查,不会失控。

🔌
支持任意 AI Agent

Claude Code、OpenAI Codex、Gemini CLI、OpenClaw……任何能读写文件的 AI Agent 都能用。program.md 本质上是一个超轻量级的”技能提示词”。

🌍
活跃社区 Fork(多平台支持)

macOS(M系列芯片)、Windows(RTX显卡)、MLX框架均有社区 Fork,低配设备也能体验 AI 自主研究。

🚀典型使用场景

🌙 场景一:夜间自动实验

下班前启动 Agent,让它通宵自主实验。第二天早上,你会收到一份完整的实验日志,记录每次改动、训练曲线和验证集效果。相当于白得一个不知疲倦的研究生。

🔬 场景二:快速模型架构探索

想尝试不同的注意力机制、优化器组合或模型深度?让 Agent 在固定时间预算内自动探索各种组合,快速找到最优配置,省去大量手工调参时间。

📚 场景三:学习深度学习最佳实践

即使是深度学习初学者,也可以阅读 Agent 的修改记录和实验日志,从中学习哪些改动有效、哪些无效,快速积累建模经验。

💡推荐理由

Karpathy 出品,必属精品。autoresearch 最震撼的地方在于它把”AI 做 AI 研究”从科幻变成了现实——而且代码极简,整个训练代码只有一个 train.py,清晰到可以作为学习材料。

固定5分钟时间预算的设计非常巧妙:不管怎么改模型,每次实验成本相同,结果可直接对比。这让 Agent 的”研究”变得可解释、可复现,而不是黑盒魔法。

⚠️ 注意:目前官方版本需要 NVIDIA GPU,低配设备建议使用社区 Fork。但无论如何,这个项目代表的”AI 自主研究”方向,值得每个 AI 从业者关注和思考。

📦下载地址

🔔 关注我们,每周分享最新 AI 开源项目!

GitHub 热门 AI 项目持续更新中…

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600
嗨,下午好!
所有的成功,都源自一个勇敢的开始
聊天室

登录后参与聊天