autoresearch
AI Agent 自主运行 LLM 训练研究 · Karpathy 出品
🧠 深度学习
⚡ 单GPU
🔬 自动研究
📌项目简介
autoresearch 是 AI 大神 Andrej Karpathy(前 Tesla AI 总监、OpenAI 创始成员)开源的颠覆性项目——让 AI Agent 在单张 GPU 上自主运行深度学习实验,自动修改代码、训练模型、评估结果,通宵跑完 100+ 实验,早上起来收报告。这不是科幻,是现在就能用的真实工具。
⚙️安装要求和过程
单张 NVIDIA GPU(测试过 H100)、Python 3.10+、uv 包管理器
# 1. 安装 uv(如果还没有)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. 安装依赖
uv sync
# 3. 下载训练数据 + 训练 BPE 分词器(一次性,约2分钟)
uv run prepare.py
# 4. 手动跑一次训练实验(约5分钟)
uv run train.py
在仓库目录下启动 Claude Code / Codex 等 AI Agent(关闭所有权限确认),然后发送提示:
Hi have a look at program.md and let's kick off a new experiment!
let's do the setup first.
没有 H100?社区已有 macOS、MLX、Windows RTX 等 Fork,MacBook 也能跑!
⭐核心功能
Agent 自动修改 train.py,训练5分钟,检查 val_bpb 是否下降,保留或丢弃改动,不断迭代。你只需要睡前启动,早上收实验日志。
每次实验固定5分钟(wall clock),不管 Agent 怎么改模型架构、batch size,所有实验都可直接对比。约12次实验/小时,通宵可跑100+次。
整个仓库只有3个核心文件:prepare.py(固定)、train.py(Agent 修改)、program.md(人类修改)。diff 清晰可审查,不会失控。
Claude Code、OpenAI Codex、Gemini CLI、OpenClaw……任何能读写文件的 AI Agent 都能用。program.md 本质上是一个超轻量级的”技能提示词”。
macOS(M系列芯片)、Windows(RTX显卡)、MLX框架均有社区 Fork,低配设备也能体验 AI 自主研究。
🚀典型使用场景
🌙 场景一:夜间自动实验
下班前启动 Agent,让它通宵自主实验。第二天早上,你会收到一份完整的实验日志,记录每次改动、训练曲线和验证集效果。相当于白得一个不知疲倦的研究生。
🔬 场景二:快速模型架构探索
想尝试不同的注意力机制、优化器组合或模型深度?让 Agent 在固定时间预算内自动探索各种组合,快速找到最优配置,省去大量手工调参时间。
📚 场景三:学习深度学习最佳实践
即使是深度学习初学者,也可以阅读 Agent 的修改记录和实验日志,从中学习哪些改动有效、哪些无效,快速积累建模经验。
💡推荐理由
Karpathy 出品,必属精品。autoresearch 最震撼的地方在于它把”AI 做 AI 研究”从科幻变成了现实——而且代码极简,整个训练代码只有一个 train.py,清晰到可以作为学习材料。
固定5分钟时间预算的设计非常巧妙:不管怎么改模型,每次实验成本相同,结果可直接对比。这让 Agent 的”研究”变得可解释、可复现,而不是黑盒魔法。
⚠️ 注意:目前官方版本需要 NVIDIA GPU,低配设备建议使用社区 Fork。但无论如何,这个项目代表的”AI 自主研究”方向,值得每个 AI 从业者关注和思考。
📦下载地址
GitHub 仓库:https://github.com/karpathy/autoresearch
社区 Fork(macOS):https://github.com/miolini/autoresearch-macos
社区 Fork(Windows RTX):https://github.com/jsegov/autoresearch-win-rtx
Karpathy 推文介绍:https://x.com/karpathy/status/2029701092347630069
🔔 关注我们,每周分享最新 AI 开源项目!
GitHub 热门 AI 项目持续更新中…
