### [OpenMontage:全球首个开源 AI 智能体视频制作系统,21.2K+ Stars 让 AI 编程助手变身视频工作室](https://www.willai.cc/article/2622) **Published:** 2026-06-25T11:35:23 **Author:** hiyoho **Excerpt:** 🎬 OpenMontage:全球首个开源 AI 智能体视频制作系统 21.2K+ Stars | AGPL-3.0 | Python/TypeScript | calesthio 出品 查看 GitHub → OpenMontage 是全球 🎬 # OpenMontage:全球首个开源 AI 智能体视频制作系统 21.2K+ Stars | AGPL-3.0 | Python/TypeScript | calesthio 出品 [查看 GitHub →](https://github.com/calesthio/OpenMontage) **OpenMontage** 是全球首个开源的智能体驱动(agentic)视频生产系统,包含 **12 条生产管线**、**52 个生产工具**、**500+ 智能体技能**。将你的 AI 编码助手(Claude Code/Cursor/GitHub Copilot 等)转化为完整的视频制作工作室,支持从创意到成片的端到端全流程自动化生产。 21.2K+ GitHub Stars 12 生产管线 52 生产工具 500+ 智能体技能 ## ⚙️ 安装要求和过程 ### 环境要求 - Python 3.10+ - FFmpeg(视频编码、字幕烧录、音频混合) - Node.js 18+(Remotion 合成引擎) - 任意支持的 AI 编码助手(Claude Code/Cursor/GitHub Copilot 等) ### 快速安装 \# 一键安装(推荐) git clone https://github.com/calesthio/OpenMontage.git cd OpenMontage make setup \# 无 make 手动安装 pip install -r requirements.txt cd remotion-composer && npm install && cd .. pip install piper-tts cp .env.example .env ### 本地 GPU 支持(免费视频生成) make install-gpu \# 然后在 .env 中配置: VIDEO\_GEN\_LOCAL\_ENABLED=true VIDEO\_GEN\_LOCAL\_MODEL=wan2.1-1.3b # 可选 wan2.1-14b、hunyuan-1.5 等 ## ⭐ 核心功能 🎬 ### 12 条全流程生产管线 覆盖动画讲解、动画制作、虚拟人播报、电影感剪辑、短视频批量生成、纪录片蒙太奇、混合制作、本地化配音、播客剪辑、屏幕演示、口播视频等场景。每条管线遵循「研究 → 提案 → 脚本 → 分镜 → 资产 → 剪辑 → 合成」的标准化流程。 🎨 ### 双渲染引擎支持 Proposal 阶段锁定渲染运行时,可选 **Remotion**(React 组件化合成,适合数据驱动讲解)或 **HyperFrames**(HTML/CSS/GASP 合成,适合动态图形和 SVG 角色动画)。禁止运行时静默切换,确保生产一致性。 💰 ### 零成本/本地免费生产路径 无需 API 密钥即可使用 Piper TTS 离线配音、Archive.org/NASA/Pixabay 等免费素材库、Remotion/HyperFrames 合成、FFmpeg 后期处理。还支持本地 GPU 运行 WAN 2.1、Hunyuan 等免费视频生成模型。 🎯 ### 7 维评分自动选品 所有工具选择通过「任务匹配度 30%、输出质量 20%、可控性 15%、可靠性 15%、成本效率 10%、延迟 5%、连续性 5%」的打分机制自动选择最优供应商,所有决策可追溯。 ✅ ### 生产级质量门禁 包含合成前校验(阻断交付承诺不符、幻灯片风险过高的问题)、渲染后自检(ffprobe 验证、抽帧检查、音频分析、字幕校验)、决策审计日志(所有创意/技术选择留痕可查),避免输出无效内容。 ## 🚀 典型使用场景 📚 ### 教育内容创作 输入「做一个 60 秒的动画讲解,主题是为什么天空是蓝色的」,AI 自动完成脚本编写、分镜设计、配音合成、字幕添加,全程无需手工操作。支持零密钥本地免费生成。 🎬 ### 参考视频驱动创作 粘贴 YouTube/Reels/TikTok 链接,智能体自动分析参考视频的节奏、结构、风格,输出 2-3 个差异化创意方案(含成本预估和效果预览),避免从零开始构思。 📰 ### 纪录片/蒙太奇制作 「做一个 90 秒的纪录片蒙太奇,主题是凌晨 4 点的城市氛围,仅使用实拍素材,无旁白,elegiac 基调。」支持 Archive.org 等免费素材库自动检索和剪辑。 🎨 ### 风格化动画生成 「做一个 30 秒的吉卜力风格动画,内容是云端的魔法浮动图书馆,黄金时段场景。」配置图像/视频 API 后,成本约 $0.15-$1.50 即可生成风格化动画。 ## 💡 推荐理由 💡 OpenMontage 是我近期看到的最有想象力的 AI + 创意工具结合项目之一。**它不只是「AI 生成视频」的工具,而是一个完整的视频生产管线系统**——把 AI 编程助手变成了导演、编剧、分镜师、剪辑师、配音演员的集合体。 最打动我的是它的**「零成本路径」设计**:你可以完全不花一分钱(无需任何 API Key)就生成完整的视频——使用 Piper 离线 TTS 配音、免费素材库、本地 FFmpeg 处理。对于个人创作者和学习者,这是极大的降低门槛。 另外,它的**7 维评分自动选品机制**和**生产级质量门禁**,让我看到了这个项目是「真正可用于生产」的,而不仅仅是 Demo 级别的玩具。所有决策留痕可查,合成前/后双重校验,这些设计在开源项目中非常少见。 「如果你已经在使用 Claude Code 或 Cursor,OpenMontage 能让你用同样的工作流(写提示词 → 看结果 → 迭代)来「编程」视频,而不是去学习 PRo/Afer Effects。」 ## 🔧 支持的 AI 工具与服务商 **兼容的 AI 编码助手:**Claude Code、Cursor、GitHub Copilot、Windsurf、Codex(后续支持 Ollama、LM Studio 本地大模型) **视频生成:**Kling、Runway Gen-4、Google Veo 3、Grok Imagine Video、Higgsfield、MiniMax、HeyGen、WAN 2.1、Hunyuan、CogVideo、LTX-Video、Pexels、Pixabay、Wikimedia Commons **图像生成:**FLUX、Google Imagen 4、Grok Imagine Image、DALL-E 3、Recraft、Local Diffusion、Pexels、Pixabay、Unsplash、ManimCE **文本转语音:**ElevenLabs、Google TTS(700+ 音色)、OpenAI TTS、Piper(免费离线) **音乐/音效:**Suno AI、ElevenLabs Music、ElevenLabs SFX ## 📥 下载地址 [ 🐙 GitHub 仓库 calesthio/OpenMontage ](https://github.com/calesthio/OpenMontage) [ 📖 官方文档 README + 使用指南 ](https://github.com/calesthio/OpenMontage#readme) [ 🎬 演示视频 YouTube @OpenMontage ](https://www.youtube.com/@OpenMontage) [ 💬 社区支持 GitHub Issues + Discussions ](https://github.com/calesthio/OpenMontage/issues) 授权协议:AGPL-3.0(免费开源) 开发语言:Python, TypeScript, Rust 出品团队:calesthio(YC S26 孵化项目) **Tags:** AGPL许可, AI, AI Agent, AI开源项目, AI视频, LLM, Python, 开源, 智能体, 视频制作 **Categories:** 开源项目 ---