暂无菜单项

OpenMontage:全球首个开源 AI 智能体视频制作系统,21.2K+ Stars 让 AI 编程助手变身视频工作室

发布于
1

🎬

OpenMontage:全球首个开源 AI 智能体视频制作系统

21.2K+ Stars | AGPL-3.0 | Python/TypeScript | calesthio 出品

OpenMontage 是全球首个开源的智能体驱动(agentic)视频生产系统,包含 12 条生产管线52 个生产工具500+ 智能体技能。将你的 AI 编码助手(Claude Code/Cursor/GitHub Copilot 等)转化为完整的视频制作工作室,支持从创意到成片的端到端全流程自动化生产。

21.2K+
GitHub Stars
12
生产管线
52
生产工具
500+
智能体技能

⚙️
安装要求和过程

环境要求

  • Python 3.10+
  • FFmpeg(视频编码、字幕烧录、音频混合)
  • Node.js 18+(Remotion 合成引擎)
  • 任意支持的 AI 编码助手(Claude Code/Cursor/GitHub Copilot 等)

快速安装

# 一键安装(推荐)

git clone https://github.com/calesthio/OpenMontage.git
cd OpenMontage
make setup

# 无 make 手动安装

pip install -r requirements.txt
cd remotion-composer && npm install && cd ..
pip install piper-tts
cp .env.example .env

本地 GPU 支持(免费视频生成)

make install-gpu
# 然后在 .env 中配置:
VIDEO_GEN_LOCAL_ENABLED=true
VIDEO_GEN_LOCAL_MODEL=wan2.1-1.3b # 可选 wan2.1-14b、hunyuan-1.5 等


核心功能

🎬

12 条全流程生产管线

覆盖动画讲解、动画制作、虚拟人播报、电影感剪辑、短视频批量生成、纪录片蒙太奇、混合制作、本地化配音、播客剪辑、屏幕演示、口播视频等场景。每条管线遵循「研究 → 提案 → 脚本 → 分镜 → 资产 → 剪辑 → 合成」的标准化流程。

🎨

双渲染引擎支持

Proposal 阶段锁定渲染运行时,可选 Remotion(React 组件化合成,适合数据驱动讲解)或 HyperFrames(HTML/CSS/GASP 合成,适合动态图形和 SVG 角色动画)。禁止运行时静默切换,确保生产一致性。

💰

零成本/本地免费生产路径

无需 API 密钥即可使用 Piper TTS 离线配音、Archive.org/NASA/Pixabay 等免费素材库、Remotion/HyperFrames 合成、FFmpeg 后期处理。还支持本地 GPU 运行 WAN 2.1、Hunyuan 等免费视频生成模型。

🎯

7 维评分自动选品

所有工具选择通过「任务匹配度 30%、输出质量 20%、可控性 15%、可靠性 15%、成本效率 10%、延迟 5%、连续性 5%」的打分机制自动选择最优供应商,所有决策可追溯。

生产级质量门禁

包含合成前校验(阻断交付承诺不符、幻灯片风险过高的问题)、渲染后自检(ffprobe 验证、抽帧检查、音频分析、字幕校验)、决策审计日志(所有创意/技术选择留痕可查),避免输出无效内容。

🚀
典型使用场景

📚

教育内容创作

输入「做一个 60 秒的动画讲解,主题是为什么天空是蓝色的」,AI 自动完成脚本编写、分镜设计、配音合成、字幕添加,全程无需手工操作。支持零密钥本地免费生成。

🎬

参考视频驱动创作

粘贴 YouTube/Reels/TikTok 链接,智能体自动分析参考视频的节奏、结构、风格,输出 2-3 个差异化创意方案(含成本预估和效果预览),避免从零开始构思。

📰

纪录片/蒙太奇制作

「做一个 90 秒的纪录片蒙太奇,主题是凌晨 4 点的城市氛围,仅使用实拍素材,无旁白,elegiac 基调。」支持 Archive.org 等免费素材库自动检索和剪辑。

🎨

风格化动画生成

「做一个 30 秒的吉卜力风格动画,内容是云端的魔法浮动图书馆,黄金时段场景。」配置图像/视频 API 后,成本约 $0.15-$1.50 即可生成风格化动画。

💡
推荐理由

💡

OpenMontage 是我近期看到的最有想象力的 AI + 创意工具结合项目之一。它不只是「AI 生成视频」的工具,而是一个完整的视频生产管线系统——把 AI 编程助手变成了导演、编剧、分镜师、剪辑师、配音演员的集合体。

最打动我的是它的「零成本路径」设计:你可以完全不花一分钱(无需任何 API Key)就生成完整的视频——使用 Piper 离线 TTS 配音、免费素材库、本地 FFmpeg 处理。对于个人创作者和学习者,这是极大的降低门槛。

另外,它的7 维评分自动选品机制生产级质量门禁,让我看到了这个项目是「真正可用于生产」的,而不仅仅是 Demo 级别的玩具。所有决策留痕可查,合成前/后双重校验,这些设计在开源项目中非常少见。

「如果你已经在使用 Claude Code 或 Cursor,OpenMontage 能让你用同样的工作流(写提示词 → 看结果 → 迭代)来「编程」视频,而不是去学习 PRo/Afer Effects。」

🔧
支持的 AI 工具与服务商

兼容的 AI 编码助手:Claude Code、Cursor、GitHub Copilot、Windsurf、Codex(后续支持 Ollama、LM Studio 本地大模型)

视频生成:Kling、Runway Gen-4、Google Veo 3、Grok Imagine Video、Higgsfield、MiniMax、HeyGen、WAN 2.1、Hunyuan、CogVideo、LTX-Video、Pexels、Pixabay、Wikimedia Commons

图像生成:FLUX、Google Imagen 4、Grok Imagine Image、DALL-E 3、Recraft、Local Diffusion、Pexels、Pixabay、Unsplash、ManimCE

文本转语音:ElevenLabs、Google TTS(700+ 音色)、OpenAI TTS、Piper(免费离线)

音乐/音效:Suno AI、ElevenLabs Music、ElevenLabs SFX

📥
下载地址

授权协议:AGPL-3.0(免费开源)
开发语言:Python, TypeScript, Rust
出品团队:calesthio(YC S26 孵化项目)
0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600