AI视频剪辑项目 OpenMontage 持续霸榜Github

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI视频剪辑项目 OpenMontage 持续霸榜Github
8395点击    2026-07-04 14:13

火!爆!惹!


Github热榜持续屠榜,短短几天一路狂揽15.4k stars,甚至一度冲到了Top 1的位置。


不是啥大厂项目,也不是啥新模型。


而是一个叫OpenMontage的开源「视频制作」系统~(剪辑人狂喜.jpg)


持续霸榜Github的是一个AI视频剪辑项目


友友们,真不怪人家火,主要嘛——


这项目直接把过去传统视频剪辑流程的八百道工序步骤,梭哈成一支「全自动拍片团队」了。


只需对Claude Code、Cursor、GitHub Copilot等编程工具说出需求,脚本、素材、配音、字幕到剪辑就能一条龙自动完成!


比如下面这个画质、音频、剪辑全在线的动画视频,就是完全用OpenMontage制作的~


AI视频剪辑项目 OpenMontage 持续霸榜Github


好好好,AI编程工具集体转岗,变身视频工作室。


只能说在Agent赛道视频剪辑还是太有的整了…


剪辑软件:不er,同行们咋都背着我卷到这一步了?


火爆GitHub的OpenMontage视频制作系统


u1s1,碰过剪辑软件的友友大概都有同一种《崩溃》。


想做一个短视频,本来只是个简单需求,结果一路拆成了十几个工具在打架——


前脚在素材网站疯狂扒视频,后脚去配音软件找声音,再转头打开剪辑软件扣剪辑……(崩溃*100.jpg)


现在AI工具确实不少,但问题也很现实,它们大多只解决一个点,但几乎没人帮咱把一整条视频做完!!


持续霸榜Github的是一个AI视频剪辑项目


而OpenMontage之所以在Github上如此之火爆,主要还是把传统视频生成的老bug磨平了……


OpenMontage的思路很「直给」——


它不是不优化视频创作某一个环节,而是直接重写整条视频生产链


具体来说,里面内置了大规模的生产体系:包括52个工具模块、12条标准化视频流水线和400+可组合技能。


从选题、脚本、分镜、素材、配音、字幕、剪辑,到最后合成输出,全部拆成可编排的生产模块~


持续霸榜Github的是一个AI视频剪辑项目


那问题来了,这不就是一个剪辑工具吗?——NO,NO,NO!


因为OpenMontage本质不是让AI帮咱剪视频,而是让AI替我们组一个剪辑团队:


Claude Code、Cursor、Copilot这些AI coding助手会被当成调度与执行单元,去跑完整的视频制作流程!!


(适配性多多,都是我们的老朋友~)


持续霸榜Github的是一个AI视频剪辑项目


此外还有个必须值得一说的。


那就是OpenMontage并不局限于「纯AI生成视频」。


因为它还支持直接接入大量开放素材源,包括Archive.org、NASA、Wikimedia、Pexels、Unsplash这些。


相当于它自己在搭一个可检索的真实视频素材库,再把这些素材自动拼进时间线里!


咱来看下面这个皮克斯风格的动画短片官方demo。


这个视频是由6段fal.ai生成的动作片段组成的,配音用的Google Chirp3-HD,字幕是TikTok风格标注,后期用Remotion做统一渲染。


整个故事情节、逻辑和画面完成度都蛮高,从故事到画面,纯·流水线一口气跑出来:


AI视频剪辑项目 OpenMontage 持续霸榜Github


再来看下面这个50秒的质感广告大片。


4张由GPT生成的图像打底+自动配音+自动抓取无版权音乐+WhisperX做逐词级字幕对齐+Remotion做最终视觉与数据化包装。


一条完整视频,从画面、声音到字幕节奏,全都被系统自动拼好。


but——更离谱的是《成本》。


官方给出的数据是:单条视频制作成本约0.69美元,换算一下,大概4块多人民币???


(有点心动啊我说,再想想我的剪辑软件月费…


AI视频剪辑项目 OpenMontage 持续霸榜Github


此外值得一提的是,OpenMontage本身就支持Kling、Runway Gen4、Google Veo这些视频模型。


所以它更像是一个把这些AI工具的「顶级能力」,重新拼成一套可调用生产系统的东西。


只不过这一次,这套系统是跑在Agent上的。(doge)


OpenMontage:行了,这些工具你不用一个个学了,我帮你一起整了得了。(哦吼)


核心运行逻辑:Agent驱动架构


当然了,能让一个系统就把视频创作全流程梭哈,技术架构上必有点东西。


事实上OpenMontage是一个三层结构在协同运作。


最底层是工具层,负责提供原始能力。


比如Kling、Runway、Veo这些视频生成模型,再往下还有图像生成、TTS配音、音乐生成、字幕识别、剪辑渲染这些基础模块,本质上都是一组随时可以被调用的能力单元~


持续霸榜Github的是一个AI视频剪辑项目


中间一层是技能层,它主要做的是翻译的工作。


也就是把这些零散工具包装成方法,比如脚本怎么生成、分镜怎么拆、画面风格怎么控制、节奏怎么剪、不同模型在什么情况下被调用。


这一层让工具不再只是工具,而变成了一套套可以复用的做事方式~


第三层则是Agent的调度与编排层


它不再关心某一个环节具体怎么实现,而是直接理解用户要做什么视频,然后自动拆解任务结构,把合适的技能和工具串成一条完整的production pipeline,从输入一个需求开始,一路走到最终成片输出。


底层是能力,中层是方法,上层是组织能力的系统。


这样一来,OpenMontage就能轻轻松松让视频制作变成一套可以被「自动调度」的生产流程了!


大家另一个很关心的问题来了。


这OpenMontage具体咋部署捏?


——《实则不难》。


从GitHub克隆项目到本地环境,安装Python依赖与基础运行环境,然后在.env中配置所需的模型与服务能力就OK~


完成配置后,通过命令行或AI coding工具启动pipeline,就好了~


持续霸榜Github的是一个AI视频剪辑项目


说实话,OpenMontage在能力上不算一个特别新的东西。


这两年Codex、Claude Cod这些编程工具越来越火后,视频剪辑、内容生成等场景也开始向工作流系统集大成。


就比如前一阵接入Codex的AI视频生成平台HeyGen,也是数字人、画面、字幕、辑、导出全能一锅出。


只不过OpenMontage更进一步的地方在于——


它不依赖单一平台能力,而是把流程本身也变成了可编排对象,所以在系统层面可扩展性更强一些。


当然了,这些对于咱用户来说都不是最重要的。


能省力、没有N个内容生成工具在中间赚差价,而且也不用咱在几个软件来回切换。


怎么不算好事情捏?大家说是吧?


参考链接:https://github.com/calesthio/OpenMontage


文章来自于微信公众号 “量子位”,作者 “量子位”

AI转型,免费服务,就找AITNT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales