harry0703/MoneyPrinterTurbo:一键 AI 短视频,以及素材库这道天花板

一条视频流水线,而不是一个视频模型

MoneyPrinterTurbo 接受一个主题或关键词,返回一个成品的竖屏或横屏短视频:它用语言模型写文案、拉取匹配的素材片段、生成字幕、合成配音、铺上背景音乐,再把这一切合成为 1080x1920 或 1920x1080。这名字把意图说得很直白:它就是为了批量产出 TikTok 和 Shorts 内容而造的。

要紧的心智模型,也是功能清单没明说的一点,是它是一个编排器,而非一个生成式视频模型。它不会凭空想出画面。它把语言模型的文字、素材库的片段、和一段文字转语音的声音缝在一起。看懂这一点,你就清楚它在哪儿出彩、又在哪儿撞墙。

它实际把什么接在一起

一个文案步骤,调用某个模型服务商。README 列了长长一串,含 OpenAI、Azure、Gemini、DeepSeek、Moonshot、通义千问、文心一言、MiniMax,以及一个本地 Ollama 选项,所以你不被单一厂商锁定。
一个素材步骤,拉取高清、无版权的片段,配置的服务商是 Pexels,也可以用你自己的本地素材。
字幕生成,可控字体、位置、颜色、大小和描边。
多种合成语音并可实时试听,加上可控音量的背景音乐。
批量生成,所以你一次产出多个候选、留下最好的那个;同时有 Web UI 和 API,挂在一个清晰的 MVC 结构之下。

安装

从源码克隆运行,是维护者当作主路径的方式:

git clone https://github.com/harry0703/MoneyPrinterTurbo.git

把 config.example.toml 复制成 config.toml,填好 pexels_api_keys 和你的 llm_provider 及其 key。在 macOS 和 Linux 上推荐用 uv sync --frozen;想要隔离环境就走文档里的 Docker。Windows 用户有一个一键便携包,但有一条值得留意的注意事项,见下文。

issue 历史暴露的坑

README 是一圈功能巡礼。那些真正引发讨论的 closed issue,才是摩擦所在:

配音步骤是脆弱环节。 多个高评论的帖子都是 TTS 失败:音频生成时报错、语音服务返回 403。如果一次运行挂了,这是第一个该看的地方。
合成环节坑过人。 一个讨论度不低的帖子报告 combine_videos 在某些环境里完全不工作,而这是一条流水线最后、也最让人难受的失败点。
Windows 包落后于代码。 README 自己就标注:打包的 Windows 启动器是较旧的 v1.2.6 构建,并让你先跑 update.bat 再跑 start.bat。跳过这步是常见的早期绊脚石。
网络假设。 文档提到 VPN 可能需要开全局流量模式,以及非 ASCII 路径会引发不可预料的失败。在维护者的环境之外,这两点都很容易踩到。

这些都不是致命伤,而且 open issue 数很低(截至 2026-06 为 30),说明 issue 有人分诊。但这是一条外部服务的链条,而链条会断在它最弱的那次调用上。

它适合什么,以及天花板

当你想要规模化的、无真人出镜、有旁白、用素材片段拼的短视频时上它:讲解片、清单体、励志 reels。批量模式和服务商灵活性,让它在这条赛道上是个货真价实的生产工具。

天花板是素材。因为画面是按关键词匹配的素材片段、而非生成出来的场景,视频只能和素材库允许的程度一样切题,抽象或小众的文案常常拉来关系松散的 B-roll。如果你需要真正呈现你具体文案内容的画面,这套架构带不了你到那儿。这是流水线设计的固有属性,不是一个等它修好的 bug。

MoneyPrinterTurbo 与它的血缘和邻居对比

	MoneyPrinterTurbo	MoneyPrinter	ShortGPT
Stars	84,230	13,426	7,397
界面	Web UI 和 API	脚本	框架
许可	MIT	MIT	MIT
最擅长	带 UI 的批量短视频	极简的原版	可编程的管线

计数取自 GitHub,截至 2026 年 6 月。MoneyPrinter 是这个项目名字所致敬的、更精简的原版。ShortGPT 更偏向一个用于自动化内容的可编程框架。MoneyPrinterTurbo 的优势在打磨过的 Web UI、批量生成,以及它接受的模型服务商之广。

FAQ

它用 AI 生成视频画面吗? 不。它拼装的是无版权素材片段、AI 写的文案、合成配音、字幕和音乐。画面是拉取的,不是生成的。

我需要哪些 API key? 至少要一个素材库 key(Pexels)和一个语言模型服务商 key。文案步骤可以用本地 Ollama 模型来覆盖。

为什么我的运行在音频或合成步骤失败了? 那是报告最多的失败点。先查 TTS 服务商配置,再查视频合成步骤。

它免费吗? 项目是 MIT 许可。你的成本是你接入的第三方模型和素材服务。