基于 MCP 架构的 AI 视频编辑 Agent,通过自然语言交互实现从素材搜索、脚本生成到渲染输出的全流程视频创作。
FireRed-OpenStoryline 是一个对话式 AI 视频编辑 Agent,采用 MCP Server + LangChain Agent 架构,将传统手动剪辑转化为意图导向的视频创作流程。
项目覆盖完整视频生产链路:智能素材搜索(Pexels)、镜头分割(TransNetV2)、VLM 视觉理解、Few-shot 风格化脚本生成、多供应商 TTS 配音、情绪驱动的 BGM 推荐与节拍同步、AI 转场生成(通义万相/海螺),以及基于 MoviePy + FFmpeg 的最终渲染。内置 18 个处理节点,通过 MCP Server 以 streamable-http 协议暴露能力。
交互层面支持 CLI 和 Web UI 两种模式,并可通过对话式指令完成镜头剪辑、替换、重排及视觉细节微调。Style Skills 机制允许将完整编辑流程保存为可复用技能,实现素材替换后的批量风格化产出。同时提供 OpenClaw、Claude Code、Codex 等 AI Agent 的 Skills 集成,支持从安装到生成的全流程自动化。
支持本地安装(Python >= 3.11)和 Docker 部署,跨平台运行(Linux/macOS/Windows),需配置外部 LLM/VLM 及相关 API Key。
注意:README 中出现 2026 年日期标注(开源日期及新增功能日期),可能为项目方文档中的未来日期或内部规划时间线,实际时间以 Git 历史为准。HuggingFace Demo 及项目 Homepage 的具体 URL 在调研中未能获取。