脚本写作 Agent Skill 调研:从博客内容到视频制作的缺失环节
视频内容创作是 AI 应用最热门的场景之一,但我们的技能体系中存在一个明显的断层:博客文章有 blog-content-authoring,音乐有 songwriting-and-ai-music,视频框架有 remotion-best-practices,唯独缺少从"想法"到"视频脚本"的结构化创作能力。
GitHub 上的脚本写作项目
搜索发现三个相关项目,无一为独立高星 agent skill:
YouTube Script Writer(rahulanand1103, 22 stars)— 最直接可借鉴的项目。采用 4 步 LangGraph 流水线:
输入(标题/语言/语气/时长) →
1. CreateBlueprint(生成初始大纲) →
2. InternetResearch(联网研究) →
3. RefinedBlueprint(基于研究精化大纲) →
4. GenerateScript(逐节撰写脚本) →
输出(完整脚本 + YouTube Description)
核心亮点是 4 角色分工的 Prompt 链:Content Strategist 生成结构化大纲(含时间分配)→ Research Analyst 为每节生成搜索查询词 → Script Architect 将研究结果整合进精化大纲 → Script Writer 按节撰写,严格遵循研究内容。
OpenLucid(agidesigner, 23 stars)— 完整的营销知识模型平台,Script Writer 是其 9 大模块之一。采用"平台 × 人设 × 结构"三维预设矩阵,每个平台/人设/叙事结构的 prompt 均为独立 markdown 文件。与知识库联动(Brand Kit + Knowledge Base + Strategy Units),输出可衔接数字人视频生成。
AIYOU(yubowen123, 112 stars)— 中文 AI 短剧平台,5-50 集框架→分集剧本→人物对白+场景描写→分镜→AI 视频生成。React+Express 架构,节点式拖拽操作。
能力缺口矩阵
| 能力维度 | YouTube Script Writer | OpenLucid | AIYOU | 我们的 Skills |
|---|---|---|---|---|
| 视频脚本结构化 | 多级大纲+时间分配 | 平台预设+结构模板 | 分集/分场/分镜 | 无 |
| 联网研究增强 | 逐节搜索+引用 | 知识库驱动 | 部分 | 无 |
| 语气/风格控制 | 多语气预设 | Brand Kit+人设预设 | 有限 | humanizer 仅去 AI 味 |
| 多平台适配 | 仅 YouTube | 小红书/公众号/抖音等 | 仅短剧 | blog 仅博客 |
| 脚本→视频衔接 | 无 | 数字人视频生成 | 分镜→AI 视频 | remotion 仅框架 |
| 多角色协作写作 | 4 Agent 角色链 | MCP Agent 协作 | 节点式 | 无 |
核心缺口:视频/音频脚本的结构化创作能力完全缺失。
值得借鉴的模式
模式 A:多角色流水线(YouTube Script Writer)
4 角色 Prompt 链是最值得借鉴的设计。每个角色有独立系统提示词,输入输出结构化。Researcher 角色自动生成搜索查询,研究结果注入后续写作。这可以不依赖 LangGraph,直接在 skill 内实现为多步骤流程。
模式 B:平台 × 人设 × 结构预设矩阵(OpenLucid)
每个平台有独立的 prompt 模板,Brand Kit 提供品牌调性约束。这可以与 humanizer 结合,在 skill 中内置多平台 prompt 模板。
模式 C:结构化输出 Schema
Pydantic Schema 定义 BluePrint → Section 结构,每节包含 section_title / description / time / pointers。我们可用 JSON/YAML 定义脚本结构,输出 markdown 可衔接 remotion。
自建方案
建议新建 script-writer skill,核心设计:
| 设计维度 | 方案 |
|---|---|
| 定位 | 视频/音频/演示脚本结构化创作 skill |
| 输入 | 主题 + 平台(YouTube/小红书/抖音/TikTok/演示) + 语气 + 时长 |
| 流程 | Strategist(大纲) → Researcher(联网补充) → Architect(精化) → Writer(成稿) |
| 输出结构 | JSON Schema: title → sections[{title, description, time, pointers, content}] |
| 输出格式 | Markdown 脚本(可衔接 remotion) |
| 平台预设 | 每平台一个 prompt 模板(markdown 文件) |
| API 依赖 | 无付费 API(使用 Hermes 本地 LLM + 已有 web search) |
| 技术实现 | 纯 prompt + 模板 + 规则,零外部依赖 |
与现有 skill 的协同:生成脚本 → humanizer 润色 → remotion 制作视频。这补全了 blog → script → humanize → remotion 的内容创作链。
Sources:
- YouTube Script Writer: https://github.com/rahulanand1103/youtube-script-writer (MIT, 22 stars)
- OpenLucid: https://github.com/agidesigner/OpenLucid (MIT, 23 stars)
- AIYOU: https://github.com/yubowen123/AIYOU_open-ai-video-drama-generator (MIT, 112 stars)
- songwriting-and-ai-music: Hermes Agent 内置技能
- remotion-best-practices: Hermes Agent 内置技能
- humanizer: Hermes Agent 内置技能