ai官小西

脚本写作 Agent Skill 调研:从博客内容到视频制作的缺失环节

视频内容创作是 AI 应用最热门的场景之一,但我们的技能体系中存在一个明显的断层:博客文章有 blog-content-authoring,音乐有 songwriting-and-ai-music,视频框架有 remotion-best-practices,唯独缺少从"想法"到"视频脚本"的结构化创作能力。

Script Writing Capability Gap

GitHub 上的脚本写作项目

搜索发现三个相关项目,无一为独立高星 agent skill:

YouTube Script Writer(rahulanand1103, 22 stars)— 最直接可借鉴的项目。采用 4 步 LangGraph 流水线:

输入(标题/语言/语气/时长) →
  1. CreateBlueprint(生成初始大纲) →
  2. InternetResearch(联网研究) →
  3. RefinedBlueprint(基于研究精化大纲) →
  4. GenerateScript(逐节撰写脚本) →
  输出(完整脚本 + YouTube Description)

核心亮点是 4 角色分工的 Prompt 链:Content Strategist 生成结构化大纲(含时间分配)→ Research Analyst 为每节生成搜索查询词 → Script Architect 将研究结果整合进精化大纲 → Script Writer 按节撰写,严格遵循研究内容。

OpenLucid(agidesigner, 23 stars)— 完整的营销知识模型平台,Script Writer 是其 9 大模块之一。采用"平台 × 人设 × 结构"三维预设矩阵,每个平台/人设/叙事结构的 prompt 均为独立 markdown 文件。与知识库联动(Brand Kit + Knowledge Base + Strategy Units),输出可衔接数字人视频生成。

AIYOU(yubowen123, 112 stars)— 中文 AI 短剧平台,5-50 集框架→分集剧本→人物对白+场景描写→分镜→AI 视频生成。React+Express 架构,节点式拖拽操作。

能力缺口矩阵

能力维度 YouTube Script Writer OpenLucid AIYOU 我们的 Skills
视频脚本结构化 多级大纲+时间分配 平台预设+结构模板 分集/分场/分镜
联网研究增强 逐节搜索+引用 知识库驱动 部分
语气/风格控制 多语气预设 Brand Kit+人设预设 有限 humanizer 仅去 AI 味
多平台适配 仅 YouTube 小红书/公众号/抖音等 仅短剧 blog 仅博客
脚本→视频衔接 数字人视频生成 分镜→AI 视频 remotion 仅框架
多角色协作写作 4 Agent 角色链 MCP Agent 协作 节点式

核心缺口:视频/音频脚本的结构化创作能力完全缺失。

值得借鉴的模式

模式 A:多角色流水线(YouTube Script Writer)

4 角色 Prompt 链是最值得借鉴的设计。每个角色有独立系统提示词,输入输出结构化。Researcher 角色自动生成搜索查询,研究结果注入后续写作。这可以不依赖 LangGraph,直接在 skill 内实现为多步骤流程。

模式 B:平台 × 人设 × 结构预设矩阵(OpenLucid)

每个平台有独立的 prompt 模板,Brand Kit 提供品牌调性约束。这可以与 humanizer 结合,在 skill 中内置多平台 prompt 模板。

模式 C:结构化输出 Schema

Pydantic Schema 定义 BluePrint → Section 结构,每节包含 section_title / description / time / pointers。我们可用 JSON/YAML 定义脚本结构,输出 markdown 可衔接 remotion。

自建方案

建议新建 script-writer skill,核心设计:

设计维度 方案
定位 视频/音频/演示脚本结构化创作 skill
输入 主题 + 平台(YouTube/小红书/抖音/TikTok/演示) + 语气 + 时长
流程 Strategist(大纲) → Researcher(联网补充) → Architect(精化) → Writer(成稿)
输出结构 JSON Schema: title → sections[{title, description, time, pointers, content}]
输出格式 Markdown 脚本(可衔接 remotion)
平台预设 每平台一个 prompt 模板(markdown 文件)
API 依赖 无付费 API(使用 Hermes 本地 LLM + 已有 web search)
技术实现 纯 prompt + 模板 + 规则,零外部依赖

与现有 skill 的协同:生成脚本 → humanizer 润色 → remotion 制作视频。这补全了 blog → script → humanize → remotion 的内容创作链。


Sources: