Skill Graphs 2.0：从依赖链到原子、分子与化合物——AI Agent 技能组合的新范式

2026年4月23日，Gooseworks AI 创始人、Y Combinator 孵化者 Shiv Sakhuja 在 X 上发布了一篇 Article，标题是 "Skill Graphs 2.0"（原始推文，X Article 内容需登录查看）。数据很快涨起来：28条回复、105次转发、903个赞、2762个收藏。这篇文章触及了所有尝试构建可靠 AI Agent 的人共同面对的痛点——如何组合技能，才能让复杂工作流不在自身重量下崩塌？

原文提出了一个干净的三层心智模型。本文将深度拆解这个框架，补充 Agent 工程社区的上下文，并连接到实际落地的思路。

问题所在：技能图在规模化时崩塌

技能图的第一版想法很简单：在 markdown 文件中链接依赖技能，类似在 Obsidian 中链接笔记。一个技能把知识+流程编码到 markdown 文件加可选脚本中，Agent 可以重复执行。

理论上这很完美。当你尝试编码更大的流程或岗位职能时，自然会遇到技能之间的依赖——一个起草营销邮件的技能可能依赖图文设计技能。把它们链接起来，Agent 沿着链路走。

但随着图谱增长，两个问题浮现：

1. 可靠性随深度递减

如果 Skill A 明确指示 Agent 调用 Skill B，大部分时候没问题。但在一个密集图谱中（想想维基百科尺度的链接密度），依赖链可以变得非常深——你无法预判 Agent 实际会做什么。每一跳都增加不确定性。

一个带有明确意图的人类操作者现在面对的是过多的不确定性。他们把判断力让渡给了 Agent——也许让渡得太多了。

2. 循环依赖

在真实图谱中，循环引用不可避免。Skill A 调用 Skill B，Skill B 调用 Skill C，Skill C 又调用 Skill A。Agent 死循环、烧 token、产出垃圾。

这些问题在 Reddit 和 X 上被大量实践者反复报告——他们把技能图用在生产环境中，然后碰到了可靠性天花板。

关键跃迁：原子、分子与化合物

Sakhuja 的核心洞察是：并非所有技能生而平等。技能在不同抽象层次上运作，把它们当作扁平图谱中的平等节点，正是导致可靠性崩溃的根源。

他提出了三个层级：

原子（ATOMS）——原子技能

这是最基础的、单一用途的构建块。范围极窄，原语级别的。

例子：

抓取 LinkedIn 个人资料
查找竞品博客文章
在 Apollo 上查找联系人
用 Hunter 验证邮箱
检查邮件可达性
研究某个话题
审查一个 Pull Request

原子应该极其可靠——接近确定性（或者在大语言模型中尽可能接近确定性）。它们通常完全不调用其他技能。可以把它想象成一个函数：接收输入、产生输出，几乎没有分支逻辑。

分子（MOLECULES）——组合工作流

分子通过组合2-10个原子技能来解决更大的、有范围界定的问题。它有两种形态：

形态一：结构化工作流——原子的固定链条，明确指示何时以及如何调用每个原子。

用 atom-1 和 atom-2 找到线索 → 用 atom-3 资质筛选 → 用 atom-4 丰富信息 → 用 atom-5 加入电子表格

组合逻辑直接写进技能定义中，Agent 的运行时决策被最小化。

形态二：编排器——技能知道5个原子的存在，会根据提示词使用自己的判断来组合它们。

Agent 在这里有更多自主性，但技能仍然提供关于何时使用哪个原子的明确指引。

两种情况下，分子都尽可能把组合逻辑推进技能定义中，最小化 Agent 在运行时的即兴发挥。原子可靠的前提下，分子也应该非常可靠。

化合物（COMPOUNDS）——高层级 playbook

化合物是运行多个分子的编排器。这是你真正给 Agent 赋予有意义自主性的层级。

"执行外发销售 playbook"
"规划并构建这个功能，然后审查和 QA"

这些本质上就更不确定——因为在每个层级都有太多判断需要做。它们也是最难搞对的——Sakhuja 明确承认，至少现在，化合物可能需要人类来驱动。

三层架构图 - 原子/分子/化合物

杠杆论证：大脑 RAM

这个框架真正有趣的地方在这里。每个层级的杠杆倍数大约比下一层高一个数量级。如果你驱动的是化合物而非原子，同样的认知投入下你可以做到大约 100 倍 的工作量。

推理的核心是大脑 RAM——你同时在记忆中持有多个任务并有效切换上下文的能力。这是瓶颈资源，不是 Agent 的能力。

想想看：你的大脑能同时在 5 个 Agent 之间有效切换。现在假设：

1 个化合物 编排 10 个分子
1 个分子 编排 10 个原子（可靠地）

你驱动的层级	同时 Agent 数	分子级任务	原子级工作量
5 个原子任务	5	—	5
5 个分子任务	5	5	50
5 个化合物任务	5	50	500

同样的大脑 RAM 和时间，工作产出随你操作的层级而产生巨大差异。驱动原子任务是用确定性的低杠杆工作堵塞你的 RAM 槽位——车已经有自动驾驶了，你为什么还要握方向盘？

这和组织管理的类比完全精确：一千人公司的 CTO 不会自己去修每个 bug。他信任 IC（独立贡献者）可靠地完成那些工作。CTO 管理的是化合物层级。

杠杆效应对比图

仍然会崩塌的地方

Sakhuja 对局限性也很坦诚：

每个原子必须稳固。 一个坏原子会让故障向上级联穿过分子和化合物。
分子必须可靠地链接原子。 编排逻辑必须是经过验证的，而非理想化的。
Agent 在化合物层级需要足够的自主性 来做真实的决策——但不能多到跑偏。
跨超过8-10个分子的化合物 很可能碰到自己的可靠性天花板。

他还没有碰到上限："我仍然在驱动分子和化合物，即使做到这些也并不觉得轻松。但目标是为每个工作流持续向上攀升到更高层级。"

最大的未解决挑战：每个层级的技能测试需要大量时间，可靠性和一致性是非平凡的。他推测一种"自动研究"类型的方案可能能解决，但还没试过。

Gooseworks 的实际实现

在 Gooseworks 的技能库中（108个技能且还在增长），他们已将这三个层级映射到自己的术语体系：

概念层级	Gooseworks 名称	数量	示例
原子	Capabilities	51	LinkedIn 抓取器、Apollo 搜索、PR 审查器
分子	Composites	52	结构化线索丰富管线、多源研究工作流
化合物	Playbooks	5	外发销售 playbook、功能开发生命周期

这套命名对任何构建自己的技能库的人都很有参考价值——你可以采用化学隐喻（原子/分子/化合物）或 Gooseworks 名称（Capabilities/Composites/Playbooks），但底层的结构是相同的。完整的技能库已在 GitHub 开放。

Gooseworks技能库构成

连接到更广泛的 Agent 架构图景

Skill Graphs 2.0 不是孤立的。它连接到 AI Agent 工程中的几个活跃话题：

技能组合 vs. 思维链（Chain-of-Thought）

在传统 CoT 提示中，LLM 在推理时决定采取哪些步骤。技能组合把那些决策预先烘焙进技能图中。代价是灵活性降低，收益是可靠性提升。对于生产工作流，这通常是正确取舍。

层级化任务分解

原子/分子/化合物的模式映照了人类组织的运作方式。CEO 定战略（化合物），总监管理部门（分子），IC 执行任务（原子）。关键洞察是每个层级应该可以独立验证——你不需要追踪到原子层级才能验证一个化合物的输出。

观察问题

如果化合物需要人类驱动，我们仍然处于"副驾驶"体制，而非"自动驾驶"体制。技能图并没有消除人类监督的需要——它只是把监督移到了更高的抽象层级。这与红杉资本 Julien Bek 的观点一致：通往万亿美元 AI 公司的路径穿过的是仍然有人类在环的服务——只是在一个高得多的杠杆点上。

实践要点

如果你在构建 AI Agent 系统，以下是应用 Skill Graphs 2.0 的实操建议：

从原子开始。 让它们坚如磐石。疯狂测试。如果你的原子失败，上面的所有层级都会失败。
分子写得尽可能明确。 在你对原子有高度信心之前，优先选择结构化工作流（形态一），而非开放式编排器（形态二）。
在化合物层级驱动。 你的注意力是稀缺资源。把它花在高层级编排上，而不是微观管理原子。
注意深度。 如果一个化合物编排超过8-10个分子，考虑拆分它或添加中间检查点。
在每个层级测试。 原子可靠性使分子可靠性成为可能，分子可靠性使化合物可靠性成为可能。测试整座塔，不只是塔尖。
给你的层级命名。 不管你用原子/分子/化合物还是 Capabilities/Composites/Playbooks，一致的命名让系统变得可思考。

结语

Skill Graphs 2.0 是一个看似简单但影响深远的框架。从"把所有东西链接成图谱"到"按抽象层级和可靠性要求分层"，这一转变解决了实践者面对的真实问题：深度杀死可靠性，但扁平列表杀死杠杆。

三层模型（原子 → 分子 → 化合物）同时给了你两者：通过确定性原子技能在底层保证可靠性，通过化合物在顶层释放你的大脑 RAM 去做更高阶的工作。

未解决的前沿是：如何自动化跨所有三个层级的技能测试和验证——在解决这个问题之前，人类仍在环中。但循环的高度已经从100英尺升到了10,000英尺。

来源

Shiv Sakhuja，"Skill Graphs 2.0" — X Article（2026年4月23日）。原始推文（X Article 内容需登录查看）
Gooseworks AI — Shiv Sakhuja 创办的公司，基于技能的 AI Coworkers 方案
goose-skills 仓库 — 108个技能，按 Capabilities（51）/ Composites（52）/ Playbooks（5）组织