ai官小西

Skill Graphs 2.0:从依赖链到原子、分子与化合物——AI Agent 技能组合的新范式

2026年4月23日,Gooseworks AI 创始人、Y Combinator 孵化者 Shiv Sakhuja 在 X 上发布了一篇 Article,标题是 "Skill Graphs 2.0"原始推文,X Article 内容需登录查看)。数据很快涨起来:28条回复、105次转发、903个赞、2762个收藏。这篇文章触及了所有尝试构建可靠 AI Agent 的人共同面对的痛点——如何组合技能,才能让复杂工作流不在自身重量下崩塌?

原文提出了一个干净的三层心智模型。本文将深度拆解这个框架,补充 Agent 工程社区的上下文,并连接到实际落地的思路。


问题所在:技能图在规模化时崩塌

技能图的第一版想法很简单:在 markdown 文件中链接依赖技能,类似在 Obsidian 中链接笔记。一个技能把知识+流程编码到 markdown 文件加可选脚本中,Agent 可以重复执行。

理论上这很完美。当你尝试编码更大的流程或岗位职能时,自然会遇到技能之间的依赖——一个起草营销邮件的技能可能依赖图文设计技能。把它们链接起来,Agent 沿着链路走。

但随着图谱增长,两个问题浮现:

1. 可靠性随深度递减

如果 Skill A 明确指示 Agent 调用 Skill B,大部分时候没问题。但在一个密集图谱中(想想维基百科尺度的链接密度),依赖链可以变得非常深——你无法预判 Agent 实际会做什么。每一跳都增加不确定性。

一个带有明确意图的人类操作者现在面对的是过多的不确定性。他们把判断力让渡给了 Agent——也许让渡得太多了。

2. 循环依赖

在真实图谱中,循环引用不可避免。Skill A 调用 Skill B,Skill B 调用 Skill C,Skill C 又调用 Skill A。Agent 死循环、烧 token、产出垃圾。

这些问题在 Reddit 和 X 上被大量实践者反复报告——他们把技能图用在生产环境中,然后碰到了可靠性天花板。


关键跃迁:原子、分子与化合物

Sakhuja 的核心洞察是:并非所有技能生而平等。技能在不同抽象层次上运作,把它们当作扁平图谱中的平等节点,正是导致可靠性崩溃的根源。

他提出了三个层级:

原子(ATOMS)——原子技能

这是最基础的、单一用途的构建块。范围极窄,原语级别的。

例子:

  • 抓取 LinkedIn 个人资料
  • 查找竞品博客文章
  • 在 Apollo 上查找联系人
  • 用 Hunter 验证邮箱
  • 检查邮件可达性
  • 研究某个话题
  • 审查一个 Pull Request

原子应该极其可靠——接近确定性(或者在大语言模型中尽可能接近确定性)。它们通常完全不调用其他技能。可以把它想象成一个函数:接收输入、产生输出,几乎没有分支逻辑。

分子(MOLECULES)——组合工作流

分子通过组合2-10个原子技能来解决更大的、有范围界定的问题。它有两种形态:

形态一:结构化工作流——原子的固定链条,明确指示何时以及如何调用每个原子。

用 atom-1 和 atom-2 找到线索 → 用 atom-3 资质筛选 → 用 atom-4 丰富信息 → 用 atom-5 加入电子表格

组合逻辑直接写进技能定义中,Agent 的运行时决策被最小化。

形态二:编排器——技能知道5个原子的存在,会根据提示词使用自己的判断来组合它们。

Agent 在这里有更多自主性,但技能仍然提供关于何时使用哪个原子的明确指引。

两种情况下,分子都尽可能把组合逻辑推进技能定义中,最小化 Agent 在运行时的即兴发挥。原子可靠的前提下,分子也应该非常可靠。

化合物(COMPOUNDS)——高层级 playbook

化合物是运行多个分子的编排器。这是你真正给 Agent 赋予有意义自主性的层级。

  • "执行外发销售 playbook"
  • "规划并构建这个功能,然后审查和 QA"

这些本质上就更不确定——因为在每个层级都有太多判断需要做。它们也是最难搞对的——Sakhuja 明确承认,至少现在,化合物可能需要人类来驱动

三层架构图 - 原子/分子/化合物


杠杆论证:大脑 RAM

这个框架真正有趣的地方在这里。每个层级的杠杆倍数大约比下一层高一个数量级。如果你驱动的是化合物而非原子,同样的认知投入下你可以做到大约 100 倍 的工作量。

推理的核心是大脑 RAM——你同时在记忆中持有多个任务并有效切换上下文的能力。这是瓶颈资源,不是 Agent 的能力。

想想看:你的大脑能同时在 5 个 Agent 之间有效切换。现在假设:

  • 1 个化合物 编排 10 个分子
  • 1 个分子 编排 10 个原子(可靠地)
你驱动的层级 同时 Agent 数 分子级任务 原子级工作量
5 个原子任务 5 5
5 个分子任务 5 5 50
5 个化合物任务 5 50 500

同样的大脑 RAM 和时间,工作产出随你操作的层级而产生巨大差异。驱动原子任务是用确定性的低杠杆工作堵塞你的 RAM 槽位——车已经有自动驾驶了,你为什么还要握方向盘?

这和组织管理的类比完全精确:一千人公司的 CTO 不会自己去修每个 bug。他信任 IC(独立贡献者)可靠地完成那些工作。CTO 管理的是化合物层级。

杠杆效应对比图


仍然会崩塌的地方

Sakhuja 对局限性也很坦诚:

  1. 每个原子必须稳固。 一个坏原子会让故障向上级联穿过分子和化合物。
  2. 分子必须可靠地链接原子。 编排逻辑必须是经过验证的,而非理想化的。
  3. Agent 在化合物层级需要足够的自主性 来做真实的决策——但不能多到跑偏。
  4. 跨超过8-10个分子的化合物 很可能碰到自己的可靠性天花板。

他还没有碰到上限:"我仍然在驱动分子和化合物,即使做到这些也并不觉得轻松。但目标是为每个工作流持续向上攀升到更高层级。"

最大的未解决挑战:每个层级的技能测试需要大量时间,可靠性和一致性是非平凡的。他推测一种"自动研究"类型的方案可能能解决,但还没试过。


Gooseworks 的实际实现

在 Gooseworks 的技能库中(108个技能且还在增长),他们已将这三个层级映射到自己的术语体系:

概念层级 Gooseworks 名称 数量 示例
原子 Capabilities 51 LinkedIn 抓取器、Apollo 搜索、PR 审查器
分子 Composites 52 结构化线索丰富管线、多源研究工作流
化合物 Playbooks 5 外发销售 playbook、功能开发生命周期

这套命名对任何构建自己的技能库的人都很有参考价值——你可以采用化学隐喻(原子/分子/化合物)或 Gooseworks 名称(Capabilities/Composites/Playbooks),但底层的结构是相同的。完整的技能库已在 GitHub 开放

Gooseworks技能库构成


连接到更广泛的 Agent 架构图景

Skill Graphs 2.0 不是孤立的。它连接到 AI Agent 工程中的几个活跃话题:

技能组合 vs. 思维链(Chain-of-Thought)

在传统 CoT 提示中,LLM 在推理时决定采取哪些步骤。技能组合把那些决策预先烘焙进技能图中。代价是灵活性降低,收益是可靠性提升。对于生产工作流,这通常是正确取舍。

层级化任务分解

原子/分子/化合物的模式映照了人类组织的运作方式。CEO 定战略(化合物),总监管理部门(分子),IC 执行任务(原子)。关键洞察是每个层级应该可以独立验证——你不需要追踪到原子层级才能验证一个化合物的输出。

观察问题

如果化合物需要人类驱动,我们仍然处于"副驾驶"体制,而非"自动驾驶"体制。技能图并没有消除人类监督的需要——它只是把监督移到了更高的抽象层级。这与红杉资本 Julien Bek 的观点一致:通往万亿美元 AI 公司的路径穿过的是仍然有人类在环的服务——只是在一个高得多的杠杆点上。


实践要点

如果你在构建 AI Agent 系统,以下是应用 Skill Graphs 2.0 的实操建议:

  1. 从原子开始。 让它们坚如磐石。疯狂测试。如果你的原子失败,上面的所有层级都会失败。
  2. 分子写得尽可能明确。 在你对原子有高度信心之前,优先选择结构化工作流(形态一),而非开放式编排器(形态二)。
  3. 在化合物层级驱动。 你的注意力是稀缺资源。把它花在高层级编排上,而不是微观管理原子。
  4. 注意深度。 如果一个化合物编排超过8-10个分子,考虑拆分它或添加中间检查点。
  5. 在每个层级测试。 原子可靠性使分子可靠性成为可能,分子可靠性使化合物可靠性成为可能。测试整座塔,不只是塔尖。
  6. 给你的层级命名。 不管你用原子/分子/化合物还是 Capabilities/Composites/Playbooks,一致的命名让系统变得可思考。

结语

Skill Graphs 2.0 是一个看似简单但影响深远的框架。从"把所有东西链接成图谱"到"按抽象层级和可靠性要求分层",这一转变解决了实践者面对的真实问题:深度杀死可靠性,但扁平列表杀死杠杆。

三层模型(原子 → 分子 → 化合物)同时给了你两者:通过确定性原子技能在底层保证可靠性,通过化合物在顶层释放你的大脑 RAM 去做更高阶的工作。

未解决的前沿是:如何自动化跨所有三个层级的技能测试和验证——在解决这个问题之前,人类仍在环中。但循环的高度已经从100英尺升到了10,000英尺。


来源

  • Shiv Sakhuja,"Skill Graphs 2.0" — X Article(2026年4月23日)。原始推文(X Article 内容需登录查看)
  • Gooseworks AI — Shiv Sakhuja 创办的公司,基于技能的 AI Coworkers 方案
  • goose-skills 仓库 — 108个技能,按 Capabilities(51)/ Composites(52)/ Playbooks(5)组织