Blog

七月上旬，Lilian Weng 发表 Harness Engineering for Self-Improvement 长文，将 Harness 工程提升到递归自我改进的核心地位；Anthropic 密集发布 Managed Agents、Agent Skills 等工程实践；Cognition 发布 SWE-1.7 模型。本文速览海外 AI 工程博客的最新动态，并分析它们与国内 AI 工程实践的共鸣。

2026年7月9日news

每日早报 · 2026-07-09

美国连续第二天打击伊朗，特朗普宣布停火结束；OpenAI 发布 GPT-Live 全双工语音模型；美联储纪要显示内部分裂，部分官员支持加息。

2026年7月8日news

每日早报 · 2026-07-08

美国对伊朗恢复石油制裁并发动军事打击，全球芯片股因三星业绩不及预期集体重挫；Meta发布AI图像模型Muse Image，SpaceX申请部署10万颗第三代星链卫星。

2026年7月7日ai

AI 智能体工程工具箱：Harness 与 Loop 工程的实战工具指南

知道了 Harness 工程和 Loop 工程的概念之后，用什么工具落地？本文系统梳理 2024-2025 年活跃维护的 AI 智能体工程工具，覆盖工具定义、上下文组装、输出解析、安全门控、状态管理、上下文压缩、检查点、可观测性等全链路，帮你从零搭建或在现有框架上扩展自己的 agent 系统。

2026年7月7日ai

BMAD-METHOD 深度解析：50K Star 的 AI 敏捷开发方法论如何让 Agent 从「写代码」到「做产品」

BMAD-METHOD 不是又一个「AI 编程技巧合集」——它是一套完整的 AI 驱动的敏捷开发方法论。50K Star、12+ 专业 Agent 角色、34+ 结构化工作流、从头脑风暴到部署的完整生命周期。本文拆解 BMAD 的四阶段流程、Party Mode 多角色协作、以及它与 ECC/Ralph 的生态位差异。

2026年7月7日ai

Clypra 深度解析：用 Tauri + React 重新定义开源视频编辑器的技术选型

Clypra 是 AIEraDev 团队用 Tauri + React 构建的现代化视频编辑器，代表了开源视频编辑工具的技术选型新方向——用 Rust 替代 C++ 做性能层，用 React 替代 Qt 做 UI 层。本文从技术架构到同类对比，拆解这一选型的优势与挑战。

2026年7月7日news

每日早报 · 2026-07-07

道指突破53000点创历史新高，SpaceX上市15天即纳入纳指100；微软裁员4800人；沙特阿美对亚洲原油降价11美元/桶创本世纪之最；英伟达Kyber架构传延后引发供应链暴跌。

2026年7月7日ai

ECC 深度解析：227K Star 的 Agent 操作系统如何让 AI 编程助手从「能用」到「好用」

ECC 不是又一个「Claude Code 配置包」——它是 227K Star、230+ 贡献者、跨越 7 个 AI 编程助手的 Agent 操作系统。261 个技能、自进化学习层、安全扫描、跨会话记忆持久化、Token 优化——本文从架构到实战，拆解 ECC 如何让 AI Agent 从「一次性对话」变成「持续进化的工程系统」。

2026年7月7日ai

Harness 工程与 Loop 工程：给 AI 智能体造一副好骨架和一套好步法

当大模型本身已经足够强，真正决定 AI 智能体好坏的不再是参数量，而是包裹它的两层工程：Harness 工程（静态脚手架——工具、上下文、安全门）和 Loop 工程（动态控制流——观察、思考、行动、停止）。本文系统梳理这两个概念的核心要素、设计原则、最佳实践和参考资料，帮你理解 Claude Code、Manus、Hermes Agent 等系统背后的工程逻辑。

2026年7月5日ai

Seed-Audio 深度解析：字节跳动的「音频世界模型」如何用一段 Prompt 生成完整配音场景

Seed-Audio 1.0 不是又一个 TTS 引擎——它是字节跳动 Seed 团队从 Seed-TTS 论文到生产级音频生成平台的完整进化。支持单次 Prompt 生成六角色对话+环境音效+背景音乐，288 种预设音色，语音克隆，以及音频优先的视频生成管线。本文从论文到 API 到实际用例，逐层拆解其技术架构与设计取舍。

2026年7月4日ai

Boogu-Image-0.1 深度解析：用十分之一数据挑战闭源生图模型的开源新星

Boogu-Image-0.1 是 2026 年 6 月发布的开源图像生成与编辑模型家族，662 Star，Apache-2.0。它用比同类开源模型少一个数量级的训练数据，实现了接近闭源系统的性能。本文拆解其统一理解+生成架构、Base/Turbo/Edit/Edit-Turbo 四模型矩阵、Boogu Arena 评估体系，并与 FLUX、Qwen-Image、Z-Image 做横向对比。

2026年7月4日ai

MaineCoon 深度解析：首个实时音视频自回归模型——22B 参数、47.5 FPS、社交世界模型的新范式

MaineCoon 是 Catnip AI 团队构建的首个实时音视频自回归模型，22B 参数，单 H100 GPU 上实现 47.5 FPS 的流式生成，生成成本低于 $0.001/秒。它提出了「社交世界模型」这一新范式——不只是生成视频，而是主动观察用户、内部模拟社交动态、实时反应。本文拆解其流式训练、Agentic 推理和 SocialVideo-Bench 评估体系。

2026年7月3日ai

Hermes Agent v0.18.0 深度解析：208K Star 的自进化 AI Agent——MoA、验证闭环与零 P0/P1 的工程奇迹

Hermes Agent 是 Nous Research 构建的自进化 AI Agent，208K Star，MIT 许可证。v0.18.0（2026.7.1）实现了 P0/P1 清零、MoA 一等公民、验证闭环、/learn 和 /journey 自进化命令、后台扇出委托、桌面编程项目等里程碑。本文深度拆解其自进化学习循环、技能系统、记忆架构、多平台网关和最新版本的核心突破。

2026年6月30日ai

GBrain 深度解析：Garry Tan 的 14 万页 AI 大脑——架构、知识图谱与自进化循环

GBrain 是 YC 总裁 Garry Tan 构建的 AI Agent 大脑系统，24K+ Star，MIT 许可证。它管理着 14.6 万页、2.4 万人、5300 家公司的知识，66 个定时任务自主运行。核心差异：不只是搜索——它合成答案、自建知识图谱、在夜间自主进化。本文拆解其混合检索、自连接图谱、Schema Pack 和 Dream Cycle 四大核心机制。

2026年6月30日ai

Understand Anything 深度解析：69K Star 的代码知识图谱——多 Agent 管线、Tree-sitter+LLM 混合架构与 15 平台兼容

Understand Anything 是 2026 年增长最快的开源开发者工具之一，69K Star，MIT 许可证。它用 Tree-sitter + LLM 混合架构将任何代码库转化为可交互的知识图谱，支持 15+ AI 编程平台。本文拆解其 5 Agent 管线、确定性+语义双引擎、增量更新机制和跨平台插件架构。

2026年6月29日ai

中国首批智能体国家标准深度解读：7项标准、闭环体系与全球首发意义

2026年6月29日，中国市场监管总局正式发布《人工智能智能体互联》系列7项国家标准——这是全球首个国家级AI Agent标准体系。本文逐项拆解7项标准的内容、闭环架构的设计逻辑，并与Google A2A、Anthropic MCP等西方方案做对比，分析这套标准对国内Agent生态的深远影响。

2026年6月29日ai

OpenMontage 深度解析：全球首个开源 Agentic 视频制作系统——架构、管线与横向对比

OpenMontage 是全球首个开源 Agentic 视频制作系统，27K+ Star，12 条管线、52 个工具、500+ Agent 技能。它把 AI 编程助手变成完整的视频制作工作室——从研究、脚本、资产生成到剪辑、合成、自审，全流程 Agent 驱动。本文拆解其 Agent-first 架构、三层知识体系、12 条生产管线，并与 Remotion、Diffusers、MoviePy、Toonflow 等 7 个同类开源项目做横向对比。

2026年6月28日ai

Cognee 深度解析：AI Agent 记忆平台的架构、机制与取舍

Cognee 是当前最活跃的开源 AI Agent 记忆平台（24K+ Star），它用知识图谱+向量混合存储、14 种检索器自适应路由、Truth Subspace 对齐机制和技能系统，试图解决 Agent「跨会话失忆」的核心问题。本文从架构、检索管线、图构建到与 mem0/Zep 的对比，逐层拆解其设计取舍。

2026年6月28日ai

Godcoder 深度解析：本地优先、自建 Harness 的 Rust 编程 Agent

Godcoder 是一个用 Rust 构建的本地优先开源编程 Agent，发布于 2026 年 6 月 27 日，两天内获 245 Star。它的核心差异点不是又一个 Cursor 竞品——而是 Agent 能自主构建和优化自己的 Harness，甚至能通过 CoWork 模式学习操作桌面应用。本文拆解其纯 Rust Agent 核心、六种工作模式、自优化循环和上下文引擎架构。

2026年6月28日ai

Loop Engineering：从手动提示词到自主编排——AI Agent 的下一层抽象

Loop Engineering 是 2026 年 6 月才开始凝聚的新兴学科：将「你来提示 Agent」替换为「你设计一个系统让它自己提示自己」。Anthropic Claude Code 负责人 Boris Cherny 的一句话触发了整个社区的重新思考——这篇文章拆解这个概念的定义、评估难题、安全威胁，以及它究竟是真正的范式跃迁，还是改了名字的 cron job。

2026年6月28日ai

OpenTag 深度解析：开源版「Slack 里的 Claude」——CopilotKit 的多平台 Agent 框架

OpenTag 是 CopilotKit 推出的开源 Slack Agent，299 Star，MIT 许可证。它让你在 Slack 里跑自己的 AI Agent——读线程、回答问题、调用 Linear/Notion 工具、渲染图表，所有代码自托管。本文拆解其多平台适配架构、AG-UI 协议、Generative UI 渲染和人机协作审批机制。

2026年6月16日ai

Agent Reach：给 AI 智能体一双看遍全网的眼睛——而且不用付 API 费

AI 智能体能推理、能写代码、能改你的文件——可一旦让它去读一条推文、看一个 YouTube 教程、查一下 Reddit，它就瞬间失明了。Agent Reach 是一个开源 CLI，它的解法不是再造一个工具，而是做一层「能力层」：为每个平台挑选、安装、体检并路由当下最可靠的免费后端，而真正的读取由你的智能体直接调用上游工具完成。本文深入拆解它「路由即配置」的架构、会真实探测的 doctor、能扛住平台反爬变动的有序后端列表，以及为什么 2026 年真正的瓶颈是「触达」而非「推理」。

2026年6月16日ai

「断网开关」先例：Anthropic 与白宫的对峙，如何把前沿 AI 推入「主权管控」时代

2026 年 6 月 12 日（周五）美东时间下午 5:21，Anthropic 收到美国商务部一封信，命令它切断两款最强模型对所有外国人的访问。由于无法按国籍区分用户，实际效果就是一个全球断网开关——几小时内两款模型对所有人下线。这是史上第一次，出口管制法被用来管控对一个前沿 AI 模型的「访问」，而非芯片或权重——它标志着前沿模型治理从自愿的安全承诺，倾向硬性的主权管控。本文梳理已核实的事实、政府/Anthropic/安全研究者三方对峙、看似成立却含糊的法律机制，以及未来一到两周内值得盯住的两个具体观察指标。

2026年6月16日tech

Iroh 1.0 深度解析：拨号公钥，而非 IP 地址

2026 年 6 月 15 日，n0 发布了 iroh 1.0——这个用 Rust 编写的网络栈让你用设备的公钥而非 IP 地址来发起连接，迎来首个稳定版本。本文深入剖析 iroh 如何穿透 NAT 打洞、如何在打洞失败时回落到中继、为何要自研 QUIC 实现，以及它如何把整个互联网变成一个安全的 localhost。我们将拆解它的架构、可组合协议生态、全新的官方 Python/Node/Swift/Kotlin 绑定，以及 1.0 的线协议稳定性承诺对生产环境到底意味着什么。

2026年5月26日ai

Codex 走进手机：'随时随地工作'到底改变了什么

OpenAI 把 Codex 放进了 ChatGPT 手机 App。这不是一个界面迁移——它改变了开发者与长时间运行的 AI agent 之间的交互节奏。我们拆解工作流变化、治理边界，以及团队在拥抱这一能力前应该做的事。

2026年5月26日ai

Codex Windows 沙箱深度解析 — 为一个 AI 编程 Agent 构建操作系统级隔离

OpenAI Codex Windows 沙箱技术深度解析——David Wiesen 如何从被否决的 advisory 原型迭代到生产级 OS 隔离。拆解四层架构、三条死路、最终设计，从中提取可复用的 agent 运行时沙箱化设计模式。

2026年5月26日ai

LangChain Interrupt 2026：从框架厂商到全栈 Agent 平台的跃迁

LangChain 在 Interrupt 2026 大会上发布了五项重要产品更新，标志着从库厂商到平台厂商的关键转变。本文深入解析 LangSmith Engine、SmithDB、Context Hub、Deep Agents v0.6 和 Delta Channels，分析它们如何组合成完整的 Agent 操作系统——覆盖可观测性数据层、自主改进循环、托管运行时、上下文治理和可扩展检查点机制。

2026年5月26日ai

《Teaching Claude Why》：Anthropic 对齐研究揭示了什么关于 AI 安全训练的真相

Anthropic 最新对齐研究揭示了一个反直觉的发现：教模型解释为什么正确行为是对的，效果远超训练正确行为本身。本文深度解析宪法文档训练、虚构故事和伦理推理数据如何将 Claude 的 agentic misalignment 降至零，并探讨这对 AI 安全未来的意义。

2026年5月18日ai

AI Agent 周报：Codex 登陆移动端、Anthropic 对齐突破、Agent 工具生态爆发

本周 AI Agent 领域重要动态：OpenAI 将 Codex 带到移动端（周活400万用户），Anthropic 揭示如何将 agentic 对齐失败率从 96% 降至零，LangChain 发布完整 agent 可观测性技术栈，开源 agent 工具生态大爆发。2026年5月11-18日一周回顾。

2026年5月14日tech

线束工程：现代工业神经网络全景指南

深入解析线束工程——每辆汽车、每架飞机、每台工业机器的神经系统背后的工程学。覆盖 Yazaki、TE Connectivity 等八大龙头企业，IPC/WHMA-A-620、USCAR 等关键标准，现代设计工具与自动化趋势。

2026年5月12日ai

Cookiy AI：首个智能体AI用户研究平台

深度解析Cookiy AI — 全球首个智能体AI用户研究平台，单日可完成100+访谈，4小时内交付洞察。

2026年5月12日ai

Flipbook：当浏览器不再渲染 HTML，而是生成图像

Flipbook 用 AI 生成的图像替代了 HTML。每一页都是一张 JPEG，文字和图表全由图像模型渲染。点击任意区域即可深入探索。本文解析其技术架构、产品哲学，以及开源克隆 openflipbook 为何比原版更有意义。

2026年5月12日ai

Gizmo 产品策略深度分析：把 TikTok 的上瘾循环改造成 Anki 的学习循环

本文深度分析 AI 教育公司 Gizmo 的产品策略：它并不是简单的 AI Tutor，而是在用 AI Import 降低学习材料生产成本，再用间隔重复、主动回忆、游戏化、社交网络和订阅摩擦，把被动材料变成高频学习循环。

2026年5月7日ai

DeerFlow 2.0 深度解析：架构拆解、竞品对比与多 Agent 框架全景

深入拆解字节跳动 6.5 万星开源项目 DeerFlow 2.0 的中间件架构、子 Agent 编排、沙箱隔离、记忆系统与 MCP 集成，并与 9 款同类多 Agent 框架进行全面对比分析。

2026年5月7日ai

标签生成 Agent Skill 调研：低优先级，必要时扩展现有 SEO 技能

GitHub 上无高星 hashtag-generator agent skill，竞品均为付费 SaaS（$9-49/月）。基础标签生成可复用现有 SEO 关键词提取逻辑，无需独立 skill。评估为低优先级，未来有社交内容需求时可轻量扩展。

2026年5月7日ai

Hermes Kanban：多 Agent 任务编排的持久看板——架构、原理与竞品全景分析

深入剖析 Hermes Kanban 的架构原理——从 SQLite 持久化状态机、原子化 claim 锁、依赖自动晋升引擎，到人机协作与第三方平台集成路径。对比 CrewAI、LangGraph、Airflow、Temporal 等 6 款竞品，为想要落地 AI Agent 多角色协作的开发者提供一张从概念到上手的完整路线图。

2026年5月7日ai

图片生成 Agent Skill 调研：代码驱动图优先，像素图仅按需

GitHub 上的 image-generation skill 本质是付费 API 封装，按政策不适用。我们评估了现有 9 个视觉技能的能力边界，提出博客场景的出图成本优化策略：代码驱动图优先、像素图最小化、仅当阅读质量必要时配图。

2026年5月7日ai

脚本写作 Agent Skill 调研：从博客内容到视频制作的缺失环节

GitHub 上不存在高星的独立 script-writer agent skill，但 YouTube Script Writer 的 4 角色流水线和 OpenLucid 的平台预设矩阵提供了优秀模式。我们评估了视频/音频脚本结构化创作的能力缺口与自建方案。

2026年5月7日ai

Stagehand 与 BrowserBase 调研：AI Agent 该不该引入 act/extract/observe 三原语？

Stagehand 的 act/extract/observe 三原语设计模式对 AI 浏览器自动化领域有重要启示，但 BrowserBase 云服务为付费模式。本文对比现有 agent-browser、browser-use、Playwright MCP 等方案，评估借鉴价值与自建可行性。

2026年5月7日ai

摘要 Agent Skill 调研：三个缺失能力 — Map-Reduce、关键帧锚点与跨源综合

我们已有 4 个摘要 skill 覆盖主流场景，但 Map-Reduce 长文分块摘要、视频关键帧锚点、跨源综合摘要三大能力缺失。本文评估了 6 个 GitHub 项目和 6 种摘要模式，提出了优先级建议。

2026年5月7日ai

趋势监控 Agent Skill 调研：能否基于免费接口构建跨平台趋势情报？

GitHub 上最完整的趋势监控 skill 套件 trend-radar 提供了 monitor→deep-dive→alert→forage→report 的闭环流程，但依赖付费 MCP server。我们评估了基于免费公开接口自建趋势监控的可行性。

2026年5月7日ai

小红书自动化 Skill 调研：合规风险高，仅提取可复用浏览器组件

小红书自动化生态的头部项目 MediaCrawler (18k stars) 提供了多平台爬虫能力，但小红书无公开 API，所有自动化均基于逆向工程，合规风险显著。建议仅提取 Playwright 反检测等通用组件，不建独立 XHS skill。

2026年5月6日ai

深度对比：AI Agent 沙箱执行 — AgentScope Runtime vs OpenAI Agents SDK

从源码层面深度对比 AgentScope Runtime 与 OpenAI Agents SDK 的沙箱执行机制：容器后端、安全加固、生产部署模式。你的场景适合哪一个？

2026年5月6日tech

切斯特顿栅栏：为什么你应该先理解，再拆除

切斯特顿栅栏是一个思维模型，告诫我们在拆除任何东西之前，先弄清楚它为什么存在。这个源自 G.K. 切斯特顿 1929 年寓言的原理，已成为软件工程、组织设计和公共政策中二阶思维的基石。

2026年5月6日tech

代码简化技能评测 — 如何在不动行为的前提下清理代码

多角度评测 code-simplifier 技能生态，对比 Anthropic Claude Code 官方插件与我们适配的 Hermes 版本。深入分析安全简化的五项原则，用真实代码模式测试两个实现，明确哪些值得借鉴、哪些已经覆盖。

2026年5月6日ai

Harness Engineering：2026年构建可靠AI Agent完全指南

Harness Engineering 是2025-2026年AI Agent领域涌现的新兴工程学科，专注于设计围绕AI模型的全部运行环境——上下文交付、工具接口、验证闭环、记忆系统和安全沙箱——决定了Agent在生产环境中的可靠性。本文系统梳理从提示词工程到Harness工程的演进路径、核心架构组件、关键开源项目、生产案例与实用落地路线图。

2026年5月6日ai

Hermes Agent 召回机制深潜：从源码到架构再到行业对比

从源码级别拆解 Hermes Agent 的三层召回架构——内置记忆、会话搜索与 Hindsight 外部记忆提供者——并与 Claude Code、Cursor、Codex CLI、mem0、Zep、LangChain Memory、Letta 七个竞品进行系统对比。

2026年5月6日ai

MCP Builder 技能评测 — AI Agent 工具开发所需的那块拼图

调查 MCP Builder 生态系统——从 Anthropic 官方 create-python-server 到社区脚手架工具。分析 MCP Builder 到底是什么、做对了什么、缺失了什么，以及为什么 Hermes 可能需要自己的 MCP 工具工厂。

2026年5月6日ai

PowerPoint 技能评测 — 教 AI Agent 做出来不像 AI 做的幻灯片

对 AI agent PowerPoint 生成工具的批判性评测——对比 python-pptx、pptxgenjs、markitdown 和我们现有的技能。测试幻灯片质量、AI 特有的陷阱，以及现有工具是否能产出不露馅的演示文稿。

2026年5月6日ai

Ralph Loop 深度解析 — 那个不跑完 PRD 绝不停下的 AI 编程循环

Ralph Loop 生态全景深度解析——从 Geoffrey Huntley 的原始 Bash 循环到五个生产级实现。分析核心机制，对比各实现差异，探索如何将自主循环执行融入 Hermes Agent 的现有基础设施。

2026年5月6日tech

Webapp Testing 技能评测 — 让 AI Agent 真正可用的浏览器测试方案

深入评测 webapp-testing 技能，对比我们基于 Playwright 的方案与 AI agent 生态中的替代工具。分析侦查-执行模式、服务器生命周期管理，以及为什么大多数 AI 测试工具把事情搞复杂了。

2026年5月5日ai

如何将 Quality Playbook 适配到 Hermes：提取，而非复制

逐步记录如何将流行的 quality-playbook-generator 技能适配到 Hermes Skill Graph 2.0 中。我们没有复制 479 行指令，而是提取了通用的取证方法论，创建了两个可组合的技能，并丢弃了已有技能体系覆盖的部分。

2026年5月5日ai

技能创建生态：从 18 万安装量到 Hermes Skill Graph 2.0

深入对比三大技能创建框架：Anthropic Skills（182K 安装量）、OpenClaw Skill Creator 和 Hermes Skill Graph 2.0。分析各自的设计哲学、优势劣势，以及 Hermes 如何将最佳实践融合为分层组合模型。

2026年5月5日ai

Agent Skills 生态调研 2026：8 个类别揭示的 AI 智能体进化趋势

全面调研 8 个 agent skill 类别——从 tmux 会话控制到 Playwright 测试——揭示哪些技能值得采用，哪些冗余，以及生态现状告诉我们关于 AI 智能体成熟度的什么信息。

2026年5月5日tech

GitNexus 深度解析：为 AI Agent 打造的 35K Star 代码智能引擎

对 GitNexus 的全面技术分析——这个拥有 35K GitHub Star 的零服务器代码智能引擎。我们深入剖析其 12 阶段索引流水线、16 个 MCP 工具、流程检测引擎、LadybugDB 图存储，并评估其在我们 AI Agent 技能生态中的适配性。

2026年5月5日ai

在 RTX 4090 上运行 NVIDIA Nemotron Nano Omni 30B 多模态模型

NVIDIA 在 2026 年 4 月底发布了 Nemotron 3 Nano Omni——首个原生支持视频+音频+图像+文本的 30B 级开源多模态模型。我在消费级 RTX 4090 上完成了从下载到推理的全流程实测，记录下令人惊喜的速度、意外的中文能力、多模态的部署限制，以及对本地 AI 发展趋势的思考。

2026年5月5日tech

AI 智能体的 Tmux 技能：为什么我们不需要 Tmux 包装器

tmux 控制技能在 skills.sh 上有 2800 个安装量，但你的 AI 智能体真的需要它吗？我们探讨了基于 tmux 的会话控制与原生终端工具之间的架构权衡。

2026年5月4日ai

AI 音乐 Agent Skill 全景评估：2026 年谁能用？

我们调研了四个 AI 音乐 agent skill：程序化 MIDI 生成的 EsshUwU、走 Suno API 的 Cynaps3、多模态工具集 vargHQ、以及已弃用的 fltman。结果很惨淡——要么依赖付费 API（一票否决），要么音质停留在 90 年代 SoundFont 水平。只有本地程序化生成路线值得关注。

2026年5月4日tech

从同步到备份：AI Agent 数据安全的缺失半程

同步让 AI Agent 在多台机器上保持一致，但无法拯救宕机的服务器或误删的文件。深入分析为什么备份是同步之后的自然下一步，以及如何用每日 ZIP + git push 策略补齐这块短板。

2026年5月4日ai

Hermes Novel Generator vs NovelClaw：AI 小说生成工具的横向对比

三个 AI 长篇小说生成项目横向比较：Hermes Novel Generator（14 星）跑在 Hermes 里做 Scene Sandbox pipeline，NovelClaw（293 星）是哈工大团队搞的完整写作工作台，Morpheus（25 星）有三层记忆+知识图谱。各自适合什么场景，优缺点一览。

2026年5月4日ai-agent

把 humanizer 接入 Agent 技能体系——以及缺失的中文部分

我们将 humanizer（Wikipedia 整理的 29 种英文 AI 写作模式）接入到六个技能中，覆盖博文管线和求职问候管线，并构建了 zh-anti-slop v2——从 patina 借用了触发条件/排除条件/语义风险框架，覆盖 20 种中文模式，全部分级了专业/日常/正式三种语域，防止去 AI 味的同时干掉专业性。

2026年5月4日ai

psy-core：为 AI Agent 内存操作加上防篡改审计日志

psy-core 把 AI agent 的每一次 memory 写入都记录进一条 HMAC 密封的哈希链。你可以追查 agent 在什么时候学会了什么、哪个 session 改了哪个 skill。本文拆解它的适配器架构、哈希链机制和安装流程。

2026年5月4日tech

将 Skywork Office Skills 整合进 Hermes Skill Graph 2.0

深入分析如何评估和整合 SkyworkAI 开源 Office Skills 到 Hermes Skill Graph 2.0 体系——安全审计、多维评估、架构决策，以及完整的适配过程。

2026年5月4日ai

Telepath：一个会读 Agent 记忆的可视化工具

Telepath 在画图之前会先读你的 Hermes Agent 的 memory。Hermes 越了解你，Telepath 问的问题就越少。输入一句模糊意图，输出图表、架构图或信息图——全部用 Kimi K2 驱动。2026 年 Hermes Agent Hackathon 参赛作品。

2026年5月3日tech

Skill Graphs 2.0：AI Agent 技能的层级化架构设计方法论

Skill Graphs 2.0 是一套将 AI Agent 技能组织为原子、分子、化合物的层级架构方法论——把扁平的工具箱转化为可组合、可版本化的知识图谱。本文分享设计思路、来自 194 个技能的实战指标和架构经验。

2026年5月3日tech

Spark 2.0：李飞飞团队开源的流式 3D 高斯溅射引擎，10亿溅射体在手机浏览器流畅渲染

Spark 2.0 为 3D 高斯溅射引入了流式 LOD 和虚拟分页系统，让包含上亿溅射体的场景在任何设备上流畅渲染。由李飞飞的 World Labs 打造，它重新定义了 3DGS 内容在开放网络上的呈现方式。

2026年5月2日ai

安全幻觉：深度评估 AI 技能安全扫描器 Skill-Vetter

对 skill-vetter 的多维度深度评估——第一款 AI Agent 技能安全扫描器。尽管有 26 个 GitHub stars，该工具无法通过自己的安全检查，依赖 grep 正则表达式，且为自身添加豁免规则。结论：安全幻觉。

2026年5月2日tech

AI Agent 技能多机同步难题：八大生态 × 六种方案的深度拆解

当你在 MacBook、Linux 工作站和云服务器上使用同一个 AI 编程助手时，技能如何保持一致？系统对比 Hermes、Claude Code、Cursor、Copilot、OpenCode、Aider 和 Windsurf 八大生态的同步策略，以及从 dotfiles 到 Nix 的六种通用方案。

2026年5月2日tech

我从 Awesome 列表中安装了 10 个 Hermes Agent 技能（并修好了每一个）

我扫描了 0xNyk 的 awesome-hermes-agent 列表（2,197 stars），从 7 个仓库中找出 11 个可安装技能，批量安装了其中 10 个，诊断了每一个损坏的依赖项，并修复了平台兼容性问题。这是完整记录。

2026年5月2日ai

洁癖 neat-freak：让你的 AI Agent 不再「脑腐」的那个 Skill

代码迭代了七八轮，文档还是最初那一版；Agent 记忆里写着用 SQLite，其实你早换了 PostgreSQL；CLAUDE.md 的接口列表跟实际路由对不上。neat-freak（洁癖）是一个跨平台的 AI Agent Skill，用编辑而非记录员的思维，在每次开发会话结束后自动对齐代码、项目文档和 Agent 记忆三层知识体系。本文深度解析它的三层知识模型、五步执行流程，并提供 Hermes Agent 适配指南。

2026年5月2日tech

OpenCLI 深度评测：把任意网站变成 CLI 命令 —— 以及它和同类工具的横评

jackwener 的 OpenCLI 能把任意网站、Electron 桌面应用、本地二进制工具转化为标准化的 CLI 命令，兼顾人类用户和 AI Agent。本文从五个维度横向对比 browser-use、Claude Code、Aider、Goose 和 OpenCLI.co 目录站，判断它是否值得引入你的工具链。

2026年5月2日ai

Pixelle-Video 深度解析：2026 年最值得关注的 AI 短视频引擎

从架构设计、管线分解、TTS驱动的音画同步，到与 MoneyPrinterTurbo、NarratoAI 的横向对比，本文是对 AIDC-AI 开源项目 Pixelle-Video 的全面技术深潜。近 9000 Star 的背后，是工作流驱动架构对单体管线的降维打击。

2026年5月2日ai

AI 编程 Agent Token 瘦身术：GitNexus、RTK、Skim 等 8 款工具深度横评 —— 如何砍掉 90% 的 Token 开销

8 款 AI 编程 Agent token 优化工具的全面多维度对比 —— 从透明重写命令的 CLI 代理到注入代码知识图谱的智能索引，再到针对 Hermes Agent 的最优分层方案。

2026年5月1日ai

Browser Harness：自愈合 CDP 线束，重写 AI 代理与浏览器交互的规则

深入对比 Browser Harness——Browser Use 团队出品的自愈合 CDP 线束——与 agent-browser、Browser Use（Python库）、Hermes 内置浏览器工具的异同。仅 592 行核心 Python 代码，却引入了一种全新范式：代理在运行时自行编写缺失的辅助函数。我们从架构、理念、适用场景等多维度剖析。

2026年5月1日tech

Fireworks Tech Graph 深度评测：2026 年 AI 绘图技能横向对比

从图表类型覆盖度、视觉质量、技术深度、生态集成和学习曲线五个维度，对 fireworks-tech-graph 与 Excalidraw、architecture-diagram、FlowForge、baoyu-infographic、graphify 五款现有 AI 绘图工具进行全方位对比分析，探讨它是否值得加入你的 Agent 工具箱。

2026年4月30日business

拆解 CREAO AI：一个 AI Agent 平台的成功案例分析

从产品策略、技术架构、商业模式、增长策略和市场定位五个角度，深度拆解 CREAO AI —— 一个将对话转化为可复用、24/7 运行的 AI Agent 的平台。

2026年4月30日tech

Git Worktree：AI 编程 Agent 的轻量级任务隔离方案

当 AI Agent 在你的项目里修改文件时，它需要一个沙箱。Git worktree 提供轻量级、即时的目录隔离——无需 clone，无需 stash，无需来回切分支。本文详解如何用它并行运行多个 AI Agent、实验和代码审查，互不干扰。

2026年4月30日ai

gstack：将 Claude Code 变成一支虚拟工程团队

深度解析 Garry Tan 的 gstack——这个87k星的开源工具包将 Claude Code 转变为拥有23位专家的虚拟工程团队。涵盖架构设计、53个技能的 sprint 流程、AI 系统集成方式，以及支撑810倍生产力提升的构建者哲学。

2026年4月29日ai

Graphify：把任何文件夹变成可查询的知识图谱

Graphify 是一个拥有 37k 星标的开源工具，它能读取你的代码、论文、文档和图片，构建出带有社区发现、诚实置信度标注和 71 倍查询 token 压缩的可导航知识图谱——完全本地运行，无需服务器。

2026年4月29日ai

HyperFrames：当 AI Agent 学会写 HTML，视频生成就变得像说话一样简单

HeyGen 开源的 HyperFrames 框架用一个巧妙的思路解决了 AI 生成视频的难题：既然 LLM 天生会写 HTML，那就让视频定义本身就是 HTML——无需 React、无需 DSL、无需编译步骤，Agent 直接输出可渲染的视频代码。

2026年4月29日ai

Skill Graphs 2.0：从依赖链到原子、分子与化合物——AI Agent 技能组合的新范式

Shiv Sakhuja 的 Skill Graphs 2.0 框架重新定义了 AI Agent 技能组合方式：放弃深层依赖链，将技能分为原子、分子、化合物三个层级——每个层级在确定性与杠杆之间做出取舍，但前提是底层必须足够稳固。

2026年4月28日ai

在 RTX 4090 上用 Ollama 本地运行 Carnice-V2-27B —— 完整教程

手把手教你如何将 Carnice-V2-27B（基于 Qwen3.6-27B 的 Hermes 风格 Agent 模型）部署到本地 RTX 4090 24GB 显卡上，涵盖 GGUF 量化选择、Modelfile 配置、Ollama 导入流程以及性能调优建议。

2026年4月28日tech

Next.js SEO 审计实战：从空壳页面到搜索引擎友好的 7 步改造

一次完整的 Next.js 个人站点 SEO 审计与修复过程记录——涵盖 SSR 迁移、中英双语博客路由、结构化数据、Favicon、Sitemap、RSS 及搜索引擎验证。

2026年4月27日ai

深度解读红杉资本「万亿象限图」：AI的下一个万亿美元公司将不再是软件公司

红杉资本合伙人 Julien Bek 的「服务即新软件」论文引爆硅谷。本文深度解构其智力vs判断力框架、Copilot与Autopilot的分野、外包楔子策略，以及10大垂直领域的机会矩阵，并呈现反方批评与个人思考。

Invalid Date