小红书自动化 Skill 调研：合规风险高，仅提取可复用浏览器组件

小红书（XHS）是中国最重要的内容社交平台之一，月活超 3 亿。其自动化需求集中在数据爬取、内容发布和账号管理三个方向。但与 X/Twitter（有官方 API）不同，小红书无公开 API，所有自动化均基于逆向工程，合规风险显著高于其他平台。

XHS Compliance Risk

头部开源项目

NanmiCoder/MediaCrawler（约 18k stars）— 多平台爬虫框架，支持小红书/抖音/微博/B 站/知乎。基于 Playwright + 指纹伪装，抓取笔记/评论/用户数据。Apache-2.0 许可，但项目已加免责声明，明确提示用户自行承担法律风险。

ReaJason/xhs（约 2k stars）— Python SDK，封装小红书 Web API，支持登录/发帖/搜索。功能相对轻量，但同样基于逆向接口。

商业 SaaS：蝉妈妈、新红、千瓜等，月费数百至数千元，提供数据分析 + 自动化投放。这些服务商通过商业合作获取数据授权，合规性优于开源爬虫。

这是本文最关键的部分。小红书自动化的合规风险远高于其他平台：

1. 反爬条款违规 — 小红书《用户协议》明确禁止自动化抓取。违反可触发民事诉讼，平台有权索赔经济损失。

2. 刑法风险 — 大规模爬取用户数据可能触及"非法获取计算机信息系统数据罪"（刑法第 285 条）。2024-2025 年国内多家爬虫团队被追究刑责，刑期从数月到数年不等。

3. 个人信息保护法 — 抓取含个人信息的内容（用户名、头像、位置、消费记录）违反《个人信息保护法》(PIPL)。即使数据公开可见，批量采集仍需用户同意。

4. 封号风险 — 平台反爬持续升级（设备指纹 + 行为分析 + 风控模型），自动化账号封禁率极高。一次封号可能导致关联设备永久拉黑。

5. 执法趋势 — 近年执法趋严，多起爬虫刑事案件判罚明确。MediaCrawler 已在项目首页加免责声明，提醒用户自行承担法律后果。

维度	xurl (Twitter)	boss-channel-run	browser-use-setup	XHS 自动化
平台	X/Twitter	BOSS 直聘	通用浏览器	小红书
核心操作	发帖/互动	CDP 投放	浏览器操控	爬取/发帖
API 方式	官方 API	平台接口	Playwright	逆向 Web API
合规风险	中（有 API）	低（商业合作）	低	高（无官方 API）

关键差异：xurl 基于官方 API，合规风险可控。小红书无官方 API，所有自动化本质上都是"黑操作"。

不建议作为独立 skill 开发，但可提取通用组件。

可提取的通用能力：

Playwright 指纹伪装 — MediaCrawler 的反检测方案（浏览器指纹、Canvas 噪声、WebGL 参数）可复用到 browser-use-setup，作为通用浏览器反检测能力沉淀
Cookie/登录态管理 — 扫码登录 + Cookie 池方案可借鉴，用于任何需要登录态的浏览器自动化场景
数据结构化模型 — 笔记/用户/评论的数据模型设计，可用于其他内容平台的数据采集
多平台爬虫架构 — 模块化设计思路，未来扩展其他平台时参考

若需 XHS 数据的建议路径：

优先考虑蝉妈妈/新红等合规数据服务商 API。若需发帖自动化，建议仅做辅助创作工具（内容生成 + 人工发布），避免全自动链路。内容创作部分可由 script-writer skill 覆盖，人工确认后发布。

Sources:

MediaCrawler: https://github.com/NanmiCoder/MediaCrawler (Apache-2.0, 18k stars)
xhs Python SDK: https://github.com/ReaJason/xhs (MIT, 2k stars)
蝉妈妈: https://www.chanmama.com/ (商业 SaaS)
新红: https://www.newrank.cn/ (商业 SaaS)
xurl: Hermes Agent 内置技能
browser-use-setup: Hermes Agent 内置技能