JuliusBrussee/caveman:一个让你的 AI agent 用更少 token 说话的 skill

caveman 顶着一句玩笑标语(“why use many token when few token do trick”),底下却有个真实的工程点。它改写你的 AI agent 说话方式:去掉冠词、填充词和客套,保留技术内容,于是每条回复的输出 token 大幅减少。脑子还是大脑子,嘴巴变小。它能装进 Claude Code 和 30+ 个其它 agent,而且尽管是 meme 式品牌,它带 benchmark、有版本发布、有 CI。本文把实测现实和 meme 分开。

它到底做什么

caveman 是一套带级别的系统 prompt 规则,而非改模型:

/caveman lite 去填充词但保留语法。
/caveman full(默认)去冠词、用短同义词和片段。
/caveman ultra 缩写领域术语(DB、auth、config),用箭头表因果。
/caveman wenyan 走到极端的文言式精简。

除回复风格外,它还带配套命令:/caveman-commit 写精简 commit 信息,/caveman-review 写单行 PR 评论,/caveman-stats 实时统计省下的 token,/caveman-compress <file> 把 CLAUDE.md 或笔记文件改写成精简形态。另有 caveman-shrink,一个压缩工具描述的 MCP 中间件。

数字,诚实地说

README 公布了一个 benchmark(10 个任务),显示输出 token 平均减少约 65%(约从 1,214 降到 294),逐任务范围从二十几到八十几个百分点。caveman-compress 报告在内存文件上减少约 46% 的输入 token。项目自己说明的两条诚实限定:代码块不压缩(保持字节级准确),推理或思考 token 不受影响。所以节省在可见的回答上,而非模型的内部工作。它引用了一篇 2026 年的论文,主张简洁约束甚至能提升准确率：这是个有意思的角度,但应当读作一项主张,而非定论。

安装

# 一行,自动检测 agent(macOS / Linux / WSL / Git Bash)
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

# Windows PowerShell
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

# Claude Code 插件
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman

它需要 Node >= 18。在 Claude Code、Gemini CLI、opencode、OpenClaw 上自动激活;在 Cursor、Windsurf、Copilot 上每会话用 /caveman 开启(或 --with-init 让它常开)。

适合与不适合

适合:按 token 付费、且回答能承受精简的高频 agent 使用:代码评论、commit 信息、快速技术问答。不太适合:你想让 agent 长篇讲解或教学,精简会牺牲清晰。它也不会让 agent 更聪明或思考更便宜,只缩短它说出来的部分。把它读作输出侧的成本杠杆,用在冗长本属浪费的地方。

横向对比

项目	它压缩什么	Stars(2026-06)
JuliusBrussee/caveman	agent 回复风格(输出 token)	~71k
chopratejas/headroom	工具输出、日志、RAG 块(输入)	~22k
RyanCodrai/turbovec	向量索引效率	~11k

三者互补而非对手。caveman 削 agent 说的;headroom 削进 agent 的(工具输出和上下文);turbovec 在向量层做事。一个 token 敏感的配置可以同时用不止一个。

issue 里的坑

caveman 跑得很快(2026-04 创建后约两个月就到 71k star),开放 issue 更多反映跨 agent 集成之痛,而非核心缺陷:

在 VS Code 和 Copilot 上,用户报告并没真正减少 token 或额度(#506),所以节省取决于 agent。
OpenCode 安装因缺命令文件和 schema 不匹配而坏掉(#494、#491)。
出现 Gemini 和 Antigravity 兼容问题(#492、#497)。
一个插件 SessionStart hook 因 SKILL.md 路径错误而可能静默退回最小规则集(#507)。

规律是:在 skill 真正加载并激活的地方,节省是真的,而在 30+ 个 agent 上的激活是脆弱环节。用 /caveman-stats 核实它在你的具体 agent 上确实起了作用。

FAQ

caveman 免费吗? 是。caveman 是 MIT 许可,作为 skill 或插件安装,无付费档。

caveman 真能省 token 吗? 输出侧能,其 10 任务 benchmark 平均减少约 65%,但取决于 agent:用户报告在 VS Code 和 Copilot 上没真正减少(#506),而 Claude Code、Gemini CLI、opencode、OpenClaw 会自动激活它。用 /caveman-stats 核实。

caveman 会让 agent 变笨吗? 不会。caveman 缩短 agent 说什么,而非它怎么想;代码块保持字节级准确、推理 token 不动。代价是散文清晰度而非正确性,需要解释时用 lite。

怎么在 Claude Code 装 caveman? 跑 claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman,或跨 agent 的 curl ... install.sh | bash 一行命令。

JuliusBrussee/caveman:一个让你的 AI agent 用更少 token 说话的 skill

Star 增长

它到底做什么

数字,诚实地说

安装

适合与不适合

横向对比

issue 里的坑

FAQ

相关阅读

仓库数据