caveman 顶着一句玩笑标语(“why use many token when few token do trick”),底下却有个真实的工程点。它改写你的 AI agent 说话方式:去掉冠词、填充词和客套,保留技术内容,于是每条回复的输出 token 大幅减少。脑子还是大脑子,嘴巴变小。它能装进 Claude Code 和 30+ 个其它 agent,而且尽管是 meme 式品牌,它带 benchmark、有版本发布、有 CI。本文把实测现实和 meme 分开。
它到底做什么
caveman 是一套带级别的系统 prompt 规则,而非改模型:
/caveman lite去填充词但保留语法。/caveman full(默认)去冠词、用短同义词和片段。/caveman ultra缩写领域术语(DB、auth、config),用箭头表因果。/caveman wenyan走到极端的文言式精简。
除回复风格外,它还带配套命令:/caveman-commit 写精简 commit 信息,/caveman-review 写单行 PR 评论,/caveman-stats 实时统计省下的 token,/caveman-compress <file> 把 CLAUDE.md 或笔记文件改写成精简形态。另有 caveman-shrink,一个压缩工具描述的 MCP 中间件。
数字,诚实地说
README 公布了一个 benchmark(10 个任务),显示输出 token 平均减少约 65%(约从 1,214 降到 294),逐任务范围从二十几到八十几个百分点。caveman-compress 报告在内存文件上减少约 46% 的输入 token。项目自己说明的两条诚实限定:代码块不压缩(保持字节级准确),推理或思考 token 不受影响。所以节省在可见的回答上,而非模型的内部工作。它引用了一篇 2026 年的论文,主张简洁约束甚至能提升准确率:这是个有意思的角度,但应当读作一项主张,而非定论。
安装
# 一行,自动检测 agent(macOS / Linux / WSL / Git Bash)
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash
# Windows PowerShell
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex
# Claude Code 插件
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman
它需要 Node >= 18。在 Claude Code、Gemini CLI、opencode、OpenClaw 上自动激活;在 Cursor、Windsurf、Copilot 上每会话用 /caveman 开启(或 --with-init 让它常开)。
适合与不适合
适合:按 token 付费、且回答能承受精简的高频 agent 使用:代码评论、commit 信息、快速技术问答。不太适合:你想让 agent 长篇讲解或教学,精简会牺牲清晰。它也不会让 agent 更聪明或思考更便宜,只缩短它说出来的部分。把它读作输出侧的成本杠杆,用在冗长本属浪费的地方。
横向对比
| 项目 | 它压缩什么 | Stars(2026-06) |
|---|---|---|
| JuliusBrussee/caveman | agent 回复风格(输出 token) | ~71k |
| chopratejas/headroom | 工具输出、日志、RAG 块(输入) | ~22k |
| RyanCodrai/turbovec | 向量索引效率 | ~11k |
三者互补而非对手。caveman 削 agent 说的;headroom 削进 agent 的(工具输出和上下文);turbovec 在向量层做事。一个 token 敏感的配置可以同时用不止一个。
issue 里的坑
caveman 跑得很快(2026-04 创建后约两个月就到 71k star),开放 issue 更多反映跨 agent 集成之痛,而非核心缺陷:
- 在 VS Code 和 Copilot 上,用户报告并没真正减少 token 或额度(#506),所以节省取决于 agent。
- OpenCode 安装因缺命令文件和 schema 不匹配而坏掉(#494、#491)。
- 出现 Gemini 和 Antigravity 兼容问题(#492、#497)。
- 一个插件 SessionStart hook 因 SKILL.md 路径错误而可能静默退回最小规则集(#507)。
规律是:在 skill 真正加载并激活的地方,节省是真的,而在 30+ 个 agent 上的激活是脆弱环节。用 /caveman-stats 核实它在你的具体 agent 上确实起了作用。
FAQ
caveman 免费吗? 是。caveman 是 MIT 许可,作为 skill 或插件安装,无付费档。
caveman 真能省 token 吗? 输出侧能,其 10 任务 benchmark 平均减少约 65%,但取决于 agent:用户报告在 VS Code 和 Copilot 上没真正减少(#506),而 Claude Code、Gemini CLI、opencode、OpenClaw 会自动激活它。用 /caveman-stats 核实。
caveman 会让 agent 变笨吗? 不会。caveman 缩短 agent 说什么,而非它怎么想;代码块保持字节级准确、推理 token 不动。代价是散文清晰度而非正确性,需要解释时用 lite。
怎么在 Claude Code 装 caveman? 跑 claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman,或跨 agent 的 curl ... install.sh | bash 一行命令。
相关阅读
输入侧节省见 chopratejas/headroom;向量层见 RyanCodrai/turbovec。三者同处一个随着昂贵前沿模型一起长出来的 token 效率领域。