RTK:CLI代理 — 将LLM Token消耗降低60-90%的零依赖Rust工具
项目介绍
CLI proxy that reduces LLM token consumption by 60-90% on common dev commands. Single Rust binary, zero dependencies.
RTK(全称 Runtime Token Reducer)是一个用 Rust 编写的 CLI 代理工具,它静静地坐在你的终端和 AI 编码代理之间,透明地拦截并压缩命令输出,然后再将它们送入 LLM 的上下文窗口。这意味着你的 Claude Code、Codex、Cursor 等 AI 代理在读取 git status、cargo test、ls -la 等命令输出时,消费的 token 量可以降低 60-90%。
- ⭐ Stars: 51,026 | 🍴 Forks: 3,109 | 🔧 语言: Rust (92.2%)
- 📜 许可证: MIT(README标注)/ Apache 2.0(GitHub元数据)
- 👥 贡献者: 90+ | 🏠 官网: https://www.rtk-ai.app
为什么需要 RTK?
当你使用 AI 编码代理时,每次执行命令的输出都会被完整送入 LLM 上下文窗口。一个简单的 git status 可能输出 2,000 tokens,cargo test 的输出可能高达 25,000 tokens。这些原始输出中大部分是冗余信息——LLM 只关心关键部分,比如"测试失败了"或者"有文件被修改了"。
RTK 的核心洞察:不压缩代码,只压缩命令输出。因为命令输出(而非源代码)才是 AI 编码代理的 token 消耗大头。
核心功能
1. 智能过滤与压缩
RTK 为 100+ 种常用命令内置了智能过滤策略:
| 命令 | 标准输出 | RTK 处理后 | 节省 |
|---|---|---|---|
ls / tree |
2,000 tokens | 400 tokens | -80% |
cat / read |
40,000 tokens | 12,000 tokens | -70% |
git add/commit/push |
1,600 tokens | 120 tokens | -92% |
cargo test / npm test |
25,000 tokens | 2,500 tokens | -90% |
| 30分钟Claude Code会话总计 | ~118,000 tokens | ~23,900 tokens | -80% |
2. 零开销架构
Claude --git status--> RTK --> git
^ | |
| ~200 tokens | filter |
+------- (filtered) ---+----------+
RTK 作为一个透明代理运行,开销 < 10ms。当某个命令的过滤策略出错时,原始输出通过 [tee] 机制保存,LLM 可以重新读取而无需重新执行命令。
3. 支持的 AI 平台
RTK 支持 13+ 个 AI 编码代理的一键接入:
- Claude Code / Copilot / Gemini CLI / Codex:
rtk init -g - Cursor:
rtk init -g --agent cursor - Windsurf:
rtk init --agent windsurf - Cline / Roo Code / Kilo Code / Hermes / OpenCode / Antigravity: 均支持
4. 完整的命令覆盖
文件操作: ls, read, find, grep, diff, smart(两行启发式摘要)
版本控制: git status, log, diff, add/commit/push/pull
GitHub CLI: gh pr list/view, gh issue list, gh run list
测试运行器: pytest(-90%), go test(-90%), cargo test(-90%), jest, vitest, playwright
构建与Lint: tsc, next build, cargo build/clippy(-80%), ruff check(-80%), golangci-lint(-85%)
包管理器: pnpm list, pip list/outdated, bundle install
云服务: aws sts/get-caller-identity, docker ps/images/logs, kubectl pods/logs/services
快速上手
安装
# macOS / Linux 一键安装
brew install rtk
# 或
curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh
# 通过 Cargo 安装
cargo install --git https://github.com/rtk-ai/rtk
初始化
# 为 Claude Code 配置(自动注入钩子)
rtk init -g
# 验证安装
rtk --version
rtk gain # 查看 Token 节省统计
Token 分析
rtk gain # 查看汇总统计
rtk gain --graph # 可视化图表
rtk gain --daily # 每日趋势
rtk gain --all --format json # 完整 JSON 输出
rtk discover # 发现尚未利用的优化机会
rtk session # 查看各会话的采用情况
类似项目对比
| 特性 | RTK | 手动优化 | 无优化 |
|---|---|---|---|
| 自动拦截 | ✅ 透明代理 | ❌ 需要手动写 | ❌ |
| 零依赖 | ✅ 单Rust二进制 | ❌ 需要shell脚本 | ✅ |
| 开销 | <10ms | 取决于实现 | 0 |
| 支持命令数 | 100+ | 自定义 | 0 |
| 支持AI代理数 | 13+ | 自定义 | N/A |
| 隐私保护 | ✅ 遥测默认关闭 | ✅ | N/A |
结合当前技术背景的分析
AI 编码代理的 Token 经济学
2026 年,大模型 API 的成本虽然持续下降,但 AI 编码代理的单会话 token 消耗量却在快速增长。一个典型的 Claude Code 会话消耗 10-50 万 tokens,其中约 60% 是命令输出(而非代码)。对于重度用户,月度 token 费用可达数百美元。
RTK 精准地切入了这个痛点:它不改变模型的推理质量,只减少送入模型的冗余数据。80% 的压缩率意味着 80% 的成本节省。
从"更多模型"到"更聪明地使用"
2025 年的趋势是寻找更便宜的模型(如 DeepSeek V3、Gemma 3)。但 2026 年的新趋势是——在模型不变的前提下,优化输入数据的效率。RTK、CodeGraph(预索引知识图谱)等项目共同代表了这一方向。
隐私意识驱动的本地工具
RTK 的另一个重要特征是隐私:遥测默认关闭,不收集源代码、文件路径、命令参数、环境变量或个人数据。在 AI 隐私法规日益严格的背景下,这种"默认安全"的设计正在成为工具链的标配。
对开发者的启示
- 如果你使用 AI 编码代理,RTK 是最快见效的工具——安装 30 秒,立即节省 60-90% token
- 如果你是工具链开发者,RTK 展示了"中间件"模式的潜力——不取代现有工具,而是在现有工具之上加一层优化
- 如果你关注 AI 成本控制,RTK + CodeGraph + AgentMemory 的组合可以将 coding agent 的运营成本降低一个数量级