CodeGraph:预索引代码知识图谱 — 让 AI Agent 告别文件扫描,Token 消耗直降 92%
项目介绍
CodeGraph(仓库:colbymchenry/codegraph)是一套为 AI 编码代理设计的预索引代码知识图谱工具。它通过 tree-sitter 解析 AST,构建本地 SQLite 数据库存储符号关系、函数调用图和代码结构,让 AI 代理用图查询替代传统的 grep/glob/Read 文件扫描方式。
- Stars: 8,035(今日 +1,910,本周 +4,650)
- 语言: TypeScript(95.2%)
- 许可证: MIT
- 最新版本: v0.7.10(2026-05-19)
- 支持 Agent: Claude Code、Cursor、Codex CLI、OpenCode
基准测试:惊人的效率提升
在 6 个真实世界代码库上的测试结果(Claude Opus 4.6, Claude Code v2.1.91):
| 代码库 | 使用 CodeGraph | 不使用 CodeGraph | 提升幅度 |
|---|---|---|---|
| VS Code(TypeScript) | 3 次调用,17 秒,0 次文件读取 | 52 次调用,1 分 37 秒,~15 次读取 | 94% 更少调用 · 82% 更快 |
| Excalidraw(TypeScript) | 3 次调用,29 秒,0 次文件读取 | 47 次调用,1 分 45 秒,~20 次读取 | 94% 更少调用 · 72% 更快 |
| Claude Code(Python+Rust) | 3 次调用,39 秒,0 次文件读取 | 40 次调用,1 分 8 秒,~15 次读取 | 93% 更少调用 · 43% 更快 |
| Claude Code(Java) | 1 次调用,19 秒 | 26 次调用,1 分 22 秒 | 96% 更少调用 · 77% 更快 |
| Swift 编译器(Swift/C++) | 6 次调用,35 秒,0 次文件读取(25,874 文件,272,898 节点) | 37 次调用,2 分 8 秒 | 84% 更少调用 · 73% 更快 |
关键发现: 使用 CodeGraph 后,Agent 完全不再需要回退到文件读取——它完全信任图查询的结果。跨语言查询同样无缝工作。
核心功能
MCP 工具集
CodeGraph 通过 MCP(Model Context Protocol)提供 8 个工具:
| 工具 | 用途 |
|---|---|
codegraph_search |
FTS5 全文本符号搜索,跨代码库即时查找 |
codegraph_context |
构建任务特定的代码上下文 |
codegraph_callers |
查找谁调用了某个函数 |
codegraph_callees |
查找某个函数调用了什么 |
codegraph_impact |
分析修改的影响范围 |
codegraph_node |
获取符号详情 + 可选源代码 |
codegraph_files |
获取已索引的文件结构 |
codegraph_status |
检查索引健康状况和统计信息 |
工作原理
代码库 → tree-sitter AST 解析
↓
提取节点(函数、类)和边(调用、导入、继承)
↓
本地 SQLite 数据库(.codegraph/codegraph.db)+ FTS5 全文搜索
↓
解析调用链接 → 函数定义 → 处理导入、继承、框架模式
↓
原生文件监视器(FSEvents/inotify/ReadDirectoryChangesW),2 秒去抖
支持的语言和框架
19+ 种语言: TypeScript、JavaScript、Python、Go、Rust、Java、C#、PHP、Ruby、C、C++、Swift、Kotlin、Scala、Dart、Svelte、Vue、Liquid、Pascal/Delphi
13 种框架路由: Django、Flask、FastAPI、Express、Laravel、Rails、Spring、Gin/chi/gorilla/mux、Axum/actix/Rocket、ASP.NET、Vapor、React Router、SvelteKit
快速上手
# 安装(交互式):自动检测 Agent,写入 MCP 配置 + 说明
npx @colbymchenry/codegraph
# 初始化项目
cd your-project
codegraph init -i
# 重启你的 Agent
非交互式 / CI 安装:
codegraph install --target=auto --location=global --yes
手动 MCP 配置:
{
"mcpServers": {
"codegraph": {
"type": "stdio",
"command": "codegraph",
"args": ["serve", "--mcp"]
}
}
}
类似项目对比
| 项目 | 相似点 | 差异 |
|---|---|---|
| RTK | 都优化 AI 代理效率 | RTK 压缩 CLI 输出减少 Token;CodeGraph 用图查询替代文件扫描——两者可以完美互补 |
| AgentMemory | 都是持久化基础设施 | AgentMemory 存的是对话记忆;CodeGraph 存的是代码库结构 |
| claude-code-mcp-servers | MCP 工具集合 | 通用 MCP 工具集,CodeGraph 专注代码知识图谱这一垂直场景 |
结合当前 AI 发展背景的分析
CodeGraph 的爆火反映了 2026 年 AI 编码领域的一个核心趋势:从"让 AI 能写代码"到"让 AI 高效地理解和修改代码"。
Token 成本是关键瓶颈
随着 AI 编码代理的普及,Token 消耗成为实际落地的主要成本。当开发者每天使用 Claude Code 处理大型代码库时,每一次 grep、glob、cat 操作都在消耗宝贵的 Token。CodeGraph 通过预索引知识图谱,将领航阶段(exploration)的 Token 消耗降低了一个数量级。
与 RTK 的协同效应
RTK 和 CodeGraph 分别从两个维度解决同一个问题:
- RTK:减少送入模型的数据量(压缩 CLI 输出 60-90%)
- CodeGraph:减少 Agent行动的次数(减少 84-96% 的工具调用)
两者结合使用,理论上可以将大型代码库上 AI 编码的 Token 消耗降低 95% 以上。
"本地优先"的胜利
CodeGraph 的所有索引和查询都在本地 SQLite 数据库中完成,没有数据离开你的机器。在隐私意识日益增强的 2026 年,这一点对于企业级采用至关重要。
更新记录(2026-05-20)
- 首次上榜,当日 Stars 增长 1,910+
- 总 Stars 达到 8,035
- 最新版本 v0.7.10 于 2026-05-19 发布
- 同时位列今日榜 #3 和本周榜 #6
更新记录(2026-05-21)
- 今日再获 2,123 stars,总星数达 10,187
- 持续霸榜 GitHub Trending 首页,代码知识图谱赛道热度不减
- 继续以 70% 工具调用减少和 59% Token 节省的核心优势吸引开发者
|—
更新记录(2026-05-22)
- 三连霸榜! 今日再获 4,294 stars,总星数达 14,085,成为今日 GitHub Trending 冠军
- 连续三天位列今日热榜 Top 3,本周累计增长超 10,749 stars
- 开发者对 AI Agent 效率工具的需求持续爆发,预索引知识图谱正成为 AI 编码的标准配置
更新记录(2026-05-23)
- 四连霸榜! 今日再获 3,684 stars,总星数达 17,804
- 连续四天占据 GitHub 今日热榜,本周累计增长超 14,072 stars
- CodeGraph 已成为 AI 编码 Agent 代码理解领域的标杆性项目,预索引知识图谱的范式被广泛接受
- 开发者社区对其 35% 成本降低和 70% 工具调用减少的 benchmark 数据给予了高度认可
更新记录(2026-05-24)
- 今日再获 2,456 stars,总星数达 19,897
- 本周累计已获 15,909 stars(周榜第 2 名),是本周增长最迅速的开发者工具之一
- v0.9.3 版本(2026-05-22)发布后持续收割关注,预索引知识图谱方案正在成为 AI Agent 理解代码库的标准架构
- 跨日榜和周榜双榜同时在列,说明项目热度远超常规单日爆发