项目介绍
AgentMemory 是一个专为 AI 编码代理设计的持久化记忆系统,其核心承诺简洁而有力——“你的编码代理记住一切,无需重复解释”。
会话1:“给 API 添加认证” — Agent 编写代码、运行测试。AgentMemory 捕捉了整个过程。
会话2:“现在加限流” — Agent 已经知道你在 src/middleware/auth.ts 中使用 jose。零重复解释,立即开始工作。
由 rohitg00 开发,该项目采用 TypeScript(81.3%)构建,获得 14,118+ Stars,今日新增 1,609 Stars,本周新增 7,830 Stars。基于 Apache-2.0 协议,并由 iii 引擎驱动。
核心亮点:LongMemEval-S 基准测试第一
在 LongMemEval-S 基准测试中,AgentMemory 以 95.2% 的 R@5 召回率 和 88.2% 的 MRR 位列第一,大幅领先同类产品:
| 系统 | LongMemEval-S R@5 | MRR | 年化 token 成本 |
|---|---|---|---|
| agentmemory | 95.2% | 88.2% | ~$10 (~170K tokens) |
| BM25-only fallback | 86.2% | 71.5% | – |
| LLM-summarized | – | – | ~$500 |
| 粘贴完整上下文 | – | – | 不可能(窗口溢出) |
| mem0(53K stars) | 68.5% | – | 不定 |
| Letta/MemGPT(22K stars) | 83.2% | – | 核心记忆在上下文中 |
与内置记忆(CLAUDE.md / .cursorrules)的对比
| 特性 | 内置记忆 | agentmemory |
|---|---|---|
| 规模 | ~200 行上限 | 无限 |
| 搜索 | 全部加载到上下文 | BM25 + 向量 + 图(Top-K) |
| Token 成本 | 240 条观察需 22K+ tokens | ~1,900 tokens(节省 92%) |
| 跨 Agent | 每个 Agent 独立文件 | MCP + REST(任何 Agent) |
| 可观测性 | 手动读取文件 | 实时查看器(:3113) |
快速上手
# 全局安装
npm install -g @agentmemory/agentmemory
# 启动记忆服务器(默认端口 :3111)
agentmemory
# 运行演示,验证记忆召回效果
agentmemory demo
# 连接 Claude Code
agentmemory connect claude-code
30秒快速测试:
# 终端 1:启动记忆服务器
npx @agentmemory/agentmemory
# 终端 2:运行演示(搜索"database performance optimization"能找到"N+1 query fix")
npx @agentmemory/agentmemory demo
打开 http://localhost:3113 即可实时观察记忆的构建过程。
记忆架构:4层记忆体系
PostToolUse hook fires
-> SHA-256 去重(5分钟窗口)
-> 隐私过滤(剥离密钥、API token)
-> 存储原始观察
-> LLM 压缩 -> 结构化事实 + 概念 + 叙述
-> 向量嵌入(6种供应商 + 本地)
-> 索引到 BM25 + 向量
会话结束 hook 触发
-> 总结会话
-> 知识图谱提取(如果启用)
-> 槽位反思(如果启用)
会话开始 hook 触发
-> 加载项目配置文件
-> 混合搜索(BM25 + 向量 + 图 + RRF 融合)
-> Token 预算(默认 2000 tokens)
-> 注入到对话
4层记忆整合:
| 层级 | 内容 | 类比 |
|---|---|---|
| 工作记忆 | 原始观察 | 短期记忆 |
| 情景记忆 | 压缩的会话总结 | “发生了什么” |
| 语义记忆 | 提取的事实与模式 | “我知道什么” |
| 程序记忆 | 工作流与决策模式 | “怎么做” |
搜索机制:三流 RRF 融合
| 流 | 启用条件 |
|---|---|
| BM25(词干提取 + 同义词扩展) | 始终启用 |
| 向量(密集嵌入的余弦相似度) | 配置了嵌入供应商 |
| 图(知识图谱 BFS 遍历) | 查询中检测到实体 |
集成支持(20+ Agent)
一套记忆服务器,通过 MCP、插件或 REST API 共享给所有 Agent:
- Claude Code:插件 + 12 hooks + MCP
- Codex CLI:插件 + 6 hooks + MCP
- Cursor:MCP 服务器
- Gemini CLI:MCP 服务器
- OpenCode:22 hooks + MCP + 插件
- Aider:REST API
行业分析
AgentMemory 的火爆(单日 1.6K,单周 7.8K Stars)反映了一个深刻的行业共识:
1. 记忆是 AI Agent 的"圣杯"
从 2025 年到 2026 年,AI 编码 Agent 的能力已经有了质的飞跃,但一个核心问题始终未解决:每次新会话 Agent 都像失忆一样。AgentMemory 通过将 Karpathy 提出的 LLM Wiki 模式产品化,以不到 $10/年的 token 成本解决了这个问题,这正是它获得社区热捧的根本原因。
2. 跨 Agent 共享记忆才是真正的价值
AgentMemory 的核心理念是一套记忆服务器可以被 20+ 种 Agent 共享。这对日常使用多种编码工具的开发者来说是巨大的效率提升——Claude Code 中学会的项目结构,Cursor 中也能直接使用,反之亦然。
3. 本地优先 + 开源 = 信任
在 2026 年,开发者在选择 AI 工具时越来越关注隐私和数据主权。AgentMemory 的本地嵌入模型(all-MiniLM-L6-v2)无需任何 API Key,所有数据存储在本地,这在高星标的开源项目中越来越成为标配。
更新记录(2026-05-21)
- 本周新增 7,976 stars,总星数达 15,237
- 持续高增长,AI 代理记忆已成为开发者刚需
- v0.9.21 最新版本,43 个 release 持续迭代
更新记录(2026-05-23)
- 本周新增 6,891 stars,总星数达 16,512
- AI 编码代理持久化记忆赛道的领跑者,持续高增长
- LongMemEval-S 基准测试 R@5 达 95.2%,技术优势明显
- 随着 AI Agent 从短期对话走向长期协作,持久化记忆已成为不可或缺的基础设施