三只貓
Rich Mindset Zone
richmindsetzone.com
← All posts

AI Agent 記憶層新挑戰者:remindb、TrueMemory、MemOS 實測 token 節省對比

AI Agent 記憶層新挑戰者:remindb、TrueMemory、MemOS 實測 token 節省對比

2026 年最便宜的 context window,是你永遠不需要傳入的那部分。本文聚焦三個正在悄悄改變格局的新工具——remindb、TrueMemory、MemOS——用數據告訴你,它們到底比 mem0 和 OriginTrail DKG 省在哪裡。


問題還是那個問題,但惡化了

如果你在 2025 年底搭過 AI agent,你對這個場景一定不陌生:

Agent 每次啟動,先讀一遍 CLAUDE.md,再讀幾個 context 文件,再拉一些歷史記錄——光是「熱身」就燒掉 8,000 到 15,000 個 input token。你的 agent 還沒開始做事,錢已經花了一半。

到 2026 年,情況更嚴峻。模型越來越強,但也越來越貴。Claude Sonnet 4 的 input 價格維持在 $3/1M tokens,Opus 4 更是 $15/1M。一個中型 SaaS 產品,每月光記憶層成本就能輕鬆燒掉 $3,000 至 $10,000。

記憶層已不是「優化方向之一」,而是 agent 成本的核心戰場。

業界在 2025 年底到 2026 年初湧現了一批新工具,試圖從不同角度解決這個問題。本文聚焦三個較新的挑戰者——remindbTrueMemoryMemOS——並對比已有成熟方案的 mem0 和 OriginTrail DKG,用數字說話。

(注:若你想了解 mem0、Zep、Letta 等主流方案的基礎介紹,可先參考我們 5 月 20 日的文章。本文假設你對這些工具已有基本認識,直接進入對比。)


三個新挑戰者

1. remindb — Coding Agent 的專用記憶層

GitHub: radimsem/remindb | Stars: 93 | 語言: Go | License: MIT

remindb 的定位非常精準,幾乎是為「coding agent 的 context 開銷」量身訂做的工具。

問題診斷

作者 radimsem 的洞察很清晰:coding agent 已經有記憶(CLAUDE.mdAGENTS.md、各種 context 文件),但問題是每次 session 都重新讀整批文件。原始 Markdown 是「wrong shape for memory」——每次讀都要付 full token cost,不管你這次的任務用不用到那些內容。

remindb 的答案:用 SQLite 建一個結構化記憶樹,讓 agent 可以精準 index 而不是盲目 skim。

核心架構

MemoryTree(層級索引)
  └── Hot Nodes(近期讀取,優先搜尋)
  └── Cold Nodes(自動觸發摘要壓縮)
        └── 保留 anchor + 版本歷史,但 token 數大幅縮減

每個 node 有:

  • Hash:內容指紋,無需重讀就知道有沒有變化
  • 溫度(Temperature):讀取時升溫,隨時間衰減;hot node 優先出現在搜尋結果
  • Token 計數:一眼知道這個 node 有多貴
  • 版本快照:Git-style diff,MemoryDelta 只同步變更部分

MCP 工具套件(直接整合 Claude Code、Codex、Gemini CLI、OpenCode): MemoryTree / Search / Fetch / Delta / Write / Summarize / Compile / Relate / Forget / Rollback / Pin

Token 節省數字

場景傳統全讀方式remindb節省比例
一般 coding project contextbaseline結構化索引67–75%
大型知識庫(如 450 檔 Obsidian vault)全掃描精準 node 定位99.8%
多 session 累積記憶線性增長token budget 封頂視 budget 設定

關鍵邏輯:remindb 的 token cost 由你設定的「budget ceiling」決定,不隨記憶庫增長而線性膨脹。傳統方案越用越貴,remindb 的邊際成本趨近於零。

適合場景: Coding agent(Claude Code、OpenCode)、個人知識管理、需要攜帶式單文件記憶的場景


2. TrueMemory — 神經科學架構的準確度刺客

GitHub: buildingjoshbetter/TrueMemory | License: AGPL-3.0

TrueMemory 的賣點不是「最省 token」,而是「最準確」——然後順帶省了 token。

架構哲學

TrueMemory 借鑑神經科學的「記憶編碼理論」:人腦不是把所有經歷都原封不動存起來,而是先用一個「編碼閘門(encoding gate)」過濾訊號與雜訊,再分層存儲。

具體實現:

  1. Encoding Gate:新記憶進入前先過濾,丟棄噪聲,只存「真正有資訊量」的事實
  2. 六層檢索架構:語義層、時序層、情節層、偏好層、決策層、技術層,按查詢類型組合
  3. 記憶分類:每條記憶自動標記為 personal / preference / decision / correction / temporal / technical / relationship

本地部署,單一 SQLite 文件,零 API key,零雲端。

Benchmark 數字(2026 年自報)

BenchmarkTrueMemorymem0(對比)Zep(對比)
LoCoMo93.0%66.9%75.14%
LongMemEval92.0%~49–63%63.8%
BEAM-1M(百萬 token 長記憶)SOTA未公開未公開

這些數字若屬實,是目前所有 live-retrieval 記憶系統中最高的。

⚠️ 重要提醒: TrueMemory 是個人項目,benchmark 為自報數字,尚未經過第三方獨立驗證。高準確度的代價是:AGPL-3.0 授權下商業使用需另外授權,且社群較小,production 支援有限。

Token 節省機制

TrueMemory 的節省來自「不存垃圾」:encoding gate 在寫入階段就把無效記憶過濾掉,導致記憶庫更精簡,檢索時需要的 context 自然更少。準確度高意味著更少的「多取一點以防萬一」——直接命中,不需要大量備選。

適合場景: 個人 agent、研究項目、準確度優先且可接受 AGPL 授權的場景


3. MemOS — 企業級記憶作業系統

GitHub: MemTensor/MemOS | 定位: Self-evolving Memory OS

MemOS 的定位最宏大:不是一個記憶「工具」,而是一個記憶「作業系統」。

設計理念

MemOS 把 LLM agent 的記憶分成三層統一管理:

  • Textual Memory(文字記憶):傳統的語義/向量記憶
  • Activation Memory(激活記憶):KV cache,可跨 session 重用
  • Parametric Memory(參數記憶):模型微調後的隱式知識

三層統一調度,避免同一知識在不同層重複存儲和重複計算。

關鍵功能

  • Cross-task Skill Reuse:Agent 做過的任務形成「技能記憶」,下次相似任務直接調用,不重新推理
  • Hybrid Retrieval:FTS5 全文搜尋 + 向量語義搜尋,在本地運行
  • Memory Viewer Dashboard:可視化記憶庫,知道 agent 「記住了什麼」
  • Multi-agent Memory Sharing:多個 agent 可共享同一記憶庫

Token 節省數字

方案Token 節省說明
MemOS Cloud Plugin72%相比無記憶層基準
MemOS Local Plugin35.24%(官方標榜)純本地,100% on-device
對比 OpenAI Memory+43.70% 準確度準確度顯著提升

2026 年 3 月推出的 OpenClaw Plugin 整合版,宣稱在 token 使用量降低 72% 的同時支援多 agent 記憶共享。

適合場景: 企業級 agent 部署、多 agent 協作、需要技能積累和知識沉澱的長期項目


五大方案完整對比表

維度remindbTrueMemoryMemOSmem0OriginTrail DKG
定位Coding agent 記憶神經科學高準確度企業記憶 OS通用記憶壓縮去中心化共享記憶
Token 節省67–99.8%間接(精準檢索)35–72%73–93%多 agent 省 40%
準確度(LoCoMo)未公開93.0%(自報)未公開66.9%N/A
架構SQLite 節點樹神經科學六層三層記憶 OS向量 + LLM 提取去中心化知識圖譜
本地部署✅ 單 .db 文件✅ 本地 SQLite✅ Local Plugin部分(On-prem 付費)⚠️ 需 TRAC 代幣
MCP 整合✅ 原生支援✅ Claude Code hooks✅ OpenClaw Plugin❌ REST API
多 agent 共享✅ 原生
部署難度低(單二進制)低(本地安裝)中(Python 環境)低(SDK)高(需區塊鏈)
開源授權MITAGPL-3.0Apache-2.0部分 MITMIT
商業使用✅ 自由⚠️ 需另購 license有免費層
生產就緒⚠️ 早期(93 stars)⚠️ 個人項目✅ 有 Cloud 版❌ 公測中
技術支援社群個人企業級企業級社群

Token 成本估算:實際數字對比

以一個典型 coding assistant agent 為例:

基本假設:

  • 每次 session 平均啟動:讀 5 個 context 文件,共約 12,000 tokens
  • 使用 Claude Sonnet($3/1M input tokens)
  • 每日 100 個 agent session,每月 3,000 session

無記憶層(每次全讀)

12,000 tokens × 3,000 session/月 = 36,000,000 tokens
成本:$108/月(僅啟動 context)

使用 remindb(67% 節省)

12,000 × 33% = 3,960 tokens/session(精準 node 定位)
3,960 × 3,000 = 11,880,000 tokens
成本:$35.6/月
節省:$72.4/月(67%)

使用 mem0(73% 節省)

3,240 tokens/session
3,240 × 3,000 = 9,720,000 tokens
成本:$29.2/月 + mem0 訂閱($19–249/月)
實際總成本:$48–278/月(視方案)

重點: remindb 是 MIT 授權開源工具,本地部署無訂閱費。對於中小型項目,零訂閱的 67% 節省,實際到手比需付費的 73% 節省更划算。

使用 TrueMemory(準確度節省)

TrueMemory 沒有公開直接的 token 節省百分比,但高準確度(93%)意味著:

  • 平均需要的檢索候選數更少(直接命中 vs 廣撒網)
  • 估算節省:50–70%(相比全文 context)

大型知識庫場景(remindb 450 檔 Obsidian vault 案例)

傳統做法:掃描 450 個文件 ≈ 450,000 tokens(估算)
remindb:精準 node 定位 ≈ 900 tokens(99.8% 節省)
每次查詢節省:449,100 tokens = $1.35/次
每月 1,000 次查詢:節省 $1,350

這個場景的節省是數量級的差異,不是百分比的問題。


架構選型的真正問題

Token 節省數字很好看,但選工具不能只看 benchmark。以下是更實際的決策框架:

你的記憶主要是什麼形態?

  • 非結構化文字(Markdown、對話記錄)→ mem0 或 TrueMemory
  • 結構化代碼知識(架構決策、API 文檔)→ remindb
  • 時序事件序列(誰在什麼時候說了什麼)→ Zep/Graphiti(見前文)
  • 跨 agent 共享知識 → MemOS 或 OriginTrail DKG

你的部署限制是什麼?

  • 零雲端、合規要求嚴格 → remindb(.db 文件,完全本地)或 TrueMemory(本地 SQLite)
  • 想快速上線、唔想管基礎設施 → mem0 Cloud
  • 企業級支援、需要 SLA → mem0 Enterprise 或 MemOS Cloud

你的 agent 架構是什麼?

  • 單一 coding agent(Claude Code、OpenCode)→ remindb 最原生
  • 多 agent 協作 → MemOS(本地共享)或 OriginTrail DKG(去中心化)
  • 消費者 app(個人化推薦、聊天)→ mem0

你的商業模式是什麼?

  • 個人/研究 → TrueMemory(AGPL 免費)、remindb(MIT 免費)
  • 開源項目 → remindb(MIT)、MemOS(Apache-2.0)
  • 商業 SaaS → mem0(有授權支援)、MemOS Cloud;避開 TrueMemory AGPL

使用場景推薦矩陣

場景首選備選避開
Claude Code / OpenCode 個人 coding agentremindbTrueMemoryOriginTrail DKG
準確度要求極高(醫療、法律)TrueMemoryZep/GraphitiLangMem
企業多 agent 系統MemOSmem0 EnterpriseOriginTrail DKG(未成熟)
快速上線 SaaS(1-2 週 MVP)mem0MemOS Cloudremindb(早期)
個人知識庫(Obsidian / 大型 markdown)remindbmem0全文 context
多 agent swarm + 記憶可驗證OriginTrail DKG(等成熟)MemOSremindb
預算極限(零訂閱費)remindbTrueMemorymem0 Pro

結論:新工具的崛起,不是替代而是分層

mem0 在 2025–2026 年確立了「記憶壓縮層」這個品類,但它的設計是通用的——通用的代價是「在每個場景都不是最優」。

2026 年出現的這批新工具,走的是相反路線:

  • remindb 說:coding agent 的問題跟客服 agent 不一樣,我只解決 coding agent 的問題,但解決得更徹底(99.8%)
  • TrueMemory 說:現有工具準確度太低,我從神經科學出發重建架構,準確度 93% 比什麼都重要
  • MemOS 說:記憶不是一個功能,是一個系統;你需要的是 OS,不是插件

2026 年的記憶層選型建議:

  1. Coding agent(Claude Code / OpenCode)→ 先試 remindb:MIT 授權,單文件部署,MCP 原生,67–99.8% 節省,沒有訂閱費負擔
  2. 準確度優先的嚴肅應用 → 留意 TrueMemory,但等待第三方 benchmark 驗證
  3. 快速商業 MVP → mem0 仍然是最安全的選擇(生態成熟、文檔完善)
  4. 企業多 agent 系統 → MemOS,技術棧更完整,有 Cloud 版支援
  5. OriginTrail DKG → 繼續等,v9 公測還沒完成,production 部署太早

記憶層不再是「加一個 mem0 就搞掂」的選擇題。根據你的 agent 類型、部署限制、商業授權需求,答案可能完全不同——而且每種選擇的 token 節省數字差距,可以是每月幾百到幾千美元的真實開支差異。


資料來源(2026):