三只貓
Rich Mindset Zone
richmindsetzone.com
← All posts

AI Agent 記憶層大亂鬥:mem0 vs Zep vs OriginTrail DKG 實測 token 節省對比

AI Agent 記憶層大亂鬥:mem0 vs Zep vs OriginTrail DKG 實測 token 節省對比

你的 AI agent 每次對話都要帶幾萬個 token 的「前情提要」嗎?2026 年,記憶層已經成為 agent 成本控制的核心戰場。本文用真實數據拆解各大方案,話畀你知邊個最慳錢。


引言:記憶,係 AI agent 最貴的開支之一

搭過 AI agent 的人都知,context window 唔係免費的。

一個客服 agent,每次對話平均要帶入 3,150 個 input token,加上歷史記錄越積越多,話唔定幾個月後每次問候語都要先過一遍 10,000 token 的對話記錄。對於每日有 10,000 活躍用戶的應用,光係 token 成本每月隨時燒掉 $2,000 至 $5,000 美元。

問題唔係「要唔要記憶」,而係「點樣記得更聰明」。

2025-2026 年湧現了一批專門解決呢個問題的工具:mem0、Zep/Graphiti、OriginTrail DKG、LangMem、Letta……各有各的架構哲學,各有各的適用場景。本文逐一拆解,附帶實際 token 成本估算,等你睇完即刻知道揀邊個。


各工具逐一介紹

1. Mem0 — 目前最主流的記憶壓縮層

定位: 智能記憶提取 + 向量檢索,幫 agent 只帶「最相關」的記憶入 prompt。

架構:

  • 三層存儲:工作記憶(in-context)、短期記憶(Redis/快取)、長期記憶(向量 DB)
  • 單次提取(single-pass hierarchical extraction):每次對話只做一次 LLM 調用提取記憶,唔係每句都處理
  • 多信號檢索(multi-signal retrieval):結合語義相似度、時間權重、重要性評分

Token 表現(2026 年 4 月新演算法):

  • LoCoMo benchmark 平均每次檢索:~6,956 tokens
  • 全文 context 基準線:~26,031 tokens
  • 節省比例:約 73%
  • 某些場景(客服)可達 93% 節省(1,800 tokens vs 26,000 tokens)

準確度: LOCOMO benchmark 得分 66.9%(圖譜增強版 Mem0g 達 68.4%)

定價:

  • Hobby(免費):10K 記憶,1K 次檢索/月
  • Starter($19/月):50K 記憶,5K 次檢索
  • Pro($249/月):無限記憶 + 圖譜記憶 + 分析功能
  • Enterprise:自訂(支援 on-prem / HIPAA)

適合: 個人化推薦、客服 agent、需要快速部署的 SaaS 產品


2. Zep / Graphiti — 時序知識圖譜派

定位: 不只記「內容」,更記「時間關係」,知道你昨天講什麼、上個月改了什麼決定。

架構:

  • 底層用自家開源的 Graphiti 庫建構時序知識圖譜(temporal knowledge graph)
  • 每條記憶都帶時間戳記,支援「這個事實在哪個時間點被更新」的查詢
  • 背景非同步處理:agent 對話唔需要等記憶入庫

Token 表現:

  • Zep 自報(反駁 Mem0 benchmark 後):LOCOMO 得分 75.14%(高於 Mem0 的 66.9%)
  • LongMemEval(測試時序查詢):Zep 63.8% vs Mem0 49.0%(使用 GPT-4o)
  • 記憶體佔用:Mem0 指 Zep 在某些配置下可達 600,000+ tokens,但 Zep 對此有爭議,指係測試配置問題

成本取捨: 圖譜建構比純向量貴,高頻寫入場景成本明顯上升;低頻(每日/每週批次)場景則可接受。

適合: 需要時序推理的 agent(法律、財務、醫療記錄)、複雜多 session 追蹤


3. OriginTrail DKG — 去中心化 + 可驗證記憶

定位: 將 AI agent 記憶發布到去中心化知識圖譜,任何 agent 都可共享、查詢、驗證。

架構:

  • 三層架構:區塊鏈層(錨定記憶,不可篡改) + 知識圖譜層(RDF triple 存儲) + LLM 整合層(dRAG 框架)
  • 每條「知識資產」(Knowledge Asset)都有 Merkle proof,可驗證來源
  • 多 agent 共享記憶池:一個 agent 的發現可即時被另一個 agent 引用
  • TRAC 代幣:用來支付記憶發布、更新費用

Token / 成本表現:

  • 多 agent 協作場景:DKG 協調比傳統方法快 60%,總 token 成本低 40%(因為唔需要每個 agent 各自維護重複記憶)
  • 但單 agent 場景:因多了區塊鏈錨定步驟,延遲比 mem0/Zep 高,成本優勢不明顯
  • 查詢成本:除 LLM token 外,還需支付 TRAC(加密貨幣),成本波動性較大

v9 狀態(2026 年 5 月): 仍在公測 testnet,未到 production-ready

適合: 多 agent swarm 協作、需要記憶可驗證性的場景(監管合規、供應鏈 AI)


4. LangMem — LangChain 生態原生

定位: LangGraph 的長期記憶層,支援語義、情節、程序三種記憶類型。

Token 表現:

  • LOCOMO 得分:58.10%(低於 Mem0 和 Zep)
  • p95 搜尋延遲:59.82 秒 — 對即時互動 agent 完全不可接受

適合: 已深度使用 LangChain 生態、不需要即時回應的批次任務


5. Letta(前身 MemGPT)— Agent 自主管理記憶

定位: 賦予 agent「工具」去自行讀寫記憶,類似 OS 管理 RAM/磁碟的概念。

架構: Agent 決定什麼值得記、什麼可以丟棄,而非外部系統被動提取。

適合: 長期運行的自主 agent、需要 agent 自我反思和記憶整理的場景


橫向比較表格

維度Mem0Zep/GraphitiOriginTrail DKGLangMemLetta
架構向量 + LLM 提取時序知識圖譜去中心化圖譜多類型混合Agent 自管
token 節省73–93%中等(圖建構貴)多 agent 省 40%視場景
LOCOMO 準確度66.9%75.14%*N/A58.1%N/A
即時延遲0.71s 中位數低–中高(鏈上錨定)59.82s p95
多 agent 共享部分原生支援
可驗證性是(Merkle proof)
部署難度低(SDK 即用)高(需 TRAC 代幣)低(LangChain 內)
開源部分是(Graphiti)是(DKG v9)
免費方案Testnet
生產就緒未(公測中)

*Zep 自報數字,對 Mem0 benchmark 配置有爭議


實測數據:token 成本估算

以一個典型客服 agent 為例:

  • 每次對話平均:3,150 input tokens + 400 output tokens
  • 使用 Claude Sonnet($3/$15 per 1M tokens)
  • 每日活躍用戶:10,000 人,每人平均 3 次對話

無記憶層(全文 context 方案)

隨著歷史積累,假設平均 context 長度增長至 26,000 tokens:

項目數量成本
Input tokens/月26,000 × 3 × 10,000 × 30~23.4B tokens
Input 成本23.4B × $3/1M$70,200/月

使用 Mem0(單次檢索 ~6,956 tokens)

項目數量成本
Input tokens/月6,956 × 3 × 10,000 × 30~6.26B tokens
Input 成本6,956 × $3/1M$18,780/月
Mem0 Pro 訂閱企業方案~$500–1,000/月(估)
總計約 $19,780/月
節省$50,420/月(72%)

使用 Zep/Graphiti(時序圖譜,假設有效 context ~8,000 tokens)

項目估算
Token 成本約 $21,600/月
Zep 服務費視用量
適合場景需要時序準確性的場景,token 稍貴但準確度更高

OriginTrail DKG(多 agent 場景)

項目估算
Token 成本(省 40%)約 $42,120/月
TRAC 代幣費用波動,視網絡擁堵
備注單 agent 場景性價比低,多 agent swarm 才值得考慮

選邊站:適用場景指南

選 Mem0,如果你:

  • 需要快速上手,SDK 幾行 code 搞掂
  • 做個人化推薦、聊天機器人
  • 成本敏感,要最大化 token 節省
  • 需要雲端 + on-prem 靈活性

選 Zep/Graphiti,如果你:

  • Agent 需要回答「你上個月話過點?」這類時序問題
  • 做法律、醫療、財務類 agent,記憶準確性比速度重要
  • 願意接受略高的圖建構成本換取更高準確度

選 OriginTrail DKG,如果你:

  • 搭建多 agent swarm,需要 agent 之間共享知識
  • 監管合規場景需要記憶來源可驗證
  • 有加密貨幣基礎設施接受 TRAC 代幣費用
  • 不急: v9 仍在公測,production 部署要等

選 LangMem,如果你:

  • 已深度綁定 LangChain/LangGraph 生態
  • 跑批次任務,唔需要即時回應
  • 唔想多加一個外部服務

選 Letta,如果你:

  • 搭建長期自主 agent,需要 agent 自行決定記什麼
  • 喜歡 MemGPT 的哲學,相信 agent 應該自主管理記憶

結論:記憶層唔係可選項,係必備基礎建設

2026 年的 AI agent 開發,記憶層已經從「加分功能」變成「成本控制核心」。用全文 context 的做法,規模一上去隨時每月多燒幾萬美元。

最慳錢方案:Mem0(開箱即用,token 節省 73-93%,有免費方案)

最高準確度:Zep/Graphiti(時序查詢碾壓,但 token 消耗較高)

最有潛力但最未成熟:OriginTrail DKG(多 agent 場景革命性,但 v9 公測中,不建議現在 production 用)

如果你今天要做決定:先上 Mem0 的免費層做 POC,確認 token 節省比例符合預期,再決定要不要換更複雜的方案。 大部分場景,Mem0 已經夠用,而且便宜。

記憶層的競爭才剛開始,OriginTrail DKG 成熟後,多 agent 協作的格局可能會重新洗牌——但那是 2027 年的故事了。


資料來源(2025-2026):