记忆系统 (RAG)

一句话概括

记忆系统通过本地 SQLite 数据库上的混合搜索引擎（向量 + FTS5 关键词 + MMR 重排序）提供检索增强生成，将相关上下文块注入每次 LLM 对话。

文件	行数	角色
`src/memory/manager.ts`	640	主 API：`MemoryIndexManager` 类 — 搜索、同步、状态、读取
`src/memory/manager-search.ts`	~200	搜索实现：`searchVector()`、`searchKeyword()`
`src/memory/manager-sync-ops.ts`	~1000+	文件索引：分块、嵌入、数据库写入
`src/memory/hybrid.ts`	149	混合合并：`mergeHybridResults()` 可配置权重
`src/memory/embeddings.ts`	296	Provider 工厂：`createEmbeddingProvider()` 多 provider 降级
`src/memory/mmr.ts`	~200	MMR 多样性重排序算法
`src/memory/temporal-decay.ts`	~150	时间衰减评分
`src/memory/query-expansion.ts`	~500	查询关键词提取以改善 FTS

机制	Token 成本	详情
搜索结果	500-2,000 tokens/轮	`maxResults` 个块 × `SNIPPET_MAX_CHARS`（700 字符）每块
每块成本	最多约 175 tokens	700 字符 / 4 ≈ 175 tokens
典型注入	5-10 块 × 175 = 约 875-1,750 tokens	取决于 `maxResults` 配置

agents.defaults.memorySearch.query:
  maxResults: 5-20（注入多少块）
  minScore: 0-1（质量阈值）
  hybrid:
    vectorWeight: 0-1
    textWeight: 0-1

依赖：config/（记忆设置）、sessions/（会话感知索引）、SQLite + sqlite-vec、chokidar（文件监视）
被依赖：agents/pi-embedded-runner/（通过 Pi SDK hooks 注入记忆上下文）、system-prompt.ts（记忆回忆指令）、auto-reply/reply/memory-flush.ts（回复后记忆刷新）