讨论 Agent Memory 时,文本、摘要、向量和 KV Cache 经常被放在同一张架构图里。但“都能减少重复计算”并不意味着它们拥有相同的语义。
事实源与派生视图
文本记忆可以被审计、编辑和删除,因此适合作为事实源。摘要和向量依赖某个生成模型或编码器,是可重新生成的派生表示。KV Cache 的约束更强:它还绑定模型权重、tokenizer、prompt 布局、位置编码和推理实现。
因此,更稳妥的定义是:
KV Cache 不是事实记忆,而是特定模型执行环境下的物化视图。
这个定义直接影响失效策略。当事实源发生修改时,系统不应试图“修补”旧缓存,而应沿依赖关系识别受影响的派生视图,并决定删除、延迟重建或按需重算。
版本需要回答什么
仅给记忆对象增加一个递增版本号并不够。系统至少要记录:事实版本、派生版本、生成配置,以及视图所依赖的事实范围。这样才能判断一个缓存是“仍然正确”,还是仅仅“仍然存在”。
研究问题
真正困难的部分不是缓存本身,而是在有限资源下决定保留什么:复用概率、重算成本、访问延迟、显存压力和错误代价必须进入同一个调度模型。这也是 Agent Memory 从数据结构走向系统问题的地方。