KV Cache 与 Agent Memory：先划清事实与执行的边界

讨论 Agent Memory 时，文本、摘要、向量和 KV Cache 经常被放在同一张架构图里。但“都能减少重复计算”并不意味着它们拥有相同的语义。

事实源与派生视图

文本记忆可以被审计、编辑和删除，因此适合作为事实源。摘要和向量依赖某个生成模型或编码器，是可重新生成的派生表示。KV Cache 的约束更强：它还绑定模型权重、tokenizer、prompt 布局、位置编码和推理实现。

因此，更稳妥的定义是：

KV Cache 不是事实记忆，而是特定模型执行环境下的物化视图。

这个定义直接影响失效策略。当事实源发生修改时，系统不应试图“修补”旧缓存，而应沿依赖关系识别受影响的派生视图，并决定删除、延迟重建或按需重算。

仅给记忆对象增加一个递增版本号并不够。系统至少要记录：事实版本、派生版本、生成配置，以及视图所依赖的事实范围。这样才能判断一个缓存是“仍然正确”，还是仅仅“仍然存在”。

真正困难的部分不是缓存本身，而是在有限资源下决定保留什么：复用概率、重算成本、访问延迟、显存压力和错误代价必须进入同一个调度模型。这也是 Agent Memory 从数据结构走向系统问题的地方。