大模型也会“健忘”？一文说清它的“短期记忆”和“长期记忆”

你有没有遇到过这样的情况：跟AI聊天聊到一半，它突然“失忆”了，问它刚才说过什么，它一脸茫然？
或者，你希望它记住你上次提过的偏好——比如“我不吃花生”，结果下次再聊，它又忘了？这其实不是AI“笨”，而是它的“记忆机制”有讲究。就像人脑有短期记忆和长期记忆一样，大模型也有两种不同的“记东西”的方式。今天，我们就用最直白的话，讲清楚：什么是大模型的短期记忆和长期记忆？它们有什么区别？怎么工作？又用在哪些地方？

短期记忆：像“临时便签”，只在当前对话里有效

短期记忆，顾名思义，就是大模型在一次对话中能“记住”的内容。
比如你问：“我叫小明。”
接着问：“我叫什么？”
它能答：“小明。”
这就是靠短期记忆。

原理很简单：每次你发消息，系统都会把之前的对话历史一起打包，塞进给大模型的请求里（也就是“prompt”）。模型看到这些上下文，就知道你在说什么。

但问题来了——大模型的“脑子”容量有限。这个容量叫“上下文窗口”，比如常见的有4K、8K、甚至128K个token（可以粗略理解为“字数”）。一旦对话太长，旧的内容就会被“挤出去”，就像你写满一张便签纸，只能撕掉前面的字腾地方。

举个例子：

在工具中，你可以设置“上下文轮数”。假设设为3轮：

第1轮：你好
第2轮：我叫小李
第3轮：我喜欢咖啡
第4轮：你记得我叫什么吗？

这时，第1轮的“你好”可能就被丢掉了！模型只看到后三轮，所以还能答“小李”。但如果对话继续到第6轮，连“我叫小李”都可能被挤出，它就真“忘了”。

短期记忆的局限：

只在单次会话 内有效，关掉聊天窗口就清零；
越长越贵（按token计费）；
上下文太长反而影响模型表现（研究显示：长上下文可能导致“注意力稀释”）；
无法跨对话共享信息。

所以，短期记忆就像你手里的便签纸——方便、即时，但一松手就没了。

2. 长期记忆：像“个人档案”，能跨天、跨月记住你

那怎么让AI真正“记住”你？比如记住“你对花生过敏”“你上周在上海出差”？
这就需要长期记忆。

长期记忆的核心思想：把重要信息存到外部数据库，下次需要时再“查出来”告诉模型。

技术实现：通常用 RAG（检索增强生成） 技术。
步骤如下：

存储

把关键信息（如“用户对花生过敏”）转成向量（一种数学表示），存进向量数据库（如FAISS、Pinecone）；

检索

当你提问时，系统先分析你的问题，去数据库里“找”相关记忆；

注入

把找到的记忆片段加到当前对话的上下文中；

回答

模型结合新上下文，给出更准确的回答。

长期记忆还能分类：

情境记忆

记录具体事件，如“2024年5月10日，用户在上海出差，提到喜欢Manner咖啡”；

语义记忆

存储事实，如“用户对花生过敏”；

程序记忆

记住操作流程，如“如何调用某API提交报销”。

举个实际场景：
你在公司用AI助手处理差旅报销。

第一次对话：你说“我要订上海到北京的机票，经济舱”。
助手记下：用户偏好经济舱、常飞京沪线。
一个月后，你又说：“帮我订票。”
助手自动检索长期记忆，直接问：“还是经济舱，上海到北京吗？”

但长期记忆也有坑：

AI可能“自作主张”记错信息（比如误判“你说喜欢咖啡”其实是“同事说的”）；
检索不准时，强行关联错误记忆，导致答非所问；
需要额外存储和计算成本。

长期记忆就像你的个人档案柜——东西放进去，以后随时能翻出来用。

3. 短期 vs 长期：关键差异对比

维度	短期记忆	长期记忆
有效期	单次对话内	跨天、跨月、跨会话
存储位置	请求参数中（临时）	外部数据库（持久化）
实现方式	拼接对话历史	RAG + 向量检索
成本	高（随上下文增长）	中（需存储+检索）
适用场景	聊天连贯性、多轮推理	个性化服务、历史复用
是否共享	不跨会话	可跨会话、跨用户（需权限控制）

4. 实际应用场景

客服机器人

用长期记忆记住用户历史工单，避免重复询问；

个人助理

记住你的日程、偏好、健康数据；

教育AI

跟踪学生的学习进度，推荐个性化内容；

企业知识库

结合员工身份，召回相关政策或流程；

游戏NPC

让角色记住玩家之前的选择，推动剧情发展。

大模型本身没有“记忆”，它的“记性”全靠我们设计，也就是怎么在提示词中加入相关联的信息。
短期记忆让我们对话流畅，长期记忆 让AI真正“懂你”。
但两者都不是万能的——短期会“遗忘”，长期可能“记错”。
真正的智能，不在于记住多少，而在于在对的时间，想起对的事。

未来，随着MemoryBank、分层记忆架构等技术的发展，AI的记忆会越来越像人类：有重点、会遗忘、能关联。
而我们要做的，是合理设计记忆策略，让AI既聪明，又可靠。

大模型也会“健忘”？一文说清它的“短期记忆”和“长期记忆”

2. 长期记忆：像“个人档案”，能跨天、跨月记住你

3. 短期 vs 长期：关键差异对比

4. 实际应用场景

相关文章

AI大模型到底怎么"思考"的？这个网站让你亲眼看见

和 AI 聊天，它是怎么"记住"你说的话的？

我们经常说的“模型降智”是什么意思？为什么有时候AI助手像变了个人？

关注公众号获取最新 AI 资讯