小百学AI

大模型也会“健忘”?一文说清它的“短期记忆”和“长期记忆”

knowledge2026/3/86 分钟阅读

你有没有遇到过这样的情况:跟AI聊天聊到一半,它突然“失忆”了,问它刚才说过什么,它一脸茫然?
或者,你希望它记住你上次提过的偏好——比如“我不吃花生”,结果下次再聊,它又忘了? 这其实不是AI“笨”,而是它的“记忆机制”有讲究。就像人脑有短期记忆和长期记忆一样,大模型也有两种不同的“记东西”的方式。今天,我们就用最直白的话,讲清楚:什么是大模型的短期记忆和长期记忆?它们有什么区别?怎么工作?又用在哪些地方?


  1. 短期记忆:像“临时便签”,只在当前对话里有效

短期记忆,顾名思义,就是大模型在一次对话中能“记住”的内容。
比如你问:“我叫小明。”
接着问:“我叫什么?”
它能答:“小明。”
这就是靠短期记忆。

原理很简单:每次你发消息,系统都会把之前的对话历史一起打包,塞进给大模型的请求里(也就是“prompt”)。模型看到这些上下文,就知道你在说什么。

但问题来了——大模型的“脑子”容量有限。这个容量叫“上下文窗口”,比如常见的有4K、8K、甚至128K个token(可以粗略理解为“字数”)。一旦对话太长,旧的内容就会被“挤出去”,就像你写满一张便签纸,只能撕掉前面的字腾地方。

举个例子
图片

在 工具中,你可以设置“上下文轮数”。假设设为3轮:

  • 第1轮:你好

  • 第2轮:我叫小李

  • 第3轮:我喜欢咖啡

  • 第4轮:你记得我叫什么吗?

这时,第1轮的“你好”可能就被丢掉了!模型只看到后三轮,所以还能答“小李”。但如果对话继续到第6轮,连“我叫小李”都可能被挤出,它就真“忘了”。

短期记忆的局限

  • 只在单次会话 内有效,关掉聊天窗口就清零;

  • 越长越贵(按token计费);

  • 上下文太长反而影响模型表现(研究显示:长上下文可能导致“注意力稀释”);

  • 无法跨对话共享信息。

所以,短期记忆就像你手里的便签纸——方便、即时,但一松手就没了。



2. 长期记忆:像“个人档案”,能跨天、跨月记住你

那怎么让AI真正“记住”你?比如记住“你对花生过敏”“你上周在上海出差”?
这就需要长期记忆

长期记忆的核心思想:把重要信息存到外部数据库,下次需要时再“查出来”告诉模型。

技术实现:通常用 RAG(检索增强生成) 技术。
步骤如下:

  1. 存储
把关键信息(如“用户对花生过敏”)转成向量(一种数学表示),存进向量数据库(如FAISS、Pinecone);
  1. 检索
当你提问时,系统先分析你的问题,去数据库里“找”相关记忆;
  1. 注入
把找到的记忆片段加到当前对话的上下文中;
  1. 回答
模型结合新上下文,给出更准确的回答。

图2

长期记忆还能分类

  • 情境记忆
记录具体事件,如“2024年5月10日,用户在上海出差,提到喜欢Manner咖啡”;
  • 语义记忆
存储事实,如“用户对花生过敏”;
  • 程序记忆
记住操作流程,如“如何调用某API提交报销”。

举个实际场景
你在公司用AI助手处理差旅报销。

  • 第一次对话:你说“我要订上海到北京的机票,经济舱”。

  • 助手记下:用户偏好经济舱、常飞京沪线。

  • 一个月后,你又说:“帮我订票。”

  • 助手自动检索长期记忆,直接问:“还是经济舱,上海到北京吗?”

但长期记忆也有坑

  • AI可能“自作主张”记错信息(比如误判“你说喜欢咖啡”其实是“同事说的”);

  • 检索不准时,强行关联错误记忆,导致答非所问;

  • 需要额外存储和计算成本。

长期记忆就像你的个人档案柜——东西放进去,以后随时能翻出来用。

3. 短期 vs 长期:关键差异对比

维度短期记忆长期记忆
有效期单次对话内跨天、跨月、跨会话
存储位置请求参数中(临时)外部数据库(持久化)
实现方式拼接对话历史RAG + 向量检索
成本高(随上下文增长)中(需存储+检索)
适用场景聊天连贯性、多轮推理个性化服务、历史复用
是否共享不跨会话可跨会话、跨用户(需权限控制)

图3

4. 实际应用场景

  • 客服机器人
用长期记忆记住用户历史工单,避免重复询问;
  • 个人助理
记住你的日程、偏好、健康数据;
  • 教育AI
跟踪学生的学习进度,推荐个性化内容;
  • 企业知识库
结合员工身份,召回相关政策或流程;
  • 游戏NPC
让角色记住玩家之前的选择,推动剧情发展。



大模型本身没有“记忆”,它的“记性”全靠我们设计,也就是怎么在提示词中加入相关联的信息。
短期记忆让我们对话流畅,长期记忆 让AI真正“懂你”。
但两者都不是万能的——短期会“遗忘”,长期可能“记错”。
真正的智能,不在于记住多少,而在于在对的时间,想起对的事

未来,随着MemoryBank、分层记忆架构等技术的发展,AI的记忆会越来越像人类:有重点、会遗忘、能关联。
而我们要做的,是合理设计记忆策略,让AI既聪明,又可靠。

分享:

相关文章

小百学AI 公众号二维码

关注公众号获取最新 AI 资讯

每周精选 AI 领域最值得关注的新闻、工具和教程,助你保持技术敏感度。

每周更新独家内容工具推荐