上下文记忆
上下文记忆指的是人工智能系统在特定会话内或跨多个会话中保留、访问和利用从先前交互中收集到的信息的能力。与将每次输入都视为全新的无状态处理不同,上下文记忆使人工智能能够建立对用户持续需求、偏好和对话流程的动态理解。
对于现代应用,尤其是聊天机器人和智能代理来说,上下文至关重要。没有上下文,交互就会支离破碎且令人沮丧。上下文记忆将一个简单的问答工具转变为一个有帮助的、持久的助手。它允许系统准确地回答后续问题,即使用户没有明确重述所有必要细节。
该机制通常涉及将交互数据——例如用户输入、系统响应、识别出的实体和推断的意图——存储在临时或持久的内存存储中。然后,这些数据被编码(通常使用向量嵌入)并作为当前提示的一部分反馈给语言模型或决策算法。这使得模型能够根据历史记录来决定其下一个输出。
检索增强生成 (RAG) 是一种常与上下文记忆结合使用的技术,用于将相关的外部知识拉入当前的上下文窗口。状态管理是管理系统如何跟踪用户会话当前操作状态的更广泛的工程学科。