知识运行时
知识运行时(Knowledge Runtime)是指人工智能(AI)应用中的一个操作层,它负责管理外部、专有或实时知识源的检索、情境化和应用。它是使大型语言模型(LLM)或AI代理能够超越其静态训练数据并与当前、特定的企业信息进行交互的机制。
在企业环境中,通用型LLM通常缺乏特定领域的知识或最新的信息。知识运行时通过将AI的响应建立在经过验证的内部数据上,解决了这个问题。这极大地减少了“幻觉”(hallucinations),提高了事实准确性,并使AI能够成为组织的真正主题专家。
该过程通常涉及检索增强生成(Retrieval-Augmented Generation, RAG)。当用户提交查询时,知识运行时首先解析意图。然后,它会查询包含组织文档的向量数据库或知识图谱。相关的文本片段被检索出来,并将这些片段直接注入到LLM的提示(prompt)中作为上下文。LLM然后仅基于此提供的上下文生成答案。
该概念与向量数据库(Vector Databases)、嵌入(Embeddings)、提示工程(Prompt Engineering)和检索增强生成(RAG)密切相关。