Generación Aumentada por Recuperación (RAG)
La Generación Aumentada por Recuperación (RAG) es una arquitectura de IA que combina un modelo de lenguaje grande con una fuente de conocimiento externa. En lugar de depender únicamente de lo que el modelo aprendió durante el entrenamiento, un sistema RAG recupera documentos relevantes, entradas de bases de datos o contenido de la base de conocimientos en tiempo de ejecución y utiliza ese contexto para generar una respuesta más precisa.
Un flujo de trabajo RAG típico consta de tres pasos:
Esto hace que RAG sea útil cuando las respuestas deben reflejar datos comerciales actualizados, documentación interna, catálogos de productos, políticas o contenido de soporte.
RAG ayuda a reducir las alucinaciones, mejora la fundamentación fáctica y permite a los equipos actualizar las respuestas sin reentrenar el modelo base. Se utiliza ampliamente en búsqueda de IA, chatbots empresariales, asistentes internos, herramientas de soporte al cliente y sistemas de gestión de conocimiento.