定义
自然语言遥测(NLT)是一种先进的监控和可观测性技术,它允许用户使用自然人类语言与复杂、高容量的系统遥测数据进行交互,而不是使用传统的查询语言(如 SQL 或专有 DSL)。
它弥合了原始的、机器生成的运营数据(日志、指标、跟踪)与人类理解之间的差距,使非技术利益相关者能够就系统健康状况提出复杂的问题。
为什么重要
在现代的分布式微服务架构中,遥测数据的巨大容量和复杂性可能会使传统的监控仪表板不堪重负。NLT 使可观测性民主化,使产品经理、业务分析师和支持人员能够在无需专业数据工程技能的情况下获得深入的见解。
这种转变通过使数据探索变得直观,加速了事件响应时间并提高了功能验证的速度。
工作原理
NLT 系统通常采用一个涉及多个 AI 组件的管道:
- 摄取和解析: 收集和标准化原始遥测数据(日志、指标)。
- 自然语言理解 (NLU): NLU 模型处理用户的自然语言查询,以确定意图、实体(例如“延迟”、“服务_X”)和约束(例如“过去一小时”)。
- 查询生成: 将 NLU 的输出翻译成底层数据存储(例如 PromQL、SQL)理解的正式、可执行的查询语言。
- 执行和可视化: 查询在遥测数据库上运行,结果被返回并以易于理解的格式呈现给用户。
常见用例
- 事件分类: 支持工程师可以询问“在过去 30 分钟内,支付服务的 5xx 错误有哪些?”,从而立即确定故障范围。
- 性能分析: 开发人员可以询问“上周所有区域 API 端点 /users 的平均响应时间是多少?”
- 容量规划: 运维团队可以询问“过去一个季度数据库集群的 CPU 利用率趋势如何?”
主要优势
- 降低入门门槛: 降低了数据查询的技术技能要求。
- 提高速度: 在事件期间实现更快的数据检索和假设测试。
- 更深入的洞察: 允许使用简单的措辞探索跨异构数据源的复杂关系。
挑战
- 歧义处理: 自然语言本质上是模糊的,需要 NLU 层进行强大的上下文管理。
- 数据模式映射: 将抽象的语言概念准确地映射到精确的技术数据字段仍然很复杂。
- 计算开销: 实时 NLU 翻译所需的处理会比直接查询增加延迟。
相关概念
该概念与 AIOps(IT 运营人工智能)、日志聚合和对话式 AI 接口有很大重叠。