联邦索引
联邦索引是一种架构模式,它允许单个搜索界面或查询访问和搜索多个独立、地理分布的数据存储库或索引。系统不是将所有数据整合到一个巨大的索引中,而是协调跨这些独立索引的查询,动态地聚合结果。
在现代企业环境中,数据很少是集中化的。它存在于各种系统中——本地数据库、云存储桶、专业微服务和区域服务器。联邦索引解决了数据孤岛问题,使用户能够在整个数据环境中执行全面的搜索,而无需进行复杂、资源密集型的 ETL(提取、转换、加载)过程将所有数据移到一处。
当用户向联邦层提交查询时,过程就开始了。该层充当一个智能路由器。它解析查询并确定哪些底层数据源是相关的。然后,它将查询翻译成每个源所需的特定语言或 API(例如,一个数据库使用 SQL,另一个使用 Lucene 查询)。每个源在本地执行查询,只将相关结果子集返回给联邦层,联邦层随后合并、排序并向最终用户呈现统一的结果集。
联邦索引对于大规模操作至关重要,例如:
该概念与分布式数据库、数据虚拟化和分布式搜索引擎密切相关。