此功能实现了差分备份逻辑,仅备份在完整基线备份后发生修改的数据块。它扫描文件系统以获取时间戳差异,构建增量差异集,并将这些差异集写入存储库。与完整备份相比,这种方法可以降低存储成本和网络带宽消耗,同时能够快速恢复最近的更改,而无需重新下载整个数据集。
系统启动扫描阶段,以识别自上次完整备份操作以来已修改的文件,从而确定数据捕获的时间范围。
一种算法将当前文件的哈希值与基准注册表进行比较,以生成一个增量数据集,该数据集仅包含已更改或已删除的记录。
计算得到的增量数据集被序列化并持久化到备份存储层,同时附加元数据,表明其依赖于之前的完整备份。
通过检索最近一次完整备份的ID来初始化会话。
执行文件系统扫描,收集自该基准时间戳以来所有已修改文件的元数据。
计算哈希值差异,以构建最终的差异数据集,同时排除未发生变化的块。
将增量数据集序列化,并上传至目标存储位置,同时使用适当的版本控制标签。
在完成指定的全量备份周期或达到配置的间隔时间时,触发差分备份任务。
检测文件修改事件,并将变更元数据馈送至数据摄取管道,用于增量计算。
接收序列化的增量数据包,并在将数据块写入备份存储库之前进行去重处理。