在 MLOps 和自动化环境中,自动化测试通过系统地执行单元测试、集成测试和模型测试,验证机器学习工作流程的完整性。此功能确保代码修改不会降低性能或在生产环境中引入问题。通过将测试直接集成到计算基础设施中,机器学习工程师可以在提高可靠性标准的同时,加速部署周期。该过程涵盖数据预处理逻辑、模型训练流程、推理准确性以及端到端管道功能。
该系统初始化了一个测试框架,该框架能够自动检测代码库的变更,并触发针对各个模块的相关单元测试。
然后,会执行集成测试,以验证数据管道、模型训练脚本和部署配置之间的交互。
最后,针对特定模型进行的测试,能够验证其预测准确性、延迟指标以及在受控条件下的抗攻击能力。
配置测试套件,以满足单元测试、集成测试和模型验证的要求。
将测试代理部署到与生产环境相匹配的隔离计算实例上。
执行自动化脚本,用于数据导入、模型训练和结果评估。
汇总结果,并生成包含各项指标的详细通过/未通过状态报告。
自动化测试会在代码提交到代码仓库时自动触发,并在计算环境中运行,以防止出现错误的部署。
测试结果证实,只有符合预定性能标准的模型才能晋升至生产阶段。
测试执行过程中的实时指标会被记录到计算日志中,以便立即检测故障并进行调试。