该功能可在 AI 工厂生态系统中实现代理基础设施的动态、自动化扩展。它通过监控工作负载指标,如队列深度、延迟阈值和吞吐量限制,来触发对活动代理实例的比例增加或减少。该系统在无需人工干预的情况下执行水平扩展策略,从而确保企业应用程序在依赖自主代理网络时,能够持续可用并实现成本效益。
编排引擎持续地从所有连接的代理程序接收遥测数据,以评估当前的负载情况,并与预定义的运营基线进行比较。
当系统检测到持续超出阈值的情况时,会自动分配额外的代理资源,并在低需求期间释放过剩的资源。
弹性扩展活动采用实时执行和零停机部署策略,以确保为相关应用程序提供不间断的服务。
监控代理工作负载指标,并与配置的阈值基线进行比较。
当指标超过预设阈值且持续一段时间时,触发自动扩缩策略。
根据计算出的容量需求,配置或取消配置新的代理实例。
验证集成是否成功,并在扩展事件后验证性能稳定性。
实时收集所有已部署的代理实例的CPU、内存和任务队列指标。
通过算法评估负载模式与策略规则的匹配情况,以确定最佳的扩展操作。
用于在扩展事件期间动态分配或释放计算资源的 API 接口。