Ajuste automáticamente la capacidad de los agentes en función de las fluctuaciones de demanda en tiempo real, para garantizar una utilización óptima de los recursos y mantener niveles de servicio consistentes en sistemas distribuidos.

Priority
Esta función permite el escalamiento dinámico y automatizado de la infraestructura de agentes dentro del ecosistema AI Factory. Monitorea métricas de carga de trabajo, como la profundidad de la cola, los umbrales de latencia y los límites de rendimiento, para activar aumentos o disminuciones proporcionales en el número de instancias de agentes activos. El sistema ejecuta políticas de escalamiento horizontal sin intervención manual, garantizando la disponibilidad continua y la eficiencia de costos para las aplicaciones empresariales que dependen de redes de agentes autónomos.
El motor de orquestación ingiere continuamente datos de telemetría de todos los agentes conectados para evaluar la carga actual en comparación con los umbrales operativos predefinidos.
Al detectar violaciones sostenidas de los umbrales, el sistema aprovisiona automáticamente recursos adicionales para los agentes, al tiempo que desprovisiona la capacidad excedente durante los períodos de baja demanda.
Las actualizaciones se ejecutan en tiempo real, con estrategias de implementación sin interrupciones, para mantener la prestación continua del servicio a las aplicaciones dependientes.
Monitoree las métricas de la carga de trabajo de los agentes y compárelas con los umbrales predefinidos.
Active una política de escalado automático cuando los umbrales se superan durante un período sostenido.
Proveer o deshabilitar nuevas instancias de agentes según los requisitos de capacidad calculados.
Verificar la integración exitosa y validar la estabilidad del rendimiento después del evento de escalamiento.
Recopilación en tiempo real de métricas de CPU, memoria y cola de tareas de todas las instancias de agente implementadas.
Evaluación algorítmica de patrones de carga en función de las reglas de la política para determinar las acciones de escalamiento óptimas.
Puntos finales de API para la asignación o liberación dinámica de recursos de cómputo durante eventos de escalamiento.