Permitir el acceso seguro y escalable a una API RESTful para que los sistemas externos interactúen con los recursos de computación, soportando flujos de trabajo complejos de recuperación de datos y ejecución.

Priority
Esta función proporciona una interfaz estandarizada para que los desarrolladores accedan de forma programática a los puntos finales de inferencia y entrenamiento de modelos de aprendizaje automático. Garantiza respuestas de baja latencia al tiempo que mantiene los estrictos protocolos de autenticación requeridos en entornos empresariales. La API REST facilita la integración perfecta con sistemas heredados existentes, lo que permite a los ingenieros de aprendizaje automático implementar modelos sin necesidad de desarrollar SDKs personalizados. Al abstraer las complejidades subyacentes del procesamiento, acelera el ciclo de desarrollo para los equipos de ciencia de datos.
El sistema expone una estructura de localizador de recursos uniforme que se corresponde directamente con las instancias de GPU disponibles y los registros de modelos.
Los tokens de autenticación se validan contra el proveedor de identidad empresarial antes de que se asignen o consulten cualquier recurso de computación.
Las respuestas incluyen esquemas JSON estructurados que reflejan los parámetros de entrada específicos y los formatos de salida esperados para las tareas de inferencia.
Inicie una solicitud HTTP POST al punto final de inferencia especificado, utilizando una carga útil JSON que contenga los tensores de entrada.
La puerta de enlace valida la firma de la solicitud y verifica la existencia de licencias de cómputo activas asociadas al rol de usuario.
Los recursos de cómputo se aprovisionan dinámicamente en función de los requisitos de latencia especificados en los parámetros de la API.
Ejecute la lógica de inferencia del modelo y devuelva los resultados procesados dentro del intervalo de tiempo configurado.
El punto de entrada principal donde las solicitudes HTTP entrantes se dirigen al endpoint de servicio de modelo correspondiente, según las etiquetas de los recursos.
Valida los tokens de acceso o las credenciales de OAuth para garantizar que solo los ingenieros de aprendizaje automático autorizados puedan acceder a los recursos de computación confidenciales.
Recupera los metadatos y la información de versión del modelo específico solicitado a través de la llamada a la API.