此功能用于管理网络带宽分配,专门用于区分高带宽的训练工作负载和对延迟敏感的推理请求。通过实现动态优先级队列,它可防止训练任务因与其他推理流量的竞争而出现阻塞,反之亦然。该系统确保关键的 AI 模型获得所需的吞吐量,同时保持实时应用的低抖动,从而直接影响整体计算效率和模型收敛速度,且无需硬件升级。
网络控制器能够识别出源自训练集群和推理端点的不同流量类型。
优先级权重会根据当前的系统负载需求以及预定义的的服务级别协议 (SLA) 动态分配。
数据包头部会被修改,以反映优先级等级,从而引导交换机网络选择最佳的路由路径。
通过将源 IP 地址映射到训练或推理标识符,定义流量类别。
在高峰时段,为培训任务分配更高的优先级权重,以确保其获得更高的带宽保障。
配置数据包标记规则,以便将优先级标签嵌入到网络头部。
通过模拟并发的高负载训练和推理流量,验证队列的行为。
自动检测并根据源 IP 地址模式和端口范围,对属于训练或推理会话的数据包进行标记。
配置诸如保证带宽和最大延迟阈值等 QoS 参数,以优化特定的人工智能工作负载。
实时显示网络 fabric 上的队列深度、丢包率以及优先级策略执行效果等关键指标。