I_MODULE
硬件 - 网络设备

InfiniBand

利用 InfiniBand 协议,设计高速互连技术,用于集群内部的通信,以确保计算节点之间的数据传输具有低延迟和高带宽。

Low
高性能计算工程师
Technician reviews digital displays while standing near densely packed server racks with blue cables.

Priority

Low

Execution Context

此设计阶段侧重于配置高性能计算环境中 InfiniBand 交换机的物理和逻辑拓扑。工程师需要定义交换机架构的能力、端口配置以及服务质量 (QoS) 策略,以优化网络性能,从而提升并行处理工作负载的效率。合理的规划能够确保分布式系统中的数据包丢失最小化,并通过率最大化。

定义 InfiniBand 交换机的物理拓扑结构,并使用合适的线缆标准将其连接到计算节点。

配置交换机参数,包括链路速度、链路聚合以及错误纠正功能,以实现最佳集群性能。

建立逻辑网络配置,例如子网、虚拟接口和流量管理策略,以实现高效的数据传输。

Operating Checklist

根据预期的集群规模和性能需求,选择合适的 InfiniBand 交换机型号。

将物理端口映射到逻辑子网,以定义网络结构。

配置链路聚合,以提高多链路间的带宽容量。

在部署生产工作负载之前,请使用诊断工具验证网络连接的可靠性。

Integration Surfaces

交换机链路聚合配置

请验证交换机固件版本,并配置端口速率以满足高性能计算 (HPC) 集群的网络需求。

拓扑规划

请设计物理布局,确保关键计算节点之间的跳数最少,以降低延迟。

服务质量策略配置

实施服务质量 (QoS) 策略,以优先处理关键数据流,使其优于对时间敏感性较低的流量。

FAQ

Bring InfiniBand Into Your Operating Model

Connect this capability to the rest of your workflow and design the right implementation path with the team.