华为云AI开发平台ModelArtsGPU A系列裸金属服务器RoCE带宽不足问题解决方法_云淘科技
问题现象 NVIDIA Ant8支持RoCE网卡, Ubuntu20.04场景,在进行nccl-tests时,总线带宽理论峰值可达90GB/s,但实际测试下来的结果只有35GB/s。 原因分析 “nv_peer_mem”是一个Linux 内…
共1项
问题现象 NVIDIA Ant8支持RoCE网卡, Ubuntu20.04场景,在进行nccl-tests时,总线带宽理论峰值可达90GB/s,但实际测试下来的结果只有35GB/s。 原因分析 “nv_peer_mem”是一个Linux 内…