场景描述 本文指导如何在V100裸金属服务器上安装Docker环境(服务器系统需为Ubuntu18.04或Ubuntu20.04)。 操作步骤 NVIDIA驱动安装。 wget https://us.download.nvidia.com/…
场景描述 本文旨在指导完成GPU Ant8裸金属服务器装机和nccl-test测试。装机软件预览如下: 表1 装机软件 软件类型 版本详情 预置操作系统 Ubuntu 20.04 server 64bit nvidia-driver 515…
场景描述 本文主要指导如何在GPU A系列裸金属服务器上测试RoCE性能带宽。 前提条件 GPU A系列裸金属服务器已经安装了IB驱动。(网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu2…
场景描述 本文介绍如何华为云裸金属服务器中安装NVIDIA和CUDA驱动(以Ant8规格为例)。 1. 安装NVIDIA驱动 打开NVIDIA官方网站。 根据Ant8的详细信息和您所需的cuda版本选择驱动 图1 驱动选择 选择后会自动出现…
GPU V100裸金属服务器EulerOS 2.9安装NVIDIA 515+CUDA 11.7 GPU V100裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4 GPU V100裸金属服务器的Docker模式…
场景描述 当裸金属服务器预置的NVIDIA版本和业务需求不匹配时,需要更换NVIDIA驱动和CUDA版本。本文介绍华为云A系列GPU裸金属服务器(Ubuntu20.04系统)如何从“NVIDIA 525+CUDA 12.0”更换为“NVID…
场景描述 本文旨在指导如何在GPU V100裸金属服务器上(Euler2.9系统),安装NVIDIA驱动版本515.105.01,CUDA版本11.7.1。 操作步骤 安装NVIDIA驱动。 wget https://us.download…
场景描述 本文旨在指导如何在GPU V100裸金属服务器上(Ubuntu 18.04系统),安装NVIDIA驱动版本470,CUDA版本11.4。 操作步骤 安装NVIDIA驱动。 apt-get update sudo apt-get i…
场景描述 本文旨在指导完成GPU Ant8裸金属服务器装机和nccl-test测试。装机软件预览如下: 表1 装机软件 软件类型 版本详情 预置操作系统 Ubuntu 20.04 server 64bit nvidia-driver 525…
场景描述 本文介绍如何配置NVIDIA驱动、CUDA和FabricManager, 并安装PyTorch2.0,最后验证是否正常运行。 服务器信息: GPU Ant8裸金属服务器 操作系统:Ubuntu 20.04 server 64bit…