华为云AI开发平台ModelArtsGPU V100裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4_云淘科技
场景描述
本文旨在指导如何在GPU V100裸金属服务器上(Ubuntu 18.04系统),安装NVIDIA驱动版本470,CUDA版本11.4。
操作步骤
安装NVIDIA驱动。
apt-get update sudo apt-get install nvidia-driver-470
安装CUDA。
wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run chmod +x cuda_11.4.4_470.82.01_linux.run ./cuda_11.4.4_470.82.01_linux.run --toolkit --samples --silent
验证NVIDIA安装结果。
nvidia-smi -pm 1 nvidia-smi /usr/local/cuda/bin/nvcc -V
安装Pytorch2.0和验证CUDA验证。
PyTorch2.0所需环境为Python3.10, 安装配置miniconda环境。
miniconda安装并创建alpha环境。
wget https://repo.anaconda.com/miniconda/Miniconda3-py310_23.1.0-1-Linux-x86_64.sh chmod 750 Miniconda3-py310_23.1.0-1-Linux-x86_64.sh bash Miniconda3-py310_23.1.0-1-Linux-x86_64.sh -b -p /home/miniconda export PATH=/home/miniconda/bin:$PATH conda create --quiet --yes -n alpha python=3.10
安装pytorch2.0并验证cuda状态。
在alpha环境下安装torch2.0, 使用清华PIP源完成。
source activate alpha conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia python
验证torch与cuda的安装状态,输出为True即为正常。
import torch print(torch.cuda.is_available())
父主题: GPU裸金属服务器环境配置
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家