华为云AI开发平台ModelArtsGPU V100裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4_云淘科技

场景描述

本文旨在指导如何在GPU V100裸金属服务器上(Ubuntu 18.04系统),安装NVIDIA驱动版本470,CUDA版本11.4。

操作步骤

安装NVIDIA驱动。

apt-get update
sudo apt-get install nvidia-driver-470

安装CUDA。

wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run
chmod +x cuda_11.4.4_470.82.01_linux.run
./cuda_11.4.4_470.82.01_linux.run --toolkit --samples --silent

验证NVIDIA安装结果。

nvidia-smi -pm 1
nvidia-smi
/usr/local/cuda/bin/nvcc -V

安装Pytorch2.0和验证CUDA验证。

PyTorch2.0所需环境为Python3.10, 安装配置miniconda环境。

miniconda安装并创建alpha环境。

wget https://repo.anaconda.com/miniconda/Miniconda3-py310_23.1.0-1-Linux-x86_64.sh
chmod 750 Miniconda3-py310_23.1.0-1-Linux-x86_64.sh
bash Miniconda3-py310_23.1.0-1-Linux-x86_64.sh -b -p /home/miniconda
export PATH=/home/miniconda/bin:$PATH
conda create --quiet --yes -n alpha python=3.10

安装pytorch2.0并验证cuda状态。

在alpha环境下安装torch2.0, 使用清华PIP源完成。

source activate alpha
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
python

验证torch与cuda的安装状态,输出为True即为正常。

import torch
print(torch.cuda.is_available())

父主题: GPU裸金属服务器环境配置

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家