华为云AI开发平台ModelArts配置流程_云淘科技

图1 DevServer资源配置流程图

表1 Server资源配置流程

配置顺序

配置分类

配置任务

使用场景说明

是否必选操作

1

网络

单EIP实现多节点的SSH登录和外网访问

指导一个租户VPC配置一个EIP,通过NAT网关配置进行EIP资源共享,实现该VPC下的所有Server资源均可以通过该EIP进行公网访问和SSH登录。

必选。(二选一)

单EIP绑定裸金属服务器

指导单EIP如何绑定在一台裸金属服务器上实现公网访问和SSH登录。

裸金属服务器支持IPV6解决方案

指导配置裸金属服务器实现支持IPV6。

可选。

2

存储

裸金属服务器存储指南

指导如何选择和使用存储服务。

必选。

3

环境配置

GPU V100裸金属服务器EulerOS 2.9安装NVIDIA 515+CUDA 11.7

指导如何在V100裸金属服务器EulerOS 2.9系统上安装NVIDIA 515+CUDA 11.7。

必选。(根据服务器规格和操作系统选择)

GPU V100裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4

指导如何在V100裸金属服务器Ubuntu 18.04系统上安装NVIDIA 470+CUDA 11.4。

GPU Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 525+CUDA 12.0

指导如何在Ant8裸金属服务器Ubuntu 20.04系统上安装NVIDIA 525+CUDA 12.0。

GPU Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA 11.7

指导如何在Ant8裸金属服务器Ubuntu 20.04系统上安装NVIDIA 515+CUDA 11.7。

GPU Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 470+CUDA 11.3

指导如何在Ant8裸金属服务器Ubuntu 20.04系统上安装NVIDIA 470+CUDA 11.3。

NPU Snt9B裸金属服务器环境配置

本文旨在指导如何在Snt9b裸金属服务器上,进行磁盘合并挂载、安装docke等环境配置

GPU A系列裸金属服务器RoCE性能带宽测试

指导如何在GPU A系列裸金属服务器上测试RoCE性能带宽。

可选。

NVIDIA和CUDA驱动安装指南

指导如何安装NVIDIA和CUDA驱动。

可选。若需要安装其他版本的驱动,可参考此章节。

GPU V100裸金属服务器的Docker模式环境搭建

指导如何在V100裸金属服务器上安装Docker环境

可选。

4

监控

华为云CES服务官方监控方案

指导如何使用华为云BMS+CES联合提供的裸金属服务器的指标监控方案。

可选。(二选一)

NVIDIA官方推荐的DCGM监控方案

指导如何使用DCGM监控方案。

父主题: DevServer资源配置

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家