华为云AI开发平台ModelArtsk8s Cluster资源开通(直接购买)_云淘科技

本章节介绍用户如何开通集群资源。

当前仅限贵阳一区域支持直接购买,其他局点请参考k8s Cluster资源开通(预购)。

集群资源开通流程

开通集群资源过程中用户侧需要完成的任务流程如下图所示。

图1 用户侧任务流程

表1 用户侧任务流程

阶段

任务

说明

参考文档

预购集群资源

1、登录华为云控制台,在ModelArts上创建委托授权。

第一次使用ModelArts时需要创建委托授权,授权允许ModelArts代表用户去访问其他云服务。

如果之前已经创建过委托授权,需要更新委托相应的权限。

配置ModelArts访问授权

2、申请扩大资源配额。

集群所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小资源会超出华为云默认提供的资源配额,因此需要申请扩大配额。

具体的配额方案请联系客户经理获取。

配额需大于要开通的资源,且在购买开通前完成配额提升,否则会导致资源开通失败。

提升资源配额

购买集群资源

在ModelArts控制台上购买资源池。

购买集群资源

Step1 在ModelArts上创建委托授权

新建委托

第一次使用ModelArts时需要创建委托授权,授权允许ModelArts代表用户去访问其他云服务。使用ModelArts Lite的资源池需要授权允许ModelArts代表用户访问云容器引擎服务CCE、裸金属服务BMS、镜像服务IMS和密钥管理服务DEW。

进入到ModelArts控制台的“全局配置”页面,单击“添加授权”,根据提示进行操作。

更新委托

如果之前给ModelArts创过委托授权,此处需要更新授权。

进入到ModelArts控制台的“专属资源池”页面,查看是否存在授权缺失的提示,如图2所示。

图2 专属资源池权限缺失提示

如果有授权缺失,根据提示,点击“此处”更新委托。根据提示选择“追加至已有授权”,单击“确定”,系统会提示权限更新成功。

图3 追加授权

Step2 申请扩大资源配额

集群所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小资源会超出华为云默认提供的资源配额,因此需要申请扩大配额。请先联系客户经理确认资源配额提升具体方案,再参考本章节申请扩大配额。

登录华为云管理控制台。
在顶部导航栏单击“资源 > 我的配额”,进入服务配额页面。

图4 我的配额

在服务配额页面,单击右上角的“申请扩大配额”,填写申请材料后提交工单。

申请扩大配额主要是申请弹性云服务器ECS实例数、核心数(CPU核数)、RAM容量(内存大小)和云硬盘EVS磁盘容量这4个资源配额。具体的配额数量请先联系客户经理获取。

图5 ECS资源类型

图6 云硬盘资源类型

配额需大于需要开通的资源,且在购买开通前完成提升,否则会导致资源开通失败。

Step3 购买集群资源

登录ModelArts管理控制台,在左侧菜单栏中选择“专属资源池 > 弹性集群 NEW”,进入“弹性集群”页面。
在“资源池”页签,单击“创建”,进入购买专属资源池界面,参见下表填写参数并完成支付。

表2 专属资源池的参数说明

参数名称

子参数

说明

名称

专属资源池的名称。

只能以小写字母开头,由小写字母、数字、中划线(-)组成,不能以中划线结尾。

描述

专属资源池的简要说明。

使用场景

选择“ModelArts Lite”。

计费模式

仅支持“包年/包月”模式。

CCE集群

在下拉列表中选择用户账户下已有的CCE集群。如果没有集群,单击右侧的“创建集群”,先去创建集群。

当前仅支持CCE标准版本集群,且CCE版本仅支持1.23。同时需要确认CCE集群“运行中”状态。

规格管理

支持添加多个规格。限制如下:

添加的多个规格项中,不能有相同的规格。
选择多个规格的CPU架构必须相同。例如都是X86,或者都是ARM。
如果选择了多个GPU或NPU规格,由于不同规格的参数网络平面不互通,分布式训练时训练速度会受到影响。如果您要做分布式训练,建议您只选择一个GPU或NPU规格。
一个资源池中,最多可添加10种规格。

规格类型

请根据界面提示选择需要使用的规格。平台分配的资源规格包含了一定的系统损耗,实际可用的资源量小于规格标称的资源。实际可用的资源量可在专属资源池创建成功后,在详情页的“节点”页签中查看。

可用区

您可以根据实际情况选择“随机分配”或“指定AZ”。可用区是在同一区域下,电力、网络隔离的物理区域。可用区之间内网互通,不同可用区之间物理隔离。

随机分配:系统自动分配可用区。
指定AZ:指定资源池节点在哪个可用区域。考虑系统容灾时,推荐指定节点在同一个可用区。可设置可用区的节点数。

节点数量

选择专属资源池的节点数,选择的节点数越多,计算性能越强。

当“可用区”选择“指定AZ”时,节点数量会根据可用区的数据自动计算,此处无须再次设置。

说明:

单次创建时,节点数建议不大于30,否则可能触发限流导致创建失败。

自定义驱动

默认关闭。GPU规格资源池允许自定义安装驱动。集群中默认会安装GPU驱动,无需用户操作。只有需要指定GPU驱动版本时,需要安装。

GPU驱动

打开“自定义驱动”开关,显示此参数。选择GPU加速卡驱动。

购买时长

选择购买时长。只有选择“包年/包月”计费模式时才需填写。

登录方式

集群登录方式,可以设置密码登录,也可以设置密钥对登录。

密码登录:默认用户名为root,用户自己设置密码。
密钥对(KeyPair)登录:可以选择已有的密钥对,或者单击右侧的“创建密钥对”,先去创建一个密钥对。

高级选项

选中“现在配置”,可配置标签信息。

ModelArts支持对接标签管理服务TMS,在ModelArts中创建资源消耗性任务(例如:创建Notebook、训练作业、推理在线服务)时,可以为这些任务配置标签,通过标签实现资源的多维分组管理。

标签详细用法请参见ModelArts如何通过标签实现资源分组管理。

图7 购买专属资源池

Step5 查看是否购买成功

当资源池创建成功后,资源池的状态会变成“运行中”。单击集群资源名称,进入资源详情页。确认购买的规格是否正确。

图8 查看资源详情

父主题: k8s Cluster资源开通

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家