华为云AI开发平台ModelArts创建资源池_云淘科技

本章节主要介绍创建专属资源池的详细操作。

创建专属资源池

登录ModelArts管理控制台,在左侧菜单栏中选择“专属资源池 > 弹性集群”。

新用户在ModelArts管理控制台“专属资源池”中只能看到新版的“弹性集群”。使用过旧版专属资源池的老用户,可以看到两个弹性集群,其中“弹性集群 New”为新版的专属资源池。

在“资源池”页签,单击“创建”,进入购买专属资源池界面,参见下表填写参数。

表1 专属资源池的参数说明

参数名称

子参数

说明

名称

专属资源池的名称。

只能以小写字母开头,由小写字母、数字、中划线(-)组成,不能以中划线结尾。

描述

专属资源池的简要说明。

使用场景

选择使用场景,“ModelArts Standard”或“ModelArts Lite”。创建“ModelArts Lite”相关资料请见《ModelArts Lite用户指南》的弹性集群k8s Cluster。该参数仅在贵阳一区域显示。

计费模式

选择计费模式,“包年/包月”或“按需计费”。

资源池类型

可选物理资源池和逻辑资源池。逻辑资源池与规格有关,若无逻辑规格则不显示逻辑资源池。

作业类型

根据业务需要,选择该资源池支持的作业类型。

物理资源池:支持“开发环境”、“训练作业”和“推理服务”的作业类型。
逻辑资源池:仅支持“训练作业”的作业类型。

IPv6

开启IPv6功能。若开启了此功能,要求资源池绑定的网络也开启IPv6功能,网络开启IPv6可以参考创建网络章节。该功能一旦开启,将不能关闭。

当前支持IPv6功能的有如下规格:

modelarts.kc1.2xlarge.4
modelarts.vm.cpu.16u32g.d
modelarts.vm.cpu.16u64g.d
modelarts.vm.cpu.24u48g.d
modelarts.vm.cpu.48u96g.d
modelarts.vm.cpu.8ud

网络

表示服务实例运行在指定的网络中,可以与该网络中的其它云服务资源实例互通。

在下拉框中选择,如果没有可用网络,单击右侧的“创建”,创建一个可用的网络。创建网络相关可以参考创建网络章节。

规格管理

规格类型

请根据界面提示选择需要使用的规格。平台分配的资源规格包含了一定的系统损耗,实际可用的资源量小于规格标称的资源。实际可用的资源量可在专属资源池创建成功后,在详情页的“节点”页签中查看。

可用区

您可以根据实际情况选择“随机分配”或“指定AZ”。可用区是在同一区域下,电力、网络隔离的物理区域。可用区之间内网互通,不同可用区之间物理隔离。

随机分配:系统自动分配可用区。
指定AZ:指定资源池节点在哪个可用区域。考虑系统容灾时,推荐指定节点在同一个可用区。可设置可用区的节点数。

节点数量

选择专属资源池的节点数,选择的节点数越多,计算性能越强。

当“可用区”选择“指定AZ”时,节点数量会根据可用区的数据自动计算,此处无须再次设置。

说明:

单次创建时,节点数建议不大于30,否则可能触发限流导致创建失败。

高级选项

开启后,可设置容器引擎空间大小。

容器引擎空间大小仅支持整数, 默认值与最小值为50G,不同规格的最大值不同,数值有效范围请参考界面提示。

自定义驱动

选择规格为GPU时,显示此参数。打开开关,选择GPU驱动。

GPU驱动

打开“自定义驱动”开关,显示此参数。选择GPU加速卡驱动。

购买时长

选择购买时长。只有选择“包年/包月”计费模式时才需填写。

自动续费

是否自动续费。只有选择“包年/包月”计费模式时才需填写。

按月购买:自动续费周期为1个月。
按年购买:自动续费周期为1年。

高级选项

选中“现在配置”,可配置标签信息、网段、控制节点分布。

标签

ModelArts支持对接标签管理服务TMS,在ModelArts中创建资源消耗性任务(例如:创建Notebook、训练作业、推理在线服务)时,可以为这些任务配置标签,通过标签实现资源的多维分组管理。

标签详细用法请参见ModelArts如何通过标签实现资源分组管理。

说明:

可以在标签输入框下拉选择TMS预定义标签,也可以自己输入自定义标签。预定义标签对所有支持标签功能的服务资源可见。租户自定义标签只对自己服务可见。

网段

可选默认和自定义。

默认:系统随机分配一个不冲突的网段供用户使用,因后续不支持修改建议商用场景选择手动分配,确保网段符合用户诉求。
自定义:需要自定义K8S容器网段和K8S服务网段。

K8S容器网段:集群下容器使用的网段,决定了集群下容器的数量上限。创建后不可修改。
K8S服务网段:同一集群下容器互相访问时使用的Service资源的网段。决定了Service资源的上限。 创建后不可修改。

控制节点分布

控制节点的分布位置,可选择随机分配和自定义。

随机分配:随机分配控制节点可用区。
自定义:需选择控制节点的可用区。

控制节点推荐尽可能随机分布在不同可用区以提高容灾能力。

单击“下一步”确认规格。规格确认无误后,单击“提交”,即可创建专属资源池。

当资源池创建成功后,资源池的状态会变成“运行中”,当“节点个数”中的“可用”和“总数”值大于0时,资源池才能下发任务。

图1 查看资源池

可以在资源池列表左上角“操作记录”中查看资源池的任务记录。

图2 资源池列表

常见问题

创建专属资源池时,能选到规格但最终创建时发生报错,提示无可用资源?

由于专属资源的可选规格是动态监测的,因此在极少数情况下会出现,规格在购买界面可以被选择,但由于没有及时支付和创建资源池,导致该规格售罄创建失败。

建议您在创建界面更换规格重新创建资源池。

为什么无法使用资源池节点上的全部CPU资源?

由于资源池节点上会安装系统、插件等内容,因此不能完全使用所有资源。例如:资源池节点是8U,节点分配给系统组件部分CPU,可用的资源会小于8U。

建议您在启动任务前,在该资源池的详情页中,单击“节点”页签,查看实际可用的CPU资源。

父主题: 弹性集群

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家