华为云AI开发平台ModelArts资源池驱动升级_云淘科技
场景介绍
当专属资源池中的节点含有GPU/Ascend资源时,用户基于自己的业务,可能会有自定义GPU/Ascend驱动的需求,ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。
驱动升级有两种升级方式:安全升级、强制升级。
安全升级:不影响正在运行的业务,开始升级后会先将节点进行隔离(不能再下发新的作业),待节点上的存量作业运行完成后再进行升级,因需要等待作业完成,故升级周期可能比较长。
强制升级:忽略资源池中正在运行的作业,直接进行驱动升级,可能会导致运行中作业失败,需谨慎选择。
XX驱动版本最后支持时间到xxx,在此时间之后,ModelArts不再提供支撑,建议您及时将驱动升级为最新版本。
约束限制
专属资源池状态处于运行中,且专属池中的节点需要含有GPU/Ascend资源。
对于逻辑资源池/逻辑子池,需要开启节点绑定后才能进行驱动升级,请提交工单联系华为工程师开启节点绑定。
驱动升级操作
登录ModelArts管理控制台,在左侧导航栏中选择“专属资源池 > 弹性集群”,默认进入“资源池”页面。
在资源池列表中,选择需要进行驱动升级的资源池“操作 > 驱动升级”。
在“驱动升级”弹窗中,会显示当前专属资源池的驱动类型、节点数量、当前版本、目标版本和升级方式。
目标版本:在目标版本下拉框中,选择一个目标驱动版本。
升级方式:选择“升级方式”,可选择安全升级或强制升级。
图1 驱动升级
选择完成后,单击“确定”开始驱动升级。
父主题: 弹性集群
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家