华为云AI开发平台ModelArts训练管理中使用自定义镜像介绍_云淘科技

订阅算法和预置框架涵盖了大部分的训练场景。针对特殊场景,ModelArts支持用户构建自定义镜像用于模型训练。 自定义镜像的制作要求用户对容器相关知识有比较深刻的了解,除非订阅算法和预置框架无法满足需求,否则不推荐使用。自定义镜像需上传至容…
共6项
订阅算法和预置框架涵盖了大部分的训练场景。针对特殊场景,ModelArts支持用户构建自定义镜像用于模型训练。 自定义镜像的制作要求用户对容器相关知识有比较深刻的了解,除非订阅算法和预置框架无法满足需求,否则不推荐使用。自定义镜像需上传至容…
模型训练是一个不断迭代和优化的过程。在训练模块的统一管理下,方便用户试验算法、数据和超参数的各种组合,便于追踪最佳的模型与输入配置,您可以通过不同版本间的评估指标比较,确定最佳训练作业。 前提条件 已将用于训练的数据上传至OBS目录。 已在…
针对您在本地或使用其他工具开发的算法,支持上传至ModelArts中统一管理。 创建算法入口 在ModelArts上基于自定义镜像创建算法有2个入口: 入口1:在ModelArts控制台“算法管理 >我的算法”入口,此处创建的算法可以…
问题现象 使用自定义镜像训练作业时,训练失败。 定位思路 确定镜像来源 a. 确认该自定义镜像的基础镜像是否来源于ModelArts提供的基础镜像,推荐用户使用ModelArts的基础镜像构建自定义镜像,具体请参见使用ModelArts的基…
训练管理中使用自定义镜像介绍 示例:从 0 到 1 制作自定义镜像并用于训练 准备训练镜像 使用自定义镜像创建算法 使用自定义镜像创建训练作业(CPU/GPU) 使用自定义镜像创建训练作业(Ascend) 自定义镜像训练作业失败定位思路 同…
如果Ascend-Powered-Engine预置镜像无法满足您的需求,您可以构建一个自定义镜像,通过自定义镜像创建训练作业。Ascend自定义镜像训练作业创建流程与 CPU/GPU 一致,但是需要额外关注: Ascend HCCL RAN…