本章节介绍如何上传镜像到容器镜像服务SWR。 Step1 登录SWR 登录容器镜像服务控制台,选择区域。 图1 容器镜像服务控制台 单击右上角“创建组织”,输入组织名称完成组织创建。您可以自定义组织名称,本示例使用“deep-learnin…
针对您在本地或使用其他工具开发的算法,支持上传至ModelArts中统一管理。 创建算法入口 在ModelArts上基于自定义镜像创建算法有2个入口: 入口1:在ModelArts控制台“算法管理 >我的算法”入口,此处创建的算法可以…
制作自定义镜像有以下方式: 方式一:使用Notebook的预置镜像创建开发环境实例,在环境中进行依赖安装与配置,配置完成后,可以通过开发环境提供的镜像保存功能,将运行实例的内容以容器镜像的方式保存下来,作为自定义镜像使用。详细操作请参考将N…
PyTorch Tensorflow Ascend-Powered-Engine Horovod/MPI/MindSpore-GPU 父主题: 训练基础镜像详情介绍 同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851) 内…
从Notebook中保存的镜像可以在镜像管理中查询到,可以用于创建新的Notebook实例,完全继承保存状态下的实例软件环境配置。 基于自定义镜像创建Notebook实例有两种方式: 方式一:在Notebook实例创建页面,镜像类型选择“自…
问题现象 使用Conda安装Keras 2.3.1版本报错。 原因分析 可能是Conda网络不通,请使用pip install命令安装。 解决方法 执行 !pip install keras==2.3.1命令安装Keras。 父主题: 环境…
问题现象 在训练创建后出现“系统容器异常退出”的故障。 图1 错误日志 原因分析 出现该问题的可能原因如下: OBS相关错误。 OBS文件不存在。The specified key does not exist。 用户OBS权限不足。 OB…
问题现象 在pytorch镜像运行分布式作业时,设置NCCL日志级别,代码如下: import os os.environ[“NCCL_DEBUG”] = “INFO” 会出现如下错误: 图1 错误日志 原因分析 可能原因如下: 原因1:未…
问题现象 现象:创建Notebook文件后,右上角的Kernel状态为“No Kernel”。 原因分析 可能因为用户工作目录下的code.py和创建kernel依赖的import code文件名称冲突。 解决方案 查看“/home/ma-…
问题现象 训练作业访问OBS时,出现如下报错: 图1 报错信息 原因分析 出现该问题的可能原因如下: OBS服务的权限出现问题,导致无法正常读取数据 处理方法 请检查OBS权限配置,如未解决问题可参考OBS文档的已配置OBS权限,仍然无法访…