因为现在pytorch-npu推理速度比较慢(固定shape比mindir慢4倍),在现在pth-onnx-mindir的模型转换方式下,暂时只能把lora合并到unet主模型内,在每次加载模型前lora特性就被固定了(无法做到pytorc…
此处介绍如何通过编写 Dockerfile 文件制作自定义镜像的操作步骤 。 目标:构建安装好如下软件的容器镜像,并使用 ModelArts 训练服务运行。 ubuntu-18.04 cann-6.3.RC2 (商用版本) python-3…
报错”data type not equal”时,按照堆栈信息,将对应的行数的数据类型修改为匹配的类型。 图1 报错信息 处理该问题时,pipeline_onnx_stable_diffusion_img2img_m…
本章节介绍如何将制作好的镜像上传至SWR服务,方便后续在ModelArts上创建训练作业时调用。 登录容器镜像服务控制台,选择区域。 图1 容器镜像服务控制台 单击右上角“创建组织”,输入组织名称完成组织创建。请自定义组织名称,本示例使用“…
配置完IAM权限之后,需要在ModelArts页面为子用户设置Modelarts访问授权,允许ModelArts访问OBS、SWR、IEF等依赖服务。 此方式只允许主用户为子用户进行配置。因此,本示例中,管理员帐号需为所有用户完成访问授权的…
前提条件 已经在OBS上创建好并行文件系统,请参见创建并行文件系统。 已经在obsutil安装和配置,请参见obsutils安装和配置。 准备数据 点击下载猫狗数据集至本地,并解压。 通过obsutil将数据集上传至OBS桶中。 ./obs…
前提条件 要迁移的训练任务代码在GPU上多次训练稳定可收敛。训练业务代码和数据,应该确保在GPU环境中能够运行,并且训练任务有稳定的收敛效果。 本文只针对基于PyTorch的训练脚本迁移。这里假设用户使用的是基于PyTorch的训练代码进行…
由于4中的权限需要等待15-30分钟生效,建议在配置完成后,等待30分钟,再执行如下验证操作。 使用用户组02中任意一个子用户登录ModelArts管理控制台。在登录页面,请使用“IAM用户登录”方式进行登录。 首次登录会提示修改密码,请根…
通过打通VPC,可以方便用户跨VPC使用资源,提升资源利用率。 在“专属资源池 > 网络”页面,单击网络列表中某个网络操作列的“打通VPC”。 图1 打通VPC 在打通VPC窗口,打开开关,在下拉框中选择可用的VPC和子网。 图2 打…
基于Pytorch Adapter完成代码迁移适配后,用户需要进一步验证精度是否达标。迁移过程精度偏差的来源,一方面是昇腾设备部分算子的实现和CUDA算子有差异,另外一方面则是硬件方面的差异,如Ascend Snt9芯片上的Matmul和C…