问题现象 在线服务预测报错DL.0105,报错日志:“TypeError:‘float’object is not subscriptable”。 原因分析 根据报错日志分析,是因为一个float数据被当做对象下标访问了。 处理方法 将模型…
ML Studio在使用中出现的错误码及含义详见下表。 错误码 错误描述 1001 预置资产不可删除 1002 预置资产不可修改 1003 算子分组不存在 1004 缺少必要参数 1005 资产类别不存在 1006 名字中不允许使用字符 &…
当您在部署批量服务时,会选择输出数据目录位置,您可以查看“运行完成”状态的批量服务运行结果。 操作步骤 登录ModelArts管理控制台,在左侧菜单栏中选择“部署上线>批量服务”,进入“批量服务”管理页面。 单击状态为“运行完成”的目…
原因分析 节点磁盘不足,镜像大小过大 解决方法 首先考虑优化镜像,减小节点磁盘的占用。 优化镜像无法解决问题,请联系系统管理员处理。 父主题: 服务部署 同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851) 内容没看懂? …
原因分析 容器镜像代码错误 解决方法 根据容器日志进行排查,修复代码,重新创建AI应用,部署服务。 父主题: 服务部署 同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851) 内容没看懂? 不太想学习?想快速解决? 有偿解决…
ModelArts提供了一个PyCharm插件工具PyCharm ToolKit,协助用户完成SSH远程连接Notebook、代码上传、提交训练作业、将训练日志获取到本地展示等,用户只需要专注于本地的代码开发即可。 视频介绍 前提条件 本地…
原因分析 容器提供的健康检查接口调用失败。容器健康检查接口调用失败,原因可能有两种: 镜像健康检查配置问题 AI应用健康检查配置问题 解决方法 根据容器日志进行排查,查看健康检查接口失败的具体原因。 镜像健康检查配置问题,需修复代码后重新制…
自定义镜像模型部署为在线服务时出现异常 部署的在线服务状态为告警 服务启动失败 服务部署、启动、升级和修改时,拉取镜像失败如何处理? 服务部署、启动、升级和修改时,镜像不断重启如何处理? 服务部署、启动、升级和修改时,容器健康检查失败如何处…
当使用专属资源池时,允许用户使用ModelArts控制台提供的CloudShell登录运行中的训练容器。CloudShell调试方法请参见CloudShell使用指导。 父主题: FAQ 同意关联代理商云淘科技,购买华为云产品更优惠(QQ …
使用场景 本文指导用户通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题。 操作步骤 在ModelArts控制台,选择“训练管理>训练作业”,在训练作业详情页面,在右侧的CloudShell页签,登录训练容器(训练作业…