问题现象 使用CV2包部署在线服务报错 原因分析 使用OBS导入元模型,会用到服务侧的标准镜像,标准镜像里面没有CV2依赖的so的内容。所以ModelArts不支持从对象存储服务(OBS)导入CV2模型包。 处理方法 需要您把CV2包制作为…
部署上线调用API报错,排查项如下: 确认配置文件模型的接口定义中有没有POST方法。 确认配置文件里url是否有定义路径。例如:“/predictions/poetry”(默认为“/”)。 确认API调用中body体中的调用路径是否拼接自…
问题现象 在使用pytorch1.0镜像时,必现如下报错: “RuntimeError: std::exception” 原因分析 出现该问题的可能原因如下: pytorch1.0镜像中的libmkldnn软连接与原生torch的冲突,具体…
问题现象 在使用pandas.to_datetime转换时间时,出现如下报错: pandas._libs.tslibs.np_datetime.OutOfBoundsDatetime: Out of bounds nanosecond ti…
问题现象 用户提交的Caffe模型出现转换不成功。 转换失败后,您可以在模型转换任务详情页面获得相应日志。如果出现如下类似日志,表示算子不支持导致转换失败。 ‘Error your model contain ddk not supoort…
问题现象 服务状态一直处于“部署中”,查看AI应用日志未发现服务有明显错误。 原因分析 一般情况都是AI应用的端口配置有问题。建议您首先检查创建AI应用的端口是否正确。 处理方法 AI应用的端口没有配置,默认为8080,如您在自定义镜像配置…
问题现象 在Notebook实例中,使用pip install时,出现“No Space left…”的错误。 解决办法 建议使用pip install –no-cache ** 命令安装,而不是使用pip inst…
问题现象 基于TensorFlow-1.8启动训练作业,并在代码中使用“tf.gfile”模块连接OBS,启动训练作业后会频繁打印如下日志信息: Connection has been released. Continuing. Found…
问题现象 使用mindspore进行训练时,出现如下报错: [ERROR] RUNTIME(3002)model execute error, retCode=0x91, [the model stream execute failed] …
问题现象 训练作业在运行时提示URL连接超时,具体报错如下: urllib.error.URLERROR: 原因分析 由于安全性问题在ModelArts上不能联网下载。 处理方法 如果在运行训练作业时提示连接超时,请您将需要联网下载的数据提…