华为云AI开发平台ModelArtsPytorch1.0引擎提示“RuntimeError: std::exception”_云淘科技
问题现象
在使用pytorch1.0镜像时,必现如下报错:
“RuntimeError: std::exception”
原因分析
出现该问题的可能原因如下:
pytorch1.0镜像中的libmkldnn软连接与原生torch的冲突,具体可参看文档。
处理方法
按照issues中的说明,应该是环境中的库冲突了,因此在启动脚本最开始之前,添加如下代码。
import os os.system("rm /home/work/anaconda3/lib/libmkldnn.so") os.system("rm /home/work/anaconda3/lib/libmkldnn.so.0")
必现的问题,使用本地Pycharm远程连接Notebook调试。
建议与总结
在创建训练作业前,推荐您先使用ModelArts开发环境调试训练代码,避免代码迁移过程中的错误。
直接使用线上notebook环境调试请参考使用JupyterLab开发模型。
配置本地IDE(Pycharm或者VSCode)联接云上环境调试请参考使用本地IDE开发模型。
父主题: 云上迁移适配故障
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家