问题现象 订阅的AI应用一直处于等待同步状态。 原因分析 订阅的AI应用一直处于等待同步状态,可能原因如下: 由于ModelArts的数据存储、模型导入以及部署上线等功能依赖OBS、SWR等服务,需获取依赖服务的授权后,才能正常使用Mode…
问题现象 创建训练作业如何读取“json”和“npy”文件。 训练作业如何使用cv2库读取文件。 如何在MXNet环境下使用torch包。 训练作业读取文件,出现如下报错: NotFoundError (see above for trac…
问题现象 用户通过OBS导入AI应用时,选择使用基础镜像,用户自己编写了部分推理代码实现自己的推理逻辑,出现故障后希望通过故障日志排查定位故障原因,但是通过logger打印日志无法在“在线服务”的日志中查看到部分内容。 原因分析 推理服务的…
场景描述 在主备节点上使用添加的自增主键值进行查询,查询结果中出现数据不一致问题。 原因分析 对于无主键表,表中数据的顺序由存储引擎的RowID决定,无主键表中的数据在主备节点上的RowID可能不同,因此表中的数据在主备节点上的顺序不同。当…
场景描述 长事务告警一直存在,如何定位长事务。 原因分析 执行以下语句,查看当前事务的运行时间,根据运行时间定位长事务。 Select t.*,to_seconds(now())-to_seconds(t.trx_started) idle…
问题现象 训练失败并提示“Cann软件与Ascend驱动版本不匹配”。 原因分析 当昇腾规格的训练作业在ModelArts训练平台上运行时,会自动对Cann软件与Ascend驱动的版本匹配情况进行检查。如果平台发现版本不匹配,则会立即训练失…
适用场景 本节操作以CentOS 6.8操作系统云服务器为例,指导用户创建swap分区。 约束与限制 操作过程中涉及创建指定大小的文件,请确认系统磁盘空间有足够的空余空间。 场景一:使用块设备创建swap 执行以下命令,新建一个分区(以2G…
问题现象 修改SSH服务的默认端口后,安全组入方向也放通了该端口,但无法SSH连接云服务器 。 约束与限制 本节操作适用于CentOS 7系列操作系统。 根因分析 登录管理控制台,并通过VNC方式登录云服务器。 执行以下命令,查看是否开启了…
问题描述 Windows云服务器在长时间运行后,无妨访问网站或应用。 此时,云服务器可以正常远程登录,可以Ping通外部网址,但是无法使用浏览器访问外部网站或应用。 可能原因 Windows云服务器的动态端口耗尽。 由于Windows操作系…
问题描述 在Windows云服务器访问使用IIS创建web站点时,提示“Bad Request – Invalid Hostname”错误,如图 访问报错图所示。 图1 访问报错 可能原因 在IIS管理器中,如果配置Web站点大…