问题现象 裸金属服务器EulerOS 2.8系统下,使用yum update -y命令,导致软件NetworkManagre-config-server升级到高版本, 出现SSH链接故障无法访问。 原因分析 查看yum命令历史,发现执行了“…
当您开通SQL审计功能,系统会将所有的SQL操作记录下来并存入日志文件中,方便用户下载并查询。本文介绍如何开启或关闭SQL审计日志。 使用须知 RDS for MariaDB默认关闭SQL审计功能。 开启SQL审计功能后,系统会将所有的SQ…
本章节介绍用户如何开通集群资源。开通集群资源需要先联系客户经理进行预购,并提供相应的预购信息,预购完成后再正式购买开通。 开通后的资源会发放到用户帐号下。 贵阳一区域支持直接购买k8s Cluster资源开通(直接购买),下文的预购方式仅用…
问题现象 服务器没有任务,但GPU显示被占用。 图1 显卡运行状态 处理方法 nvidia-smi -pm 1 父主题: FAQ 同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851) 内容没看懂? 不太想学习?想快速解决?…
本章节介绍用户如何开通集群资源。 当前仅限贵阳一区域支持直接购买,其他局点请参考k8s Cluster资源开通(预购)。 集群资源开通流程 开通集群资源过程中用户侧需要完成的任务流程如下图所示。 图1 用户侧任务流程 表1 用户侧任务流程 …
前提条件 专属资源池未适配1.23以上的CCE版本,故在本指导适用于1.23版本CCE。 已购买资源,购买资源步骤请参考集群资源购买。 操作步骤 Step 1:登录节点 Step 2:配置kubectl工具 Step 3:准备业务基础镜像 …
场景描述 本案例介绍如何在Snt9B上使用deployment部署在线在推理服务。 操作步骤 拉取镜像。本测试镜像为bert_pretrain_mindspore:v1,已经把测试数据和代码打进镜像中。 docker pull swr.cn…
问题现象 在高性能8卡GPU的裸金属上的训练任务突然变慢,以前1个epoch约2小时执行完成,最近1个epoch需要2天才能执行完成,并且执行“nvidia-smi”也明显变很卡顿。 原因分析 根据现象描述可能出现了nvidia-smi D…
场景描述 本案例介绍如何在Snt9B上进行分布式训练任务。lite资源池已经默认安装volcano调度器,训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型,详细代码和指导可参考Bert。 操…
场景描述 本文旨在指导完成GPU Ant8裸金属服务器装机和nccl-test测试。装机软件预览如下: 表1 装机软件 软件类型 版本详情 预置操作系统 Ubuntu 20.04 server 64bit nvidia-driver 515…