华为云AI开发平台ModelArts性能监控_云淘科技

服务创建后,用户需要掌握自己的在线服务和对应AI应用版本的监控数据。可以通过“服务列表-监控列”和“服务详情-监控信息页签”两种方式查看服务和对应AI应用版本的监控数据。

监控指标

监控数据见下表:

表1 监控指标

参数名称

参数说明

CPU使用率

服务和AI应用版本的CPU使用率。

内存使用率

服务和AI应用版本的内存使用率。

GPU使用率

使用GPU资源时显示。服务和AI应用版本的GPU使用率。

服务访问量

服务和AI应用版本的总的调用量。

成功率

服务和AI应用版本的调用成功率。

分钟级访问量

显示服务前一分钟的调用次数。

正常实例数/总实例数

服务的总实例数和正常实例数。

CPU使用率、内存使用率和GPU使用率为实时数据。

服务访问量、成功率、分钟级访问量、正常实例数/总实例数是从服务创建完成后开始统计。

查看监控信息

服务列表-监控列

方式1:服务创建完成后,在服务列表页面,您可以单击对应服务“监控”列的监控图标,底部会弹出服务的监控数据。单击选中服务所在行的空白处,可退出监控界面。
方式2:单击服务名称前面的复选框,展开列表页面底部的延展视图(未展开延展视图时,可单击页面底部浮层区域或右下角展开),将鼠标悬停在“监控”列的监控图标上,查看服务的监控数据。若单击该图标,可进入到服务详情页查看“监控信息”页签。

服务详情-监控信息页签

服务创建完成后,进入服务详情页,单击“监控信息”页签,查看服务和AI应用版本的监控数据详情。

当存在多个AI应用版本时,您需要单击“查看各灰度版本监控”,展开AI应用版本面板,查看AI应用版本监控数据详情。

如果您想查看更多更详细的监控指标,可以单击“查看服务监控详情”和“查看版本监控详情”,前往云监控服务控制台查看。您还可以设置服务和AI应用的告警规则,单击“设置告警策略”,前往云监控服务控制台,设置服务或AI应用版本的监控指标。

云监控平台监控您的ModelArts在线服务和对应模型负载,执行自动实时监控、告警和通知操作,帮助您更好地了解服务和模型的各项性能指标。了解云监控平台ModelArts监控,请参见ModelArts支持的监控指标。

父主题: 维护在线服务

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家