华为云AI开发平台ModelArts性能监控_云淘科技
服务创建后,用户需要掌握自己的在线服务和对应AI应用版本的监控数据。可以通过“服务列表-监控列”和“服务详情-监控信息页签”两种方式查看服务和对应AI应用版本的监控数据。
监控指标
监控数据见下表:
参数名称 |
参数说明 |
---|---|
CPU使用率 |
服务和AI应用版本的CPU使用率。 |
内存使用率 |
服务和AI应用版本的内存使用率。 |
GPU使用率 |
使用GPU资源时显示。服务和AI应用版本的GPU使用率。 |
服务访问量 |
服务和AI应用版本的总的调用量。 |
成功率 |
服务和AI应用版本的调用成功率。 |
分钟级访问量 |
显示服务前一分钟的调用次数。 |
正常实例数/总实例数 |
服务的总实例数和正常实例数。 |
CPU使用率、内存使用率和GPU使用率为实时数据。
服务访问量、成功率、分钟级访问量、正常实例数/总实例数是从服务创建完成后开始统计。
查看监控信息
服务列表-监控列
方式1:服务创建完成后,在服务列表页面,您可以单击对应服务“监控”列的监控图标,底部会弹出服务的监控数据。单击选中服务所在行的空白处,可退出监控界面。
方式2:单击服务名称前面的复选框,展开列表页面底部的延展视图(未展开延展视图时,可单击页面底部浮层区域或右下角展开),将鼠标悬停在“监控”列的监控图标上,查看服务的监控数据。若单击该图标,可进入到服务详情页查看“监控信息”页签。
服务详情-监控信息页签
服务创建完成后,进入服务详情页,单击“监控信息”页签,查看服务和AI应用版本的监控数据详情。
当存在多个AI应用版本时,您需要单击“查看各灰度版本监控”,展开AI应用版本面板,查看AI应用版本监控数据详情。
如果您想查看更多更详细的监控指标,可以单击“查看服务监控详情”和“查看版本监控详情”,前往云监控服务控制台查看。您还可以设置服务和AI应用的告警规则,单击“设置告警策略”,前往云监控服务控制台,设置服务或AI应用版本的监控指标。
云监控平台监控您的ModelArts在线服务和对应模型负载,执行自动实时监控、告警和通知操作,帮助您更好地了解服务和模型的各项性能指标。了解云监控平台ModelArts监控,请参见ModelArts支持的监控指标。
父主题: 维护在线服务
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家