华为云AI开发平台ModelArts从容器镜像中选择元模型_云淘科技

针对ModelArts目前不支持的AI引擎,您可以通过自定义镜像的方式将编写的模型导入ModelArts。

约束与限制

关于自定义镜像规范和说明,请参见模型镜像规范。
针对您开发并训练完成的模型,需要提供对应的模型配置文件,此文件需遵守ModelArts的填写规范,详情请参见模型配置文件编写说明。编写完成后,需将此文件上传至OBS指定目录下。
使用容器化部署,导入的元模型有大小限制,详情请参见导入AI应用对于镜像大小限制。

前提条件

确保您使用的OBS目录与ModelArts在同一区域。

创建AI应用操作步骤

登录ModelArts管理控制台,在左侧导航栏中选择“AI应用管理 > AI应用”,进入AI应用列表页面。
单击左上角的“创建”,进入“创建AI应用”页面。
在“创建AI应用”页面,填写相关参数。

填写AI应用基本信息,详细参数说明请参见表1。

表1 AI应用基本信息参数说明

参数名称

说明

名称

AI应用名称。支持1~64位可见字符(含中文),名称可以包含字母、中文、数字、中划线、下划线。

版本

设置所创建AI应用的版本。第一次导入时,默认为0.0.1。

说明:

AI应用创建完成后,可以通过创建新版本,导入不同的元模型进行调优。

描述

AI应用的简要描述。

填写元模型来源及其相关参数。当“元模型来源”选择“从容器镜像中选择”时,其相关的参数配置请参见表2。

图1 从容器镜像中选择AI应用

表2 元模型来源参数说明

参数

说明

“容器镜像所在的路径”

单击从容器镜像中导入模型的镜像,其中,模型均为Image类型,且不再需要用配置文件中的“swr_location”来指定您的镜像位置。

制作自定义镜像的操作指导及规范要求,请参见模型镜像规范。

说明:

您选择的模型镜像将共享给系统管理员,请确保具备共享该镜像的权限(不支持导入其他帐户共享给您的镜像),部署上线时,ModelArts将使用该镜像部署成推理服务,请确保您的镜像能正常启动并提供推理接口。

“容器调用接口”

用于指定AI应用启动的协议和端口号。

说明:

ModelArts提供的请求协议和端口号的缺省值是HTTP和8080。用户需根据实际的自定义镜像进行配置。

“镜像复制”

镜像复制开关,选择是否将容器镜像中的模型镜像复制到ModelArts中。

关闭时,表示不复制模型镜像,可极速创建AI应用,更改或删除SWR源目录中的镜像会影响服务部署。
开启时,表示复制模型镜像,无法极速创建AI应用,SWR源目录中的镜像更改或删除不影响服务部署。

“健康检查”

用于指定AI应用的健康检查。仅当自定义镜像中配置了健康检查接口,才能配置“健康检查”,否则会导致AI应用创建失败。

检查方式:可以选择“HTTP请求检查”或者“执行命令检查”。
健康检查URL:“检查方式”选择“HTTP请求检查”时显示,填写健康检查的URL,默认值为“/health”。
健康检查命令:“检查方式”选择“执行命令检查”时显示,填写健康检查的命令。
健康检查周期:填写1-2147483647之前的整数,单位为秒。
延迟时间(秒):实例启动后,延迟执行健康检查的时间。填写0-2147483647之间的整数,单位为秒,不能为空。
健康检查最大失败次数:填写1-2147483647之间的整数。在服务启动阶段,当健康检查请求连续失败达到所填次数后,服务会进入异常状态;在服务运行阶段,当健康检查请求连续失败达到所填次数后,服务会进入告警状态。

说明:

当AI应用配置了健康检查,部署的服务在收到停止指令后,会延后3分钟才停止。

“AI应用说明”

为了帮助其他AI应用开发者更好的理解及使用您的AI应用,建议您提供AI应用的说明文档。单击“添加AI应用说明”,设置“文档名称”及其“URL”。AI应用说明支持增加3条。

“部署类型”

选择此AI应用支持部署服务的类型,部署上线时只支持部署为此处选择的部署类型,例如此处只选择在线服务,那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。

“启动命令”

指定模型的启动命令,您可以自定义该命令。

说明:

包含字符$,|,>,<,`,!,
,\,?,-v,–volume,–mount,–tmpfs,–privileged,–cap-add的启动命令,在AI应用发布时将会置空。
指定的启动命令在部署为边缘服务时不生效。

“apis定义”

提供AI应用对外Restfull api数据定义,用于定义AI应用的输入、输出格式。apis定义填写规范请参见模型配置文件编写说明中的apis参数说明,示例代码请参见apis参数代码示例。

确认信息填写无误,单击“立即创建”,完成AI应用创建。

在AI应用列表中,您可以查看刚创建的AI应用及其对应的版本。当AI应用状态变更为“正常”时,表示AI应用创建成功。在此页面,您还可以进行创建新版本、快速部署服务、发布AI应用等操作。

后续操作

部署服务:在“AI应用列表”中,单击AI应用名称左侧的单选按钮,在列表页底部展开此AI应用下的“版本列表”。在对应版本所在行,单击“操作”列的部署类型按钮,可以将AI应用部署上线为创建AI应用时所选择的部署类型。

父主题: 创建AI应用

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家