华为云AI开发平台ModelArts语音分割_云淘科技

由于模型训练过程需要大量有标签的音频数据,因此在模型训练之前需对没有标签的音频添加标签。通过ModelArts您可对音频添加标签,快速完成对音频的标注操作,也可以对已标注音频修改或删除标签进行重新标注。

开始标注

登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理> 数据标注”,进入“数据标注”管理页面。
在标注作业列表右侧“所有类型”页签下拉选择标注类型,基于“标注类型”选择需要进行标注的标注作业,单击标注作业名称进入标注作业标注详情页。

图1 下拉选择标注类型

在标注作业标注详情中,展示此标注作业下全部数据。

同步数据源

ModelArts会自动从数据集输入位置同步数据至数据集详情页,包含数据及标注信息。

为了快速获取OBS桶中最新数据,可在数据集详情页的“未标注”页签中,单击“同步数据源”,快速将通过OBS上传的数据添加到数据集中。

问题现象:

将已标注好的数据上传至OBS,同步数据后,显示为未标注。

原因分析:

可能是OBS桶设置了自动加密导致此问题。

解决方法:

需要新建OBS桶重新上传数据,或者取消桶加密后,重新上传数据。

标注音频

标注作业详情页中,展示了此标注作业中“未标注”和“已标注”的音频,默认显示“未标注”的音频列表。

在“未标注”页签左侧音频列表中,单击目标音频文件,在右侧的区域中出现音频,单击音频下方,即可进行音频播放。
根据播放内容,选取合适的音频段,在下方“语音内容”文本框中填写音频标签和内容。

图2 语音标签音频标注

输入内容后单击下方的“确认标注”按钮完成标注。音频将被自动移动至“已标注”页签。

查看已标注音频

在标注作业详情页,单击“已标注”页签,您可以查看已完成标注的音频列表。单击音频,可在右侧的对应的文本框中了解当前音频的内容信息。

修改标注

当数据完成标注后,您还可以进入“已标注”页签,对已标注的数据进行修改。

修改标签:在数据标注详情页,单击“已标注”页签,然后在音频列表中选中待修改的音频。在右侧下方的标签信息区域中修改语音内容中的“标签”和,单击下方的“确认标注”按钮完成修改。
删除标签:单击目标编号操作列的“删除”,删除该段音频的标注。您也可以单击标注音频文件上方的删除标注,然后单击“确认标注”。

添加音频

除了同步新数据外,您还可以在标注详情页面中,直接添加数据,用于数据标注。

在标注作业详情页面,单击“未标注”页签,然后单击左上角“添加数据”。
在弹出的导入对话框中,选择数据来源、导入方式、导入路径等参数,导入数据。单击确定。

导入数据的详细操作介绍请参见导入操作。

图3 导入数据

删除音频

通过数据删除操作,可将需要丢弃的音频数据快速删除。

在“未标注”或“已标注”页面中,选中需要删除的音频,然后单击左上角“删除音频”,在弹出的对话框中,根据实际情况选择是否勾选“同时删除OBS源文件”,确认信息无误后,单击“确定”完成音频删除操作。

如果勾选了“同时删除OBS源文件”,删除音频操作是将删除对应OBS目录下存储的音频。此操作可能会影响已使用此源文件的其他数据集或数据集版本,有可能导致展示异常或训练/推理异常。删除后,数据将无法恢复,请谨慎操作。

标注人员管理

若您创建的标注作业,开启了团队标注,“标注人员管理”页面中可查看团队标注作业的标注详情。添加、修改或删除标注成员。

登录“数据管理>数据标注”,在“我创建的”页签下可查看所有的标注作业列表。
在作业列表的“名称”列,根据标注作业名称找到对应的团队标注作业。(团队标注作业的名称后带有标识。)
单击作业操作列的“更多>标注人员管理”。或单击作业名称进入作业详情,继续单击右上角“团队标注>标注人员管理”,进入成员管理页面。

图4 进入标注人员管理页(1)

图5 进入标注人员管理页(2)

添加成员:

单击页面“添加成员”,选择成员名称,单击确定。

在操作列,选择“发送邮件”,可将该标注任务以邮件的方式发送至该标注成员。

修改成员信息:

单击操作列的“修改”,可修改该成员的角色。

删除标注成员:

单击操作列的“删除”可删除该标注成员的所有信息。

父主题: 音频标注

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家