华为云AI开发平台ModelArts数据标注简介_云淘科技
数据管理模块即将下线,对未使用过数据管理的用户不可见。
模型训练过程中需要大量已标注的数据,因此在模型训练之前需要进行数据标注作业。ModelArts为用户提供了标注数据的能力:
人工标注:用户创建单人标注作业,对数据进行手工标注。
智能标注:在标注一定量的数据情况下,用户可以通过启动智能标注任务对数据进行自动标注,提高标注的效率。
团队标注:对于大批量的数据,用户可以通过创建团队标注作业,进行多人协同标注。
人工标注
对于不同类型的数据,用户可以选择不同的标注类型。当前ModelArts支持如下类型的标注作业:
图片
图像分类:识别一张图片中是否包含某种物体。
物体检测:识别出图片中每个物体的位置及类别。
图像分割:根据图片中的物体划分出不同区域。
音频
声音分类:对声音进行分类。
语音内容:对语音内容进行标注。
语音分割:对语音进行分段标注。
文本
文本分类:对文本的内容按照标签进行分类处理。
命名实体:针对文本中的实体片段进行标注,如“时间”、“地点”等。
文本三元组:针对文本中的实体片段和实体之间的关系进行标注。
视频
视频标注:识别出视频中每个物体的位置及分类。目前仅支持mp4格式。
智能标注
除了人工标注外,ModelArts还提供了智能标注功能,快速完成数据标注,为您节省70%以上的标注时间。智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。
目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。
团队标注
数据标注任务中,一般由一个人完成,但是针对数据集较大时,需要多人协助完成。ModelArts提供了团队标注功能,可以由多人组成一个标注团队,针对同一个数据集进行标注管理。
团队标注功能当前仅支持“图像分类”、“物体检测”、“文本分类”、“命名实体”、“文本三元组”、“语音分割”类型的数据集。
不同类型数据集支持的功能列表
其中,不同类型的数据集,支持不同的功能,详细信息请参见表1。
数据集类型 |
标注类型 |
人工标注 |
智能标注 |
团队标注 |
---|---|---|---|---|
图片 |
图像分类 |
支持 |
支持 |
支持 |
物体检测 |
支持 |
支持 |
支持 |
|
图像分割 |
支持 |
– |
– |
|
音频 |
声音分类 |
支持 |
– |
– |
语音内容 |
支持 |
– |
– |
|
语音分割 |
支持 |
– |
支持 |
|
文本 |
文本分类 |
支持 |
– |
支持 |
命名实体 |
支持 |
– |
支持 |
|
文本三元组 |
支持 |
– |
支持 |
|
视频 |
视频标注 |
支持 |
– |
– |
自由格式 |
– |
– |
– |
– |
表格 |
– |
– |
– |
– |
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家