在我之前的文章中已经介绍过了, 什么是人工智能下的数据标注, 并简单介绍了数据标注的类别及其应用, 下面我将详细介绍一下数据标注的种类让大家对数据标注有一个更深入的了解.
一, 图像类
矩形拉框: 这个在数据标注中属于 2D 拉框, 通常需要拉一个矩形框贴合框选出待检测物体(人, 动物, 汽车等等). 框选出待检测物体之后还需要对所选框添加一个或多个标签进行注明, 以人为例的话可能需要注明人的性别, 年龄, 衣着等.
多边形拉框: 多边形拉框和矩形拉框类似, 不过多边形拉框的要求更高需要围绕标注元素的轮廓进行标注, 多以点框的形式进行. 多边形拉的框往往也需要添加标签来对元素进行注明.
打点: 打点需要根据要求对人脸或关键部位进行打点标注, 往往此类标注会对每个点的位子进行限制和要求, 从而实现高精度的检测识别. 此类标注对人员的要求较高, 但相应标注的单价也会高很多.
OCR 识别: OCR 识别分为两部分一部分是拉框, 框选出待检测部位此部分与上述多边形拉框较为相似多用点框的方式进行操作, 第二部分则需要对框选部分的内容进行高准确性转写. 此类打标好的数据往往应用于文本检测模型的训练.
语义分割: 此类标注与拉框打点比起来占的比例较少, 但目前此类标注有增加的趋势. 此类标注需要对图片内的元素进行区分, 并对每部分分别进行标注填色, 一般需要先向 ps 抠图那样讲此部分元素抠出来然后再选择属性标签, 这样此部分元素就切割出来了.
图片审核分类: 此类标注需要根据要求对张图片进行判定. 有的是需要将图片进行分类, 有的是判断图片内容时候符合要求, 也有的是判断两张图片或几张图片时候属于一类.
下面分享一篇文章, 详细介绍了图片类标注经常使用的工具和平台, 感兴趣的可以看一下.
http://blog.51cto.com/14028810/2307977
二, 语音类
语音转写: 语音转写属于最常见的一种语音标注了, 标注人员需要听一段语音然后将听到的语音转写出来. 根据语种可以分为中文, 外文, 方言等. 根据时长可以分为段语音和长语音一般一分钟以下 (通常为三秒左右) 的语音为短语音, 其中语音的长短, 声音质量, 有无预打标结果, 是否需要切割等因素都会较大的影响语音转写的难度.
其他类语音标注: 其他类的语音标注比较占的比例比较小, 如给一段文本和语音判定文本和语音内容是否对应, 又或者是给一段语音标注人员对语音进行鉴定听是不是包含违法敏感元素.
下面分享一篇文章, 详细介绍了语音类数据标注涉及的工具和数据标注平台
三, 文本类
情感标注: 此类标注通常需要判定一句话包含的情感, 如三级情感标注(正向, 中性, 负向), 要求高的会分成六级甚至十二级情感标注.
实体标注: 实体标注需要将一句话中的实体提取出来, 如电视, 足球, 门等. 有时候还需要将划分这句话的类别如音乐, 百科, 新闻等或者是标注出文本中的动作指令(开门, 播放等).
相似性判断: 这种标准多集中在两个文本之中, 通常需要判断两句话表达的含义是否一致. 如果一致标 1, 不一致标 - 1, 无法判定标 0.
其他类文本标注: 其他类的文本标注如舆情标注, 判断一段文章提及的公司是积极还是消极的影响. 还有文章敏感性检测判断文本内容有无违法敏感信息.
因为敏感标注常在线下进行一般 Excel 就可以搞定所以在此不在分享文本标注涉及的数据标注工具和数据标注平台了.
四, 采集类
因为在我的其他文章中有大篇幅介绍了采集类的标注了在此就不详细介绍了, 感兴趣的可以点击下面文章的分享链接查看.
http://blog.51cto.com/14065470/2314920
来源: http://www.bubuko.com/infodetail-2932991.html