人工智能-数据标注 雷梦婕 昆山市城北中心小学校 1mj1mj_2008@126.com18601421627 愿意现场分享
人工智能----数据标注 雷梦婕 昆山市城北中心小学校 lmjlmj_2008@126.com 18601421627 愿意现场分享
什么是数据标注? 如果把人工智能比作金字塔,最顶端的是人工智能应用(比如无人车、 机器人等),而最低端则是数据服务。人工智能的最终目标使计算机能够 模拟人的思维方式和行为。若想达到这个目标,则需要大量优质的训练数 据使人工智能可以通过学习从而形成更好的模型,变得更加智能化。所以 简单来说,数据标注就是使用自动化工具通过分类、画框、注释等等对收 集来的数据进行标记以形成可供计算机识别分析的优质数据的过程
什么是数据标注? 如果把人工智能比作金字塔,最顶端的是人工智能应用(比如无人车、 机器人等),而最低端则是数据服务。人工智能的最终目标使计算机能够 模拟人的思维方式和行为。若想达到这个目标,则需要大量优质的训练数 据使人工智能可以通过学习从而形成更好的模型,变得更加智能化。所以 简单来说,数据标注就是使用自动化工具通过分类、画框、注释等等对收 集来的数据进行标记以形成可供计算机识别分析的优质数据的过程
例如 我们有张飞机的图片,并且上面标注着"飞机"两个字,然后机 器通过学习了无数张飞机图片中的特征,直到它可以自行识别飞机,这 时候我们再给机器任意一张飞机的图片,它就能认出来这是飞机了
我们有张飞机的图片,并且上面标注着 " 飞机 " 两个字,然后机 器通过学习了无数张飞机图片中的特征,直到它可以自行识别飞机,这 时候我们再给机器任意一张飞机的图片,它就能认出来这是飞机了。 例如
训练集与测试集 再以飞机为例子,假设我们有1000张标注着"飞机"的图 片,那么我们可以拿900张作为训训练集,100张作为测试集。 机器从900张飞机的图片中学习得到一个模型,然后我们 将剩下的100张机器没有见过的图片去给它识别,那么我们就 能够得到这个模型的准确率了
再以飞机为例子,假设我们有 1000 张标注着 " 飞机 " 的图 片,那么我们可以拿 900 张作为训练集,100 张作为测试集。 机器从 900 张飞机的图片中学习得到一个模型,然后我们 将剩下的 100 张机器没有见过的图片去给它识别,那么我们就 能够得到这个模型的准确率了。 训练集与测试集
哪些数据需要标注以及标记什么? 数据标注的对象主要分为文本、图片、音频、视频四个种类: 1)文本标注主要包括情感分析、知识库、关键词提取、文字翻译、搜索引擎优化等。就比如, 识别一句话蕴含的情感,翻译等等: 2)图片标注主要包括图像分割、物体检测、图像语义理解、图像生成、图片加注等服务: 3)音频标注主要包括对全球主要语言和语料、包括方言、特殊情景语音进行识别标注,语音 识别等等: 4)视频标注主要包括对视频中出现的物体、文字、语音、情景等进行标注
哪些数据需要标注以及标记什么? 数据标注的对象主要分为文本、图片、音频、视频四个种类: 1)文本标注主要包括情感分析、知识库、关键词提取、文字翻译、搜索引擎优化等。就比如, 识别一句话蕴含的情感,翻译等等; 2)图片标注主要包括图像分割、物体检测、图像语义理解、图像生成、图片加注等服务; 3)音频标注主要包括对全球主要语言和语料、包括方言、特殊情景语音进行识别标注,语音 识别等等; 4)视频标注主要包括对视频中出现的物体、文字、语音、情景等进行标注
数据标注的基本流程 反馈测试结裹 板型指标 数据标注 模型训练 模型测试 产品评估 反绿数据问蹈 不断地用标注后的数据去训练模型,不断调整模型参数,得到指标数值更高的模型
一:数据标注的基本流程 不断地用标注后的数据去训练模型,不断调整模型参数,得到指标数值更高的模型
二:常见的几种数据标注类型 1.分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选 择数据对应的标签,是封闭集合。如下图,一张图就可以有很多分类/标签: 成人、女、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词 动词等。 年胎:成人 性翻:女 人种黄 被帽无 殿眼镜:无 脸部被遮档:无 头发:长 面部朝向:正面 表情:大笑 适用:文本、图像、语音、视频 应用:脸龄识别,情绪识别,性别识别
二:常见的几种数据标注类型 1.分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选 择数据对应的标签,是封闭集合。如下图,一张图就可以有很多分类/标签: 成人、女、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词 动词等。 适用:文本、图像、语音、视频 应用:脸龄识别,情绪识别,性别识别
二:常见的几种数据标注类型 2标框标注: 机器视觉中的标框标注,很容易理解,就是框选要检测的对象。 如人脸识别,首先要先把人脸的位置确定下来。行人识别,如下图。 适用:图像 应用:人脸识别,物品识别
二:常见的几种数据标注类型 2.标框标注:机器视觉中的标框标注,很容易理解,就是框选要检测的对象。 如人脸识别,首先要先把人脸的位置确定下来。行人识别,如下图。 适用:图像 应用:人脸识别,物品识别