三:数据标注的过程 1.标注标准的确定 确定好标准是保证数据质量的关键一步,要保证有个可以参照的标准。一般可以: 设置标注样例、模版。例如颜色的标准比色卡。 对于模棱两可的数据,设置统一处理方式,如可以弃用,或则统一标注。 参照的标准有时候还要考虑行业。以文本情感分析为例,“疤痕”一词,在心理 学行业中,可能是个负面词,而在医疗行业则是一个中性词。三:数据标注的过程 1.标注标准的确定 确定好标准是保证数据质量的关键一步,要保证有个可以参照的标准。一般可以: 设置标注样例、模版。例如颜色的标准比色卡。 对于模棱两可的数据,设置统一处理方式,如可以弃用,或则统一标注。 参照的标准有时候还要考虑行业。以文本情感分析为例,“疤痕”一词,在心理 学行业中,可能是个负面词,而在医疗行业则是一个中性词