考虑到该类情感维度词典在当前所有情感维度词典中所占的词的比例（作为先验）

正在加载图片...

第5期皇甫璐雯，等：一种基于OCC模型的文本情感挖掘方法 .649. 考虑到该类情感维度词典在当前所有情感维度词 score=a·scorepolariyl+(1-a)·scorep2(3）典中所占的词的比例（作为先验）。 (0≤a≤1) 2.1.2求精过程式中score1和Score2虽然基于相同的(2) 构建完成后的情感维度词典往往存在不一致式，但是分别利用了上面提到的不同的极性词典计性或者噪声，包括语义不一致性、情感倾向不一致算而得的。通过设定score的阈值，以避免加入质量性，以及非情感词等。因此利用情感维度词的同义过低的词。词集合和反义词集合检查情感维度词的正负倾向， 2.2情感类型的生成从而过滤掉质量低的情感维度词，完成情感维度词完成构建和求精情感维度词典后，便可以利用典的求精过程 OCC情感模型生成情感类型。情感类型的生成基语义不一致性是指同一个词在同一情感维度于情感认知结构模型，根据该模型中每种情感类型上具有相互矛盾的取值，比如在“褒贬性”维度上同与情感维度及其取值的对应关系，自动生成6种主时具有“P”和“B”这两个维度值或者在“合意性”维要的情感类型。具体地说，“合意性”维度值为“合度上同时具有“D”和“U”这两个维度值：情感倾向意的”并且“可能性”维度值为“确定的”时对应的情不一致性是指一个词同时具有正负情感倾向相互感类型为“高兴”；“合意性”维度值为“不合意的” 冲突的情感维度值。情感词的极性可以是正向或且“可能性”维度值为“确定的”对应的情感类型为负向。根据含义可知，“P”和“D”表示对情感对象 “悲伤”：“合意性”维度值为“合意的”且“可能性” 的正面态度或评价，故极性为正；“B”和“U”表示对维度值为“可能的”对应的情感类型为“希望”：“合情感对象的负面态度或评价，故极性为负。若检测意性”维度值为“不合意的”且“可能性”维度值为到语义或情感倾向不一致的词，对该情感词的求精 “可能的”对应的情感类型为“恐惧”：“合意性”维方法根据通用语义词典中的同义和反义关系共同度值为“合意的”，“褒贬性”维度值为“值得称赞确定其情感倾向。当前待求精的情感维度词的计的”且“可能性”维度值为“确定的”对应的情感类型算公式如式(2)：为“骄傲”：“合意性”维度值为“不合意的”，“褒贬 score =st-nso nAm-nAnt- 性”维度值为“应受责备的”且“可能性”维度值为 (2) 2·nsym 2·nAm “确定的”对应的情感类型为“羞耻”。工作实现的式中：ns、nu分别是当前待求精的情感词的同义 6种情感类型生成规则如下。词和反义词的总数，n+、nsm-分别是该词的极性规则1如果“合意性”维度值=“合意的”并且为正和为负的同义词个数，nsnn-分别是该词 “可能性”维度值=“确定的”对应的情感类型=“高的极性为正和为负的反义词个数。同时，为了保证兴”。同义词和反义词集合的均衡性，将其归一化后相规则2如果“合意性”维度值=“不合意的” 加。如果计算得到的score值小于某一阈值02，则并且“可能性”维度值=“确定的”对应的情感类型= 过滤掉该情感词。由于以往相关工作中已建立了 “悲伤”。多个关于情感词的正负极性词典，这里nsyn Ant的规则3如果“合意性”维度值=“不合意”并且正负极性可通过参照这些情感极性词典来确定。 “可能性”维度值=“可能的”对应的情感类型=“希非情感词包括无实际意义的词，如具体数字、望”。代词等，也包括中性的名词和动词。过滤的方法包规则4如果“合意性”维度值=“不合意的” 括直接列出这些明显的不应该加入的词加以过滤，并且“可能性”维度值=“可能的”对应的情感类型= 或者计算情感倾向，将某一阈值范围内的词别除。 “恐惧”。除了以本身建造的情感维度词典作为极性词规则5如果“合意性”维度值=“合意的”并且典，还采用一个公开的极性词表。选择这两个极 “褒贬性”维度值=“值得称赞的”对应的情感类性词典的原因是它们的优势可以互补。构建的情型=“骄傲”。感维度词典能够覆盖到较大集合的情感维度词，词规则6如果“合意性”维度值=“不合意的”并性词表尽管质量高，但是包含词的数量非常有限，且“褒贬性”维度值=“应受责备的”对应的情感类并且只有词的极性信息。所以，两者结合后彼此扬型=“羞耻”。长避短。同时可以通过(3)式进一步提高词的根据前述的情感类型的生成过程，下面给出一质量。个具体示例。考虑到该类情感维度词典在当前所有情感维度词典中所占的词的比例（作为先验）。２．１．２求精过程构建完成后的情感维度词典往往存在不一致性或者噪声，包括语义不一致性、情感倾向不一致性，以及非情感词等。因此利用情感维度词的同义词集合和反义词集合检查情感维度词的正负倾向，从而过滤掉质量低的情感维度词，完成情感维度词典的求精过程。语义不一致性是指同一个词在同一情感维度上具有相互矛盾的取值，比如在“褒贬性”维度上同时具有“Ｐ”和“Ｂ”这两个维度值或者在“合意性”维度上同时具有“Ｄ”和“Ｕ”这两个维度值；情感倾向不一致性是指一个词同时具有正负情感倾向相互冲突的情感维度值。情感词的极性可以是正向或负向。根据含义可知，“Ｐ”和“Ｄ”表示对情感对象的正面态度或评价，故极性为正；“Ｂ”和“Ｕ”表示对情感对象的负面态度或评价，故极性为负。若检测到语义或情感倾向不一致的词，对该情感词的求精方法根据通用语义词典中的同义和反义关系共同确定其情感倾向。当前待求精的情感维度词的计算公式如式（２）：ｓｃｏｒｅ＝ｎＳｙｎ＋－ｎＳｙｎ－２·ｎＳｙｎ－ｎＡｎｔ＋－ｎＡｎｔ－２·ｎＡｎｔ（２）式中：ｎＳｙｎ、ｎＡｎｔ分别是当前待求精的情感词的同义词和反义词的总数，ｎＳｙｎ＋、ｎＳｙｎ－分别是该词的极性为正和为负的同义词个数，ｎＳｙｎ－、ｎＡｎｔ－分别是该词的极性为正和为负的反义词个数。同时，为了保证同义词和反义词集合的均衡性，将其归一化后相加。如果计算得到的ｓｃｏｒｅ值小于某一阈值 θ２，则过滤掉该情感词。由于以往相关工作中已建立了多个关于情感词的正负极性词典，这里ｎＳｙｎ、ｎＡｎｔ的正负极性可通过参照这些情感极性词典来确定。非情感词包括无实际意义的词，如具体数字、代词等，也包括中性的名词和动词。过滤的方法包括直接列出这些明显的不应该加入的词加以过滤，或者计算情感倾向，将某一阈值范围内的词剔除。除了以本身建造的情感维度词典作为极性词典，还采用一个公开的极性词表［９］。选择这两个极性词典的原因是它们的优势可以互补。构建的情感维度词典能够覆盖到较大集合的情感维度词，词性词表尽管质量高，但是包含词的数量非常有限，并且只有词的极性信息。所以，两者结合后彼此扬长避短。同时可以通过（３）式进一步提高词的质量。ｓｃｏｒｅ＝ α·ｓｃｏｒｅｐｏｌａｒｉｔｙ１＋（１－ α）·ｓｃｏｒｅｐｏｌａｒｉｔｙ２（３）（０ ≤ α ≤ １）式中ｓｃｏｒｅｐｏｌａｒｉｔｙ１和ｓｃｏｒｅｐｏｌａｒｉｔｙ２虽然基于相同的（２）式，但是分别利用了上面提到的不同的极性词典计算而得的。通过设定ｓｃｏｒｅ的阈值，以避免加入质量过低的词。２．２情感类型的生成完成构建和求精情感维度词典后，便可以利用ＯＣＣ情感模型生成情感类型。情感类型的生成基于情感认知结构模型，根据该模型中每种情感类型与情感维度及其取值的对应关系，自动生成６种主要的情感类型。具体地说，“合意性” 维度值为“合意的”并且“可能性”维度值为“确定的”时对应的情感类型为“高兴”；“合意性” 维度值为“不合意的” 且“可能性”维度值为“确定的”对应的情感类型为 “悲伤”；“合意性”维度值为“合意的”且“可能性” 维度值为“可能的”对应的情感类型为“希望”；“合意性”维度值为“不合意的” 且“可能性” 维度值为 “可能的”对应的情感类型为“恐惧”；“合意性” 维度值为“合意的”，“褒贬性” 维度值为 “值得称赞的”且“可能性”维度值为“确定的”对应的情感类型为“骄傲”；“合意性”维度值为“不合意的”， “褒贬性”维度值为“应受责备的” 且“可能性”维度值为 “确定的”对应的情感类型为“羞耻”。工作实现的６种情感类型生成规则如下。规则１如果“合意性”维度值＝ “合意的”并且 “可能性”维度值＝ “确定的”对应的情感类型＝ “高兴”。规则２如果“合意性” 维度值＝ “不合意的” 并且“可能性”维度值＝ “确定的”对应的情感类型＝ “悲伤”。规则３如果“合意性”维度值＝ “不合意”并且 “可能性”维度值＝ “可能的” 对应的情感类型＝ “希望”。规则４如果 “合意性”维度值＝ “不合意的” 并且“可能性”维度值＝ “可能的”对应的情感类型＝ “恐惧”。规则５如果“合意性”维度值＝ “合意的”并且 “褒贬性” 维度值＝ “值得称赞的” 对应的情感类型＝ “骄傲”。规则６如果“合意性”维度值＝ “不合意的”并且“褒贬性”维度值＝ “应受责备的” 对应的情感类型＝ “羞耻”。根据前述的情感类型的生成过程，下面给出一个具体示例。第５期皇甫璐雯，等：一种基于ＯＣＣ模型的文本情感挖掘方法 ·６４９·

<<向上翻页向下翻页>>

点击下载：智能系统：一种基于OCC模型的文本情感挖掘方法