·538 智能系统学报 第5卷 且小于该情感因子的综合置信度值,根据实验经验 数/总分割区域数”统计出平均识别率为78.2%.从 本文规定该阈值为0.75. 识别结果可以看出,颜色、纹理特征越统一、越鲜明 的图像区域,如雪山、蓝天、绿草地等,其识别效果越 4实验结果与分析 好,可达到90%左右;而对于建筑物和花等对图像 以Matlab为工作平台,开发了一个图像情感标 形状特征要求较高的语义类,识别效果要差很多,只 识原型系统,系统分为训练和测试2个阶段.在训练 有约50%.最后采用D-S证据理论计算每幅图像对 阶段,从Corel图片库中选择120幅自然风景图像, 各情感因子的综合置信度并判断最终情感类别, 从中手工分割出200个图像区域作为训练样本,训 为了验证情感标识的准确性,为系统增加了检 练图像内容分类器SVM.这200个图像区域涵盖了 索功能,检索关键词为情感因子.图3显示了200幅 狭义关键词描述的44种语义内容,并且为每个狭义 图像中关键词为“清醒的”的部分检索结果 关键词提供了至少2个图像样本.通过3重交叉验 证和网格搜索算法实验,发现C=2',y=2-1能获 得最小的3重交叉验证误差,因此采用这2个核参 数值代表训练好的SVM. 另一方面通过小规模问卷调查来获得各种颜色 和各语义内容的D-S不确定性区间,即得出各种颜 色和各种语义内容给观察者带来“悠闲的、宁静的、 清醒的、精力充沛的”这4种情感认知的概率范围, 由于颜色及语义内容的多样性,让参与者回答所有 颜色和语义的情感认知工作量太大,进而会影响调 图4关键词为“清醒的”的部分检案结果 查的准确性.本实验请80位在校大学生参与,同时 Fig.4 A part of retrieval results of"clear-headed" 将20幅颜色图片(包括黑色、白色各一幅,其他颜 然后采用最常用的检索查准率(precision,P,) 色按照亮度不同各2幅)和上述200个手工分割的 和查全率(recall,.R)进行检索效果度量.检索查准 图像区域组成问卷调查图片库.这些图片被随机分 率和查全率的定义分别为P,=N/N,R。=N/N, 为22组,每组由10幅图像组成.每位学生只需选择 其中N。代表检索到符合用户此种情感认知的图像 一组图像完成问卷调查即可.根据卷面结果统计出 数,N,代表被标识系统标上该关键词的图像数,N。 各种颜色和各语义内容图像引起4种情感认知的概 表示系统用户手工标注该关键词的图像数.随机抽 率范围.限于篇幅只列出部分颜色及图像内容对 选8位在校大学生参加检索测侧试,他们的检索查准 “悠闲的”、“清醒的”这2种情感因子的D-S不确定 率和查全率差距不大,限于篇幅,列出平均查准率最 性区间(如表4所示) 高和最低2位实验者的数据(如表5所示). 表4部分颜色及图像内容对2种情感因子的不确定性区间 表5扩大语义内容的不确定性区间前后的情感检索结果 Table 4 Uncertainty ranges of some colors and objects for Table 5 Precision and recall of affective retrieval before “relaxed"and“clear-.headed" and after enlarging uncertainty range % 颜色名/内容 悠闲的 清醒的 扩大语义内容 扩大30%语义内容 黑色 [0.2,0.4] [0.5,0.8] 情感因子 不确定区间前 不确定区间后 灰色 [0.2,0.7] [0.2,0.5] 查准率查全率 查准率 查全率 红色 [0.4,0.8] [0.56,0.861 悠闲的 77.7884.00 82.40 84.0 绿色 [0.8,0.9] [0.67,0.9] 平静的 83.80 77.50 92.30 90.0 蓝色 [0.8,0.9 [0.83,0.93] [0.8,0.951 清醒的 92.30 80.00 96.40 88.3 白色 [0.6,0.9 雪地 [0.67,0.8 [0.78,0.981 精力充沛 78.90 90.00 89.10 98.0 海洋 [0.4,0.6] [0.48,0.6] 悠闲的 82.50 68.75 85.70 75.0 晴天 [0.6,0.7] [0.67,0.971 平静的 66.6780.90 79.20 90.5 云彩 [0.72,0.92] [0.72,0.82] 清醒的83.80 89.60 91.60 94.8 小山丘 [0.3,0.7] [0.25,0.75] 精力充沛 85.10 76.90 90.00 86.5 在测试阶段,从Corel图片库中另选200幅自然 考虑到图像内容识别会引入一定误差,按30% 风景图像,采用像素聚类法先将各图像分割成3~5 的比例扩大了图像语义内容对各情感因子的不确定 个区域,然后用训练好的DAGSVM对每一区域的内 性区间.例如,将“雪地”在“悠闲的”上的不确定性 容进行分类识别,并根据“识别率=正确识别区域 区间从[0.67,0.8]扩大为[0.6505,0.8195].然