第16卷第3期 智能系统学报 Vol.16 No.3 2021年5月 CAAI Transactions on Intelligent Systems May 2021 D0:10.11992/tis.202001027 三角距离相关性的标签分布学习 黄雨婷,徐媛媛,张恒汝,闵帆 (西南石油大学计算机科学学院,四川成都610500) 摘要:针对标签相关性的表征问题,提出一种基于三角距离相关性的标签分布学习算法。首先,构建距离映 射矩阵,描述标签分布和特征矩阵之间的映射关系。其次,设计新的三角距离,以表征标签之间的相关性。最 后,结合标签相关性,设计基于Kullback-Leibler散度的目标函数。在8个数据集上的实验结果表明,与8种主 流算法相比,本文提出的算法在6个准确性指标上占优势。 关键词:标签分布学习:标签相关性;三角距离:距离映射矩阵:多标签学习:最大嫡模型:Kullback-Leibler散 度:L-BFGS方法 中图分类号:TP391文献标志码:A 文章编号:1673-4785(2021)03-0449-10 中文引用格式:黄雨婷,徐媛媛,张恒汝,等.三角距离相关性的标签分布学习W.智能系统学报,2021,16(3):449-458. 英文引用格式:HUANG Yuting,XU Yuanyuan,ZHANG Hengru,etal.Label distribution learning based on triangular distance correlation[J.CAAI transactions on intelligent systems,2021,16(3):449-458. Label distribution learning based on triangular distance correlation HUANG Yuting,XU Yuanyuan,ZHANG Hengru,MIN Fan (College of Computer Science,Southwest Petroleum University,Chengdu 610500,China) Abstract:Aiming at the representation problem of label correlation,a label distribution learning algorithm based on tri- angular distance correlation is proposed in this paper.First,a distance-mapping matrix is constructed to describe the mapping relationship between the label distribution and the feature matrix.Then a new triangle distance is designed to characterize the correlation between the labels.Finally,based on the label correlation,the Kullback-Leibler divergence- based objective function is designed.Results on eight datasets show that the proposed algorithm is superior in six evalu- ation measures in terms of accuracy compared with eight mainstream algorithms. Keywords:label distribution learning;label correlation;triangular distance;distance mapping matrix;multi-label learn- ing;maximum entropy model;Kullback-Leibler divergence;L-BFGS method 标签分布学习(label distribution learning,LDL)提出了LDLLC(label distribution learning by exploit- 是多标签学习(muti--label earing,MLL)的泛化。 ing label correlation)算法,使用皮尔逊相关系数 MLL用标签集的部分标签来描述实例,LDL 描述了标签之间的相关性。Zheng等1提出了 用标签集所有标签的表征程度构成的分布来描述 LDL-SCL(label distribution learning by exploiting 实例2-1。文献[l2]将年龄估计问题泛化到LDL sample correlation locally)算法,考虑实例之间的相 中,降低了平均绝对误差(mean absolute deviation, 关性。后2种方法显著提高了模型对标签分布的 MAE)。文献[I3]将人群计数问题泛化到LDL中, 预测能力。 提高了人群计数的准确率。 本文提出了一种三角距离相关性的标签分布 Geng等W提出了SA-IS(specialized algorithm 学习算法(label distribution learning based on trian- improithm Iternative scaling)算法,将单个标签数据 gular distance correlation,T-LDL)o首先,令X和D 转换为分布数据,但未考虑标签的相关性。Ja等 分别表示特征矩阵和标签分布矩阵,构建距离映 射矩阵0描述X和D之间的映射关系。其次,设 收稿日期:2020-01-20. 基金项目:国家自然科学基金项目(61902328). 计新的相似度距离,以表征标签之间的相关性。 通信作者:张恒汝.E-mail:zhanghrswpu(@l63.com 最后,结合标签相关性,设计基于KL(kullback-lei-DOI: 10.11992/tis.202001027 三角距离相关性的标签分布学习 黄雨婷,徐媛媛,张恒汝,闵帆 (西南石油大学 计算机科学学院,四川 成都 610500) 摘 要:针对标签相关性的表征问题,提出一种基于三角距离相关性的标签分布学习算法。首先,构建距离映 射矩阵,描述标签分布和特征矩阵之间的映射关系。其次,设计新的三角距离,以表征标签之间的相关性。最 后,结合标签相关性,设计基于 Kullback-Leibler 散度的目标函数。在 8 个数据集上的实验结果表明,与 8 种主 流算法相比,本文提出的算法在 6 个准确性指标上占优势。 关键词:标签分布学习;标签相关性;三角距离;距离映射矩阵;多标签学习;最大熵模型;Kullback-Leibler 散 度;L-BFGS 方法 中图分类号:TP391 文献标志码:A 文章编号:1673−4785(2021)03−0449−10 中文引用格式:黄雨婷, 徐媛媛, 张恒汝, 等. 三角距离相关性的标签分布学习 [J]. 智能系统学报, 2021, 16(3): 449–458. 英文引用格式:HUANG Yuting, XU Yuanyuan, ZHANG Hengru, et al. Label distribution learning based on triangular distance correlation[J]. CAAI transactions on intelligent systems, 2021, 16(3): 449–458. Label distribution learning based on triangular distance correlation HUANG Yuting,XU Yuanyuan,ZHANG Hengru,MIN Fan (College of Computer Science, Southwest Petroleum University, Chengdu 610500, China) Abstract: Aiming at the representation problem of label correlation, a label distribution learning algorithm based on triangular distance correlation is proposed in this paper. First, a distance-mapping matrix is constructed to describe the mapping relationship between the label distribution and the feature matrix. Then a new triangle distance is designed to characterize the correlation between the labels. Finally, based on the label correlation, the Kullback-Leibler divergencebased objective function is designed. Results on eight datasets show that the proposed algorithm is superior in six evaluation measures in terms of accuracy compared with eight mainstream algorithms. Keywords: label distribution learning; label correlation; triangular distance; distance mapping matrix; multi-label learning; maximum entropy model; Kullback-Leibler divergence; L-BFGS method 标签分布学习 (label distribution learning,LDL) 是多标签学习 (muti-label learning,MLL) 的泛化[1-8]。 MLL 用标签集的部分标签来描述实例[9-11] ,LDL 用标签集所有标签的表征程度构成的分布来描述 实例[12-15]。文献 [12] 将年龄估计问题泛化到 LDL 中,降低了平均绝对误差 (mean absolute deviation, MAE)。文献 [13] 将人群计数问题泛化到 LDL 中, 提高了人群计数的准确率。 Geng 等 [1] 提出了 SA-IIS(specialized algorithm improithm lternative scaling) 算法,将单个标签数据 转换为分布数据,但未考虑标签的相关性。Jia 等 [16] 提出了 LDLLC(label distribution learning by exploiting label correlation) 算法,使用皮尔逊相关系数 描述了标签之间的相关性。Zheng 等 [17] 提出了 LDL-SCL(label distribution learning by exploiting sample correlation locally) 算法,考虑实例之间的相 关性。后 2 种方法显著提高了模型对标签分布的 预测能力。 本文提出了一种三角距离相关性的标签分布 学习算法 (label distribution learning based on triangular distance correlation,T-LDL)。首先,令 X 和 D 分别表示特征矩阵和标签分布矩阵,构建距离映 射矩阵 θ 描述 X 和 D 之间的映射关系。其次,设 计新的相似度距离,以表征标签之间的相关性。 最后,结合标签相关性,设计基于 KL (kullback-lei- 收稿日期:2020−01−20. 基金项目:国家自然科学基金项目 (61902328). 通信作者:张恒汝. E-mail:zhanghrswpu@163.com. 第 16 卷第 3 期 智 能 系 统 学 报 Vol.16 No.3 2021 年 5 月 CAAI Transactions on Intelligent Systems May 2021