正在加载图片...
第16卷第3期 智能系统学报 Vol.16 No.3 2021年5月 CAAI Transactions on Intelligent Systems May 2021 D0:10.11992/tis.202001027 三角距离相关性的标签分布学习 黄雨婷,徐媛媛,张恒汝,闵帆 (西南石油大学计算机科学学院,四川成都610500) 摘要:针对标签相关性的表征问题,提出一种基于三角距离相关性的标签分布学习算法。首先,构建距离映 射矩阵,描述标签分布和特征矩阵之间的映射关系。其次,设计新的三角距离,以表征标签之间的相关性。最 后,结合标签相关性,设计基于Kullback-Leibler散度的目标函数。在8个数据集上的实验结果表明,与8种主 流算法相比,本文提出的算法在6个准确性指标上占优势。 关键词:标签分布学习:标签相关性;三角距离:距离映射矩阵:多标签学习:最大嫡模型:Kullback-Leibler散 度:L-BFGS方法 中图分类号:TP391文献标志码:A 文章编号:1673-4785(2021)03-0449-10 中文引用格式:黄雨婷,徐媛媛,张恒汝,等.三角距离相关性的标签分布学习W.智能系统学报,2021,16(3):449-458. 英文引用格式:HUANG Yuting,XU Yuanyuan,ZHANG Hengru,etal.Label distribution learning based on triangular distance correlation[J.CAAI transactions on intelligent systems,2021,16(3):449-458. Label distribution learning based on triangular distance correlation HUANG Yuting,XU Yuanyuan,ZHANG Hengru,MIN Fan (College of Computer Science,Southwest Petroleum University,Chengdu 610500,China) Abstract:Aiming at the representation problem of label correlation,a label distribution learning algorithm based on tri- angular distance correlation is proposed in this paper.First,a distance-mapping matrix is constructed to describe the mapping relationship between the label distribution and the feature matrix.Then a new triangle distance is designed to characterize the correlation between the labels.Finally,based on the label correlation,the Kullback-Leibler divergence- based objective function is designed.Results on eight datasets show that the proposed algorithm is superior in six evalu- ation measures in terms of accuracy compared with eight mainstream algorithms. Keywords:label distribution learning;label correlation;triangular distance;distance mapping matrix;multi-label learn- ing;maximum entropy model;Kullback-Leibler divergence;L-BFGS method 标签分布学习(label distribution learning,LDL)提出了LDLLC(label distribution learning by exploit- 是多标签学习(muti--label earing,MLL)的泛化。 ing label correlation)算法,使用皮尔逊相关系数 MLL用标签集的部分标签来描述实例,LDL 描述了标签之间的相关性。Zheng等1提出了 用标签集所有标签的表征程度构成的分布来描述 LDL-SCL(label distribution learning by exploiting 实例2-1。文献[l2]将年龄估计问题泛化到LDL sample correlation locally)算法,考虑实例之间的相 中,降低了平均绝对误差(mean absolute deviation, 关性。后2种方法显著提高了模型对标签分布的 MAE)。文献[I3]将人群计数问题泛化到LDL中, 预测能力。 提高了人群计数的准确率。 本文提出了一种三角距离相关性的标签分布 Geng等W提出了SA-IS(specialized algorithm 学习算法(label distribution learning based on trian- improithm Iternative scaling)算法,将单个标签数据 gular distance correlation,T-LDL)o首先,令X和D 转换为分布数据,但未考虑标签的相关性。Ja等 分别表示特征矩阵和标签分布矩阵,构建距离映 射矩阵0描述X和D之间的映射关系。其次,设 收稿日期:2020-01-20. 基金项目:国家自然科学基金项目(61902328). 计新的相似度距离,以表征标签之间的相关性。 通信作者:张恒汝.E-mail:zhanghrswpu(@l63.com 最后,结合标签相关性,设计基于KL(kullback-lei-DOI: 10.11992/tis.202001027 三角距离相关性的标签分布学习 黄雨婷,徐媛媛,张恒汝,闵帆 (西南石油大学 计算机科学学院,四川 成都 610500) 摘 要:针对标签相关性的表征问题,提出一种基于三角距离相关性的标签分布学习算法。首先,构建距离映 射矩阵,描述标签分布和特征矩阵之间的映射关系。其次,设计新的三角距离,以表征标签之间的相关性。最 后,结合标签相关性,设计基于 Kullback-Leibler 散度的目标函数。在 8 个数据集上的实验结果表明,与 8 种主 流算法相比,本文提出的算法在 6 个准确性指标上占优势。 关键词:标签分布学习;标签相关性;三角距离;距离映射矩阵;多标签学习;最大熵模型;Kullback-Leibler 散 度;L-BFGS 方法 中图分类号:TP391 文献标志码:A 文章编号:1673−4785(2021)03−0449−10 中文引用格式:黄雨婷, 徐媛媛, 张恒汝, 等. 三角距离相关性的标签分布学习 [J]. 智能系统学报, 2021, 16(3): 449–458. 英文引用格式:HUANG Yuting, XU Yuanyuan, ZHANG Hengru, et al. Label distribution learning based on triangular distance correlation[J]. CAAI transactions on intelligent systems, 2021, 16(3): 449–458. Label distribution learning based on triangular distance correlation HUANG Yuting,XU Yuanyuan,ZHANG Hengru,MIN Fan (College of Computer Science, Southwest Petroleum University, Chengdu 610500, China) Abstract: Aiming at the representation problem of label correlation, a label distribution learning algorithm based on tri￾angular distance correlation is proposed in this paper. First, a distance-mapping matrix is constructed to describe the mapping relationship between the label distribution and the feature matrix. Then a new triangle distance is designed to characterize the correlation between the labels. Finally, based on the label correlation, the Kullback-Leibler divergence￾based objective function is designed. Results on eight datasets show that the proposed algorithm is superior in six evalu￾ation measures in terms of accuracy compared with eight mainstream algorithms. Keywords: label distribution learning; label correlation; triangular distance; distance mapping matrix; multi-label learn￾ing; maximum entropy model; Kullback-Leibler divergence; L-BFGS method 标签分布学习 (label distribution learning,LDL) 是多标签学习 (muti-label learning,MLL) 的泛化[1-8]。 MLL 用标签集的部分标签来描述实例[9-11] ,LDL 用标签集所有标签的表征程度构成的分布来描述 实例[12-15]。文献 [12] 将年龄估计问题泛化到 LDL 中,降低了平均绝对误差 (mean absolute deviation, MAE)。文献 [13] 将人群计数问题泛化到 LDL 中, 提高了人群计数的准确率。 Geng 等 [1] 提出了 SA-IIS(specialized algorithm improithm lternative scaling) 算法,将单个标签数据 转换为分布数据,但未考虑标签的相关性。Jia 等 [16] 提出了 LDLLC(label distribution learning by exploit￾ing label correlation) 算法,使用皮尔逊相关系数 描述了标签之间的相关性。Zheng 等 [17] 提出了 LDL-SCL(label distribution learning by exploiting sample correlation locally) 算法,考虑实例之间的相 关性。后 2 种方法显著提高了模型对标签分布的 预测能力。 本文提出了一种三角距离相关性的标签分布 学习算法 (label distribution learning based on trian￾gular distance correlation,T-LDL)。首先,令 X 和 D 分别表示特征矩阵和标签分布矩阵,构建距离映 射矩阵 θ 描述 X 和 D 之间的映射关系。其次,设 计新的相似度距离,以表征标签之间的相关性。 最后,结合标签相关性,设计基于 KL (kullback-lei- 收稿日期:2020−01−20. 基金项目:国家自然科学基金项目 (61902328). 通信作者:张恒汝. E-mail:zhanghrswpu@163.com. 第 16 卷第 3 期 智 能 系 统 学 报 Vol.16 No.3 2021 年 5 月 CAAI Transactions on Intelligent Systems May 2021
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有