正在加载图片...
·450· 智能系统学报 第16卷 bler divergence)散度I的目标函数,利用从训练 表征度较高,{森林,沙漠}2个标签对图1(a)的表 数据直接获取的X和D拟合0以预测标签分布。 征度较低。 在8个真实数据集上,将本文提出算法与8种 主流算法进行对比实验,利用Euclidean距离I例 Sorensen距离o、Squardx距离u、KL散度u、In- tersection相似度2a和Fidelity相似度2共6种指 标进行评价。结果表明,本文提出的算法在其中 3个数据集上所有指标均为最优,在其余的数据 集上部分指标占优。 1相关工作 (a)示例图 1.0 首先提出LDL的问题描述与运行实例,然后 0.8 讨论流行的LDL算法及其目标函数。表1列出 0.6 了本文的符号系统。 0.4 表1符号系统 0.2 Table 1 Notations 符号 含义 0 森林海洋沙漠城市 森林海洋沙漠城市 R q维的输入空间 (b)多标签学习 (c)标签分布学习 上 完整标签集 图1MLL与LDL的比较 训练集 Fig.1 Differences between MLL and LDL 第个实例 表2和表3为一个标签分布学习的运行实例, d x对应的实际标签分布 分别为特征矩阵X和实际标签分布矩阵D,这里 Pi x对应的预测标签分布 S={(x1,d1),(x2,d2),…,(x4,d)},q=5,c=4。{天 Xir 第个实例的第r个特征 空,水,房屋,沙子,树木}5个特征表征了图1(a) dy 第个标签对x,的实际表征度 中包含的信息。{森林,海洋,城市,沙漠}为完整 a 距离映射矩阵 + 标签集。以加粗行为例,x1=[0.38,0.35,0.00,0.12, 特征矩阵 0.15],d1=[0.16,0.55,0.10,0.19],其中x1=0.38表 D 实际标签分布矩阵 示天空占图片面积的38%,d:=0.16表示森林描 1.1LDL问题描述 述该图片的程度为16%。 标签分布学习相对于单标签和多标签学习而 表2特征矩阵X 言,以一种更自然的方式去标记实例,并且为它 Table 2 Feature matrix X 的每个可能的标签分配一个数值。下面给出它的 特征分布 天空 水 房屋沙子 树木 形式化定义四。令X=R为q维输入空间,表示 X1 0.380.350.00 0.12 0.15 特征矩阵;Y={,2,…,}为完整标签集,c为标 0.12 0.20 0.50 0.11 0.07 签的数量;D表示实际标签分布矩阵;给定一个 X3 0.11 0.10 0.05 0.19 0.55 0.20 0.01 0.07 0.70 0.02 训练集S={XD}={x,d},{x2,d},…,{xm,dn}. 其中x,=[x1x2…x]∈X为第i个实例,d,= 表3 标签分布矩阵D [d1d2…de]∈[0,l]为x对应的实际标签分布, Table 3 Label distribution matrix D d是标签y对x的实际表征度,且d=l。 类别 森林 海洋 沙漠 城市 d 0.16 0.55 0.10 0.19 1.2运行实例 d 0.14 0.20 0.10 0.56 图1(a)为需要标记的一个示例图片2,其完 d3 0.85 0.05 0.03 0.07 整标签集为{森林,海洋,沙漠,城市}。图1b)表明 0.10 0.05 0.76 0.09 MLL中仅有{海洋,城市}2个标签能够描述图l(a)。 X和D之间的映射关系可以通过距离映射矩 图1(c)说明LDL利用这4个标签构成的分布来 阵0来描述。给定训练集后,LDL的目标为学习 描述该图片,且{海洋,城市}2个标签对图1(a)的 到该距离映射矩阵6,再通过0计算出预测标bler divergence) 散度[18] 的目标函数,利用从训练 数据直接获取的 X 和 D 拟合 θ 以预测标签分布。 在 8 个真实数据集上,将本文提出算法与 8 种 主流算法进行对比实验,利用 Euclidean 距离[19] 、 Sørensen 距离[20] 、Squardχ2 距离[21] 、KL 散度[18] 、In￾tersection 相似度[22] 和 Fidelity 相似度[23] 共 6 种指 标进行评价。结果表明,本文提出的算法在其中 3 个数据集上所有指标均为最优,在其余的数据 集上部分指标占优。 1 相关工作 首先提出 LDL 的问题描述与运行实例,然后 讨论流行的 LDL 算法及其目标函数。表 1 列出 了本文的符号系统。 表 1 符号系统 Table 1 Notations 符号 含义 R q q维的输入空间 Y 完整标签集 S 训练集 xi 第i个实例 di xi对应的实际标签分布 pi xi对应的预测标签分布 xir 第i个实例的第r个特征 dij 第j个标签对xi的实际表征度 θ 距离映射矩阵 X 特征矩阵 D 实际标签分布矩阵 1.1 LDL 问题描述 ∑c j=1 di j = 1 标签分布学习相对于单标签和多标签学习而 言,以一种更自然的方式去标记实例,并且为它 的每个可能的标签分配一个数值。下面给出它的 形式化定义[1]。令 X = R q 为 q 维输入空间,表示 特征矩阵;Y = {y1 , y2 , …, yc}为完整标签集,c 为标 签的数量;D 表示实际标签分布矩阵;给定一个 训练集 S = {X, D} = {{x1 , d1}, {x2 , d2},…,{xn , dn}}, 其中 xi = [xi 1 xi 2 … xi q ]∈X 为第 i 个实例, di = [di1 di2 … dic]∈[0,1]c 为 xi 对应的实际标签分布, dij 是标签 yj 对 xi 的实际表征度,且 。 1.2 运行实例 图 1(a) 为需要标记的一个示例图片[24] ,其完 整标签集为{森林,海洋,沙漠,城市}。图 1(b) 表明 MLL 中仅有{海洋,城市}2 个标签能够描述图 1(a)。 图 1(c) 说明 LDL 利用这 4 个标签构成的分布来 描述该图片,且{海洋,城市}2 个标签对图 1(a) 的 表征度较高,{森林,沙漠}2 个标签对图 1(a) 的表 征度较低。 (a) 示例图 森林 海洋 沙漠 城市 0 1 dij dij 森林 海洋 沙漠 城市 1.0 0.8 0.6 0.4 0.2 0 (b) 多标签学习 (c) 标签分布学习 图 1 MLL 与 LDL 的比较 Fig. 1 Differences between MLL and LDL 表 2 和表 3 为一个标签分布学习的运行实例, 分别为特征矩阵 X 和实际标签分布矩阵 D,这里 S = {(x1 ,d1 ), (x2 , d2 ), …, (x4 , d4 )},q = 5,c = 4。{天 空,水,房屋,沙子,树木}5 个特征表征了图 1(a) 中包含的信息。{森林,海洋,城市,沙漠}为完整 标签集。以加粗行为例,x1 = [0.38, 0.35, 0.00, 0.12, 0.15],d1 = [0.16, 0.55, 0.10, 0.19],其中 x11 = 0.38 表 示天空占图片面积的 38%,d11 = 0.16 表示森林描 述该图片的程度为 16%。 表 2 特征矩阵 X Table 2 Feature matrix X 特征分布 天空 水 房屋 沙子 树木 x1 0.38 0.35 0.00 0.12 0.15 x2 0.12 0.20 0.50 0.11 0.07 x3 0.11 0.10 0.05 0.19 0.55 x4 0.20 0.01 0.07 0.70 0.02 表 3 标签分布矩阵 D Table 3 Label distribution matrix D 类别 森林 海洋 沙漠 城市 d1 0.16 0.55 0.10 0.19 d2 0.14 0.20 0.10 0.56 d3 0.85 0.05 0.03 0.07 d4 0.10 0.05 0.76 0.09 X 和 D 之间的映射关系可以通过距离映射矩 阵 θ 来描述。给定训练集后,LDL 的目标为学习 到该距离映射矩阵 θ [16] ,再通过 θ 计算出预测标 ·450· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有