为了方便实验的描述，对实验中涉及的有关符号给出相应的定义，如表２所示

正在加载图片...

第1期王晓初，等：基于最小最大概率机的迁移学习分类算法 ·89· 为了方便实验的描述，对实验中涉及的有关符 MPM算法中的核函数都选取高斯核函数，参数σ在号给出相应的定义，如表2所示。 (0.001,0.01,0.1,1,10,100,1000)中选取。TL-MPM 表2实验中涉及的符号定义算法中的参数在(0.001,0.01,0.1,1,10,100,1000)中 Table 2 Definition of symbols in the experiment 选取。对表3处理好的6个真实分类数据集分别随符号定义机独立重复10次实验，选取最优参数下的取值，表4、 Ds 源域数据集表5和表6分别记录了10次独立重复实验正确率的 Dt 目标域数据集均值。仅利用目标域少量数据训练得到的目标域表4目标域样本的1%训练结果 T-LMPM MPM线性分类器 Table 4 Results of 1%training samples in the target domain/% 仅利用目标域少量数据训练得到的目标域数据集 T-LMPM T-KMPM LTL-MPM KTL-MPM T-KMPM MPM非线性分类器 comp ys rec 71.71 72.96 72.56 78.42 LTL-MPM 本文提出的TL-MPM算法得到的线性分类器 comp vs sci 66.46 74.16 72.22 76.49 KTL-MPM 本文提出的L,MPM算法得到的非线性分类器 comp ys talk 90.96 99.15 99.48 99.75 rec vs talk 60.51 71.29 66.26 76.14 4.1 20 News Groups数据集预处理首先对数据集分成源域训练数据和目标域训练 rec vs sci 62.49 71.00 64.17 76.48 数据，具体的处理结果如表3所示。 sci vs talk 68.21 77.24 67.98 76.44 表320 News Groups数据集处理结果 Table 3 Results of 20News Groups Data set processing 表5目标域样本的5%训练结果 Datasets Ds Dt Table 5 Results of 5%training samples in the target domain/% comp.graphics comp.windows.x 数据集 T-LMPM T-KMPM LTL-MPM KTL-MPM comp vs rec rec.motorcycles rec.autos comp.sys.ibm.pc. comp ys rec 61.46 80.92 64.19 83.94 comp.os.mswindows.misc comp vs sci hardware comp ys sci 58.72 76.33 63.29 79.56 sci.crypt sci.med comp.os.mswindows comp vs talk 94.13 99.41 97.74 99.83 comp.sys.mac.hardware comp vs talk misc rec vs talk 57.36 76.30 60.80 78.60 talk.politics.mideast talk.politics.guns rec vs sci 57.12 78.81 57.49 81.50 rec.autos rec.sport.baseball rec vs talk talk.politics.misc talk.religion.misc sci vs talk 57.42 86.34 63.98 86.75 rec.autos rec.sport.hockey rec vs sci sci.space sci.electronics 表6目标域样本的10%训练结果 sci.med sci.space Table 6 Results of 10%training samples in the target domain/ sci vs talk talk.religion.misc talk.politics.mideast 数据集 T-LMPM T-KMPM LTL-MPM KTL-MPM 其次，由于20 News Groups文本数据集的特 comp vs rec 76.46 85.51 80.05 86.06 征数很大，为了实验的方便，用主元分析法对数 comp vs sci 70.87 84.75 75.00 83.70 据集的特征做降维预处理，取前100维构成新的实验数据。 comp vs talk 96.16 99.32 98.66 99.69 4.2少量目标域训练样本上的实验结果与分析 rec vs talk 65.30 81.64 66.74 81.56 实验中取源域中的全部数据，分别取目标 rec vs sci 64.93 84.89 70.17 85.90 域中的1%、5%、10%的数据训练TL-MPM算法 sci vs talk 70.49 90.18 72.17 89.09 分类器和MPM算法分类器。在T-MPM和TL-为了方便实验的描述，对实验中涉及的有关符号给出相应的定义，如表２所示。表２实验中涉及的符号定义Ｔａｂｌｅ２Ｄｅｆｉｎｉｔｉｏｎｏｆｓｙｍｂｏｌｓｉｎｔｈｅｅｘｐｅｒｉｍｅｎｔ符号定义Ｄｓ源域数据集Ｄｔ目标域数据集Ｔ⁃ＬＭＰＭ仅利用目标域少量数据训练得到的目标域ＭＰＭ线性分类器Ｔ⁃ＫＭＰＭ仅利用目标域少量数据训练得到的目标域ＭＰＭ非线性分类器ＬＴＬ⁃ＭＰＭ本文提出的ＴＬ⁃ＭＰＭ算法得到的线性分类器ＫＴＬ⁃ＭＰＭ本文提出的ＴＬ⁃ＭＰＭ算法得到的非线性分类器４．１２０ＮｅｗｓＧｒｏｕｐｓ数据集预处理首先对数据集分成源域训练数据和目标域训练数据，具体的处理结果如表３所示。表３２０ＮｅｗｓＧｒｏｕｐｓ数据集处理结果Ｔａｂｌｅ３Ｒｅｓｕｌｔｓｏｆ２０ＮｅｗｓＧｒｏｕｐｓＤａｔａｓｅｔｐｒｏｃｅｓｓｉｎｇＤａｔａｓｅｔｓＤｓＤｔｃｏｍｐｖｓｒｅｃｃｏｍｐ．ｇｒａｐｈｉｃｓｒｅｃ．ｍｏｔｏｒｃｙｃｌｅｓｃｏｍｐ．ｗｉｎｄｏｗｓ．ｘｒｅｃ．ａｕｔｏｓｃｏｍｐｖｓｓｃｉｃｏｍｐ．ｏｓ．ｍｓｗｉｎｄｏｗｓ．ｍｉｓｃｓｃｉ．ｃｒｙｐｔｃｏｍｐ．ｓｙｓ．ｉｂｍ．ｐｃ．ｈａｒｄｗａｒｅｓｃｉ．ｍｅｄｃｏｍｐｖｓｔａｌｋｃｏｍｐ．ｓｙｓ．ｍａｃ．ｈａｒｄｗａｒｅｔａｌｋ．ｐｏｌｉｔｉｃｓ．ｍｉｄｅａｓｔｃｏｍｐ．ｏｓ．ｍｓｗｉｎｄｏｗｓ．ｍｉｓｃｔａｌｋ．ｐｏｌｉｔｉｃｓ．ｇｕｎｓｒｅｃｖｓｔａｌｋｒｅｃ．ａｕｔｏｓｔａｌｋ．ｐｏｌｉｔｉｃｓ．ｍｉｓｃｒｅｃ．ｓｐｏｒｔ．ｂａｓｅｂａｌｌｔａｌｋ．ｒｅｌｉｇｉｏｎ．ｍｉｓｃｒｅｃｖｓｓｃｉｒｅｃ．ａｕｔｏｓｓｃｉ．ｓｐａｃｅｒｅｃ．ｓｐｏｒｔ．ｈｏｃｋｅｙｓｃｉ．ｅｌｅｃｔｒｏｎｉｃｓｓｃｉｖｓｔａｌｋｓｃｉ．ｍｅｄｔａｌｋ．ｒｅｌｉｇｉｏｎ．ｍｉｓｃｓｃｉ．ｓｐａｃｅｔａｌｋ．ｐｏｌｉｔｉｃｓ．ｍｉｄｅａｓｔ其次，由于２０ＮｅｗｓＧｒｏｕｐｓ文本数据集的特征数很大，为了实验的方便，用主元分析法对数据集的特征做降维预处理，取前１００维构成新的实验数据。４．２少量目标域训练样本上的实验结果与分析实验中取源域中的全部数据，分别取目标域中的１％、５％、１０％的数据训练ＴＬ⁃ＭＰＭ算法分类器和ＭＰＭ算法分类器。在Ｔ⁃ＭＰＭ和ＴＬ⁃ ＭＰＭ算法中的核函数都选取高斯核函数，参数 σ 在（０．００１，０．０１，０．１，１，１０，１００，１０００）中选取。ＴＬ⁃ＭＰＭ算法中的参数在（０．００１，０．０１，０．１，１，１０，１００，１０００）中选取。对表３处理好的６个真实分类数据集分别随机独立重复１０次实验，选取最优参数下的取值，表４、表５和表６分别记录了１０次独立重复实验正确率的均值。表４目标域样本的１％训练结果Ｔａｂｌｅ４Ｒｅｓｕｌｔｓｏｆ１％ｔｒａｉｎｉｎｇｓａｍｐｌｅｓｉｎｔｈｅｔａｒｇｅｔｄｏｍａｉｎ／％数据集Ｔ⁃ＬＭＰＭＴ⁃ＫＭＰＭＬＴＬ⁃ＭＰＭＫＴＬ⁃ＭＰＭｃｏｍｐｖｓｒｅｃ７１．７１７２．９６７２．５６７８．４２ｃｏｍｐｖｓｓｃｉ６６．４６７４．１６７２．２２７６．４９ｃｏｍｐｖｓｔａｌｋ９０．９６９９．１５９９．４８９９．７５ｒｅｃｖｓｔａｌｋ６０．５１７１．２９６６．２６７６．１４ｒｅｃｖｓｓｃｉ６２．４９７１．００６４．１７７６．４８ｓｃｉｖｓｔａｌｋ６８．２１７７．２４６７．９８７６．４４表５目标域样本的５％训练结果Ｔａｂｌｅ５Ｒｅｓｕｌｔｓｏｆ５％ｔｒａｉｎｉｎｇｓａｍｐｌｅｓｉｎｔｈｅｔａｒｇｅｔｄｏｍａｉｎ／％数据集Ｔ⁃ＬＭＰＭＴ⁃ＫＭＰＭＬＴＬ⁃ＭＰＭＫＴＬ⁃ＭＰＭｃｏｍｐｖｓｒｅｃ６１．４６８０．９２６４．１９８３．９４ｃｏｍｐｖｓｓｃｉ５８．７２７６．３３６３．２９７９．５６ｃｏｍｐｖｓｔａｌｋ９４．１３９９．４１９７．７４９９．８３ｒｅｃｖｓｔａｌｋ５７．３６７６．３０６０．８０７８．６０ｒｅｃｖｓｓｃｉ５７．１２７８．８１５７．４９８１．５０ｓｃｉｖｓｔａｌｋ５７．４２８６．３４６３．９８８６．７５表６目标域样本的１０％训练结果Ｔａｂｌｅ６Ｒｅｓｕｌｔｓｏｆ１０％ｔｒａｉｎｉｎｇｓａｍｐｌｅｓｉｎｔｈｅｔａｒｇｅｔｄｏｍａｉｎ／％数据集Ｔ⁃ＬＭＰＭＴ⁃ＫＭＰＭＬＴＬ⁃ＭＰＭＫＴＬ⁃ＭＰＭｃｏｍｐｖｓｒｅｃ７６．４６８５．５１８０．０５８６．０６ｃｏｍｐｖｓｓｃｉ７０．８７８４．７５７５．００８３．７０ｃｏｍｐｖｓｔａｌｋ９６．１６９９．３２９８．６６９９．６９ｒｅｃｖｓｔａｌｋ６５．３０８１．６４６６．７４８１．５６ｒｅｃｖｓｓｃｉ６４．９３８４．８９７０．１７８５．９０ｓｃｉｖｓｔａｌｋ７０．４９９０．１８７２．１７８９．０９第１期王晓初，等：基于最小最大概率机的迁移学习分类算法 ·８９·

<<向上翻页向下翻页>>

点击下载：【机器学习】基于最小最大概率机的迁移学习分类算法编辑部