表４８个算法在人工数据集的对比Ｔａｂｌｅ４Ｃｏｍｐａｒｉｓｏｎ

正在加载图片...

.316. 智能系统学报第11卷表48个算法在人工数据集的对比 Table4 Comparison of 8 algorithms on artificial data sets 算法数据集评价指标 LSSMTC Co-Clustering FPCM TSC T-GIFP-FCM SS-FPCM TSS-FPCM ITSS-FPCM F-measure 0.6834 0.6648 0.63310.7688 0.6956 0.6984 0.7187 0.7336 RI 0.5585 0.5550 0.52410.6450 0.5770 0.5750 0.5958 0.6095 sciSet1 AC 0.8165 0.6675 0.75000.7700 0.6975 0.6950 0.7200 0.7350 NMI 0.1341 0.1021 0.11890.2923 0.1483 0.1098 0.1342 0.1564 F-measure 0.6867 0.6394 0.69800.8827 0.8907 0.8311 0.8469 0.9158 RI 0.5803 0.5395 0.57690.7921 0.8037 0.7204 0.7409 0.8440 rec vs talk AC 0.7053 0.6425 0.6975 0.8825 0.8900 0.8325 0.8475 0.9150 NMI 0.1769 0.0871 0.09930.4637 0.4873 0.3492 0.3750 0.5748 F-measure 0.6427 0.6139 0.47870.8554 0.8897 0.8214 0.8253 0.8858 RI 0.7828 0.7473 0.6825 0.9070 0.9299 0.8845 0.8884 0.9300 TDT2 AC 0.6983 0.7133 0.60830.8633 0.8967 0.8333 0.8350 0.8883 NMI 0.5426 0.5750 0.39800.7535 0.8093 0.7199 0.7217 0.8298 F-measure 0.7101 0.6840 0.6361 0.8247 0.8533 0.8121 0.8178 0.8608 RI 0.8125 0.7153 0.66200.8419 0.8658 0.8323 0.8376 0.8709 Reuters-21578 AC 0.8200 0.7275 0.71910.8300 0.8550 0.8150 0.8200 0.8650 NMI 0.5662 0.5052 0.44850.6590 0.6430 0.6162 0.62420.7076 4 结束语 mathematics and information sciences,2014,8(4):2033- 2040 本文将半监督学习思想应用到FPCM算法上， [3]DAI Wenyuan,XUE Guirong,YANG Qiang,et al.Co- 提出半监督SS-FPCM算法：迁移学习方面对算法进 clustering based classification for out-of-domain documents 行非负迁移改进，得到TSS-FPCM算法，再利用“代 [C]//Proceedings of the 13th ACM SIGKDD Tinternational Conference on Knowledge Discovery and Data Mining.San 表点”代替原始数据提出了改进的半监督的迁移聚 Jose,California,USA,2007:210-219. 类算法TSS-FPCM。在多种数据集上的实验验证表 [4]DAI Wenyuan,YANG Qiang,XUE Guirong,et al.Self- 明，TSS-FPCM算法在性能上要好于SS-FPCM算法 taught clustering[C]//Proceedings of the 25th International 与TSS-FPCM算法。在数据量不足、数据被污染的 Conference on Machine Learning.Helsinki,Finland,, 情况下，TSS-FPCM算法能够提升聚类的性能：算法 2008:200-207. 在源数据与目标数据相关不大时效果一般，下一步 [5]SAMANTA S,SELVAN A T,DAS S.Cross-domain cluste- 研究将会提取其他相关信息改善聚类性能，同时考 ring performed by transfer of knowledge across domains 虑参数的优化问题。 [C]//Proceedings of the 4th National Conference on Pat- tern Recognition,Image Processing and Graphics 参考文献： (NCVPRIPG).Jodhpur,India,2013:1-4. [6]DAI Wenyuan,XUE Guirong,YANG Qiang,et al.Trans- [1]庄福振，罗平，何清，等.迁移学习研究进展[J].软件 ferring naive Bayes classifiers for text classification[C]/ 学报，2015,26(1)：26-39. Proceedings of the 22nd National Conference on Artificial ZHUANG Fuzhen,LUO Ping,HE Qing,et al.Survey on Intelligence.Vancourver,British Columbia,Canada,2007, transfer learning research[]].Journal of software,2015,26 1:540-545. (1):26-39. [7]LIAO Xuejun,XUE Ya,CARIN L.Logistic regression with [2]WEI Fengmei,ZHANG Jianpei,CHU Yan,et al.FSFP: an auxiliary data source[C]//Proceedings of the 22nd In- transfer learning from long texts to the short[J].Applied ternational Conference on Machine Leaming.New York,表４８个算法在人工数据集的对比Ｔａｂｌｅ４Ｃｏｍｐａｒｉｓｏｎｏｆ８ａｌｇｏｒｉｔｈｍｓｏｎａｒｔｉｆｉｃｉａｌｄａｔａｓｅｔｓ数据集评价指标算法ＬＳＳＭＴＣＣｏ⁃ＣｌｕｓｔｅｒｉｎｇＦＰＣＭＴＳＣＴ⁃ＧＩＦＰ⁃ＦＣＭＳＳ⁃ＦＰＣＭＴＳＳ⁃ＦＰＣＭＩＴＳＳ⁃ＦＰＣＭｓｃｉＳｅｔ１Ｆ⁃ｍｅａｓｕｒｅ０．６８３４０．６６４８０．６３３１０．７６８８０．６９５６０．６９８４０．７１８７０．７３３６ＲＩ０．５５８５０．５５５００．５２４１０．６４５００．５７７００．５７５００．５９５８０．６０９５ＡＣ０．８１６５０．６６７５０．７５０００．７７０００．６９７５０．６９５００．７２０００．７３５０ＮＭＩ０．１３４１０．１０２１０．１１８９０．２９２３０．１４８３０．１０９８０．１３４２０．１５６４ｒｅｃｖｓｔａｌｋＦ⁃ｍｅａｓｕｒｅ０．６８６７０．６３９４０．６９８００．８８２７０．８９０７０．８３１１０．８４６９０．９１５８ＲＩ０．５８０３０．５３９５０．５７６９０．７９２１０．８０３７０．７２０４０．７４０９０．８４４０ＡＣ０．７０５３０．６４２５０．６９７５０．８８２５０．８９０００．８３２５０．８４７５０．９１５０ＮＭＩ０．１７６９０．０８７１０．０９９３０．４６３７０．４８７３０．３４９２０．３７５００．５７４８ＴＤＴ２Ｆ⁃ｍｅａｓｕｒｅ０．６４２７０．６１３９０．４７８７０．８５５４０．８８９７０．８２１４０．８２５３０．８８５８ＲＩ０．７８２８０．７４７３０．６８２５０．９０７００．９２９９０．８８４５０．８８８４０．９３００ＡＣ０．６９８３０．７１３３０．６０８３０．８６３３０．８９６７０．８３３３０．８３５００．８８８３ＮＭＩ０．５４２６０．５７５００．３９８００．７５３５０．８０９３０．７１９９０．７２１７０．８２９８Ｒｅｕｔｅｒｓ⁃２１５７８Ｆ⁃ｍｅａｓｕｒｅ０．７１０１０．６８４００．６３６１０．８２４７０．８５３３０．８１２１０．８１７８０．８６０８ＲＩ０．８１２５０．７１５３０．６６２００．８４１９０．８６５８０．８３２３０．８３７６０．８７０９ＡＣ０．８２０００．７２７５０．７１９１０．８３０００．８５５００．８１５００．８２０００．８６５０ＮＭＩ０．５６６２０．５０５２０．４４８５０．６５９００．６４３００．６１６２０．６２４２０．７０７６４结束语本文将半监督学习思想应用到ＦＰＣＭ算法上，提出半监督ＳＳ⁃ＦＰＣＭ算法；迁移学习方面对算法进行非负迁移改进，得到ＴＳＳ⁃ＦＰＣＭ算法，再利用“代表点”代替原始数据提出了改进的半监督的迁移聚类算法ＩＴＳＳ⁃ＦＰＣＭ。在多种数据集上的实验验证表明，ＩＴＳＳ⁃ＦＰＣＭ算法在性能上要好于ＳＳ⁃ＦＰＣＭ算法与ＴＳＳ⁃ＦＰＣＭ算法。在数据量不足、数据被污染的情况下，ＩＴＳＳ⁃ＦＰＣＭ算法能够提升聚类的性能；算法在源数据与目标数据相关不大时效果一般，下一步研究将会提取其他相关信息改善聚类性能，同时考虑参数的优化问题。参考文献：［１］庄福振，罗平，何清，等．迁移学习研究进展［Ｊ］．软件学报，２０１５，２６（１）：２６⁃３９．ＺＨＵＡＮＧＦｕｚｈｅｎ，ＬＵＯＰｉｎｇ，ＨＥＱｉｎｇ，ｅｔａｌ．Ｓｕｒｖｅｙｏｎｔｒａｎｓｆｅｒｌｅａｒｎｉｎｇｒｅｓｅａｒｃｈ［Ｊ］．Ｊｏｕｒｎａｌｏｆｓｏｆｔｗａｒｅ，２０１５，２６（１）：２６⁃３９．［２］ＷＥＩＦｅｎｇｍｅｉ，ＺＨＡＮＧＪｉａｎｐｅｉ，ＣＨＵＹａｎ，ｅｔａｌ．ＦＳＦＰ：ｔｒａｎｓｆｅｒｌｅａｒｎｉｎｇｆｒｏｍｌｏｎｇｔｅｘｔｓｔｏｔｈｅｓｈｏｒｔ［Ｊ］．Ａｐｐｌｉｅｄｍａｔｈｅｍａｔｉｃｓａｎｄｉｎｆｏｒｍａｔｉｏｎｓｃｉｅｎｃｅｓ，２０１４，８（４）：２０３３⁃ ２０４０．［３］ＤＡＩＷｅｎｙｕａｎ，ＸＵＥＧｕｉｒｏｎｇ，ＹＡＮＧＱｉａｎｇ，ｅｔａｌ．Ｃｏ⁃ ｃｌｕｓｔｅｒｉｎｇｂａｓｅｄｃｌａｓｓｉｆｉｃａｔｉｏｎｆｏｒｏｕｔ⁃ｏｆ⁃ｄｏｍａｉｎｄｏｃｕｍｅｎｔｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１３ｔｈＡＣＭＳＩＧＫＤＤＴｉｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＫｎｏｗｌｅｄｇｅＤｉｓｃｏｖｅｒｙａｎｄＤａｔａＭｉｎｉｎｇ．ＳａｎＪｏｓｅ，Ｃａｌｉｆｏｒｎｉａ，ＵＳＡ，２００７：２１０⁃２１９．［４］ＤＡＩＷｅｎｙｕａｎ，ＹＡＮＧＱｉａｎｇ，ＸＵＥＧｕｉｒｏｎｇ，ｅｔａｌ．Ｓｅｌｆ⁃ ｔａｕｇｈｔｃｌｕｓｔｅｒｉｎｇ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２５ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＭａｃｈｉｎｅＬｅａｒｎｉｎｇ．Ｈｅｌｓｉｎｋｉ，Ｆｉｎｌａｎｄ，，２００８：２００⁃２０７．［５］ＳＡＭＡＮＴＡＳ，ＳＥＬＶＡＮＡＴ，ＤＡＳＳ．Ｃｒｏｓｓ⁃ｄｏｍａｉｎｃｌｕｓｔｅ⁃ ｒｉｎｇｐｅｒｆｏｒｍｅｄｂｙｔｒａｎｓｆｅｒｏｆｋｎｏｗｌｅｄｇｅａｃｒｏｓｓｄｏｍａｉｎｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ４ｔｈＮａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＰａｔ⁃ ｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ，ＩｍａｇｅＰｒｏｃｅｓｓｉｎｇａｎｄＧｒａｐｈｉｃｓ（ＮＣＶＰＲＩＰＧ）．Ｊｏｄｈｐｕｒ，Ｉｎｄｉａ，２０１３：１⁃４．［６］ＤＡＩＷｅｎｙｕａｎ，ＸＵＥＧｕｉｒｏｎｇ，ＹＡＮＧＱｉａｎｇ，ｅｔａｌ．Ｔｒａｎｓ⁃ ｆｅｒｒｉｎｇｎａｉｖｅＢａｙｅｓｃｌａｓｓｉｆｉｅｒｓｆｏｒｔｅｘｔｃｌａｓｓｉｆｉｃａｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２２ｎｄＮａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ．Ｖａｎｃｏｕｒｖｅｒ，ＢｒｉｔｉｓｈＣｏｌｕｍｂｉａ，Ｃａｎａｄａ，２００７，１：５４０⁃５４５．［７］ＬＩＡＯＸｕｅｊｕｎ，ＸＵＥＹａ，ＣＡＲＩＮＬ．Ｌｏｇｉｓｔｉｃｒｅｇｒｅｓｓｉｏｎｗｉｔｈａｎａｕｘｉｌｉａｒｙｄａｔａｓｏｕｒｃｅ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２２ｎｄＩｎ⁃ ｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＭａｃｈｉｎｅＬｅａｒｎｉｎｇ．ＮｅｗＹｏｒｋ， ·３１６· 智能系统学报第１１卷

<<向上翻页向下翻页>>

点击下载：【机器学习】一种基于少量标签的改进迁移模糊聚类编辑部