正在加载图片...
第4期 温云霞,等:横向拆分形势背景下的快速规则提取方法 .531. 440 一本文算法 420 ·本文算法 文献[6算法 380 文献[6]算法 5432 340 300 10 人联 260 220 180 654 140 100 60 30 60 90 120 30 60 90 120 对象个数 对象个数 图7 Spect数据集上两种方法的执行时间 图11 Spect数据集上两种方法获取的规则数目 Fig.11 The number of rules obtained by two methods Fig.7 Execution time of two methods on Spect data set on Spect data set “本文算法 140 7升 文献6)算法 120 6 100 80 "1 一一◆ 60 一本文算法 文献[6算法 40 2 30 60 90 120 30 60 90 120 对象个数 对象个数 图8 Nursery数据集上两种方法的执行时间 图12 Nursery数据集上两种方法获取的规则数目 Fig.8 Execution time of two methods on Nursery data set Fig.12 The number of rules obtained by two methods 10 on Nursery data set 1.2 1.1 本文算法 在随机数据集上两种方法的执行时间及概念数 -一文献[6]算法 1.0 如表2所示。 0.9 表2随机数据集上两种生成规则方法时间对比 0.8 Table 2 Time comparison of two methods on 0.7 random data set 0.6 0.5 直接提取 拆分合并 0.4 对象个数概念数 蕴含规则 后生成蕴 0.3 时间 含规则的时间 0.2 0 60 90 120 对象个数 30 90 8.15 P 图9随机数据集上两种方法获取的规则数目 60 160 20.5 Fig.9 The number of rules obtained by two methods on 90 228 77 33.9 random data set 120 259 115.8 40.4 160 *本文算法 从表2中可以看出,利用伪规则集生成蕴含规 140 文献[6]算法 则的方法所用时间较直接构造概念格生成蕴含规则 120 明显减少。且时间的增长基本呈线性。在这个过程 100 中避免了概念格的合并,降低了构造概念格的时间 复杂度对规则获取的制约。 60 从图5~8中可以看出,本文算法执行时间低于 4 30 60 90120 150 180 文献[6]中的算法,且具有稳定性。在获取蕴含规 对象个数 则时间花销方面有一定的优势。 图10 Mushroom数据集上两种方法获取的规则数目 从图9~12中可以看出,本文算法所获取的伪 Fig.10 The number of rules obtained by two methods on Mushroom data set 规则的数目远小于文献[6]中算法所获取的规则数图 7 Spect 数据集上两种方法的执行时间 Fig.7 Execution time of two methods on Spect data set 图 8 Nursery 数据集上两种方法的执行时间 Fig.8 Execution time of two methods on Nursery data set 图 9 随机数据集上两种方法获取的规则数目 Fig.9 The number of rules obtained by two methods on random data set 图 10 Mushroom 数据集上两种方法获取的规则数目 Fig.10 The number of rules obtained by two methods on Mushroom data set 图 11 Spect 数据集上两种方法获取的规则数目 Fig.11 The number of rules obtained by two methods on Spect data set 图 12 Nursery 数据集上两种方法获取的规则数目 Fig.12 The number of rules obtained by two methods on Nursery data set 在随机数据集上两种方法的执行时间及概念数 如表 2 所示。 表 2 随机数据集上两种生成规则方法时间对比 Table 2 Time comparison of two methods on random data set 对象个数 概念数 直接提取 蕴含规则 时间 拆分合并 后生成蕴 含规则的时间 30 90 8.15 8 60 160 34 20.5 90 228 77 33.9 120 259 115.8 40.4 从表 2 中可以看出,利用伪规则集生成蕴含规 则的方法所用时间较直接构造概念格生成蕴含规则 明显减少。 且时间的增长基本呈线性。 在这个过程 中避免了概念格的合并,降低了构造概念格的时间 复杂度对规则获取的制约。 从图 5~8 中可以看出,本文算法执行时间低于 文献[6]中的算法,且具有稳定性。 在获取蕴含规 则时间花销方面有一定的优势。 从图 9 ~ 12 中可以看出,本文算法所获取的伪 规则的数目远小于文献[6]中算法所获取的规则数 第 4 期 温云霞,等:横向拆分形势背景下的快速规则提取方法 ·531·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有