否则加入伪规则ｈ（２３４） → ｇ（１）到伪规则集Ｒ１上，遍历

正在加载图片...

.530 智能系统学报第11卷否则加入伪规则h(234)→g(1)到伪规则集R,上， 4 实验结果及分析遍历R,对应的所有概念节点信息，更新(1234，g) 的属性信息为(1234，ag）)。上述规则合并方法我们已在Windows7环境下 1)与规则b(1235)→a(4)进行运算有用MATLAB2013实现，并在UCI上的具有单值（二 12345∩1234=1234，对应的属性集为ag。则得到值)或可转换为单值，可数量化的Spect数据集 (1234,ag)是新生成的节点，产生的规则为 Mushroom数据集、Nursery数据集，和随机生成的数 g(1234)→a(5),因为与节点(1235，ab)没有包含据集上进行了实验。在Mushshroom数据集上随机关系，因此依然记录规则b(1235)→a(4)。选定前10个属性和前180个对象，每30个对象为 2)与规则c(34)→a(125)进行运算得到的节一组。在Spect数据集上随机选定前6个属性和前点与(1)相同，同时记录规则c(34)→g(12)。 120个对象，每30个对象为一组。在Nursery数据 3)与规则b(3)→ac(4)进行运算，34C1234, 集上随机选定前8个属性，前120个对象，每30个更新规则b(3)→acg(4),记录更新节点(34，对象为一组。在随机生成的数据集上选定属性个数 acg)。为15个，每个对象有5个属性，同样30个对象为一 4)与规则c(3)→ab(125)进行运算，因为节点组。每次递增一组对象。对Mushroom数据集属性 3C1234,所以更新原来的规则cg(3)→ab(125), 平均拆分为5份，每两个属性为一个拆分。同样对随记录更新节点(3，abcg）。机生成的数据集属性平均拆分成5份，每3个属性为 5)与规则abc(3)+abc(3),3C1234,不产生一个拆分。对Spect数据集属性平分为3份，每2个新的节点，依然作为结尾节点，更新辅助规则属性为一个拆分。对Nursery数据集属性平分为4 abcg(3)→abcg(3)。份，每2个属性为一个拆分。在这4个数据集上进行最后生成更新节点与新生节点之间的规则，以了测试并和文献[6]算法进行了对比，在4个测试集及新生节点与新生节点之间的规则，生成的规则如上两种方法的执行时间结果如下图5~8所示，两种下：c(34)→ag(12),(b)中已经记录则不再记录。方法获取规则数目的比较结果如图9~12。加入h(234)→g(1)后得到的规则为： 120 110 *本文算法 g(1234)→a(5),b(1235)→a(4),c(34)→ 100 文献6]算法 ag(12),b(3)→acg(4),abcg(3)→abcg(3), 90 80 cg(3)→ab(125)。将此伪规则集记录为R,用于 0 下次插入规则。 6 50 将R,中的规则按照上述的步骤加入R,得到 40 一的规则集为：b(1235)→a(4),g(1234)→a(5), 30 20 b(123)→ag(4),g(123)→ab(5)，,h(23)→ 10 abg(1),c(34)→agh(2),b(3)→acgh(4), 0 0 60 90 120 h(234)→ag(1),b(23)→agh(4),i(4)→ 对象个数 acgh(3),c(3)→abgh(2),i(p)→abcgh(3), 图5随机数据集上两种方法的执行时间 b(p)一acghi(4)。由此伪规则集最终可以产生例 Fig.5 Execution time of two methods on random data set 1中的蕴含规则集。 9 f *一本文算法一文献[6]算法 (12345,a) 6 (1235.ab) (1234,ag） (123,abg) (234,agh) (23.abgh) (34.acgh) ◆ (3.abcgh) (4,acghi) 30 60 90120150 对象个数 (.abcghi) 图6 Mushroom数据集上两种方法的执行时间 4 L(U,(a,b,c,g,h,i,) Fig.6 Execution time of two methods on Mushroom data set Fig.4 L(U,a,b,c,g,h,i)否则加入伪规则ｈ（２３４） → ｇ（１）到伪规则集Ｒ１上，遍历Ｒ１对应的所有概念节点信息，更新（１２３４，ｇ）的属性信息为（１２３４，ａｇ）。１）与规则ｂ（１２３５） → ａ（４）进行运算有１２３４５ ∩１２３４＝１２３４，对应的属性集为ａｇ。则得到（１２３４，ａｇ）是新生成的节点，产生的规则为ｇ（１２３４） → ａ（５），因为与节点（１２３５，ａｂ）没有包含关系，因此依然记录规则ｂ（１２３５） → ａ（４）。２）与规则ｃ（３４） → ａ（１２５）进行运算得到的节点与（１）相同，同时记录规则ｃ（３４） → ａｇ（１２）。３）与规则ｂ（３） → ａｃ（４）进行运算，３４ ⊂１２３４，更新规则ｂ（３） → ａｃｇ（４），记录更新节点（３４，ａｃｇ）。４）与规则ｃ（３） →ａｂ（１２５）进行运算，因为节点３ ⊂ １２３４，所以更新原来的规则ｃｇ（３） → ａｂ（１２５），记录更新节点（３，ａｂｃｇ）。５）与规则ａｂｃ（３） → ａｂｃ（３），３ ⊂１２３４，不产生新的节点，依然作为结尾节点，更新辅助规则ａｂｃｇ（３） → ａｂｃｇ（３）。最后生成更新节点与新生节点之间的规则，以及新生节点与新生节点之间的规则，生成的规则如下：ｃ（３４） → ａｇ（１２），（ｂ）中已经记录则不再记录。加入ｈ（２３４） → ｇ（１）后得到的规则为：ｇ（１２３４） → ａ（５），ｂ（１２３５） → ａ（４），ｃ（３４） → ａｇ（１２），ｂ（３） → ａｃｇ（４），ａｂｃｇ（３） → ａｂｃｇ（３），ｃｇ（３） → ａｂ（１２５）。将此伪规则集记录为Ｒ１，用于下次插入规则。将Ｒ２中的规则按照上述的步骤加入Ｒ１，得到的规则集为：ｂ（１２３５） → ａ（４），ｇ（１２３４） → ａ（５），ｂ（１２３） → ａｇ（４），ｇ（１２３） → ａｂ（５），ｈ（２３） → ａｂｇ（１），ｃ（３４） → ａｇｈ（２），ｂ（３） → ａｃｇｈ（４），ｈ（２３４） → ａｇ（１），ｂ（２３） → ａｇｈ（４），ｉ（４） → ａｃｇｈ（３），ｃ（３） → ａｂｇｈ（２），ｉ（φ） → ａｂｃｇｈ（３），ｂ（φ） → ａｃｇｈｉ（４）。由此伪规则集最终可以产生例１中的蕴含规则集。图４Ｌ（Ｕ，｛ａ，ｂ，ｃ，ｇ，ｈ，ｉ｝，Ｉ）Ｆｉｇ．４Ｌ（Ｕ，｛ａ，ｂ，ｃ，ｇ，ｈ，ｉ｝，Ｉ）４实验结果及分析上述规则合并方法我们已在Ｗｉｎｄｏｗｓ７环境下用ＭＡＴＬＡＢ２０１３实现，并在ＵＣＩ上的具有单值（二值）或可转换为单值，可数量化的Ｓｐｅｃｔ数据集、Ｍｕｓｈｒｏｏｍ数据集、Ｎｕｒｓｅｒｙ数据集，和随机生成的数据集上进行了实验。在Ｍｕｓｈｓｈｒｏｏｍ数据集上随机选定前１０个属性和前１８０个对象，每３０个对象为一组。在Ｓｐｅｃｔ数据集上随机选定前６个属性和前１２０个对象，每３０个对象为一组。在Ｎｕｒｓｅｒｙ数据集上随机选定前８个属性，前１２０个对象，每３０个对象为一组。在随机生成的数据集上选定属性个数为１５个，每个对象有５个属性，同样３０个对象为一组。每次递增一组对象。对Ｍｕｓｈｒｏｏｍ数据集属性平均拆分为５份，每两个属性为一个拆分。同样对随机生成的数据集属性平均拆分成５份，每３个属性为一个拆分。对Ｓｐｅｃｔ数据集属性平分为３份，每２个属性为一个拆分。对Ｎｕｒｓｅｒｙ数据集属性平分为４份，每２个属性为一个拆分。在这４个数据集上进行了测试并和文献［６］算法进行了对比，在４个测试集上两种方法的执行时间结果如下图５～８所示，两种方法获取规则数目的比较结果如图９～１２。图５随机数据集上两种方法的执行时间Ｆｉｇ．５Ｅｘｅｃｕｔｉｏｎｔｉｍｅｏｆｔｗｏｍｅｔｈｏｄｓｏｎｒａｎｄｏｍｄａｔａｓｅｔ图６Ｍｕｓｈｒｏｏｍ数据集上两种方法的执行时间Ｆｉｇ．６ＥｘｅｃｕｔｉｏｎｔｉｍｅｏｆｔｗｏｍｅｔｈｏｄｓｏｎＭｕｓｈｒｏｏｍｄａｔａｓｅｔ ·５３０· 智能系统学报第１１卷

<<向上翻页向下翻页>>

点击下载：【知识工程】横向拆分形势背景下的快速规则提取方法