正在加载图片...
·356· 智能系统学报 第15卷 介绍,并对挖掘结果进行分析和讨论。 表1 Trolley数据集中不同k下的minCount 4.1不同阶次拟合对比 Table 1 MinCount of Trolley datasets under different k 首先,分析不同阶次多项式对自动确定支持 拟合曲线多项式 RminCount 度阈值的影响。下面给出Trolley数据集和Gro- y=0.0833x3-1.1429r2+3.5595x+4.28570.97544 ceries数据集两个数据集在不同阶次下曲线拟合 得到的minCount,.分别如表l、2所示。 4y=0.0417x-0.5833x3+2.4583x2-3.9167x+9 1 1 表2 Groceries数据集中不同k下的minCount Table 2 MinCount of Groceries datasets under different k k 拟合曲线多项式 R minCount 3 y=-0.0013x340.4135x2-42.763x+1486.1 0.887 107 4 y=2×10x-0.0081x3+1.163x2-71.273r+1734.8 0.9298 77 5 y=-4x107X+0.02x-0.0313x2+2.6457x2-107.71+1949.8 0.9545 57 Groceries数据集下确定minCount的不同阶 从表1和表2及图3可以看出:1)在相同的 次的多项式拟合曲线如图3所示。 结束条件下,不同数据集拟合采用的多项式次 +原始数据··二阶---三阶 数不一定相同,如本实验中数据集Groceries下 -·-四阶 一-五阶一一六阶 确定最小支持度时k取4次,而Trolley数据集 3000 2500 下k取3次;2)同一数据集下,拟合选取不同次 数的多项式,会影响minCount的值,从而也会影 2000 -.4x10440.0002.0.051342.6457r-107.7x+1949.8 -0.9545 响关联规则挖掘的效果。这说明不同的数据集 延1500 -2×10rY-0.0081r+1.163r-71.273r+1734.8 空1000 e-09298 下,不能采取统一阶次的多项次拟合,多项式拟 合的阶次应该根据数据拟合的实际情况自适应 500 确定。 0 其次,分析不同阶次多项式拟合对自动确定 -500 序号 置信度阈值的影响。对于Trolley数据集和Gro 图3 Groceries中不同阶次多项式拟合曲线 ceries数据集在上步minCount约束下所得规则的 Fig.3 Polynomial fitting curve of Groceries under differ- 基础上,自适应拟合确定最小置信度minConf,.得 ent order 到如表3和表4所示结果。 表3 Trolley数据集中不同k下的最小置信度 Table 3 MinConf of Trolley datasets under different k k 多项式拟合曲线公式 RE minConf 3 y=-6×10x3+0.0004x2-0.0199r+0.9358 0.9332 0.612 4 y=4×106x4-0.0003x3+0.0055x2-0.0565r+1.0007 0.9527 0.762 表4 Groceries数据集中不同k下的最小置信度 Table 4 MinConf of Groceries datasets under different k 多项式拟合曲线公式 R2 minConf 3 y=-7×1010x+2x105x2-0.0014r+0.5439 0.9954 0.094 4 y=8×105x-3×10x2+3x105x2-0.0018r+0.5647 0.9981 0.116 5 y=-1×1015x+4×102x-6×10”x3+4×1052-0.002r+0.5735 0.9985 0.065 同理,不同数据集中根据自动确定多项式次 0.02时,数据集Trolley下多项式次数为4次,而 数是不完全相同的,如本实验拟合精度差Rend 数据集Groceries的多项式次数为3次。同一数据 取O.O5时,数据集Trolley和数据集Groceries的多 集下不同阶次的多项式下得到的minConf也不尽 项式次数都是3次;而若拟合精度差Rend取 相同,如Trolley数据集下k取3次时得到min-介绍,并对挖掘结果进行分析和讨论。 4.1 不同阶次拟合对比 首先,分析不同阶次多项式对自动确定支持 度阈值的影响。下面给出 Trolley 数据集和 Gro￾ceries 数据集两个数据集在不同阶次下曲线拟合 得到的 minCount,分别如表 1、2 所示。 Groceries 数据集下确定 minCount 的不同阶 次的多项式拟合曲线如图 3 所示。 3 000 2 500 2 000 1 500 1 000 500 -500 0 序列值 原始数据 二阶 三阶 序号 四阶 五阶 六阶 y=7×10-9x 6 -4×10-6x 5+0.000 8x 4 -0.925x 3+5.269 1x 2 -153.11x+2 144.5 R 2=0.970 4 y=-4×10-7 x 5+0.000 2x 4 -0.031 3x 3+2.645 7x 2 -107.71x+1949.8 R 2=0.954 5 y=2×10-5x 4 -0.008 1x 3+1.163x 2 -71.273x+1 734.8 R 2=0.929 8 y=-0.001 3x 5+0.413 5x 2 -42.763x+1 486.1 R 2=0.887 y=0.086 4x 2 -20.449x+1 165.3 R 2=0.791 2 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 106 111 116 121 126 131 136 141 146 151 156 161 166 图 3 Groceries 中不同阶次多项式拟合曲线 Fig. 3 Polynomial fitting curve of Groceries under differ￾ent order 从表 1 和表 2 及图 3 可以看出:1) 在相同的 结束条件下,不同数据集拟合采用的多项式次 数不一定相同,如本实验中数据集 Groceries 下 确定最小支持度时 k 取 4 次 ,而 Trolley 数据集 下 k 取 3 次 ;2) 同一数据集下,拟合选取不同次 数的多项式,会影响 minCount 的值,从而也会影 响关联规则挖掘的效果。这说明不同的数据集 下,不能采取统一阶次的多项次拟合,多项式拟 合的阶次应该根据数据拟合的实际情况自适应 确定。 其次,分析不同阶次多项式拟合对自动确定 置信度阈值的影响。对于 Trolley 数据集和 Gro￾ceries 数据集在上步 minCount 约束下所得规则的 基础上,自适应拟合确定最小置信度 minConf,得 到如表 3 和表 4 所示结果。 同理,不同数据集中根据自动确定多项式次 数是不完全相同的,如本实验拟合精度差 Rend 取 0.05 时,数据集 Trolley 和数据集 Groceries 的多 项式次数都是 3 次;而若拟合精度差 Rend 取 0.02 时,数据集 Trolley 下多项式次数为 4 次,而 数据集 Groceries 的多项式次数为 3 次。同一数据 集下不同阶次的多项式下得到的 minConf 也不尽 相同,如 Trolley 数据集下 k 取 3 次时得到 min- 表 1 Trolley 数据集中不同 k 下的 minCount Table 1 MinCount of Trolley datasets under different k k 拟合曲线多项式 Rk 2 minCount 3 y =0.083 3x 3 −1.142 9x 2 +3.559 5x+4.285 7 0.975 4 4 4 y =0.041 7x 4 −0.583 3x 3 +2.458 3x 2 −3.916 7x+9 1 1 表 2 Groceries 数据集中不同 k 下的 minCount Table 2 MinCount of Groceries datasets under different k k 拟合曲线多项式 Rk 2 minCount 3 y =−0.001 3x 3 +0.413 5x 2 −42.763x+1 486.1 0.887 107 4 y =2×10−5 x 4 −0.008 1x 3 +1.163x 2 −71.273x+1 734.8 0.929 8 77 5 y =−4×10−7 x 5 +0.000 2x 4 −0.031 3x 3 +2.645 7x 2 −107.71x+1 949.8 0.954 5 57 表 3 Trolley 数据集中不同 k 下的最小置信度 Table 3 MinConf of Trolley datasets under different k k 多项式拟合曲线公式 Rk 2 minConf 3 y =−6×10−6 x 3 +0.000 4x 2 −0.019 9x+0.935 8 0.933 2 0.612 4 y =4×10−6 x 4 −0.000 3x 3 +0.005 5x 2 −0.056 5x+1.000 7 0.952 7 0.762 表 4 Groceries 数据集中不同 k 下的最小置信度 Table 4 MinConf of Groceries datasets under different k k 多项式拟合曲线公式 Rk 2 minConf 3 y =−7×10−10 x 3 +2×10−6 x 2 −0.001 4x+0.543 9 0.995 4 0.094 4 y =8×10−13 x 4 −3×10−9 x 3 +3×10−6 x 2 −0.001 8x+0.564 7 0.998 1 0.116 5 y =−1×10−15 x 5 +4×10−12 x 4 −6×10−9 x 3 +4×10−6 x 2 −0.002x+0.573 5 0.998 5 0.065 ·356· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有