决策值 ∂C(xi) ； ∂C(xi) Dmcs Mmcs 3) 依据决策

正在加载图片...

第6期唐玉凯，等：不完备决策系统下的多特定类广义决策约简 ·1205· 决策值ac(x: 要将其转为不完备决策系统。采用文献[16]中的 3)依据决策系统中每个对象的广义决策值方法对完备决策系统进行处理，具体处理方式 ac(x)和多特定类Dme构造相应差别矩阵Mmes; 为：除决策属性之外，每个条件属性对应列选取 4)依据差别矩阵Mms构造相应多特定类 10%的属性值进行缺失处理，缺失值使用*表示。的广义决策约简区分函数DF(Mms); 3.1约简结果对比 5)利用吸收律和分配律将多特定类区分函两种约简算法所得平均约简长度对比如表3 数DF(Mmcs)转变为极小析取范式DF'(Mme): 所示。表3中，“全决策类”表示经典全决策类约 6)依据极小析取范式DF'(M)输出多特简算法所得约简结果，“单特定类”表示MG- 定类D的广义决策约简，算法结束。 DRDM算法选定一个特定类时所得约简结果，算法1中，步骤1)的时间复杂度为OCIU), “多特定类”表示MGDRDM算法选定多个特定类步骤2)的时间复杂度为OU),步骤3)、步骤4) 时所得约简结果，“决策值”表示对应算法选取的的时间复杂度为OCU),步骤5)的过程是一个一个或多个特定类所表现决策值，“平均约简长 NP-hard问题，该步骤的时间复杂度为OICr),因此算法1的整体时间复杂度为OCF)。度”表示对应算法所得约简的平均约简长度。由表3可知，相比全部决策类，当选定特定类 3实验结果与分析数量较少时，平均约简长度往往会比全决策类所得平均约简长度要短。若多特定类选择为所有决针对本文提出的多特定类不完备决策系统广策类，则算法将退化为全决策类约简，平均约简义决策约简算法进行实验验证与分析。本节实验长度不会缩短。选择与经典不完备决策系统广义决策约简针对约简结果、占用空间以及约简效率进行比较。表3平均约简长度本节采用6组标准UCI数据集进行实验，数 Table 3 Average reduct length 据集从htp://archive.ics.uci.cdu/ml/datasets.php处下全决策类单特定类多特定类载。数据集使用WEKA3.6进行等频率离散化预 D数据集平均约决策平均约决策平均约处理，因某些原始数据中存在缺失数据数量极简长度值简长度值简长度少，无法直接作为实验使用，所以针对缺失数据 1 Z00 10.3 2 7.6 2,4 8.0 使用相应属性下出现频率最高属性值作为替换， 2 Audiology 24.1 16.7 1.4,611 20.0 针对名词性数据使用整数作为替换。数据集详细 3 Glass 10.0 6 7.0 5,6 8.0 信息如表2所示。表2中，ID表示数据集编号， “数据集”表示数据集名称，U表示数据集中对象 House 13.0 0 10.0 0,2 12.0 数目，1C1表示数据集中条件属性数目，U/Id表 Connec- 5 9.0 0 7.5 0,2 8.0 示数据集中决策类数目。本节实验环境：操作系 tionist Windows7-64 bit;CPU Intel Core i5-6500(3.2 6 Yeast 8.0 7.0 58 7.0 GHz):内存4GB;运行环境Python3.6:开发工具 3.2占用空间对比 PyCharm 本节通过比较两种算法生成的差别矩阵中非表2数据集空属性集占比进而比较两种算法占用空间大小。 Table 2 Data Sets 两种算法生成差别矩阵中非空属性集占比如表4 ID 数据集 UI ICI 1U/dl 所示，其中“占比(%)”表示对应不同算法构造差 1 Zoo 101 16 7 别矩阵中非空属性集所占比例。 2 Audiology 200 69 24 由表4可知，当选定一个或者几个特定类，特 3 Glass 214 10 6 定类数量相对全部决策类数量较少时，MG- DRDM算法所构造差别矩阵中非空属性集占比 4 House 506 3 4 J 要小于经典算法构造差别矩阵中的非空属性集占 Connectionist 528 10 11 比。因此，在保证约简目标不变的前提下，MG 6 Yeast 1484 8 10 DRDM算法所构造差别矩阵占用空间要小于经因本节采用UCI标准数据集，预处理之后数典算法构造差别矩阵占用空间。除此之外，利用据集所表示的决策系统为完备决策系统，所以需差别矩阵中非空属性集构造区分函数以及求取极决策值 ∂C(xi) ； ∂C(xi) Dmcs Mmcs 3) 依据决策系统中每个对象的广义决策值和多特定类构造相应差别矩阵； Mmcs DF(Mmcs) 4) 依据差别矩阵构造相应多特定类的广义决策约简区分函数； DF(Mmcs) DF′ (Mmcs) 5) 利用吸收律和分配律将多特定类区分函数转变为极小析取范式； DF′ (Mmcs) Dmcs 6) 依据极小析取范式输出多特定类的广义决策约简，算法结束。 O(|C||U| 2 ) O(|U| 2 ) O(|C||U| 2 ) O(|C| |U| 2 ) O(|C| |U| 2 ) 算法 1 中，步骤 1) 的时间复杂度为，步骤 2) 的时间复杂度为，步骤 3) 、步骤 4) 的时间复杂度为，步骤 5) 的过程是一个 NP-hard 问题，该步骤的时间复杂度为，因此算法 1 的整体时间复杂度为。 3 实验结果与分析针对本文提出的多特定类不完备决策系统广义决策约简算法进行实验验证与分析。本节实验选择与经典不完备决策系统广义决策约简针对约简结果、占用空间以及约简效率进行比较。 |U| |C| |U/{d}| 本节采用 6 组标准 UCI 数据集进行实验，数据集从 http://archive.ics.uci.edu/ml/datasets.php 处下载。数据集使用 WEKA3.6 进行等频率离散化预处理，因某些原始数据中存在缺失数据数量极少，无法直接作为实验使用，所以针对缺失数据使用相应属性下出现频率最高属性值作为替换，针对名词性数据使用整数作为替换。数据集详细信息如表 2 所示。表 2 中，ID 表示数据集编号， “数据集”表示数据集名称，表示数据集中对象数目，表示数据集中条件属性数目，表示数据集中决策类数目。本节实验环境：操作系统 Windows7-64 bit；CPU Intel Core i5-6500(3.2 GHz)；内存 4 GB；运行环境 Python 3.6；开发工具 PyCharm。表 2 数据集 Table 2 Data Sets ID 数据集 |U| |C| |U/{d}| 1 Zoo 101 16 7 2 Audiology 200 69 24 3 Glass 214 10 6 4 House 506 13 4 5 Connectionist 528 10 11 6 Yeast 1 484 8 10 因本节采用 UCI 标准数据集，预处理之后数据集所表示的决策系统为完备决策系统，所以需要将其转为不完备决策系统。采用文献 [16] 中的方法对完备决策系统进行处理，具体处理方式为：除决策属性之外，每个条件属性对应列选取 10% 的属性值进行缺失处理，缺失值使用*表示。 3.1 约简结果对比两种约简算法所得平均约简长度对比如表 3 所示。表 3 中，“全决策类”表示经典全决策类约简算法所得约简结果， “ 单特定类 ” 表示 MGDRDM 算法选定一个特定类时所得约简结果， “多特定类”表示 MGDRDM 算法选定多个特定类时所得约简结果，“决策值”表示对应算法选取的一个或多个特定类所表现决策值，“平均约简长度”表示对应算法所得约简的平均约简长度。由表 3 可知，相比全部决策类，当选定特定类数量较少时，平均约简长度往往会比全决策类所得平均约简长度要短。若多特定类选择为所有决策类，则算法将退化为全决策类约简，平均约简长度不会缩短。表 3 平均约简长度 Table 3 Average reduct length ID 数据集全决策类单特定类多特定类平均约简长度决策值平均约简长度决策值平均约简长度 1 Zoo 10.3 2 7.6 2,4 8.0 2 Audiology 24.1 4 16.7 1,4,6,11 20.0 3 Glass 10.0 6 7.0 5,6 8.0 4 House 13.0 0 10.0 0,2 12.0 5 Connectionist 9.0 0 7.5 0,2 8.0 6 Yeast 8.0 5 7.0 5,8 7.0 3.2 占用空间对比本节通过比较两种算法生成的差别矩阵中非空属性集占比进而比较两种算法占用空间大小。两种算法生成差别矩阵中非空属性集占比如表 4 所示，其中“占比 (%)”表示对应不同算法构造差别矩阵中非空属性集所占比例。由表 4 可知，当选定一个或者几个特定类，特定类数量相对全部决策类数量较少时， MGDRDM 算法所构造差别矩阵中非空属性集占比要小于经典算法构造差别矩阵中的非空属性集占比。因此，在保证约简目标不变的前提下，MGDRDM 算法所构造差别矩阵占用空间要小于经典算法构造差别矩阵占用空间。除此之外，利用差别矩阵中非空属性集构造区分函数以及求取极第 6 期唐玉凯，等：不完备决策系统下的多特定类广义决策约简 ·1205·

<<向上翻页向下翻页>>