正在加载图片...
第6期 张晓鹤,等:基于信息嫡的对象加权概念格 ·1101· 表3形式背景F。=(Uo,Ao,Io) 由表4可知U/RD={D1,D2},D1={1,2,4,61, Table 3 Formal context:Fp=(Up,Ap,Ip) D2={3,5}。有两个决策概念:(《1,2,4,61,0)和 序号 b d (3,5,{1)。 由上述计算过程可直接获取L(Uo,AD,ID),共 有5个概念,分别为:(1,3,5,6,{b)、(《61,{b,d)、 3 (3,5,{b,e)、(31,{b,c,e)、(©,{b,c,d,e)。 由算法2可获得粒决策规则: 6 {b,el={1 {b,c,el={1) 表3给出的形式背景构造的概念格如图3所 b,d=01 示,共5个概念结点,即为对象强加权概念格。 可进一步简化规则得: {b,e={1} {b,d}台{0} 通过本文算法对于概念格进行简化后提取规 则,可知本岗位更倾向于招聘数学专业且拥有教 师资格证的应聘者,与现实背景相符。 对于没有删除冗余属性、冗余对象、偏差对 象的情况,也即直接用表2所示的决策形式背景 获取条件概念格,然后利用算法2获取粒决策规 则,结果如下: {a,d}台{0} {b,e}={1} {a,d,e}台{0l 图3由Fo=(Uo,Ao,ID)构造的概念格 {a,b,d={0 Fig.3 Concept lattice of Fp=(Up,Ap,Ip) {a,b,c,e}→(1 通过上述计算能够看到本文提出的对象强加 进一步简化规则可得 权概念格能够通过删除不必要的对象和属性,缩 {a,d→01 小形式背景的规模,从而实现简化概念格构造过 b,e}→{1) 程的目的。且通过这种方法能够简化概念形式, 可知本岗位更倾向于招聘拥有教师资格证的 便于我们在之后进行规则提取。 数学专业的应聘者,这也是符合实际情况的。可 4)粒决策规则提取 见,通过本文构造的对象强加权概念格仍能够保 在表1的基础上给出决策形式背景(U,A, 持原决策规则的关键信息,即教育机构更愿意录 L,D,),其中对象集为6位求职者。条件属性集仍 取数学专业有教师资格证的应聘者,而且能够简 为A={a,b,c,d,e以,决策属性集为D=f,取值为 化规则获取的过程。 1代表教育机构工作录取该求职者,否则为拒绝 3.2实验分析 录取。具体数据如表4所示。 在内存为8GB,操作系统为Windows10的 表4决策形式背景(U,A,I,D,J) 计算机上,用Matlab软件实现了本文算法、经典 Table 4 Decision formal context:(U,A,I,D,J) 概念格构造算法及文献[25]的算法。选用UCI 序号 数据集中的ZOO数据集进行实验,该数据集共 有101条记录,18项属性。对数据集的预处理, 包括去掉决策属性,将数值属性布尔化等,最后 获取了共100条记录,20项属性的形式背景,以 3 20条动物记录为单位将其划分为5个子形式背 4 景。将子形式背景依次进行合并,分别采用本文 算法、经典算法及文献[25]的算法构造合并后的 整体概念格,对比其分别获取的概念结点个数, 以此对比其执行效率,具体如表5所示。表 3 形式背景 FD = (UD,AD,ID) Table 3 Formal context:FD = (UD,AD,ID) 序号 b c d e 1 1 — — — 3 1 1 — 1 5 1 — — 1 6 1 — 1 — 表 3 给出的形式背景构造的概念格如图 3 所 示,共 5 个概念结点,即为对象强加权概念格。 b 1356 be 35 bce 3 bcde bd 6 图 3 由 FD = (UD,AD,ID) 构造的概念格 Fig. 3 Concept lattice of FD = (UD,AD,ID) 通过上述计算能够看到本文提出的对象强加 权概念格能够通过删除不必要的对象和属性,缩 小形式背景的规模,从而实现简化概念格构造过 程的目的。且通过这种方法能够简化概念形式, 便于我们在之后进行规则提取。 4) 粒决策规则提取 (U,A, I,D, J) A = {a,b, c,d, e} D = {f} 在 表 1 的基础上给出决策形式背景 ,其中对象集为 6 位求职者。条件属性集仍 为 ,决策属性集为 ,取值为 1 代表教育机构工作录取该求职者,否则为拒绝 录取。具体数据如表 4所示。 表 4 决策形式背景 (U,A,I,D, J) Table 4 Decision formal context:(U,A,I,D, J) 序号 a b c d e f 1 1 1 — — — — 2 1 — — 1 1 — 3 1 1 1 — 1 1 4 1 — — — — — 5 — 1 — — 1 1 6 1 1 — 1 — — U/RD= {D1, D2} D1 = {1,2,4,6} D2 = {3,5} ({1,2,4,6},{0}) ({3,5},{1}) 由 表 4 可 知 , , 。有两个决策概念: 和 。 L(UD,AD,ID) ({1,3,5,6}, {b}) ({6},{b,d}) ({3,5},{b, e}) ({3},{b, c, e}) (Ø,{b, c,d, e}) 由上述计算过程可直接获取 ,共 有 5 个概念,分别为: 、 、 、 、 。 由算法 2 可获得粒决策规则: {b, e} ⇒ {1} {b, c, e} ⇒ {1} {b,d} ⇒ {0} 可进一步简化规则得: {b, e} ⇒ {1} {b,d} ⇒ {0} 通过本文算法对于概念格进行简化后提取规 则,可知本岗位更倾向于招聘数学专业且拥有教 师资格证的应聘者,与现实背景相符。 对于没有删除冗余属性、冗余对象、偏差对 象的情况,也即直接用表 2 所示的决策形式背景 获取条件概念格,然后利用算法 2 获取粒决策规 则,结果如下: {a,d} ⇒ {0} {b, e} ⇒ {1} {a,d, e} ⇒ {0} {a,b,d} ⇒ {0} {a,b, c, e} ⇒ {1} 进一步简化规则可得 {a,d} ⇒ {0} {b, e} ⇒ {1} 可知本岗位更倾向于招聘拥有教师资格证的 数学专业的应聘者,这也是符合实际情况的。可 见,通过本文构造的对象强加权概念格仍能够保 持原决策规则的关键信息,即教育机构更愿意录 取数学专业有教师资格证的应聘者,而且能够简 化规则获取的过程。 3.2 实验分析 在内存为 8 GB,操作系统为 Windows 10 的 计算机上,用 Matlab 软件实现了本文算法、经典 概念格构造算法及文献 [25] 的算法。选用 UCI 数据集中的 ZOO 数据集进行实验,该数据集共 有 101 条记录, 18 项属性。对数据集的预处理, 包括去掉决策属性,将数值属性布尔化等,最后 获取了共 100 条记录, 20 项属性的形式背景,以 20 条动物记录为单位将其划分为 5 个子形式背 景。将子形式背景依次进行合并,分别采用本文 算法、经典算法及文献 [25] 的算法构造合并后的 整体概念格,对比其分别获取的概念结点个数, 以此对比其执行效率,具体如表 5 所示。 第 6 期 张晓鹤,等:基于信息熵的对象加权概念格 ·1101·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有