正在加载图片...
·482· 智能系统学报 第14卷 本所占的比例。x)越大,说明x的模糊等价类 负域超边需满足条件: 与x类别一致的概率越大。 max{μs(x,e)}≥0.75 Dx≠DXe) 图1给出了4个样本的1-等价类样本集合, 表2样本-超边相似度 由式(14)可得:fx)=1,fx2)=0.2,f)=0, Table 2 Sample_Hyperedge similarity fx4)=-1。本文实验选取a=1,B=0,fx)≥1,故 u(e,x) ex e3 ea x1是正域样本;0<fx2)<1,x2是边界域样本; X1 0.65 0.30 028 0.20 fx)≤0,x3是负域样本;fx)=-1,x没有1-等价 0.70 0.35 0.46 0.22 类样本,也是负域样本。 0.72 0.28 0.36 0.34 、2、、x均为▲类 0.12 0.10 0.35 0.82 5 0.30 0.15 0.77 0.60 6 0.35 0.27 0.77 0.33 (a)的 (b)x2的 (c)x的 (d)x的 样本集合 样本集合 样本集合 样本集合 对于超边e1,与e1相似度最高的异类样本为 图1等价类样本示例 x,(e1,x)=0.72<0.75,不满足负域条件,所以e1不 Fig.1 Examples of -equivalence class sample 是负域超边,(e1,x)=0.72>0.5不满足正域条件 定义12给定模糊超网络G=<X,E,>,C为 1),所以e是边界域超边。 样本的条件属性集,D为样本的决策属性,任意 对于超边e2,与e2相似度最高的异类样本为 超边集E'(ESE)关于属性集B的正域、负域和边 x1,(e2,x=0.30<0.75,不满足负域条件,所以e2不 界域可分别定义为 是负域超边,与e2相似度最高的同类样本为x2, POS(E)=fel() 4(e2,x=0.35<0.5不满足正域条件2),所以e2是边 maus伍el≥LxeX.ceE' 界域超边。 NEG(E)=dma既eGe>+1与 (15) 对于超边e3,与e3相似度最高的异类样本为 2 x6,(e,x)=0.77>0.75,满足负域条件,所以e是负 x∈X,e∈E) BND(E)=E'-POS(E)-NEG(E) 域超边。 对于超边e4,与e4相似度最高的异类样本为 以表1的决策信息系统为例,图2是表1的 ,4(e4,x=0.34<0.5,与e4相似度最高的同类样本 一个模糊超网络模型,超边集Ey={e1,e2,e3,e4,假 为x4,(e4,x)=0.82>0.5满足正域条件,所以e4是 设超边与各样本的模糊相似度如表2所示,最优 正域超边。 模糊相似度阈值为1=0.5。图2中实线圆区域表 综上所述,POS(Ev)={ea},BND(E)={e,el, 示超边的λ-等价类,虚线圆区域表示该超边的。 NEG(Er)={e3}。 等价类,10=1+(1-)/2=0.75。 2模糊超网络分类算法 ▲Y类样本 ■N类样本 △Y类超边 2.1算法思路 同传统超网络一样,模糊超网络生成算法也 分为三大步骤:初始化超边集,训练样本分类,超 边替代。超网络通过迭代训练的方式进行演化学 习,当分类正确率和迭代次数满足特定条件时, 即可退出迭代,输出模型。由于传统超网络采用 图2模糊超网络示例 随机生成的方式初始化超边,增大了超边替代阶 Fig.2 Example of a Fuzzy hypergraph 段筛选和替换分类能力差的超边的难度。所以 根据式(15)、表2与图2可知,正域超边需同 本文提出的模糊超网络对超边的初始化随机生成 时满足两个条件: 进行了控制,同时在超边替代过程中,对不同域 1)5 中的超边进行相应的处理以提高超网络的分类效 2)m.e})≥0.5。 果。算法流程如图3所示。本所占的比例。f(x) 越大,说明 x 的模糊等价类 与 x 类别一致的概率越大。 f(x1) = 1 f(x2) = 0.2 f(x3) = 0 f(x4) = −1 α = 1, β = 0 f(x1) ⩾ 1 0 < f(x2) < 1 f(x3) ⩽ 0 f(x4) = −1 图 1 给出了 4 个样本的 λ-等价类样本集合, 由 式 (14 ) 可得: , , , 。本文实验选取 , ,故 x 1 是正域样本; , x 2 是边界域样本; ,x3 是负域样本; ,x4 没有 λ-等价 类样本,也是负域样本。 x1、x2、x3、x4均为 类 (a) x1的 样本集合 (b) x2的 样本集合 (c) x3的 样本集合 (d) x4的 样本集合 图 1 λ-等价类样本示例 Fig. 1 Examples of λ-equivalence class sample E ′ (E ′ ⊆ E) 定义 12 给定模糊超网络 G=<X, E, λ>,C 为 样本的条件属性集,D 为样本的决策属性,任意 超边集 关于属性集 B 的正域、负域和边 界域可分别定义为 POS(E ′ ) = {e| max D(x),D(e) {µB (x, e)} < λ∩ max D(x)=D(e) {µB (x, e)} ⩾ λ, x ∈ X, e ∈ E ′ } NEG(E ′ ) = {e| max D(x),D(e) {µB (x, e)} ⩾ λ+ 1−λ 2 , x ∈ X, e ∈ E ′ } BND(E ′ ) = E ′ −POS(E ′ )−NEG(E ′ ) (15) EY = {e1, e2, e3, e4} 以表 1 的决策信息系统为例,图 2 是表 1 的 一个模糊超网络模型,超边集 ,假 设超边与各样本的模糊相似度如表 2 所示,最优 模糊相似度阈值为 λ=0.5。图 2 中实线圆区域表 示超边的 λ-等价类,虚线圆区域表示该超边的 λ0 - 等价类,λ0=λ+(1−λ)/2=0.75。 e1 x2 e2 x1 e3 x5 x3 e4 Y类样本 N类样本 Y类超边 x4 x6 图 2 模糊超网络示例 Fig. 2 Example of a Fuzzy hypergraph 根据式 (15)、表 2 与图 2 可知,正域超边需同 时满足两个条件: max D(x),D(e) 1) {µB(x, e)} < 0.5 ; max D(x)=D(e) 2) {µB (x, e)} ⩾ 0.5。 负域超边需满足条件: max D(x),D(e) {µB (x, e)} ⩾ 0.75 表 2 样本-超边相似度 Table 2 Sample_Hyperedge similarity μ(e, x) e1 e2 e3 e4 x1 0.65 0.30 0.28 0.20 x2 0.70 0.35 0.46 0.22 x3 0.72 0.28 0.36 0.34 x4 0.12 0.10 0.35 0.82 x5 0.30 0.15 0.77 0.60 x6 0.35 0.27 0.77 0.33 对于超边 e1,与 e1 相似度最高的异类样本为 x3,μ(e1 , x3 )=0.72<0.75,不满足负域条件,所以 e1 不 是负域超边,μ(e1 , x3 )=0.72>0.5 不满足正域条件 1),所以 e1 是边界域超边。 对于超边 e2,与 e2 相似度最高的异类样本为 x1,μ(e2 , x1 )=0.30<0.75,不满足负域条件,所以 e2 不 是负域超边,与 e2 相似度最高的同类样本为 x2, μ(e2 , x2 )=0.35<0.5 不满足正域条件 2),所以 e2 是边 界域超边。 对于超边 e3,与 e3 相似度最高的异类样本为 x6,μ(e3 , x6 )=0.77>0.75,满足负域条件,所以 e3 是负 域超边。 对于超边 e4,与 e4 相似度最高的异类样本为 x3,μ(e4 , x3 )=0.34<0.5,与 e4 相似度最高的同类样本 为 x4,μ(e4 , x4 )=0.82>0.5 满足正域条件,所以 e4 是 正域超边。 POS(EY ) = {e4} BND(EY ) = {e1, e2} NEG(EY ) = {e3} 综上所述, , , 。 2 模糊超网络分类算法 2.1 算法思路 同传统超网络一样,模糊超网络生成算法也 分为三大步骤:初始化超边集,训练样本分类,超 边替代。超网络通过迭代训练的方式进行演化学 习,当分类正确率和迭代次数满足特定条件时, 即可退出迭代,输出模型。由于传统超网络采用 随机生成的方式初始化超边,增大了超边替代阶 段筛选和替换分类能力差的超边的难度[14]。所以 本文提出的模糊超网络对超边的初始化随机生成 进行了控制,同时在超边替代过程中,对不同域 中的超边进行相应的处理以提高超网络的分类效 果。算法流程如图 3 所示。 ·482· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有