正在加载图片...
·484· 智能系统学报 第14卷 2)决策属性初始化 时,需要查看超边参与分类的样本集合P(e,P(e)= 正域样本生成的超边,条件属性初始化采取 {x[xl=OAe∈En(x),x∈X),若lP(e=0说明超边 随机属性继承方式,决策属性直接继承生成该超 e在超网络对训练集的分类过程中没有起太大的 边的样本。边界域样本生成的超边,条件属性初 作用,一般选择将其替换;若P(e≠0,则按式 始化采取择优属性继承方式,决策属性直接继承 (18)计算置信度: 生成该超边的样本。负域样本生成的超边,同样 {xD(e)=D(x),xeP(e)月 Conf= (18) 采取随机属性继承的方式确定条件属性,因为其 P(e) 决策属性与原始样本相同的概率较低,所以该类 2.2算法描述 超边的决策属性是根据整个数据集确定的,与关 算法1初始化超边库算法 联该超边的样本集中的大类样本类别一致。 输入训练样本集X,最优阈值: 输出超边集E。 2.1.3训练样本分类 1)E=o 给定模糊超网络G=<X,E,>,决策属性的取 2)计算每个样本的-等价类样本集合,根据 值范围Vo=1,2,…,m样本x在1下的模糊等价 定义11判断样本所属区域 类超边集合为x,其中决策属性为j的超边集 3)for each x in X do 合为 4)=0 [xl=lele E[x]inD(e)=j) (16) 5)while(<5)/*设置每个样本生成的超边数*/ 对于每一个样本x的分类过程如下: 6)ifxE POS(X)then 1)计算出样本x在1下的模糊等价类超边[: 7)根据样本x生成超边e,e直接继承x的决 2)将x中的超边进行分类,将决策属性为 策属性,条件属性初始化采取随机属性继承方式 j的超边归类到[x中, 8)end if x=∑l (17) 9)ifxE NEG(X)then jEVp 3)计算x的类别Dx: 10)根据样本x生成超边e,条件属性初始化 采取随机属性继承方式,决策属性根据整个数据 D(x)=argmax ([xl),je Vp 集确定 4)若x.=O,则选取与样本x模糊相似度最 11)end if 高的n条超边e1,e2,…,en加入到集合En(w)中,类 l2)ifx∈BND(X)then 别D(x)=argmax(En(x,jeVo,本文实验取n=3。 13)根据x生成超边e,超边直接继承x的决 采用上述分类规则对训练集的每个样本进行 策属性,计算在x的等价类样本集合中各条件 分类,计算模糊超网络模型对训练集的分类正 属性的依赖度,将条件属性按依赖度大小从大到 确率。 小排序,超边e择优选择排在前710的属性继承 2.1.4超边替代 样本x的属性值 首先判断超边所在区域,然后不同的区域采 14)end if 取不同的措施: 15)E=EU(e);j++ 若超边e是正域超边,则超边e与训练集中 16)end while 所有异类样本相似度较低,与同类样本相似度较 17)end for 高,该超边的存在有助于提高分类效果,故选择 18)return E,/*输出初始超边库*/ 保留超边e; 算法2超边替代算法 若超边e是负域超边,则超边e与训练集中 输入训练样本集X,最优阈值入,超边集E: 某一异类样本相似度较高,在分类的过程中超边 输出超边集E。 e会影响其他类别的分类效果,故需要替换; 1)for each e in E do 若超边e是边界域超边,在衡量超边e的分 2)根据定义12判断超边e所属区域 类效果时,需要通过置信度Confa进行判断,若 3)ife∈PoS(E)then Conf>本文取=0.5),保留超边e,反之,则替换 4)end if 掉超边e。其中存在一种特殊情况:当关联超边 S)ife∈BND(E)then e的样本数为0时,无法计算置信度Confg。此 6)计算e的置信度Confs2) 决策属性初始化 正域样本生成的超边,条件属性初始化采取 随机属性继承方式,决策属性直接继承生成该超 边的样本。边界域样本生成的超边,条件属性初 始化采取择优属性继承方式,决策属性直接继承 生成该超边的样本。负域样本生成的超边,同样 采取随机属性继承的方式确定条件属性,因为其 决策属性与原始样本相同的概率较低,所以该类 超边的决策属性是根据整个数据集确定的,与关 联该超边的样本集中的大类样本类别一致。 2.1.3 训练样本分类 VD = {1,2,··· ,m} [x]λ 给定模糊超网络 G=<X, E, λ>,决策属性的取 值范围 样本 x 在 λ 下的模糊等价 类超边集合为 ,其中决策属性为 j 的超边集 合为 [x]λ j = {e|e ∈ [x]λ ∩ D(e) = j} (16) 对于每一个样本 x 的分类过程如下: 1) 计算出样本 x 在 λ 下的模糊等价类超边 [x]λ; [x]λ [x]λ j 2) 将 中的超边进行分类,将决策属性为 j 的超边归类到 中, |[x]λ | = ∑ j∈VD [x]λ j (17) 3) 计算 x 的类别 D(x): D(x) = argmax( [x]λ j ) , j ∈ VD [x]λ = ∅ e1, e2,··· , en En(x) D(x) = argmax( En(x) j ) , j ∈ VD 4) 若 ,则选取与样本 x 模糊相似度最 高的 n 条超边 加入到集合 中,类 别 ,本文实验取 n=3。 采用上述分类规则对训练集的每个样本进行 分类,计算模糊超网络模型对训练集的分类正 确率。 2.1.4 超边替代 首先判断超边所在区域,然后不同的区域采 取不同的措施: 若超边 e 是正域超边,则超边 e 与训练集中 所有异类样本相似度较低,与同类样本相似度较 高,该超边的存在有助于提高分类效果,故选择 保留超边 e; 若超边 e 是负域超边,则超边 e 与训练集中 某一异类样本相似度较高,在分类的过程中超边 e 会影响其他类别的分类效果,故需要替换; 若超边 e 是边界域超边,在衡量超边 e 的分 类效果时,需要通过置信度 ConfB 进行判断,若 ConfB>γ(本文取 γ=0.5),保留超边 e,反之,则替换 掉超边 e。其中存在一种特殊情况:当关联超边 e 的样本数为 0 时,无法计算置信度 ConfB。此 P(e) P(e) = {x|[x]λ = ∅∧e ∈ En(x), x ∈ X} |P(e)| = 0 |P(e)| , 0 时,需要查看超边参与分类的样本集合 , , 若 说明超 边 e 在超网络对训练集的分类过程中没有起太大的 作用,一般选择将其替换;若 ,则按式 (18) 计算置信度: ConfB = {x|D(e) = D(x), x ∈ P(e)} |P(e)| (18) 2.2 算法描述 算法 1 初始化超边库算法 输入 训练样本集 X,最优阈值 λ; 输出 超边集 E。 1) E = ∅ 2) 计算每个样本的 λ-等价类样本集合,根据 定义 11 判断样本所属区域 3) for each x in X do 4) j=0 5) while(j<5) /*设置每个样本生成的超边数*/ 6) if x ∈ POS(X) then 7) 根据样本 x 生成超边 e,e 直接继承 x 的决 策属性,条件属性初始化采取随机属性继承方式 8) end if 9) if x ∈ NEG(X) then 10) 根据样本 x 生成超边 e,条件属性初始化 采取随机属性继承方式,决策属性根据整个数据 集确定 11) end if 12) if x ∈ BND(X) then 13) 根据 x 生成超边 e,超边直接继承 x 的决 策属性,计算在 x 的 λ-等价类样本集合中各条件 属性的依赖度,将条件属性按依赖度大小从大到 小排序,超边 e 择优选择排在前 7/10 的属性继承 样本 x 的属性值 14) end if 15) E = E ∪ {e} ;j++ 16) end while 17) end for 18) return E; /*输出初始超边库*/ 算法 2 超边替代算法 输入 训练样本集 X,最优阈值 λ,超边集 E; 输出 超边集 E。 1) for each e in E do 2) 根据定义 12 判断超边 e 所属区域 3) if e ∈ POS(E) then 4) end if 5) if e ∈ BND(E) then 6) 计算 e 的置信度 ConfB ·484· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有