2) 决策属性初始化正域样本生成的超边，条件属性初始化采取随机属性继承

正在加载图片...

·484· 智能系统学报第14卷 2)决策属性初始化时，需要查看超边参与分类的样本集合P(e,P(e)= 正域样本生成的超边，条件属性初始化采取 {x[xl=OAe∈En(x),x∈X),若lP(e=0说明超边随机属性继承方式，决策属性直接继承生成该超 e在超网络对训练集的分类过程中没有起太大的边的样本。边界域样本生成的超边，条件属性初作用，一般选择将其替换；若P(e≠0，则按式始化采取择优属性继承方式，决策属性直接继承 (18)计算置信度：生成该超边的样本。负域样本生成的超边，同样 {xD(e)=D(x),xeP(e)月 Conf= (18) 采取随机属性继承的方式确定条件属性，因为其 P(e) 决策属性与原始样本相同的概率较低，所以该类 2.2算法描述超边的决策属性是根据整个数据集确定的，与关算法1初始化超边库算法联该超边的样本集中的大类样本类别一致。输入训练样本集X,最优阈值：输出超边集E。 2.1.3训练样本分类 1)E=o 给定模糊超网络G=<X,E,>,决策属性的取 2)计算每个样本的-等价类样本集合，根据值范围Vo=1,2,…,m样本x在1下的模糊等价定义11判断样本所属区域类超边集合为x,其中决策属性为j的超边集 3)for each x in X do 合为 4)=0 [xl=lele E[x]inD(e)=j) (16) 5)while(<5)/*设置每个样本生成的超边数*/ 对于每一个样本x的分类过程如下： 6)ifxE POS(X)then 1)计算出样本x在1下的模糊等价类超边[： 7)根据样本x生成超边e,e直接继承x的决 2)将x中的超边进行分类，将决策属性为策属性，条件属性初始化采取随机属性继承方式 j的超边归类到[x中， 8)end if x=∑l (17) 9)ifxE NEG(X)then jEVp 3)计算x的类别Dx: 10)根据样本x生成超边e,条件属性初始化采取随机属性继承方式，决策属性根据整个数据 D(x)=argmax ([xl),je Vp 集确定 4)若x.=O,则选取与样本x模糊相似度最 11)end if 高的n条超边e1,e2,…,en加入到集合En(w)中，类 l2)ifx∈BND(X)then 别D(x)=argmax(En(x,jeVo,本文实验取n=3。 13)根据x生成超边e,超边直接继承x的决采用上述分类规则对训练集的每个样本进行策属性，计算在x的等价类样本集合中各条件分类，计算模糊超网络模型对训练集的分类正属性的依赖度，将条件属性按依赖度大小从大到确率。小排序，超边e择优选择排在前710的属性继承 2.1.4超边替代样本x的属性值首先判断超边所在区域，然后不同的区域采 14)end if 取不同的措施： 15)E=EU(e);j++ 若超边e是正域超边，则超边e与训练集中 16)end while 所有异类样本相似度较低，与同类样本相似度较 17)end for 高，该超边的存在有助于提高分类效果，故选择 18)return E,/*输出初始超边库*/ 保留超边e; 算法2超边替代算法若超边e是负域超边，则超边e与训练集中输入训练样本集X,最优阈值入，超边集E: 某一异类样本相似度较高，在分类的过程中超边输出超边集E。 e会影响其他类别的分类效果，故需要替换； 1)for each e in E do 若超边e是边界域超边，在衡量超边e的分 2)根据定义12判断超边e所属区域类效果时，需要通过置信度Confa进行判断，若 3)ife∈PoS(E)then Conf>本文取=0.5)，保留超边e,反之，则替换 4)end if 掉超边e。其中存在一种特殊情况：当关联超边 S)ife∈BND(E)then e的样本数为0时，无法计算置信度Confg。此 6)计算e的置信度Confs2) 决策属性初始化正域样本生成的超边，条件属性初始化采取随机属性继承方式，决策属性直接继承生成该超边的样本。边界域样本生成的超边，条件属性初始化采取择优属性继承方式，决策属性直接继承生成该超边的样本。负域样本生成的超边，同样采取随机属性继承的方式确定条件属性，因为其决策属性与原始样本相同的概率较低，所以该类超边的决策属性是根据整个数据集确定的，与关联该超边的样本集中的大类样本类别一致。 2.1.3 训练样本分类 VD = {1,2,··· ,m} [x]λ 给定模糊超网络 G=<X, E, λ>，决策属性的取值范围样本 x 在 λ 下的模糊等价类超边集合为，其中决策属性为 j 的超边集合为 [x]λ j = {e|e ∈ [x]λ ∩ D(e) = j} (16) 对于每一个样本 x 的分类过程如下： 1) 计算出样本 x 在 λ 下的模糊等价类超边 [x]λ； [x]λ [x]λ j 2) 将中的超边进行分类，将决策属性为 j 的超边归类到中， |[x]λ | = ∑ j∈VD [x]λ j (17) 3) 计算 x 的类别 D(x)： D(x) = argmax( [x]λ j ) , j ∈ VD [x]λ = ∅ e1, e2,··· , en En(x) D(x) = argmax( En(x) j ) , j ∈ VD 4) 若，则选取与样本 x 模糊相似度最高的 n 条超边加入到集合中，类别，本文实验取 n=3。采用上述分类规则对训练集的每个样本进行分类，计算模糊超网络模型对训练集的分类正确率。 2.1.4 超边替代首先判断超边所在区域，然后不同的区域采取不同的措施：若超边 e 是正域超边，则超边 e 与训练集中所有异类样本相似度较低，与同类样本相似度较高，该超边的存在有助于提高分类效果，故选择保留超边 e；若超边 e 是负域超边，则超边 e 与训练集中某一异类样本相似度较高，在分类的过程中超边 e 会影响其他类别的分类效果，故需要替换；若超边 e 是边界域超边，在衡量超边 e 的分类效果时，需要通过置信度 ConfB 进行判断，若 ConfB＞γ(本文取 γ=0.5)，保留超边 e，反之，则替换掉超边 e。其中存在一种特殊情况：当关联超边 e 的样本数为 0 时，无法计算置信度 ConfB。此 P(e) P(e) = {x|[x]λ = ∅∧e ∈ En(x), x ∈ X} |P(e)| = 0 |P(e)| , 0 时，需要查看超边参与分类的样本集合，，若说明超边 e 在超网络对训练集的分类过程中没有起太大的作用，一般选择将其替换；若，则按式 (18) 计算置信度： ConfB = {x|D(e) = D(x), x ∈ P(e)} |P(e)| (18) 2.2 算法描述算法 1 初始化超边库算法输入训练样本集 X，最优阈值 λ；输出超边集 E。 1) E = ∅ 2) 计算每个样本的 λ-等价类样本集合，根据定义 11 判断样本所属区域 3) for each x in X do 4) j=0 5) while(j<5) /*设置每个样本生成的超边数*/ 6) if x ∈ POS(X) then 7) 根据样本 x 生成超边 e，e 直接继承 x 的决策属性，条件属性初始化采取随机属性继承方式 8) end if 9) if x ∈ NEG(X) then 10) 根据样本 x 生成超边 e，条件属性初始化采取随机属性继承方式，决策属性根据整个数据集确定 11) end if 12) if x ∈ BND(X) then 13) 根据 x 生成超边 e，超边直接继承 x 的决策属性，计算在 x 的 λ-等价类样本集合中各条件属性的依赖度，将条件属性按依赖度大小从大到小排序，超边 e 择优选择排在前 7/10 的属性继承样本 x 的属性值 14) end if 15) E = E ∪ {e} ；j++ 16) end while 17) end for 18) return E; /*输出初始超边库*/ 算法 2 超边替代算法输入训练样本集 X，最优阈值 λ，超边集 E；输出超边集 E。 1) for each e in E do 2) 根据定义 12 判断超边 e 所属区域 3) if e ∈ POS(E) then 4) end if 5) if e ∈ BND(E) then 6) 计算 e 的置信度 ConfB ·484· 智能系统学报第 14 卷

<<向上翻页向下翻页>>

点击下载：【知识工程】基于模糊超网络的知识获取方法研究