正在加载图片...
)Δ与Emn有关,因此被忽略的结点数与属性被处理的顺序有 关,如果最相关的属性被首先处理,Emin就会被早些得到因 此,以后计算中Δ值就会较大所以省略的结点数就多为减少 算法的运行时间最相关的属性应首先被处理 2) Max diff(T是单调递减的所以连续属性排序后,属性值域 的后半部分△值较高 3)通常如果相关属性先被处理,对不相关属性使用启发式1,将 是较有效的 启发式2.对于每个属性A,Tm是其一个切点把例子集分成两个 例子数相等的子集,E(Tm)是Tm的熵,对各属性按E(Tm)从 小到大的顺序使用启发式1进行离散化 3多区间划分 停止标准(最小描述长度) Gain(a,T; s)sg2(N -1)+△(a,Ts) Gain(a, T,s)=Ent(s)-e(a, T,s)1) 与Emin有关,因此,被忽略的结点数与属性被处理的顺序有 关,如果最相关的属性被首先处理,Emin就会被早些得到,因 此,以后计算中值就会较大,所以省略的结点数就多,为减少 算法的运行时间,最相关的属性应首先被处理. 2) Max_diff(Tr)是单调递减的,所以连续属性排序后,属性值域 的后半部分值较高. 3) 通常,如果相关属性先被处理,对不相关属性使用启发式1,将 是较有效的. 启发式2. 对于每个属性Ai,Tmi是其一个切点,把例子集分成两个 例子数相等的子集, E(Tmi )是Tmi的熵,对各属性按E(Tmi )从 小到大的顺序使用启发式1进行离散化. 3.多区间划分 停止标准(最小描述长度) N T s N N Gain A T s log ( 1) ( , ; ) ( , ; ) 2   + −  Gain(A,T;s) = Ent(s) − E(A,T;s)
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有