1) 与Emin有关,因此,被忽略的结点数与属性被处理的顺序有关,如果

正在加载图片...

)Δ与Emn有关,因此被忽略的结点数与属性被处理的顺序有关,如果最相关的属性被首先处理,Emin就会被早些得到因此,以后计算中Δ值就会较大所以省略的结点数就多为减少算法的运行时间最相关的属性应首先被处理 2) Max diff(T是单调递减的所以连续属性排序后,属性值域的后半部分△值较高 3)通常如果相关属性先被处理,对不相关属性使用启发式1,将是较有效的启发式2.对于每个属性A,Tm是其一个切点把例子集分成两个例子数相等的子集,E(Tm)是Tm的熵,对各属性按E(Tm)从小到大的顺序使用启发式1进行离散化 3多区间划分停止标准(最小描述长度) Gain(a,T; s)sg2(N -1)+△(a,Ts) Gain(a, T,s)=Ent(s)-e(a, T,s)1) 与Emin有关,因此,被忽略的结点数与属性被处理的顺序有关,如果最相关的属性被首先处理,Emin就会被早些得到,因此,以后计算中值就会较大,所以省略的结点数就多,为减少算法的运行时间,最相关的属性应首先被处理. 2) Max_diff(Tr)是单调递减的,所以连续属性排序后,属性值域的后半部分值较高. 3) 通常,如果相关属性先被处理,对不相关属性使用启发式1,将是较有效的. 启发式2. 对于每个属性Ai,Tmi是其一个切点,把例子集分成两个例子数相等的子集, E(Tmi )是Tmi的熵,对各属性按E(Tmi )从小到大的顺序使用启发式1进行离散化. 3.多区间划分停止标准(最小描述长度) N T s N N Gain A T s log ( 1) ( , ; ) ( , ; ) 2   + −  Gain(A,T;s) = Ent(s) − E(A,T;s)

<<向上翻页向下翻页>>

点击下载：《机器学习》（英文版）ExampleⅤ ersion Space