正在加载图片...
DNA序列的分类模型 503 而现有样本点f(11),f(12),…,f(120)利用距估计方法估计得 1∑f(4) ES,) 代入(1)即得g 现估计g投射L的点到实轴上后,k;(A)和g(B)的分界点x,其中 g(A)=|g(a)|a∈A g;(B)=g(b)|b∈B 以g1为例,A的10个样本点和B的10个样本点不能被一个分界点分开,由极大似然 估计的思想,分界点应该把尽可能多的点分开,即 x∈(-0.276758,0.482296) 由于g(1)的分布未知故只能假设其满足较均匀的分布,则A,B的分界点的最好估计 为28(A)+E(B) ,而E(4)+E(B)的矩估计为(4)=0(由g的定义),恰 好0∈(-0.276758,0.48296),则x1=0是分界点的最佳估计 同理,x2=0,x3=0分别是g2,g3对应分界点的最佳估计 令F=a1g1+a2g2+a33,则其分界点为x=a1×0+a2X0+a3×0=0 由F的构造方法知,F作用到A样本上大于零,作用到B样本上小于零我们确定适 当的权值,以此作为A,B的分类法即可,根据不同的实际情况,可以相应调节这三个权值, 以体现分类中的不同因素所在的比重.在下面的计算中,我们简单的取a1=1,a2=-1,a 0.5.得到的结果如表4,表5所示: 序号”目标函数值序号目标函数值序号目标函数值序号日目标函数值。 1.75355 111.38528 16-2.60295 A21.7589471.25115B12 1.22372B17-0.0165438 32.5887 1.41371 0.940004 18 组40.27582组91.9011组140.93612组192.6043 52.1781 01.97282 15-2.27465 3.603 表5 目标函数值 序号 目标函数值 21 1.9645 1.06638 B 0.873279 A 0.668504 B 2.32887 A 33 24 1.48005 2.60904 A I.184 B 36 1.22298 1.22569 1.83991 3.71616 3.01466 2.69272 0.499763 A
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有