正在加载图片...
152911.942911940.005831940.001949715.838.7410.681943883888.742.9111.6510.68 1628609500011431901902860.004763815718578.576679.524.765712867.627.62 171920.961.924811923851920.960.966.7348l86510.582886.732889.26.738.65769 l8170.8517108508525616240851.7108516245.l36.845983.42lII1715.l3l1134 190940.941890.94094094I8909410.387555.669438.498.497.555.666.6011326.600.94 200860.860.001.7208608617240862591.7215.527.765.173.454319485.175179.48517 其中b1=aaa+ata b3=cac+cte b4=ccc+cge b5 =gag+gtg b6=gcg+ggg b7=tat+ttt b8=tct+tgt b9 =aac+caatatc+ 10=aag+gaa+ bl=aat+taa+att+tta b12=acc+cca+agc+cga 13=acg+gac+ctg+gtc b14=act+tca+agt+tga b15=cag+gac+ctt+ttc b16=catttac+ctt+ttc b17=ccg+ bl8=cct+tec b19=gatttag+gtt+ttg b20=gct+tcg+ggt+tgg 综合起来,形成了有41个变量的基本特征集。 (二)特征的提取 上述基本特征集中有41个变量,即样本处于一个高维空间中。特征的提取就是通 过变换的方法用低维空间来表示样本,使得X的大部分特性能由Y来表达,即将p维 随机向量X变换成q维随机向量Y(qp)。我们用主成分分析法进行特征的提取,其 步骤是 1.求X的均方差矩阵的特征根,记为: 2.求M1,M2………Ak对应的标准正交的特征向量r1,r2…rk 得到第i个主成分为y=rX,=1,2…K 3.求第i个主成分的贡献率u=M∑λ,i1,2…K及前m个主成分的累计贡 献率va∑u 4求得q,使得V≥V(V一般在0.85到1之间),则取 Y=XW 第3步所求的贡献率,代表主成分表达X的能力,贡献率越大,对应的主成分表达X 的能力越强。只要前q个主成分的累计贡献率超过给定的百分比V。就可以用低维特征Y (yy2,…y)来反映高维特征(x,x…xp)的变化特性。 现将反映20个已知类别样本的41个特征的随机向量X进行特征提取 计算得前4个主成分的累计贡献率为96%,故提取特征为4个变量,取 W=(r,r2,r3r4),则Y=XW,Y的4个分量就是从基本特征集提取所得的特征参数向 量。(程序及结果见附录二 二.分类决策的制定15 2.91 1.94 2.91 1.94 0.00 5.83 1.94 0.00 1.94 9.71 5.83 8.74 10.68 1.94 3.88 3.88 8.74 2.91 11.65 10.68 16 2.86 0.95 0.00 11.43 1.90 1.90 2.86 0.00 4.76 3.81 5.71 8.57 8.57 6.67 9.52 4.76 5.71 2.86 7.62 7.62 17 1.92 0.96 1.92 4.81 1.92 3.85 1.92 0.96 0.96 6.73 4.81 8.65 10.58 2.88 6.73 2.88 9.62 6.73 8.65 7.69 18 1.71 0.85 1.71 0.85 0.85 2.56 16.24 0.85 1.71 0.85 16.24 5.13 6.84 5.98 3.42 11.11 1.71 5.13 11.11 3 .42 19 0.94 0.94 1.89 0.94 0.94 0.94 1.89 0.94 10.38 7.55 5.66 9.43 8.49 8.49 7.55 5.66 6.60 11.32 6. 60 0.94 20 0.86 0.86 0.00 1.72 0.86 0.86 17.24 0.86 2.59 1.72 15.52 7.76 5.17 3.45 4.31 9.48 5.17 5.17 9.48 5 .17 其中 b1 =aaa+ata b2=aca+aga b3=cac+ctc b4=ccc+cgc b5 =gag+gtg b6=gcg+ggg b7=tat+ttt b8=tct+tgt b9 =aac+caa+atc+cta b10=aag+gaa+atg+gta b11=aat+taa+att+tta b12=acc+cca+agc+cga b13=acg+gac+ctg+gtc b14=act+tca+agt+tga b15=cag+gac+ctt+ttc b16=cat+tac+ctt+ttc b17=ccg+gcc+cgg+ggc b18=cct+tcc+cgt+tgc b19=gat+tag+gtt+ttg b20=gct+tcg+ggt+tgg 综合起来,形成了有 41 个变量的基本特征集。 (二)特征的提取 上述基本特征集中有 41 个变量,即样本处于一个高维空间中。特征的提取就是通 过变换的方法用低维空间来表示样本,使得 X 的大部分特性能由 Y 来表达,即将 p 维 随机向量 X 变换成 q 维随机向量 Y(q<p)。我们用主成分分析法进行特征的提取,其 步骤是: 1. 求 X 的均方差矩阵 V 的特征根,记为: λ1≥λ2≥……≥λk>0 λk+1=……=λP=0 2. 求λ1,λ2……λK对应的标准正交的特征向量 r1,r2……rK 得到第 i 个主成分为 yi=riX, i=1,2……K 3. 求第 i 个主成分的贡献率 ui=λi/ = k i 1 λj, i=1,2……K 及前 m 个主成分的累计贡 献率 vm== m i 1 ui. 4. 求得 q,使得 Vq≥V0(V0 一般在 0.85 到 1 之间),则取 W=(r1,r2,……,rq) Y=XW 第 3 步所求的贡献率,代表主成分表达 X 的能力,贡献率越大,对应的主成分表达 X 的能力越强。只要前 q 个主成分的累计贡献率超过给定的百分比 V。就可以用低维特征 Y= (y1,y2, ……yq)来反映高维特征(x1,x2……xp)的变化特性。 现将反映 20 个已知类别样本的 41 个特征的随机向量 X 进行特征提取。 计算得前 4 个主成分的累计贡献率为 96%,故提取特征为 4 个变量,取 W=(r1,r2,r3,r4),则 Y=XW,Y 的 4 个分量就是从基本特征集提取所得的特征参数向 量。(程序及结果见附录二) 二. 分类决策的制定
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有