农业院校《试验设计与分析》课程参考资料（多变量分析方法）线性回归分析的逆预测.pdf_大学文库

第27卷第5期作物学报 Vol.27,No.5 2001年9月 ACTA AGRONOMICA SINICA Sept.,2001 线性回归分析的逆预测' 莫惠栋 (扬州大学数量遗传研究室，江苏扬州225009) 提要逆预测又称逆回归，是从依靠变数Y的某一定值Y,预测独立变数X的对应值X。及其100(1 一)%可信区间。本文详细地解释了逆回归的原理、方法和注意问题，推导了逆回归的一些基本公式，并用两个实例分别说明Y。为Y总体的条件平均数和单一观察值时的逆回归程序。关键词线性回归：逆回归 Inverse Prediction in Linear Regression Analysis MO Hui-Dong (Lab of Quantitative Genctics.Yangshou Uniwersity.Yangshou 225009.China) Abstract The inverse prediction,i.e.,inverse regression,which is predicting an inde pendent variate Xo and its 100(1-a)%fiducial limits from a given value Yo of dependent variable Y.In the present paper,the principle and method for inverse regression were ex- plained and some fundamental formulae were derived and extended.Two real examples were taken to demonstrate the inverse regression procedure when Yo was a conditional mean and a single observed variate of Y population,respectively. Key words Inverse regression:Linear regressior 回归分析是处理具有自变数(X)和依变数(Y)之分的试验资料的统计方法，通常要求X 固定，Y随机。所以分析的基本目的是由X估计或预测Y,其k元线性回归模型的一般形式为Y,=a十b,X+e(i=1,2,,k;j=1,2,…,n)们。但是，在有些情况下，研究者需要了解的却是Y在某一Y。时的X值及其置信区间。例如：在农用药物的毒力测定中，药品浓度是X变数，昆虫死亡率是Y变数，如欲得到半致死浓度(Y=50%时的药品浓度)，就必须从Y反推X:在树龄测定中，年轮数是X变数，“碳记年”是Y变数，由碳记年估计树木年龄也是由Y反推X。很多仪表的校准(calibration)亦属由Y(仪表读数)预测X(标的物状况)。在近代遗传学研究中，QTL的定位也是要从Y(表型值)估计X(基因座位位置)。这类从Y反推、估计或预测X的分析，统称为逆回归或逆预测，其统计原理和方法国内尚未见报道。本文将阐述逆回归的意义，推导其区间估计，并以实例说明演算过程，以供应用和深入理解某些涉及逆回归的问题。文中所用符号和公式，除特别说明外，都按照文献[1]，不再解释。接受日期 0-09.25 Received on:2000-08-14.Accepted on:2000-09-25

!" #$%&’() 得到 !*+等, 从表 -的 )和 .得到/0"+12-3*45"*1-67-84908 "+18867:;4958 ":1+873::4905 "+13672:24. .?)"+1-2*8-;,查 @表4AB"*C8"6时4@+1+*" 61-78,因此4根据D:EFD--EFD-6E和D-8E依次有/ )+" D*C 81-8+262E?:1-3628-" +1;7;*;*4 G" D61-788H +1-2*8-;8 E?D:1-3628-8H +18867:;E" +1+273*34 A" 61-78H +1-2*8-; :1-3628- -C +1+273*3 * = D+1;7;*;*C +12-3*E8 I +18867:; J -?8 " +1+*27+*4 )K " ID+1;7;*;*C +1+273*3H +12-3*E= +1+*27+*J?D-C +1+273*3E" +12:;*+84 )L " ID+1;7;*;*C +1+273*3H +12-3*EC +1+*27+*J?D-C +1+273*3E" +1;8+37-, 表 M 水流流率DN4OP?QRSE 和流率仪读数DTE UVWXRM YXZ[\V]RDN4OP?QRSE V^_\RV_‘^aQZ^VbXZ[OR]R\DTE ) . - -1: 8 816 6 61- : :18 * *1- ; *17 2 ;17 7 21; 3 712 -+ 31* 以上结果说明/鱼藤酮对菊蚜的半致死浓度为 !*+"#$%&’(+1;7;*;*":17;c(?de其 3*f可信高限为 #$%&’( +12:;*+8" *1*7c(?d4低限为 #$%&’( +1;8+37-":1-7c(?d, g1M Th为单一观察值的逆回归研究灌溉水流率和流率仪读数的关系4得表 8结果I:J ,某次测定读得 .+":1+4求流率 )+及其 3*f可信限, 从表 8可得回归分析的基本数据/0"*1*45" *1:*4908 "781*4958 ";21+;*4905"2:16*和 . .?)"+1+7;*+6,AB"7时的 @+1+*"816+;,故根据D:EFD--EFD-*E和D-8E依次有/ )+" D:1+C +1:36666E?+13+-8-8" 6173--c6 ?ijk4 G" D816+;8H +1+7;*+68 E?D+13+-8-88H 781*E" +1+++*3:4 A" 816+;H +1+7;*+6 +13+-8-8 --H +1333:+; -+ = D6173--C *1*E8 I 781* J -?8 " +186*:4 )+C G0" 6173--C D+1+++*3:H *1*E" 6177274 所以4 )K"D617727=+186*:E?+1333:+;":1-8*;c6 ?ijk4 )L"D617727C+186*:E?+1333:+;"61;*:;c6 ?ijk, 参考文献 - 莫惠栋1农业试验统计1上海/上海科学技术出版社4-33816+7l6834*-+l*8; 8 m&’’&nciop1qrGsr>>tuvwvxy5>t>1zj{|}~!/p}"$m&’j#$%}$i4&$k14-3*31’"#(%1; 6 )~#(j~z *4+ %c&%"1w,,ytrAqrGsr>>tuvwvxy5>t>1zj{|}~!/p}"$m&’j#$%}$i4&$k14-3371:2l*- : -%%* d1wvtv@suA./@tuv@u>@x@t>@t/xy0r@1uA>xvA2x@xwvxy5>t>13j’c}$%4’#’&4}~$&#/)n56n~#7~jii4m#8i{}~%" &$k14-3361:62l*;6 )K )K )K )K )K )K)K )K )K *期莫惠栋/线性回归分析的逆预测 *:3 万方数据

线性回归分析的逆预测作者：莫惠栋作者单位：扬州大学数量遗传研究室, 刊名：作物学报英文刊名： ACTA AGRONOMICA SINICA 年，卷(期)： 2001，27(5) 引用次数： 0次参考文献(4条) 1.莫惠栋农业试验统计 1992 2.Williums E J Regression Analysis 1959 3.Draper N R.H Smith Applied Regression Analysis 1998 4.Ott R L An introduction to statistical Methods and Data Analysis 1993 相似文献(1条) 1.学位论文莫里·桑卡雷（Mory Sangare）中国南方地区奶牛泌乳曲线数学模型的研究 2005 本研究利用广州市奶牛研究所奶牛场2000～2005年间1469头荷斯坦奶牛5863条泌乳记录，利用SAS软件ProcREG过程来估计产犊月龄、胎次、产犊季节影响效应。采用简单线性回归对不同胎次、季节、测定日的产奶量进行校正，利用SAS软件进行分析，并且对原始数据进行了Lowess光滑预处理，对不同模型分别采用SAS软件ProcREG和ProcNLIN计算模型参数，利使用多项式回归模型和 Ali等(1987)年提出的逆回归模型对泌乳曲线进行了拟合，采用SAS软件ProcNLIN计算逆回归模型的参数，利用ProcREG过程来计算多项式模型的参数。研究结果表明：对测定日产奶量有影响显著(P＜0.01)的因素包括胎次、产犊月龄和产犊季节。各因子每测定日产奶量的回归系数平均分别为：胎次(0.6043319)、产犊月龄(0.003670)、产犊季节(0.4966133)，产犊月龄的回归系数是最低，比其它因子影响小，表明本研究的产犊月龄划分是可行的。产犊月龄、产犊季节与测定日产奶量的回归分析结果表明：各胎次的回归系数都达极显著水平(P＜0.01)，但是各胎次产犊季节的回归系数都大于产犊月龄的。产犊月龄(变量X1)和产犊季节(变量 X2)每次测定的泌乳量的回归系数平均分别为：第一胎X1为-0.03880、X2为0.856937；第二胎X1为-0.026478、X2为0.123124；第三胎X1为-0.0458519、X2为0.09049；第四胎X1为-0.187895、X2为1.43744。各个胎次的X2(产犊季节)的回归系数都高于X1(产犊月龄 )，说明各胎次产奶量受产犊季节的影响最大。利用本研究的原始数据进行泌乳曲线的拟合时，所有模型的拟合度(R2)都只有0.157094～0.357969左右。对产犊季节进行简单线性回归和光滑(Lowess)处理后，回归曲线的拟合度显著升高，例如第四胎次的逆回归模型在未对产犊季节校正之前R2=0.357969，对产犊季节校正后R2=0.870970；同样，该模型在未经过光滑处理之前 R2=0.357969，光滑处理之后R2=0.998761。通过光滑处理之后，无论是逆回归模型或多项式回归模型，光滑处理之后的R2都高于简单线性回归校正之后的R2，说明对广州地区奶牛产奶量校正方法，Lowess方法要比传统的简单线性回归方法好，更具有科学性。本研究用SAS的PROCREG和SAS软件PROCNLIN两种方法计算的结果表明，PROCREG方法的(R2)普遍都高于PROCNLIN方法，多项式模型 (PROREG)的提高幅度(不同胎次校正数据的结果平均提高0.5626)要高于逆回归模型(NLIN，平均提高0.514733)；同样，经过光滑处理之后，PROCREG方法的(R2)普遍都高于PROCNLIN方法，逆回归模型提高幅度(不同胎次光滑数据的结果平均提高0.727311)要低于多项式模型(平均提高0.728125)。两个模型经过光滑处理对季节校正之后的提高幅度增加，说明PROCREG方法更能准确处理季节校正和光滑处理之后的数据。未作季节校正数据经光滑处理前，多项式模型在1、2、3、4胎次的残差均方分别为24.96666、 34.29267、36.43438及35.93795，相应地逆回归模型的残差均方在24.9710～36.3667之间。对季节进行校正之后，各模型在胎次间残差均方的差异不大，多项式模型在1、3、4胎分别为1.80051、3.15096及2.99703，相应地逆回归模型在1～4胎的残差均方在 2.9639～6.0232之间。经过光滑处理之后，各模型胎次间的残差均方相差不大，多项式模型在1、2、4胎次的残差均方分别为 0.00354、0.00516及0.01276，逆回归模型1～4胎的残差均方在0.0265～0.0781之间。经光滑之后，多项式模型和逆回归模型的残差均方比简单线性回归小得多，表明光滑处理能够较大幅度地提高模型的拟合度。研究表明不同胎次不同模型泌乳量的拟合效果的R2排名如下：未对季节校正数据和未经过光滑处理的数据：第1胎：多项式模型(0.15750)＞逆回归模型 (0.15709)；第2胎：逆回归模型(0.28985)＞多项式模型(0.28950)；第3胎：逆回归模型(0.282150)＞多项式模型(0.28120)；第 4胎：逆回归模型(0.357969)＞多项式模型(0.35740)。总体上逆回归模型的拟合效果好。对季节进行校正之后的数据：第 1胎：多项式模型(0.8113)＞逆回归模型(0.736170)；第2胎：多项式模型(0.7497)＞逆回归模型(0.745089)；第3胎：多项式模型 (0.8113)＞逆回归模型(0.793808)；第4胎：逆回归模型(0.870970)＞多项式模型(0.8696)。经过光滑处理的数据：第1胎：多项式模型(0.99920)＞逆回归模型(0.999188)；第2胎：多项式模型(0.99960)＞逆回归模型(0.999238)；第3胎：多项式模型 (0.999222)＞逆回归模型(0.999222)；第4胎：逆回归模型(0.9998761)＞多项式模型(0.99940)。无论是对季节进行校正之后或经过光滑处理数据，所有情况下多项式模型的拟合效果最好，但是经过光滑处理之后的各模型R2都高于经过简单线性回归校正之后的R2，说明用光滑处理之后，能更好回归地拟合广州荷斯坦奶牛的泌乳曲线，而且泌乳曲线的拐点应以经过光滑方法之后所拟合的为准。本文链接：http://d.g.wanfangdata.com.cn/Periodical_zuowxb200105001.aspx