正在加载图片...
未知随机因素的影响。 对于统计相关的变量,我们希望能够在已知主要影响变量x变化的情况下 预测感兴趣变量y的变化。为此回归分析用一条直线或曲线拟合图2-1或图 2-2中的散点,来描述当x变化时y的平均值的变化。这条曲线就称为回归曲 线,它给出了ν在给定x的条件下的均值E(y/x)。因此对于统计相关的变量, 回归分析就是要寻找在给定x的条件下y的概率分布,从而用一种确定的函数 关系近似描述y与ⅹ的不确定关系 为了建立变量之间的关系形式,最直观的方法是观察它们的散点图。图2一 1显示我国分地区家庭人均食品支出与人均收入有较好的线性关系;图2-2则 显示生育水平与经济水平呈对数下降关系。通常希望用简单函数,比如直线来拟 合散点,当y与x为非线性关系时,或者通过变量变换,将它们转化为线性关 系;或者用多项式去拟合散点;也可以在不同阶段拟合线性或曲线关系式,用分 段函数表示在整个区域内的非线性关系。从而许多情况下都可以将变量的关系转 换成关于参数线性的线性关系式,多元线性回归就是讨论对于参数线性的回归问 元线性回归模型 我们从简单的情况开始,先来看含有一个自变量的线性回归问题。一个自变 量的回归称为一元回归或简单回归。 统计分析经常是先对总体中随机抽样得到的样本数据进行分析,然后再对总 体迸行推断在一般统计学教科书中,总体的各种指标称为参数( parameter.), 样本的各种指标称为统计量( statistic)因此,在后面的统计表述中经常需要分 清总体参数和样本统计量。在很多情况下,两者相互对应,所以为了简明,本章 采用许多教科书的作法,在一般情况下将总体参数用大写符号标注,将样本统计 量用小写符号标注 1.一元线性回归方程 用一个例子来示范一元线性回归方程的建立。这里主要帮助读者建立回归模 型的概念。 例1.表2—1列出了我国分地区家庭年人均食品支出与人均收入的数据。我 们感兴趣家庭的人均食品支出与他们的人均收入的关系,因此设食品支出为因变 量,记为Y,人均收人为自变量,记为X,由图2-1知道Y与X有较好的线
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有