第十三章x2检验与方差分析 第一节拟合优度检验 拟合优度检验(比率拟合检验)·正态拟合检验 第二节无关联性检验 独立性、理论频数及自由度·频数比较和连续性修正·关系强度的量度 第三节方差分析 总变差及其分解·自由度·检验统计量F的计算·相关比率·方差分析的 几点讨论 第四节回归方程与相关系数的检验 回归系数的检验·积差系数的检验·回归方程的区间估计 、填空 1.方差分析可以对多个总体()是否相等进行检验 2.列联表是按()标志把两个变量的频数进行交互分类的。 3.在使用z2检验法进行列联表检验所使用的自由度为()。 4.在对()的列联表进行检验时,存在着x2(1)=Z2的关系。 5.列联表检验是通过()而不是通过相对频数的比较进行的。 6.方差分析是()检验的推广,一般用于处理自变量是一个()定类变量和 因变量是一个定距变量之间的关系。 7.在对6×5的列联表进行方差分析时,与组间平方和相联系的自由度为(),与 组内平方和相联系的自由度为(),与总平方和相联系的自由度为()。 8.方差分析中把已解释的变差对总变差的比值称为()。 9.检验两个总体变量(定距一定距变量)是否具有线性关系,主要是检验总体的() 是否等于零 10.对于定距一定距变量计算积差系数r时,要求相关的两个变量均为()变量 在回归分析中,只有()变量才是随机的 l1.在实际运用中,方差分析的结果常用一种称为()的标准形式的表格表示出来 12.取Y±1Sx,那么在散点图上约有()%的观测点落在其间 13.取Y±2Sx,那么在散点图上约有()%的观测点落在其间 4.取X±3Smx,那么在散点图上约有()%的观测点落在其间
1 第十三章 2 检验与方差分析 第一节 拟合优度检验 拟合优度检验(比率拟合检验)·正态拟合检验 第二节 无关联性检验 独立性、理论频数及自由度·频数比较和连续性修正·关系强度的量度 第三节 方差分析 总变差及其分解·自由度·检验统计量 Fo 的计算·相关比率·方差分析的 几点讨论 第四节 回归方程与相关系数的检验 回归系数的检验·积差系数的检验·回归方程的区间估计 一、填空 1.方差分析可以对多个总体( )是否相等进行检验。 2.列联表是按( )标志把两个变量的频数进行交互分类的。 3.在使用 2 检验法进行列联表检验所使用的自由度为( )。 4.在对( )的列联表进行检验时,存在着 (1) 2 = 2 Z 的关系。 5.列联表检验是通过( )而不是通过相对频数的比较进行的。 6.方差分析是( )检验的推广,一般用于处理自变量是一个( )定类变量和 因变量是一个定距变量之间的关系。 7.在对 6×5 的列联表进行方差分析时,与组间平方和相联系的自由度为( ),与 组内平方和相联系的自由度为( ),与总平方和相联系的自由度为( )。 8.方差分析中把已解释的变差对总变差的比值称为( )。 9.检验两个总体变量(定距—定距变量)是否具有线性关系,主要是检验总体的( ) 是否等于零。 10.对于定距—定距变量计算积差系数 r 时,要求相关的两个变量均为( )变量。 在回归分析中,只有( )变量才是随机的。 11.在实际运用中,方差分析的结果常用一种称为( )的标准形式的表格表示出来。 12.取 Yc ±1SY/X ,那么在散点图上约有( )%的观测点落在其间。 13.取 Yc ±2SY/X ,那么在散点图上约有( )%的观测点落在其间 14.取 Yc ±3SY/X ,那么在散点图上约有( )%的观测点落在其间
二、单项选择 1.在x2比率拟合优度检验中,对于选定的显著性水平a求临界值x2,此时的自由 度是()。 A实验数据总数n- B变量X的取值种类数c-1 C实验数据总数n一变量X的取值种类数c D实验数据总数n+变量X的取值种类数c 2.在x2正态拟合优度检验中,对于选定的显著性水平a求临界值x2,此时的自由度 是() A数据的分组数 B数据的分组数一1 C数据的分组数-2 D数据的分组数-3 3.使用x2检验法对nxc列联表进行无关联性检验,与x。这个检验统计量相联系的自 由度()。 B D(n-1)x(c-1) 4.对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部 分卡方x2影响最大。这是利用了卡方分布的() A恒正性B方差为期望值的2倍C可加性D前三者 5.在方差分析中,自变量是 A定类变量B定序变量 C定距变量D定比变量 6.在直线回归分析中,相关比率PRC=0.750。那么,积差系数r=( A0.750 B0.5625 C1.333 D0.866 三、多项选择 1.可以用于拟和优度检验的方法有() Ax检验 BF检验 C累计频数检验 D游程检验 2.方差分析法()。 A可以用于一个总体均值是否相等的检验 B可以用于两个总体均值是否相等的检验 C可以用于三个总体均值是否相等的检验 D可以用于多个总体均值是否相等的检验 3.对拟和优度推断结果,下列说法正确的是() A当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表 明实际情况切合零假设 B数据少如果否定了零假设,这一否定的可靠性是很大的 C规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多 大实际意义
2 二、单项选择 1.在 2 比率拟合优度检验中,对于选定的显著性水平α求临界值 2 ,此时的自由 度是( )。 A 实验数据总数 n―1 B 变量 X 的取值种类数 c―l C 实验数据总数 n — 变量 X 的取值种类数 c D 实验数据总数 n + 变量 X 的取值种类数 c 2.在 2 正态拟合优度检验中,对于选定的显著性水平α求临界值 2 ,此时的自由度 是( )。 A 数据的分组数 B 数据的分组数―l C 数据的分组数―2 D 数据的分组数―3 3.使用 2 检验法对 n×c 列联表进行无关联性检验,与 2 o 这个检验统计量相联系的自 由度( )。 A n―1 B c―l C n ―c D (n—1)×(c—1) 4.对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部 分卡方 2 o 影响最大。这是利用了卡方分布的( )。 A 恒正性 B 方差为期望值的 2 倍 C 可加性 D 前三者 5.在方差分析中,自变量是( )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 6.在直线回归分析中,相关比率 PRC=0.750。那么,积差系数 r=( )。 A 0.750 B 0.5625 C 1.333 D 0.866 三、多项选择 1.可以用于拟和优度检验的方法有( )。 A 2 检验 B F 检验 C 累计频数检验 D 游程检验 2.方差分析法( )。 A 可以用于一个总体均值是否相等的检验 B 可以用于两个总体均值是否相等的检验 C 可以用于三个总体均值是否相等的检验 D 可以用于多个总体均值是否相等的检验 3.对拟和优度推断结果,下列说法正确的是( )。 A 当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表 明实际情况切合零假设 B 数据少如果否定了零假设,这一否定的可靠性是很大的 C 规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多 大实际意义
D若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持 4.使用x2检验拟和优度,下列说法正确的是() A相对频数相同的列联表,在统计检验中其显著性相同 B相对频数相同的列联表,在统计检验中其显著性并不相同 C相对频数相同的列联表,样本容量增加K倍,x。不变 D相对频数相同的列联表,样本容量增加K倍,x2变也扩大K倍 5.相关比率PRE度量的可以是()。 A定类一定距变量之间的相关程度 B定距一定距变量之间的相关程度 线性相关 D非线性相关 6.下列说法正确的是()。 A方差分析的优点在于,一个检验可以代替多个均值差检验 B方差分析总是优于一系列的均值差检验 C方差分析中的自变量X如果是二分变量,不论采用方差分析或均值差检验,其 结果完全相同 D总变差分解的思想可以直接推广至多因素显著性检验 7.方差分析所包含的假定包括()。 A正态分布 B独立随机样本 C等方差性 D非负性 四、名词解释 拟和优度检验2.列联表3.理论频数4.方差分析5.方差分析表 6.总变差7.组内变差8.组间平方和9.相关比率10.估计标准误差 五、判断题 1.理论频数∫与观测频数后越接近,经验分布与理论分布拟合程度越好 2.对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不 3.规模极大的试验可把零假设有极细微的差别检测出来。 4.如何求得列联表中的理论频数就成了独立性检验的关键 ))) 5.x2检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点。 6.x2检验不适用于定类变量和定序变量的相关统计 ()
3 D 若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持 4.使用 2 检验拟和优度,下列说法正确的是( )。 A 相对频数相同的列联表,在统计检验中其显著性相同 B 相对频数相同的列联表,在统计检验中其显著性并不相同 C 相对频数相同的列联表,样本容量增加 K 倍, 2 o 不变 D 相对频数相同的列联表,样本容量增加 K 倍, 2 o 变也扩大 K 倍 5.相关比率 PRE 度量的可以是( )。 A 定类—定距变量之间的相关程度 B 定距—定距变量之间的相关程度 C 线性相关 D 非线性相关 6.下列说法正确的是( )。 A 方差分析的优点在于,一个检验可以代替多个均值差检验 B 方差分析总是优于一系列的均值差检验 C 方差分析中的自变量 X 如果是二分变量,不论采用方差分析或均值差检验,其 结果完全相同 D 总变差分解的思想可以直接推广至多因素显著性检验 7.方差分析所包含的假定包括( )。 A 正态分布 B 独立随机样本 C 等方差性 D 非负性 四、名词解释 1.拟和优度检验 2.列联表 3.理论频数 4.方差分析 5.方差分析表 6.总变差 7.组内变差 8.组间平方和 9.相关比率 10.估计标准误差 五、判断题 1.理论频数 fe 与观测频数 fo 越接近,经验分布与理论分布拟合程度越好。 ( ) 2.对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不 大。 ( ) 3.规模极大的试验可把零假设有极细微的差别检测出来。 ( ) 4.如何求得列联表中的理论频数就成了独立性检验的关键。 ( ) 5. 2 检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点。 ( ) 6. 2 检验不适用于定类变量和定序变量的相关统计。 ( )
7.在2×2列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测 方向的(Z)2来找出x2的近似值 8.相对频数相同的列联表,在统计检验中其显著性也相同 9.组内变差反映了数据的c个“中心”的散布程度 ((( ))) 10.组间平方和反映了数据围绕各“中心”的散布程度 11.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量。 12.我们不可以从总平方和减去组间平方和来求组内平方和 13.n2只可用于一个定类变量与一个定距变量的相关程度的测定。 方差分析的优点在于,一个检验可以代替多个检验。 )))) 15.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。 16.拟合值Y上下设置一个合适区间,那么Y被估计到的可能性便会大大增加。 六、计算题 1.一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。为此,他在某校随 机抽取了4500个本科生,这些学生的分布是:一年级1200人,二年级1100人,三年级1150 人,四年级1050人。试问,在给定显著性水平a为0.05下,四个年级学生人数构成是否 均匀? 2.一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规 律两种粉色杂交后,后代将以白:粉:红=1:2:1的比例出现。他做了一项杂交实验,植 株了100株后代,结果发现:21株白,61株粉,18株红。试问,在给定显著性水平α为0.05 下,是否植株后代以白:粉:红=1:2:1的比例出现? 3.某种动物的两个品种杂交后可能出现四种特征。某种理论分析表明,可能出现的四 种特征的数量将以9:3:3:1的比例出现。生物学家为此做了一项实验,检查了160个后 代,结果发现具有着四种特征的后代的数量分别是72、38、32、18。试问,在给定显著性 水平a为0.05下,是否杂交后代以9:3:3:1的比例出现? 4.某公司对电视机的可靠性进行了一次调查,使用100台电视机作样本,记录了在电 视机出现故障之前所经历的月份。根据经历的月份(按等级划分),下表给出了出现故障的 实际分布月份和故障按照正态概率分布月份 出现故障之前的月 出现故障之前的实际月份 出现故障之前的期望月份 份(等级)
4 7.在 2×2 列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测 方向的 (Zα/2) 2 来找出 2 的近似值。 ( ) 8.相对频数相同的列联表,在统计检验中其显著性也相同。 ( ) 9.组内变差反映了数据的 c 个“中心”的散布程度。 ( ) 10 . 组 间 平 方 和 反 映 了 数 据 围 绕 各 “ 中 心 ” 的 散 布 程 度 。 ( ) 11.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量。 ( ) 12.我们不可以从总平方和减去组间平方和来求组内平方和。 ( ) 13. 2 只可用于一个定类变量与一个定距变量的相关程度的测定。 ( ) 14.方差分析的优点在于,一个检验可以代替多个检验。 ( ) 15.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。 ( ) 16.拟合值 Yc上下设置一个合适区间,那么 Y 被估计到的可能性便会大大增加。 ( ) 六、计算题 1.一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。为此,他在某校随 机抽取了 4500 个本科生,这些学生的分布是:一年级 1200 人,二年级 1100 人,三年级 1150 人,四年级 1050 人。试问,在给定显著性水平α为 0.05 下,四个年级学生人数构成是否 均匀? 2 .一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规 律两种粉色杂交后,后代将以白∶粉∶红 =1∶2∶1 的比例出现。他做了一项杂交实验,植 株了 100 株后代,结果发现:21 株白,61 株粉,18 株红。试问,在给定显著性水平α为 0.05 下,是否植株后代以白:粉:红 =1∶2∶1 的比例出现? 3.某种动物的两个品种杂交后可能出现四种特征。某种理论分析表明,可能出现的四 种特征的数量将以 9∶3∶3∶1 的比例出现。生物学家为此做了一项实验,检查了 160 个后 代,结果发现具有着四种特征的后代的数量分别是 72、38、32、18。试问,在给定显著性 水平α为 0.05 下,是否杂交后代以 9∶3∶3∶1 的比例出现? 4.某公司对电视机的可靠性进行了一次调查,使用 100 台电视机作样本,记录了在电 视机出现故障之前所经历的月份。根据经历的月份(按等级划分),下表给出了出现故障的 实际分布月份和故障按照正态概率分布月份: 出现故障之前的月 份(等级) 出现故障之前的实际月份 出现故障之前的期望月份
17以下 6 17-20 18 30以上 要求:检验故障的实际分布与正态分布是否有明显差别(α取0.05)。 5.下表是三个年龄组的100名居民对生活质量要求的分布频数(按高、中、低分类): 生活质量要求 年龄(岁) 总计 17—30 12 45-65 7 总计 31 100 试问,居民对生活质量的要求与年龄是否有明显的关系(a取0.05)。 6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。 小于5次 5-10次 5次以上 合计 10公里以内 31 10-20公里 20公里以上 19 试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?(α取0.05) 7.为研究职业的代际流动问题,在某地随机抽取了160名职业区民进行调查,调查的 结果如下表所示: 父辈职业 合计 脑力劳动 体力劳动 农业劳动 脑力劳动 子辈 体力劳动 35 0 农业劳动 5
5 17 以下 17—20 21—23 24—26 27—29 30 以上 6 24 28 18 14 10 9 17 27 25 15 7 要求:检验故障的实际分布与正态分布是否有明显差别(α取 0.05)。 5.下表是三个年龄组的 100 名居民对生活质量要求的分布频数(按高、中、低分类): 年龄(岁) 生活质量要求 总计 高 中 低 17—30 11—35 45—65 12 11 8 15 13 10 13 11 7 40 35 20 总计 31 38 31 100 试问,居民对生活质量的要求与年龄是否有明显的关系(α取 0.05)。 6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。 小于 5 次 5—10 次 5 次以上 合计 10 公里以内 10—20 公里 20 公里以上 42 32 19 31 23 7 30 5 11 103 60 37 合计 93 61 46 200 试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?(α取 0.05) 7.为研究职业的代际流动问题,在某地随机抽取了 160 名职业区民进行调查,调查的 结果如下表所示: 父辈职业 合计 脑力劳动 体力劳动 农业劳动 子辈 职业 脑力劳动 体力劳动 农业劳动 25 15 5 8 35 7 5 10 50 38 60 62 合计 45 50 65 160
试问,子辈职业与父辈职业之间是否存在相关关系?(a取0.05) 8.某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法 研究者随机抽出来自农村和城市的两个家长样本,调查结果表明:在来自城市的200位家长 中,123人支持,36人反对,41人没有看法;在来自农村的300位家长中,145人支持, 85人反对,70人没有看法。试问,家长对学生延长在校时间的看法是否与其居住在城市或 农村有关?(a取0.01) 9.某连锁商业企业在同城三个不同地点开设了三个分店,从这三家商店随机抽出5天 的营业额的数据如下表所示: 单位:万元 第一家分店 第二家分店 第三家分店 第一天 10 7 14 第二天 12 11 第三天 9 8 12 第四天 10 第五天 11 10 11 要求:(1)求三家店每天的平均每天的营业额和5天的平均每天营业额 (2)求总变差、组内变差和组间平方和; (3)编制方差分析表 (4)检验三个商店的地点不同对每天的营业额是否有显著的影响 (5)计算商店的地点不同对每天的营业额之间的相关比率 10.为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调 种职业家庭的子女数的资料如下: 工人:1,3,4,4,6,2,3,4,3,5,2,4; 干部:3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1; 知识分子:6,4,2,2,3,0,5,3,1,2,1 要求:(1)求三种职业家庭户均子女数 (2)求总变差、组内变差和组间平方和; (3)编制方差分析表 (4)检验不同职业的生育观是否有显著的不同。 (5)计算职业与子女数量之间的相关比率。 l].有关雇员初始年薪和他10年后的年薪之间的一项调查,共抽取了13名雇员。数 据表明,二者之间的积差系数是0.570。现给定α=0.05,试检验此相关系数是否显著。 12.1992-2003年我国城镇居民人均消费性支出和人均可支配收入的数据见下表:
6 试问,子辈职业与父辈职业之间是否存在相关关系?(α取 0.05) 8.某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法。 研究者随机抽出来自农村和城市的两个家长样本,调查结果表明:在来自城市的 200 位家长 中, 123 人支持,36 人反对,41 人没有看法;在来自农村的 300 位家长中, 145 人支持, 85 人反对,70 人没有看法。试问,家长对学生延长在校时间的看法是否与其居住在城市或 农村有关?(α取 0.01) 9.某连锁商业企业在同城三个不同地点开设了三个分店,从这三家商店随机抽出 5 天 的营业额的数据如下表所示: 单位:万元 第一家分店 第二家分店 第三家分店 第一天 10 7 14 第二天 12 11 8 第三天 9 8 12 第四天 8 13 10 第五天 11 10 11 要求:(1)求三家店每天的平均每天的营业额和 5 天的平均每天营业额; (2)求总变差、组内变差和组间平方和; (3)编制方差分析表; (4)检验三个商店的地点不同对每天的营业额是否有显著的影响 (5) 计算商店的地点不同对每天的营业额之间的相关比率。 10.为了研究职业与家庭子女数之间的关系,随机地抽出了 41 户家庭进行了调查,调 查三种职业家庭的子女数的资料如下: 工人:1,3,4,4,6,2,3,4,3,5,2,4; 干部:3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1; 知识分子:6,4,2,2,3,0,5,3,1,2,1。 要求:(1)求三种职业家庭户均子女数; (2)求总变差、组内变差和组间平方和; (3)编制方差分析表; (4)检验不同职业的生育观是否有显著的不同。 (5)计算职业与子女数量之间的相关比率。 11. 有关雇员初始年薪和他 10 年后的年薪之间的一项调查,共抽取了 13 名雇员。数 据表明,二者之间的积差系数是 0.570。现给定α=0.05,试检验此相关系数是否显著。 12. 1992—2003 年我国城镇居民人均消费性支出和人均可支配收入的数据见下表:
单位:千元 年份 人均可支配收入 人均消费性支出 2.027 1.672 2.577 2.111 1994 3.496 2.851 1995 4.283 3.538 5.160 4.186 5.425 4.332 2000 6.280 4.998 2001 6.860 2002 7.703 6.030 2003 847 要求 (1)计算我国城镇居民人均消费性支出和人均可支配收入的积差系数 (2)检验所计算的积差系数的显著性 (3)建立我国居民人均消费支出依人均可支配收入的线性回归模型 (4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与 积差系数的数量关系: (5)计算估计标准误差 (6)已知某年我国居民人均年可支配收入为8000元,试以95%的置信度预测人均年 消费性支出的估计区间 13.某银行25家分行的不良贷款额与贷款余额调查数据如下(单位:亿元): 分行编号 各项贷款余额 不良贷款额 111.3 80.8 16.2 185.4
7 单位:千元 年份 人均可支配收入 人均消费性支出 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2.027 2.577 3.496 4.283 4.839 5.160 5.425 5.854 6.280 6.860 7.703 8.472 1.672 2.111 2.851 3.538 3.919 4.186 4.332 4.616 4.998 5.309 6.030 6.511 要求: (1)计算我国城镇居民人均消费性支出和人均可支配收入的积差系数; (2)检验所计算的积差系数的显著性; (3)建立我国居民人均消费支出依人均可支配收入的线性回归模型; (4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与 积差系数的数量关系; (5)计算估计标准误差; (6)已知某年我国居民人均年可支配收入为 8000 元,试以 95%的置信度预测人均年 消费性支出的估计区间。 13.某银行 25 家分行的不良贷款额与贷款余额调查数据如下(单位:亿元): 分行编号 各项贷款余额 不良贷款额 1 67.3 0.9 2 111.3 1.1 3 173 4.8 4 80.8 3.2 5 199.7 7.8 6 16.2 2.7 7 107.4 1.6 8 185.4 12.5 9 96.1 1
72.8 2.6 64. 0.3 2345 174.6 263.5 10.2 79.3 14.8 73.5 0.4 24.7 39.4 24 196.2 102.2 要求: (1)计算各项贷款余额和不良贷款额的积差系数; (2)检验所计算的积差系数的显著性 (3)建立不良贷款额依各项贷款余额的线性回归模型 (4)对回归模型进行F检验 (5)计算估计标准误差 (6)求出贷款余额为100亿元时,不良贷款95%的置信区间 七、问答题 1.对于拟合优度检验,解释统计推断的结果时,应注意些什么? 2.简述相关比率n2、积差系数之平方P和相关指数R之间的关系
8 10 72.8 2.6 11 64.2 0.3 12 132.2 4 13 58.6 0.8 14 174.6 3.5 15 263.5 10.2 16 79.3 3 17 14.8 0.2 18 73.5 0.4 19 24.7 1 20 139.4 6.8 21 368.2 11.6 22 95.7 1.6 23 109.6 1.2 24 196.2 7.2 25 102.2 3.2 要求: (1)计算各项贷款余额和不良贷款额的积差系数; (2)检验所计算的积差系数的显著性; (3)建立不良贷款额依各项贷款余额的线性回归模型; (4)对回归模型进行 F 检验; (5)计算估计标准误差; (6)求出贷款余额为 100 亿元时,不良贷款 95%的置信区间. 七、问答题 1.对于拟合优度检验,解释统计推断的结果时,应注意些什么? 2.简述相关比率 2 、积差系数之平方 r 2 和相关指数 R 之间的关系
参考答案 填空 1.均值2.品质3.df=(c-1)(r-1)4.2×25.频数6.均值差 7.4,1,58.相关比率9.回归系数B10.随机,因11.方差分析表 12.68.2613.95.4614.99.73 二、单项选择 B2.D3.D4.C5.A6.D 三、多项选择 1. AC 2. BCD 3. ABCD 4. BD 5. ABCD 6. ACD 7. ABC 四、名词解释 1.拟和优度检验:是有关检定总体是否具有正态或其他分布形式的非参数统计检验。 2.列联表:是按品质标志把两个变量的频数进行交互分类的统计表格 3.理论频数:是按照理论分布计算出的样本各组频数。 4.方差分析:研究多个总体均值是否存在差异的统计检验方法。 5.方差分析表:用于表达方差分析结果的标准形式的表格。其基本形式如下: 项目 自由度MS 检验统计量 临界值 显著性 组间SSB(c-1) MSB MSB/ MSw Fa(c-1,n-c)(待定) 组内SSw(n-c)MS 6.总变差:记作Ss,它表示Y对于总均值Y的偏差之平方和,即 ss=∑∑(-Y) 7.组内变差:记作Ss,它是各观测值y对其所属类别均值Y的偏差的平方和,即 (Y-Y)2 8.组间平方和:记作SS,是自变量因素所没有解释的Y的变异,即∑n(F1-Y)2
9 参考答案 一、填空 1.均值 2.品质 3. df = (c-1)(r-1) 4.2×2 5.频数 6.均值差 7. 4,1,5 8.相关比率 9.回归系数 B 10.随机,因 11.方差分析表 12.68.26 13.95.46 14.99.73 二、单项选择 1.B 2.D 3.D 4.C 5.A 6.D 三、多项选择 1.AC 2.BCD 3.ABCD 4.BD 5.ABCD 6.ACD 7.ABC 四、名词解释 1.拟和优度检验:是有关检定总体是否具有正态或其他分布形式的非参数统计检验。 2.列联表:是按品质标志把两个变量的频数进行交互分类的统计表格。 3.理论频数:是按照理论分布计算出的样本各组频数。 4.方差分析:研究多个总体均值是否存在差异的统计检验方法。 5.方差分析表:用于表达方差分析结果的标准形式的表格。其基本形式如下: 项目 SS 自由度 MS 检验统计量 临界值 显著性 组间 SSB (c―1) MSB MSB / MSW Fα(c―1,n―c) (待定) 组内 SSW (n―c) MSW —— —— —— 总 SST (n―1) —— —— —— —— 6.总变差:记作 SST,它表示 Yij 对于总均值 Y 的偏差之平方和,即 SST= 2 1 1 ( ) = = − c i n j ij i Y Y 7.组内变差:记作 SSW,它是各观测值 Yij 对其所属类别均值 Y i 的偏差的平方和,即 = = − c i n j i ij i Y Y 1 1 2 ( ) 8.组间平方和:记作 SSB,是自变量因素所没有解释的 Yij 的变异,即 2 1 n (Y Y) c i i i − =
9.相关比率:方差分析中把已解释的变差对总变差的比值称为相关比率,用符号n2表 0计标准误差:为回归剩条方差的平方根,即S=2=E2 五、判断题 1.(√)2.(×)3.(√)4.(√) 5.(√)6 9.(×)10.(×)11.(√)12.(×) 13.(×)14.(√)15.(√)16.(√) 六、计算题 1.各年级理论频数均为125人,x2=1.110x053=7.81,接受hh:四个年级 的学生频数不构成均匀分布 2.白、粉、红三色花的理论频数分别是25、50和25,x2=5.020>x20s2=599,接 受H:植株后代以白:粉:红=1:2:1的比例出现 3.四种特征后代的理论频数为:90、30、30、10,x2=12.267>x2053=781,接受 H1:杂交后代不是以9:3:3:1的比例出现 1.71>x2=7.23,接受b:检验故障的实际分布与正态分布没有明显差别 5.x054=9448x0=0.16,接受Ho:居民对生活质量的要求与年龄没有明显的关 6.x204=1328>x2=12.376,接受h:车祸事故的频数与司机单程驾车的路程相 互独立 7.x2=9479>x2054=949,接受h:子辈职业与父辈职业之间是存在相关关系 8.x2=9.61>x2012=921,拒绝h:家长对学生延长在校时间的看法与其居住在城 市或农村无关 9.(1)、(2)略:;(3)见下表;(4)由于F=0.4697<F.0(2,12)=3.98,接受 H:三个商店的地点不同对每天的营业额没有显著的影响:(5)0.0726 自由度 统计量临界值显著性
10 9.相关比率:方差分析中把已解释的变差对总变差的比值称为相关比率,用符号 2 表 示。 2 =1― T W SS SS 10.估计标准误差:为回归剩余方差 MSW的平方根,即 SY/X= 2 2 − − n (Y Yc) 五、判断题 1.( √ ) 2.( × ) 3.( √ ) 4.( √ ) 5.( √ ) 6.( × ) 7.( √ ) 8.( × ) 9.( × ) 10.( × ) 11.( √ ) 12.( × ) 13.( × ) 14.( √ ) 15.( √ ) 16.( √ ) 六、计算题 1.各年级理论频数均为 1125 人, 2 o =11.111> 2 0.05,3 =7.81,接受 H1:四个年级 的学生频数不构成均匀分布 2 .白、粉、红三色花的理论频数分别是 25、50 和 25, 2 o =5.020> 2 0.05,2 =5.99,接 受 H0:植株后代以白∶粉∶红 =1∶2∶1 的比例出现 3.四种特征后代的理论频数为:90、30、30、10, 2 o =12.267> 2 0.05,3 =781,接受 H1:杂交后代不是以 9∶3∶3∶1 的比例出现 4. 2 0.05,5 =11.71> 2 o =7.23,接受 H0:检验故障的实际分布与正态分布没有明显差别 5. 2 0.05,4 =9.448> 2 o =0.16,接受 H0:居民对生活质量的要求与年龄没有明显的关 系 6. 2 0.01,4 =13.28> 2 o =12.376,接受 H0:车祸事故的频数与司机单程驾车的路程相 互独立 7. 2 o =94.79> 2 0.05,4 =9.49,接受 H1:子辈职业与父辈职业之间是存在相关关系 8. 2 o =9.61> 2 0.01,2 =9.21,拒绝 H0:家长对学生延长在校时间的看法与其居住在城 市或农村无关 9. (1)、(2)略;(3)见下表;(4)由于 Fo=0.4697<F0.05 (2,12)=3.98,接受 H0:三个商店的地点不同对每天的营业额没有显著的影响;(5)0.0726 SS 自由度 MS 统计量 临界值 显著性