☆个案教学 趣味绕计素侧(九) ●中国人民大学副校长袁卫 Francis Galton,1822-1911)在子女与父母相像程 “回归”一词的由来 度的进传学研究方面,取得了重要进展,高尔倾的学 生卡尔,皮尔孩Karl Pe8rs0n,1857-1936)在排 在塘计学中相关与回归是经典的内容,也是应 续这一遗传学研究的过程中,测量了1078个父亲及 用最为广泛的统计方法之 ,但是,国内教材却很少 其成年儿子的身高,他们之间的数量关系见图1(K, 讲到回归方法的起源。 n and A.Lee,"On the laws of inheritance in 国著名遗传学家弗朗西斯·高尔顿爵士(S man"Biometrika,parti(1903)pp.357-462) 图】1078对父子身高的散点图 资科来源:转引自统计学,David上redmn等著,线宗舒、施锡铨等译,中国绕计出饭社。1997年10月第1版 一个点代表 子父亲的儿子身材也比较矮。同时,我们也看到一些 出的是 线的点子,这监点 子的身高。我们看 多数 角平 儿子的 子的父京 与父亲身高光全相同的极少 子落在斜 出 的关系 还说明,高个子的父亲有较高身材的儿子,而 父亲身高和儿子身高两 个变的关系还是比较 ·42 1994-2010 China Aeademic Joumal Electronie Publishing House.All rights reserved.http:/www.enki.net
☆个案教 学 袭翅 味 统 计 素 侧 九 中 国人 民大 学副 校 长 哀 卫 “ 回 归 ”一 词 的 由来 在统计学 中 , 相关与 回归是经典的内容 , 也是应 用最 为广泛 的统计方法之一 。 但是 , 国 内教材却很少 讲到 回归方法的起源 。 英 国 著名遗 传学家弗 朗西斯 · 高尔顿 爵士 , 一 在 子女与父 母相 像 程 度的遗传学研究方面 , 取得 了重要进展 。 高尔顿的学 生 卡 尔 · 皮 尔逊 , 一 在继 续这一 遗传学研 究的过 程中 , 测量 了 个父亲及 其成年儿子 的身高 。 他们之间的数量关系见 图 , “ , , , 一 厂 叫叫司叭月当﹃, 英寸儿子身高的︵︶ “ 梦 一一荡一不一 不 , 一不 一清一 一 荡一告丫一石一 石一 , 不 一 、 父 亲 的 身高 英 寸 图 对父子 身高 的散点 图 资料 来源 转 引 自《统计学 》 , 记 等著 , 魏宗舒 、 施 锡锉等译 , 中国统计出版社 。 年 月第 版 。 图中每一个 点代表 一对父 子 的身高关 系 。 横轴 的 坐 标是父 亲的身高 , 纵轴 的 坐 标给 出的是儿 子 的身高 。 我们看到 , 多数点子位于 角平分斜线的两 侧椭 圆形面积之 内 , 落在斜 线上 的点子极少 , 即儿子 与父 亲身高完全相 同的极 少 。 由点子 落在斜线周 围 还说 明 , 高 个子 的父亲有着较高身材的儿 子 , 而矮个 子父亲的儿子身材也 比较矮 。 同时 , 我们也看到 一些 远离斜 线 的点子 , 这 些点子反 映 的是 父 亲 的 身高 与 儿子 的身高相差甚远 的情况 。 比如高个子 的父 亲有 矮儿子的情况 , 或者矮父亲 有高个子 儿子的情况 。 图 中散 点 图 给 出父子 身高 的关 系 图 , 但 图 中给 出 的 父亲身高和 儿子身高两个变量 的关系还是 比较直观
☆个案教学 的,相关系数:就是对两个变量间线性相关关系系 高,但这一正相关的关系并不十分明显 密程度的度量。相关系数r的计算公式为: r-Co( (Y-EX-)Y 金么父千身高这同有什么规佛呢?经过对 的计算。 ■67.6英寸≈68英寸,标准 式中分子部分为X和Y两个变量的协方差,分 均身 母部分是X和Y两个变量标准差的乘积由于协方 742.7英 儿子的平均身高了=68.7英寸≈69英寸,:标准 差是X和Y两个变量与其均值离差乘积的数学期 差S=2.812.8英寸 ,它受X和y 、变量度量单位大小的影响,因 (1英寸=2.54厘米)我们看到,儿子的平均身高比 到1之间的相对数值。实际 父亲高一英寸,表明下一代的平均身高比上“代安 计算的 0.501,表明高个 的父亲会 高。这样,我们会自然地猪测72英寸的父亲平均会 有较高的儿子,矮身材的父亲其儿子身体也不会很 有73英寸的儿子:64英寸的父亲平均会有65英寸 的儿子,等等。那我们看一看图2中的情况: 7. 父亲的身高(英寸) 图2父子身高回归效应的图示 图2中斜德线是从父子平均身高推泄的关系 柱内的点子多数分布在斜虚线的下方,表明72英寸 线,即58寸父亲有59寸的儿子,59英寸的父 高父亲的儿子们的身高多数低于73英寸,甚至多数 亲有60英寸的儿子,等等。在父亲身高64英寸和 低于与父亲同样高度的72英寸,即较高父亲的儿子 处的两个条形虚线,表明6英寸高父亲和 们多数比父亲身材要矮。高尔领和波尔逊把这种现 象称为“回归效应”,即回归到一般高度的效应。 在这 图2中的实线即回归直线。这条回归线的含义 条线虚线 内的 是:对于每一身高父亲所对应的虚线柱内若干儿子 高父亲的儿名 们的身高多数高于65 身高点子的分布,回归直线是从这些点子中间穿过 亲的几儿子们多数比父亲身材要高。接下 的,换句话说,回归直线上的点是当给定某一X伯 再看 72英 亲的儿子们身高分布,在这条虚 线 时(即父亲身高值),对应的若干Y,值(即儿子身高 ·43 1994-2010 China Academic Joumal Electronic Publishing House.All rights reserved.http://www.enki.net
☆个案教 学 的 , 相关系数 就是对两 个 变量 间线性相 关关 系紧 密程度的度量 。 相关系数 的计算公式为 , 口 口丫 一 内 一 脚 式中分子部分为 和 两个变量 的协方差 , 分 母部分是 和 两个变量标准差 的乘积 。 由于协方 差是 和 两个变量与其均 值离差乘积的数学期 望 , 它受 和 两个变量度 量单 位大 小 的影 响 , 因 而在分母上除以 和 两个变量 的标准差 , 就将相 关 系数 转化成从 一 到 之 间 的相 对数值 。 实际 数据计算 的结果为 士 , 表 明高个子 的父亲会 有较高的儿子 , 矮身材 的父亲其 儿 子身体也 不会很 高 , 但这一正相关的关系并不十分明显 。 那么 , 父 子 身 高 之 间 有 什 么 规 律 呢 经 过 对 对父子身高数据的计算 , 得到 父亲 的平均身高 又 英寸 、 英寸 , 标准 差 、 英寸 儿子 的平均身高 英寸 、 英寸 犷标准 差 一 、 英寸 英寸 一 厘米 我 们看 到 , 儿子的平均 身高 比 父亲高 一英寸 , 表 明下 一代 的平均 身 高 比上 一 代要 高 。 这样 , 我们会 自然地猜测 英寸的父亲平均会 有 英寸 的儿子 英寸 的父亲 平均 会有 英寸 的儿子 , 等等 。 那我们看一看 图 中的情况 儿英子高寸身的︵︶ 叨花 父 亲 的 身高 英 寸 图 父子身高 回归效应 的图示 图 中斜 虚 线是 从 父 子 平均 身高 推 测 的关 系 线 , 即 英 寸父 亲有 英寸 的儿子 , 英寸 的父 亲 有 英寸 的儿子 , 等等 。 在 父亲身高 英寸和 英寸 处 的两个 条 形 虚线 , 表 明 英 寸高父亲 和 英寸高父亲 的儿子 们身高的分布情况 。 首先来看 英寸高父亲 的儿子 们身高分 布 。 我们看到 , 在这 一条 线虚 线柱 内的点子 多数分 布在斜虚线 的上方 , 表 明 英寸高父亲 的儿子 们的身高 多数高于 英 寸 , 即较矮父亲 的儿子 们多数 比父 亲 身材要高 。 接下 来再看 英寸父亲 的儿子 们身高分布 , 在这条 虚线 柱 内的点子多数分布在斜虚线 的下方 , 表 明 英寸 高父亲 的儿子们的身高多数低 于 英寸 , 甚 至 多数 低 于 与父亲 同样高度的 英寸 , 即较高父亲的儿子 们多数 比父亲身材要矮 。 高尔顿和 波尔逊把这种现 象称为 “ 回 归效应 ” , 即 回归到 一般高度的效应 。 图 中的实线即 回归直线 。 这条 回 归线的含 义 是 对于 每一身高父亲所对应的虚 线柱 内若干 儿子 身高 点子 的分布 , 回 归直 线是从这 些 点子 中间穿过 的 。 换句话说 , 回 归直线上 的点是当 给定某一 值 时 即父亲 身高值 , 对应 的若干 值 即儿 子 身高
☆个案教学 值)与之Y:(直线上点Y值记为Y:值)离差平方和 实际上是当X确定后,若千Y,的平均值。这一回归 最小的直线,即我们的回归直线是求 直线和回归方程表明,矮个子父亲的儿子们的平均 Q-习最水 n 2(Y-Y)=) 身高会比父辈高一些,高个子父亲的儿子们平均身 高会比父辈低一些,即儿子们的身高会向平均值回 bX,-a)2 归。 要对上式求最小,微积分的知识告诉我们要求其偏 我们的读者必然会问,现代人一代比一代高,为 导数并令其为零。即: 什么高个子父亲的儿子们平均身高要比父辈低呢? =-2∑(Y:-bX,-a)=0 细心的读者不难发现,当时高尔顿和皮尔逊做研究 aa 时只观察了父亲和儿子的身高,并没有考虑母亲的 =-2∑Y,-bX:-a)X:=0 ab 身高。实际上,高个子父亲的太太可能是较高的女 整理这一联立方程得到 性,也可能是较低的女性。反之,矮个子父亲的太太 可能是矮个子,也可能是较高的身材。而儿子的身高 b=2X-X),-乃-comx,山 既受父亲遗传的影响,也受母亲遗传的影响,这就是 ∑(x-x) S吴 为什么儿子们身高会发生“回归”的原因。 a=9-8X 类似的回归现象还有很多,比如我们连续观察 由于已知r=0.501,Sx=2,74,Sy=2.81,则Cov 一群学生春秋两季的考试成绩,会发现春季考试得 (X,Y)=r×Sx×S¥=0.501×2.74×2.81÷3.86 高分的学生在秋季考试中虽然平均分还比较高,但 则b-20051 平均分会有所降低。反之,春季考试分数最低的学生 们秋季的平均分会有所提高。因为在考试中除了学 a=68.7-0.51×67.6-34.22 生水平的高低这一主要因素影响之外,临场发挥等 父子身高的回归方程为 ,=34.22+0.51X 偶然因素也会起到一定的作用。我们在应用回归方 程时若能注意到回归效应的特点,会帮助我们更好 该回归方程就是图2中的回归线(实线)。 地分析和解决问题」 当X=58时,Y=63.8,当X2=64时,2=66.86。 (责任编辑马士龙) 当X,=72时,Y,=70.94。这些回归方程上的Y值 (上接第21页) 习。全局干部职工系统地学习了《邓小平文选》1一3 多年来,全局干部职工按照八字方针开拓进取,努力 卷,学习了十四大、十五大文件。讲学习、讲政治、讲 工作,全局精神文明建设和业务建设不断迈上新台 正气、讲奉献蔚然成风。提倡爱岗敬业精神,把精神 阶。 文明建设列入全局岗位目标责任制,思想政治工作 根据国家公务员规范条例制定统计局机关形象 和精神文明建设实现规范化、制度化。 建设规范,从职业道德、仪表形象、执法纪律、办事效 通过多种形式的教育,全局干部职工的政治素 率、办公环境、廉政建设等方面规范机关形象,使统 质、文化素质、业务素质得到显著提高,机关凝聚力 计局干部素质和精神面貌发生较大的变化。 得到增强,锻炼了一支能打硬仗,关键时刻能冲得上 制定和完善一系列机关管理制度,加强对干部 去的统计队伍,有数人被评为国家级和市级先进个 的管理。从90年代初就制定实施目标责任制管理, 人,统计局也多次获国家级和市级综合部门先进单 并制定相应的考核评比办法,定期对全体干部进行 位,统计局连续6年被评为区文明单位。 德、能、勒、绩综合考核,通过目标管理激发了全体干 成绩表明过去,光明就在明天。我们相信,在区 部职工的责任感,改进了机关工作作风,提高了机关 委、区政府的领导下,在社会各界的支持下,在局党 办事效率和工作质量,职工的政治素质和业务素质 组坚强有力的带领下,门头沟区统计事业将更加辉 得到明显提高。 煌。 制定学习计刻和制度,坚持政治学习、业务学 (责任编辑王军) 44 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
☆个案教 学 八 值 与之 直 线上 点 值记为 值 离 差平方和 最 小的直线 , 即我们的 回 归直线是求 一 艺 卜 最 小 一 艺 , 一 宁 一 艺 一 忿 一 要 对上式求最小 , 微积分 的知识告诉我 们要求其偏 导数并令其为零 。 即 赘一 艺 ‘ 一 。 、 一 。 一 。 豁一 艺 、 一 ‘ 一 。 ‘ 一 。 整理这一联立方程得到 艺 一 了 、 一 习 ‘ 一 又 ’ , 多 二 一 由于 已 知 一 , , , 则 , 一 只 丫 士 。 , 则“ 丈玄幸孙‘ · ‘ 一 士 父子身高的 回归方程为 艺 ‘ 该 回归方程就是 图 中的 回归线 实线 。 入 八 当 时 , , 当 时 , 。 八 八 当 一 时 , 一 。 这些 回归方程上的 值 实际上是 当 确定后 , 若干 , 的平均值 。 这 一 回归 直 线和 回归方程表 明 , 矮个子父 亲 的儿子 们 的平均 身高会 比父 辈高一些 , 高个子父 亲 的儿 子 们平均 身 高会 比父 辈低 一些 , 即儿子 们的身 高会 向平均值 回 归 。 我们的读者必然会 间 , 现代人一代 比一代高 , 为 什么高个子父亲 的儿子 们平均 身高要 比 父 辈低 呢 细心 的读者 不难发现 , 当时高 尔顿 和皮 尔逊做 研究 时只观察了父亲和 儿子 的身高 , 并没有考虑 母亲 的 身高 。 实际 上 , 高个子父亲 的太太 可能是较 高 的女 性 , 也可能是较低的女性 。 反之 , 矮个子父亲的太太 可能是矮个子 , 也可能是较高 的身材 。 而儿子的身高 既受父亲遗传的影 响 , 也 受母亲遗 传的影 响 , 这就是 为什么 儿子 们身高会发生 “ 回 归 ” 的原 因 。 类似 的回 归现 象还有 很 多 , 比 如我 们连续观察 一群学 生春 秋两季 的考试成 绩 , 会发 现春季考试得 高分 的学 生 在秋季考试 中虽然平均分还 比 较高 , 但 平均分会有所降低 。 反之 , 春季考试分数最低的学 生 们秋季 的平均分会有所提高 。 因 为在考试 中除 了学 生水平 的高低这一 主 要 因 素影 响 之外 , 临场发挥 等 偶然 因素也会起到一定 的作用 。 我们在应用 回归方 程时若能注 意 到 回 归 效应 的特点 , 会 帮助 我 们更 好 地分析和 解决问题 。 责任编辑 马士龙 上接 第 页 多年来 , 全局干部职工按 照八字方针开拓进取 , 努力 工作 , 全局 精 神文 明建设 和 业务建设 不 断迈上 新 台 阶 。 根据国家公务员规范条例制定统计局机关形象 建设规范 , 从职业道德 、 仪表形象 、 执法纪律 、 办事效 率 、 办公环境 、 廉政建设等方面规 范机关形 象 , 使统 计局 干部素质和精神面貌发生较大的变化 。 制定和 完 善一 系列 机关 管理制 度 , 加强 对 干 部 的管理 。 从 年代初就制定实施 目标责任制管理 , 并制定相应 的考核评 比办法 , 定期对全体 干 部进行 德 、 能 、 勤 、 绩综合考核 , 通过 目标管理激发 了全体干 部职工的责任感 , 改进 了机关工作作风 , 提高 了机关 办 事效率和 工作质量 , 职工 的政治 素质和 业务 素质 得到 明显提 高 。 制 定学 习计 划和 制 度 , 坚 持 政治 学 习 、 业 务 学 习 。 全局 干部职工 系统地学 习 了《邓小平文选 》一 卷 , 学 习 了十四 大 、 十五大文件 。 讲学 习 、 讲政 治 、 讲 正气 、 讲奉献蔚然成风 。 提倡 爱 岗敬业精 神 , 把精神 文 明建设列 入全局 岗位 目标 责任制 , 思 想政 治工 作 和精神文 明建设 实现规范化 、 制度 化 。 通过 多种形 式 的教育 , 全 局 干 部职 工 的政 治 素 质 、 文化 素质 、 业务素质得 到 显 著提 高 , 机关凝 聚力 得到 增强 , 锻炼 了一支能打硬仗 , 关键 时刻 能冲得上 去的统计 队伍 , 有数人 被评为 国家级 和 市级先进个 人 , 统计 局 也 多次 获 国家级 和 市级 综合部 门先 进单 位 , 统计局连续 年被评为 区文 明单位 。 成绩表 明过 去 , 光 明就在 明天 。 我们相信 , 在 区 委 、 区 政府 的领 导下 , 在社 会各界 的支持 下 , 在局 党 组坚强 有 力 的带领 下 , 门头 沟 区 统 计事业将 更加 辉 煌 。 责任编辑 王军