主编胡良平 现代统计学 AS应用 军事医学科学出版社
内容提要 本书较全面地介绍了现代统计学的理论、方法及其应用技巧。针对多元统计分析方法计算量 大和算法复杂的特点,以SAS软件包作为实现复杂统计计算的工具,本书着重介绍各种试验设计 方法、统计分析方法及其适用条件、结合具体问题正确选用统计方法的技术以及对计算结果的正 确解释和应用。在一切从实际出发的思想指导下,合理调整教材结构和编写形式,把处理同一类 问题的统计方法集中到一起讲解,使貌似复杂的统计问题化繁为简,实用方便。本书具有以下独 到之处:用计算器和计算机两种计算工具实现统计计算,便于读者选用;针对问题和资料闸述统计 方法,有利于读者提高处理实际问题的综合能力;介绍的试验设计类型多,讲解详细,具有很强的 可操作性;为读者成功地使用SAS软件提供了一条有效的捷径。 根据教学对象的层次和学时数适当取舍内容,本书可作为研究生、本科生、大中专生的统计学 教材,高等院校和科研机构的教师、学者、科技人员、生物医学工作者、管理工作者等学习和应用统 计方法的参考书;还可作为用SAS软件解决统计问题的实用手册。 图书在版编目(CIP)数据 ! 现代统计学与SAS应用/胡良平卡编:一北京:军事医学科学出版社,2000.8 ISBN7-80121-274-6 I.现…Ⅱ.胡…Ⅲ.系统分析-应用-统计分析N.C8 中国版本图书馆CIP数据核字(2000)第64744号 军事医学科学出版社出版 (北京太平路27号邮政编码:100850) 新华书店总店北京发行所发行 潮河印刷厂印刷 开本:787mm×1092mm印张:27.75字数:689千字 2000年8月第1版2000年8月第1次印刷 印数:1-3000册定价:40.00元 (购买本社图书,凡有缺、损、倒、脱页者,本社发行部负责调换)
前言 统计学是什么?统计学有何作用?统计学研究些什么内容?如何学好统计学?怎样正确 运用统计学?这些同题是刚刚涉猎统计学的人们必然要思考的,甚至有些已学过多遍统计学 的人,仍在苦苦地琢磨着这些问题,而且,大有百思不得其解之“困惑”。至于前三个问题,在本 书的第一章绪论中已作了详细的讲解,此处不便蒉述。在此,就后两个问题展开一些讨论,希 望能与读者沟通思想,交流感情,从而有利于作者与读者之间尽早达成一致共识,为传播统计 学知识、有效地发挥统计学的作用作出更大的贡献。 要想学好统计学,首先要对统计学所研究的内容有一个较为全面的了解。这种了解,不是 停留在表面上的,而是对各部分内容从原理、方法、适用条件、计算到结果解释等各方面都认真 思考和反复实践过。其次要从问题的原形入手去学统计学。统计学教科书一般都按“由浅入 深”、“分门别类”等思路去编写,但是,用统计学时却面对的是错综复杂的实际资料,常使人感 到无从下手。只有在学习的全过程中,都始终注意“从问题的原形入手去学统计学”,即弄清每 一种统计方法所能解决的问题在实际工作中是如何表现的,又是如何将其转化成“与特定统计 方法对应的统计学问题的”。例如:在选择统计分析方法之前,必须判定资料是定量的还是定 性的c这似乎是一个不值得一提的问题,居然在某名牌期刊上还出现了因误判资料类型,而错 误地选择了统计分析方法的实例;又例如:在分析定量资料时,必须先判定资料所取自的设计 类型和资料本身所具备的前提条件之后,方可正确地选择统计分析方法,但很多人却不加思索 地盲目套用t检验;再例如:在分析定性资料时,必须先判定列联表中定性变量的属性和分析 目的之后,方可正确地选择统计分析方法,但很多人却糊里糊涂地生搬硬套又检验。笔者主 编的《医学统计应用错误的诊断与释疑)一书(于1999年1月由军事医学科学出版社出版),将 有助于读者识别医学期刊论文中有关统计学的各种误用现象,同时,也有助于读者防止自已在 运用统计学中犯类似错误。 怎样才能正确运用统计学?要在较全面地掌握了统计学知识的基础上,逐渐扩大统计学 的应用范围。每用一种方法,都要做到“心中有数”即此时共有哪几种可能的统计分析方法, 其中最好的是哪一种;处理此问题时人们常犯的错误是什么。尤其是面对多因素多指标的资 料时,思路必须十分清楚,欲达到什么分析目的,应该选用什么统计分析方法,这种方法涉及到 的资料可以包括哪些类型的变量,这些资料是否满足拟选定的统计分析方法所要求的前提条 件,怎样巧妙地实现复杂的统计计算,等等。要想正确运用统计学,首先必须老老实实地学好 统计学。笔者编著的《医学统计学内容概要、考题精选与考题详解〉一书(于2000年1月由军 事医学科学出版社出版),将有助于读者突破“根据各种不同的实际资料,正确选用统计分析方 法”的难关。 下面将结合实例就定量资料统计分析中的一个难点一设计类型的辨析谈一点“如何 从问题原形入手学习和运用统计学”的体会,供广大读者参考 人们在处理实际资料前,常按习惯将实验资料按“组别”或“药物”等单个枟题来划分,从列 出的表格看,使人很容易将其视为“单因素多水乎设计”,因而,常错误地选用统计分析方法。 医学期刊中,误用统计学的现象十分严重,其中分析定量资料的错误中,绝大部分错误都出在 不能正确识别资料的设计类型上。下面举一个实例,说明如何“通过对资料原形的转换去辨析
其真正的设计类型”的方法。 【例】某人用t检验分析了如下的资料,这是很不妥当的!因为它不是多个单因素2水平 的设计。资料的原形可概述如下 为了研究“不同药物对小鼠迟发超敏反应的影响”,研究者在表中给出的分组标志是“药 物”和“剂量”两项,写在“药物剂量”两列之下的具仫内容分别是“对照一”、“补肾药5”、“补 肾药10”、“补肾药20¨、“Cy0.025”、¨(y+补肾药0.025+5”、“(y+补肾药0.025+10”、“Cy 十补肾药0.025+20”;观测的指标是“耳舯重量”;每组均为10只小鼠。 分析】原作者按“药物”和“剂量”两项并列的形式制表,使人不易看出实验设计的类型。 像单因素8水平设计问题,又像是两个单因素4水平设计问题或是某种多因素设计问题。这 是缺乏有关设计类型概念的人们习惯的列表方式,在选用统计分析方法时将起着严重的误导 作压。 仔细看看以“药物”和“剂量”为总称的这两列。似乎该实验涉及了“药物”和“剂量”两个因 素,事情是否果真如此?不妨试列出由它们组合成的表格,即把“药物种类”与“药物剂量”视为 两个实验因亲,分别放置在表的横行与纵列上。前者的2个水平分别为“衬肾药”与“Cy药”, 后者的5个水平分别为“00.025、5、10、20”(gkg),它们之间共有10种组合,其中只有一半反 映了原先的分组,另有两种组合是重复的(即原先的对照组),还有4神组合不包括在原先的设 计之中,而原先两药仝用的3个组却无法表达出来。这说明从原表中抽象出“药物”和“剂量 这样两个因亲是不够正确的转换方式。事实上,原表中所反映的是两种药具有各自的用药剂 量,故将“补肾药的剂量”和¨Cy药的剂量”视为两个实验因素,问题就迎刃而解了。此时,“补 肾药的剂量”有4个水平,即“0、5、10、20”(gkg);“Cy药的剂量”有2个水平,即“0,0.025”(g kg)。于是,将这两个因素分别放置在表的横行与纵列上,它们之间的8种水平组合正好就是 原作者的实验所代表的寞正含义。故其本质是分别具有2水平和4水平的两个因素的水平组 合,即两因素(或称4×2)析因设计,而不是单因素8水平设计,也不是两个单因素4水平设计 问题。 慨括地说,正确分析定量资料的关键是:明确观测指标;弄清因素、水平及其各因素之间的 水平组合;找出与资料原形所对应的真正的设计类型;考察资料所具备的前提条件;正确运用 统计分析软件实现统计计算;结合专业和统计学知识作出合理的解释。 关于统计学中其他具体的学术问题,请读者仔细闻读本书各篇内容,慢慢去领悟统计学的 真谛。下面让我们一同来看看本书与其他类似书籍相比,所具备的几个独到之处 其一,用计算器和计算机两种计算工具实现统计计算,便于读者选用; 其二,针对实际问懸和具体资料讲授统计方法,有利于读者提髙处理实际问题的综合能 力 其三,介绍的试验设计类型多,讲解详细,具有很强的可操作性; 其四,为读者方便、成功地学会使用SAS软件提供了一条有效的捷径 其五,与常用统计分析方沄对应的SAS引导程序比软齐全,并附有程序修改指导和输出 结果的解释; 其六,内容丰富、实用,使用方便。 这些特点是一般介绍SAS软件的书籍和以计算器为计算工具的统计学教科书所缺少的 正因如此,预计本书将产生可喜的社会效益
本书虽然是以DOS环境下的SAS软件为计算工具,但其中的全部SAS引导程序在WIN I〕wS版SAS系统中仍可不加僇改地被调用。所有用过 WINDOWS版SAS软件的用户都知 道:其中约非编程法能解决的统计计算问题所占的比例很小,绝大部分统计计算间题仍需要借 助编程法来实现,即仍需要SAS引导程序。不仅如此,根据笔者的经验,要想灵活、方便地对 付各种复杂的统计问题,非得采取编程法不可! 本书共分6篇,第1篇统计学基础知识与SAS软件应用技巧,介绍了统计学的基本概念 和学习方法、试验设计入门、统计描述、SAS软件应用入门、编写SAS实用程序的技巧、单变量 统计分析竿。第2篇试验设计与定量资料的统计分析,介绍了与τ检验、非参数检验、各种方 差分析有关的试验设计和数据处理方法。第3篇试验设计与定性资料的统计分析,介绍了处 理二维和高维列联表资料的各种统计分析方法,包括x2检验、Fskr的精确检验、 Ridit分析 秩和检验、定性资料的相关分析、线性趋势检验、Ka即pa检验、对数线性模型和 Logistic回归模 型等。第4篇试验设计与回归分析,介绍了回归分析的种类和选用方法、简单直线回归、多项 式回归、简单曲线回归、非线性曲线拟合、多元线性回归、协方差分析、直接试验设计及其资料 的回归分析等。第5篇生李分析,介绍了生存资料的特点、生存时间函数和生存分析方法的分 类等基本概念;生存资料的非参数分析方法、OOX模型和参数模型的回归分析方法与应用。 第6篇多元统计分析,介绍了主成分分析、因子分析、对应分析、聚类分析、判别分析、典型相关 分析 根裾教学对象的层次和学时数适当取舍内容,本书可作为研究生、本科生、大中专生的统 计学教村;可作为高等院校和科研机构的教师、学者、科技人员、生物医学工作者、管理工作者 等学习和应用统计方法的參考书;还可作为用SAS软件解决实际间题的实用手册 在本书即将出版之际,谨向参加编写的全体同仁表示夏心的感谢! 由于我们水平有限,峡点和错误在所难免,敬诗读者批评指正。 主编胡良平 15干北京
目录 第1篇统计学基础知识与SAS软件应用技巧 第1章绪论……… (1) 第1节统计学的理论基础和研兖对象 …(1) 第2节统计学的任务和作用… (1) 第3节统计学的主要内容………… (2) 第4节学习统计方法的捷径… 第5节统计资料的类型 ………(4) 第6节数据结构与统计方法的匹配…………… ………(4) 第?节几个重要的统计名词 (5) 第2章试验设计人门…………………………………… 第1节试验设计的意义、要素、原则和原理…… 第2节试验设计原则的实施办法…… (11) 第3节试验设计类型的概述…… (14) 第3章统计描述 …(15) 第1节统计表 …(15) 第2节统计图…………………………………… 第3节平均指柝—一度量定量指标的平均水平…… …(21) 第4节变异指标一一度量定量指标的变异程度… 第5节随机变量及其概率分布 第6节平均指标与变异指标的结合使用……… (26) 第7节分位数一—描述偏态分布资料的分布情况和商散趋势 第8节正态性检验…… (28) 第9节相对指标—对定性资料进行统计描述 (30) 第4章SAS软件应用人门……………………………………………(35) 第1节SAS软件简介……… ……(35) 第2节应用SAS的捷径…… 日甲, (35) 第3节使用SAS必须了解的几个基本概念… 第4节使用SAS必須掌握的凡组重要命令…………………………(40) 第5节实际运行SAS的步骤…… 第5章SAS实用程序编写技巧…………………………………………(42) 第1节数据步流程… 第2节创建数据集的途径 (45) 第3节建立数据集的技巧 第6章用SAs软件实现简单的统计分析………… (50) 第1节用SAS实现单变量统计分析…………
第2节用SAS语言编程求小样本率的置信区间…………………………(52) 第7章用SAS/ GRAPH模块绘制常用统计图的方法… (53) 第1节条图、圆图和直方图…………… ……(53) 第2节散布图、普通线图和半对数线图…………………………………(55) 第2篇试验设计与定量资料的统计分析 第1章基本概念与方法的概述… …(57) 第1节假设检验中有关的基本概念……… 第2节定量资料统计分析方法的概述…… (60) 第2章单组配对和成组设计及其定量资料的统计分析 第1节单组设计及其资料的统计分析……………… 第2节配对设计及其资料的统计分析……………………… 第3节成组设计及其资料的统计分析…………… ……………(69) 几种试验设计类型的鉴别…………………………… 第3章误差固定的方差分析设计类型及其定量资料的统计分析 (79) 第1节方差分析的应用场合、基本思想和前提条件…………………………(79) 第2节单因紊k(k≥3)水平设计及其资料的统计分析 (81) 第3节配伍组设计及其资料的统计分析……………………… 88) 第4节交叉设计及其资料的统亡分析… 第5节拉丁方设计及其资料的统计分析…………………………………(94) 第6节不完全拉丁方设计及其资料的统计分析…………… 第7节希腊拉丁方设计及其资料的统计分析………… 第8节析因设计及其资料的统计分析 ·带 第 含区组因素的析因设计及其资料的统计分析………… 第10节正交设计及其资料的统计分析…………………… (107) 第4章误差变动的方差分析设计类型及其定量资料的统计分析………………(11 第1节平衡不完全区组设计及其资料的统计分析… (117) 第2节系统分组(或嵌套)设计及其资料的统计分析… 第3节裂区(或分割)设计及其资料的统计分析………………… (123) 第4节具有重复測量设计及其资料的统计分析…………………………………(129 第5章多个均数或均值向量之间的多置比较 (146) 第1节有关的名词概念和符号的含义 第2节具有显著性的单因素各水平之间的多重比较………… (146) 第3节兵有显著性的交互作用项各水平之间的多重比较 第3篇试验设计与定性资料的统计分析 第1章2×2表资料的假设检验… (152) 第1节试验设计及资料的表达格式………… …(152) 第2节分析2×2表资料的常用公式及应用条件…… (153)
第3节应用举例………… (155) 第4节队列研兖和病例-对照研究资料的分析… (160 第2章R×C表资料的统计分析 (164) 第1节R×C表资料的分类… 非非甲非甲,甲甲 (164) 第2节双向无序R×C表资料的统计分析………………… (165) 第3节单向有序RXC表资料的统计分析 (168) 第4节双向钉序且属性不同的R×C表资料的统计分析……………………(177) 第5节双向有序且属性相同的R×C表资料的统计分析… (182) 第6节R×C表资料的分割………… (188) 第7节精确分割ⅹ2值及其自由度的方法…… ……………(189) 第3章高维列联表资料的统计分析 (191) 第1节用合并法把三维表压缩成二维表…………………………(191) 第2节定性资料的对数线性模型分析……………………………………(197) 第3节定性资料的 logistic回尸分析………… (199) 第4篇试验设计与回归分析 第1章回归分析的种类与简单回归分析 第1节回归分析的任务和种类…………………… …(215) 第2节直线回归与相关分析的概念和要点……………………………(216) 第3节直线回归与相关分析的计算和应用 …(216) 第4节具有重复试验数据的直线国归分析…… …(226) 第5节加权直线回归的应用~半数有效量的估计 …(229) 第6节可直线化的简单曲线的拟合 第7节一般多项式曲线拟合………… …(239) 第8节非线性曲线拟合…… (241) 第9节举例复习曲线拟合的全过程 第10节两条或多条回归直线的比较……… 第2章多元线性回归分析……………………………………… (248) 第1节多元线性回归分析的概述… ……(248) 第2节应用举例…………………………………………………(249) 第3节变量筛选方法 (257) 第4节回归诊断方法……… (259) 第5节用各种筛选变量方法编程的技巧…… (260) 第6节与回归分析有关的重要统计术语和统计量的注解………………………(263) 第3章协方差分析…… 第1节协方差分析的概述…… 第2节一元协方差分析应用举例………… (265) 第3节多元协方差分析应用举例… (275) 第4章宜接试验设计与回归分析……………………… (278)
第1节回归分析试验设计方法的发展… ……(278) 第2节各因素水平数相同时的直接试验设计………… ……(279) 第3节各因素水平数不同时的直接试验设计………………………(280) 第4节关于直接试验设计的几点说明与解释… …………(281) 第5节直接试验设计的SAS源程序 (282) 第6节直接试验设计SAS程序的运行 (286) 第7节应用举例……… 单中,,非甲非中着甲B啦电 (291) 第8节设计矩阵均匀性函数简介 …………(293) 第5篇生存分析 第1章葚本概念…………………………………… ……(295) 篥1节生存资料的特点…………………………………… (295) 第2节生存时间函数…………………………………………………(295) 第3节生存分析方法的分类 …(296) 第2章生存资料的非参数统计方法…… 第1节统计描述与非参数分析概述…… (297) 第2节用 LIFETEST过程实现统计计算…………………………… 第3节生存资料非参数统计方法中的有关计算公式 …(304) 章3章COX模型回归分析………………………… 第1节COX回归模型(半参数回归模型)………… …(307) 第2节COX模型回归分析应用举例 (307) 鎬4章参数模型回归分析………………… (312) 第1节参数回归模型 平中,击丽 (312) 第2节参数模型回归分析应用举例………… (312) 第6篇多元统计分析 第1章主成分分析… (316) 第1节基本概念与数据结构………………… (316) 第2节主成分的表达式与性质…………………………………(316) 第3节用 PRINCOMP过程实现主成分分析………………………………(318) 第4节合成资料的主成分分析 (321) 鎬2章因子分析 ……"……"……………(324 第1节基本概念……… 第2节因子模型…… (324) 第3节因子分析的基本定理与任务…… 325) 第4节用 FACTOR过程实现因子分析… …*(326) 第3章对应分析… (331 第1节方法的概述…… (331) 第2节对应分析中的变量变换方法………… (331)
第3节用 CORRESP过程实现对应分析………… …………(331) 第4章聚类分析………… 第1节方法的概述……………………………………………………(336) 第2节用 VARCLUS过程实现变量聚类分析……………………… ……(336) 第3节用 CLUSTER过程实现样品聚类分析 (343) 第4节用 FASTCLUS过程实现大样本样品聚类分析………… (347) 第5节用 ACECLUS过程对拟作样品聚类分析的资料进行预处理……………(348) 第6节用SAS/ GRAPH模块绘制样品聚类图的SAS程序 (349) 第5章判别分析 (355) 第1节定性资料的判别分析…………………… …(355) 第2节定量资料的逐步判别分析(考虑变量筛选)…… ……(357) 第3节一般判别分析(不考虑变量筛选)……… …(361) 第“章典型相关分析………… 曲4 ……(367) 第1节方法的概述……… …(367) 第2节用 CANCORR过程实现典型相关分析………………………………(367 附录1各篇练习及其参考答案… 第1篇练习题…… (371) 第2篇练习题 ……………(372) 第3篇练习题 (378) 第4篇练习题…… 第5篇练习题… …(384) 第6篇练习题…… 第1篇练习题参考答案…… (388) 第2篇练习题参考答案 第3篇练习题参考答案…… 第4篇练习题参考答寰…… …………(391) 第5篇练习题参考答案· (391) 第6篇练习题参考答案……………… ……………(391) 附录2统计用表及其产生这些表所需的SAS程序……… 统计用表 (392) 表2.1trrx2临界值 表22F临界值(方差齐性检验用,双側概率为0.05)…… …(393) 表23F临界值(方差分析用,单侧概率为0.05)… 表2.4F临界值(方差分析用,单侧概率为0.01)…… (395) 22产生上述表所需的SAS程序………… ……(396) 【sAS程序】【 TLJZ PRG】…………… SAS程序】【 KFLJZ.PRG】 【SAS程序】【FLJ2.PRG】……………… (397)