《应用统计学》课程教学大纲 一、 课程基本信息 课程代码:21100163 课程名称:应用统计学 英文名称:Applied Statistics 课程类别:专业必修课 学时:48 学分:3 适用对象:人力资源管理专业 考核方式:考试 先修课程:无 二、 课程简介 应用统计学课程介绍了当今社会科学研究中主要的统计方法,内容包括:描述统计 (样本的数据特征和统计图表),概率基础知识,随机变量及其分布,参数点估计和区间 估计,参数假设检验,分布检验,变量独立性检验,效应量和检验力,各种变量的相关 分析,测量信度,一元和多元回归分析,单因素、多因素方差分析和重复测量实验设计 的方差分析,一元逻辑斯蒂回归分析,因子分析和主成分分析。重点讨论了统计思想和 统计原理、应用实例、SPSS软件操作方法、结果解释和表述。 Applied Statistics introduces the main statistical methods of present psychological research.It covers:descriptive statistics (data features of samples and diagrams),basic knowledge of probability,random variables and theirdistribution,parameter and interval estimation,parametric hypothesis test,distribution test,variable independence test,effect size and power of statistical test,analysis of various variables,test reliability univariate and multivariate regression analysis,one-way ANOVA(analysis of variance). multivariate ANOVA,repeated measures ANOVA,unary logistic regression analy sis,facto analysis and principal component analysis.This course focuses on statistical ideas and principles,application cases,operation of software SPSS,result interpretation and expression. 三、课程性质与教学目的 本课程的性质是“专业必修课
《应用统计学》课程教学大纲 一、 课程基本信息 课程代码:21100163 课程名称:应用统计学 英文名称:Applied Statistics 课程类别:专业必修课 学 时: 48 学 分: 3 适用对象: 人力资源管理专业 考核方式:考试 先修课程:无 二、 课程简介 应用统计学课程介绍了当今社会科学研究中主要的统计方法,内容包括:描述统计 (样本的数据特征和统计图表),概率基础知识,随机变量及其分布,参数点估计和区间 估计,参数假设检验,分布检验,变量独立性检验,效应量和检验力,各种变量的相关 分析,测量信度,一元和多元回归分析,单因素、多因素方差分析和重复测量实验设计 的方差分析,一元逻辑斯蒂回归分析,因子分析和主成分分析。重点讨论了统计思想和 统计原理、应用实例、SPSS 软件操作方法、结果解释和表述。 Applied Statistics introduces the main statistical methods of present psychological research. It covers: descriptive statistics (data features of samples and diagrams), basic knowledge of probability, random variables and their distribution, parameter point estimation and interval estimation, parametric hypothesis test, distribution test, variable independence test, effect size and power of statistical test, analysis of various variables, test reliability, univariate and multivariate regression analysis, one-way ANOVA(analysis of variance), multivariate ANOVA, repeated measures ANOVA, unary logistic regression analysis, factor analysis and principal component analysis. This course focuses on statistical ideas and principles, application cases, operation of software SPSS, result interpretation and expression. 三、课程性质与教学目的 本课程的性质是“专业必修课
教学目的是,通过本门课程的教学活动,使学生掌握回归分析、方差分析、因子分 析等统计分析方法的统计思想、原理和实际操作步骤,以及统计结果的解释和表述,为 学生从事社会学研究、毕业论文创作、以及毕业后从事相关工作时,能熟练使用统计方 法分析相关的数据。统计无国界,中国人的统计是很棒的,让我们的大学生对于统计的 学习充满信心。 四、教学内容及要求 第一章变量与数据 (一)目的与要求 了解心理统计学的基本概念 (二)教学内容 第一节被试与变量 1、主要内容:被试与变量 2、基本概念与知识点: 1.总体与样本 总体(population):研究对象的全体 样品(cas:被抽到的个体。心理和教育研究通常称为被试 样本(sample):样品全体 样本容量(sample size):样品个数 2.变量 变量variable):研究对象的某种特征,在个体之间可以变化。通常是描述个体某 方面特征的概念,如学生性别、视力、自尊等 变量值(value):变量在个体上的取值 样本数据(sample data):样本中所有样品(被试)的变量值全体 3.数据来源 调查(survey):对研究对象自然产生的现象或客观存在的事实作观察、测量和记 采 实验(experiment):是人为地控制、改变一些条件,观察、测量和记录研究对象 在不同条件下的结果。 测验(testing)是运用编制好的一组题目(量表)对被试施测而获得数据的一种方 法。 4.变量命名和综码 编码(code)一对非数值的变量取值,赋予一个数值
教学目的是,通过本门课程的教学活动,使学生掌握回归分析、方差分析、因子分 析等统计分析方法的统计思想、原理和实际操作步骤,以及统计结果的解释和表述,为 学生从事社会学研究、毕业论文创作、以及毕业后从事相关工作时,能熟练使用统计方 法分析相关的数据。统计无国界,中国人的统计是很棒的,让我们的大学生对于统计的 学习充满信心。 四、教学内容及要求 第一章 变量与数据 (一) 目的与要求 了解心理统计学的基本概念 (二) 教学内容 第一节被试与变量 1、主要内容:被试与变量 2、基本概念与知识点: 1. 总体与样本 总体(population):研究对象的全体 样品(case):被抽到的个体。心理和教育研究通常称为被试 样本(sample):样品全体 样本容量(sample size):样品个数 2. 变量 变量(variable) :研究对象的某种特征,在个体之间可以变化。通常是描述个体某 方面特征的概念,如学生性别、视力、自尊等 变量值(value) :变量在个体上的取值 样本数据(sample data):样本中所有样品(被试)的变量值全体 3. 数据来源 调查(survey):对研究对象自然产生的现象或客观存在的事实作观察、测量和记 录。 实验(experiment):是人为地控制、改变一些条件,观察、测量和记录研究对象 在不同条件下的结果。 测验(testing)是运用编制好的一组题目(量表)对被试施测而获得数据的一种方 法。 4. 变量命名和编码 编码(code)——对非数值的变量取值,赋予一个数值
例如,性别是一个变量,取值是“男”或“女”。可以将变量命名为“gender'”或“xingbie" 等,将“男”编码为1,将“女”编码为0。 反向题的重新编码 5.变量的操作性定义 如果有前人的定义,除非确有必要重新定义,否则尽量采用己有的定义,使新的研 究和己有的研究之间具有延续性和可比性 问卷或量表中的一个题目,实际上定义了一个变量。该题目就是对应变量的操作定 义。如果不同的研究者使用同一个问卷来收集数据,实际上使用了相同的操作定义。 第二节变量的类型 1、主要内容:四种变量的类型 2、基本概念与知识点: 定类变量(nominal),也称为类别变量 定序变量(ordinal),也称为等级变量 定距变量(interval),也称为间距变星 定比变量(ratio),也称为比率变量 定比和定距测量数据统称为尺度(scae)测量数据。它和定序(ordinal)测量数据和 定类(nominal)测量数据一起构成SPSS中规定的三种数据测量级别。 (三)思考与实践 思考:本章属于描述性统计,本章的重点在如何进行连续型变量的频数分析描述 加强学生的动手实践能力。 实践环节:SPSS操作入门 课后练习:P12-131-4题 (四)教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第二章频数分析 (一) 目的与要求 会对类别变量和连续变量进行频数分析 (二)教学内容 1、主要内容:变量的频数分析 2、基本概念与知识点: 连续变量的频数分析: 编制次数分布表的步骤: I).求出全距(range)。全距是全部数据中的最大值与最小值的差
例如,性别是一个变量,取值是“男”或“女”。可以将变量命名为“gender”或“xingbie” 等,将“男”编码为1,将“女”编码为0。 反向题的重新编码 5. 变量的操作性定义 如果有前人的定义,除非确有必要重新定义,否则尽量采用已有的定义,使新的研 究和已有的研究之间具有延续性和可比性 问卷或量表中的一个题目,实际上定义了一个变量。该题目就是对应变量的操作定 义。如果不同的研究者使用同一个问卷来收集数据,实际上使用了相同的操作定义。 第二节变量的类型 1、主要内容:四种变量的类型 2、基本概念与知识点: 定类变量(nominal),也称为类别变量 定序变量(ordinal),也称为等级变量 定距变量(interval),也称为间距变量 定比变量(ratio),也称为比率变量 定比和定距测量数据统称为尺度(scale)测量数据。它和定序(ordinal)测量数据和 定类(nominal)测量数据一起构成 SPSS 中规定的三种数据测量级别。 (三) 思考与实践 思考:本章属于描述性统计,本章的重点在如何进行连续型变量的频数分析描述, 加强学生的动手实践能力。 实践环节:SPSS 操作入门 课后练习:P12-13 1-4 题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第二章 频数分析 (一) 目的与要求 会对类别变量和连续变量进行频数分析 (二) 教学内容 1、主要内容:变量的频数分析 2、基本概念与知识点: 连续变量的频数分析: 编制次数分布表的步骤: 1).求出全距(range)。全距是全部数据中的最大值与最小值的差
2).确定组距(size of the class interval)和组数。组距是一个组的终点与 前一个组的终点的距离,即两者之差。 3)确定组限(limit)。组限就是每一个组的起止范围。 4)有时候要计算组中值(midpoint)。它等于上限与下限之和的一半。 5).分组登记次数。 6)计算并报告频率百分比 7)计算并报告累积频率百分比。 (三)思考与实践 思考:本章属于描述性统计,本章的重点在如何进行连续型变量的 频数分析描述,加强学生的动手实践能力。 实践环节:频数分析的SPSS操作 课后练习:P23-241-2题 (四)教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第三章样本的数字特征 (一)目的与要求 会对数据进行描述统计,会计算样本的均值和标准差,会计算众数、中 数、方差、四分位差、偏态系数和峰态系数。 () 教学内容 第一节数据分布的集中趋势 1、主要内容:数据的三种集中趋势 2、基本概念与知识点: 1、算术平均数是所有观察值得总和除以总频数所得之商,简称为平均数或均 2、 中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、 下各有一半频数分布着。 3、众数是样本中该变量取值次数最多的那个数值。 例如:虽然平均数是使用频率最高的,但是还是要具体问题具体分析。例如, 描述一个城市的房价,人际平均收入用均值就很不合适,中数才是比较合适 的,因为均值更容易受极端值影响。在学习中,要活学活用,切不可死记硬 背。 第二节数据分布的离散趋势
2).确定组距(size of the class interval)和组数。组距是一个组的终点与 前一个组的终点的距离,即两者之差。 3).确定组限(limit)。组限就是每一个组的起止范围。 4).有时候要计算组中值(midpoint)。它等于上限与下限之和的一半。 5).分组登记次数。 6).计算并报告频率百分比。 7).计算并报告累积频率百分比。 (三)思考与实践 思考:本章属于描述性统计,本章的重点在如何进行连续型变量的 频数分析描述,加强学生的动手实践能力。 实践环节:频数分析的 SPSS 操作 课后练习:P23-24 1-2 题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第三章 样本的数字特征 (一) 目的与要求 会对数据进行描述统计,会计算样本的均值和标准差,会计算众数、中 数、方差、四分位差、偏态系数和峰态系数。 (二) 教学内容 第一节 数据分布的集中趋势 1、主要内容:数据的三种集中趋势 2、基本概念与知识点: 1、 算术平均数是所有观察值得总和除以总频数所得之商,简称为平均数或均 数。 2、 中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、 下各有一半频数分布着。 3、 众数是样本中该变量取值次数最多的那个数值。 例如:虽然平均数是使用频率最高的,但是还是要具体问题具体分析。例如, 描述一个城市的房价,人际平均收入用均值就很不合适,中数才是比较合适 的,因为均值更容易受极端值影响。在学习中,要活学活用,切不可死记硬 背。 第二节 数据分布的离散趋势
1、主要内容:数据的离散趋势 2、基本概念与知识点: 1、全距是分布分数最大值(maximum)X的精确上限与分布分数最小值 (minimum)X的精确下限的差值。 2、四分位距就是75%百分位数与25%百分位数间的距离,它代表分布中间50%的距离。 3、方差是指离差平方的算术平均数。 4、标准差是指离差平方和平均后的方根。即方差的平方根。 第三节数据分布的形态 1、主要内容:数据的三种分布形态 2、基本概念与知识点: 1、正态分布 2)、偏态分布 3、峰态分布 第四节标准分及其在分布中的应用 1、主要内容:标准分的计算与意义 2、基本概念与知识点: 1)、始分转换成标准分是线性转换,不改变原始分的分布形态,也不改变原始 分的排位顺序。 2)、标准分与原始分的测量单位没有关系。它以原始分的均值为原点(零点), 以原始分的标准差为单位,表示了其原始分在以平均数为中心时的相对位置 3)、Z-0对应的原始分刚好等于均值。 4)、Z的正负号说明了对应的原始分是在均值之上(正号)还是均值之下(负 号)。 5)、Z的绝对值说明了对应的原始分与均值相差有多远。例如,Z1对应的原 始分比均值大1个标准差,Z-1.5对应的原始分比均值小1.5个标准差。 第五节计算样本数字特征的SPSS例解 1、主要内容:使用SPSS软件进行样本数字特征的计算 2、基本概念与知识点: SPSS中,Frequencies(频数分析)和(Descriptives)描述统计命令都能计算数 字特征。 频数分析可以得到频数分析表,计算分位点,做出条形图(或直方图、饼图等》 描述统计可以在数据窗口产生标准化变量(即标准分) (三)思考与实践 思考:本章属于描述性统计,本章的重点在于集中趋势和离散趋势
1、主要内容:数据的离散趋势 2、基本概念与知识点: 1、 全距是分布分数最大值(maximum) X 的精确上限与分布分数最小值 (minimum) X 的精确下限的差值。 2、 四分位距就是75%百分位数与25% 百分位数间的距离,它代表分布中间50%的距离。 3、 方差是指离差平方的算术平均数。 4、 标准差是指离差平方和平均后的方根。即方差的平方根。 第三节 数据分布的形态 1、主要内容:数据的三种分布形态 2、基本概念与知识点: 1、 正态分布 2)、偏态分布 3)、峰态分布 第四节 标准分及其在分布中的应用 1、主要内容:标准分的计算与意义 2、基本概念与知识点: 1)、始分转换成标准分是线性转换,不改变原始分的分布形态,也不改变原始 分的排位顺序。 2)、标准分与原始分的测量单位没有关系。它以原始分的均值为原点(零点), 以原始分的标准差为单位,表示了其原始分在以平均数为中心时的相对位置 3)、Z=0对应的原始分刚好等于均值。 4)、Z的正负号说明了对应的原始分是在均值之上(正号)还是均值之下(负 号)。 5)、Z的绝对值说明了对应的原始分与均值相差有多远。例如,Z=1对应的原 始分比均值大1个标准差,Z=-1.5对应的原始分比均值小1.5个标准差。 第五节 计算样本数字特征的SPSS例解 1、主要内容:使用SPSS软件进行样本数字特征的计算 2、基本概念与知识点: SPSS中,Frequencies(频数分析)和(Descriptives)描述统计命令都能计算数 字特征。 频数分析可以得到频数分析表,计算分位点,做出条形图(或直方图、饼图等) 描述统计可以在数据窗口产生标准化变量(即标准分) (三) 思考与实践 思考:本章属于描述性统计,本章的重点在于集中趋势和离散趋势
的描述,加强学生的动手实践能力。 实践环节:样本数字特征分析的SPSS操作 课后练习:P391-6题 (四)教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第四章统计图 (一)目的与要求 会对数据制作统计图,包括条形图、线性图、时序图、饼图、散点图、 箱形图、茎叶图、直方图和多边图。 (二)教学内容 1、主要内容:各种统计图的介绍与绘图 2、基本概念与知识点: 1)、统计图的结构及其绘制规则 统计图由标题、图号、标目、图形、图注等项构成。下面按其构成部分说明 绘图的基本规则。标题:图的名称应简明扼要,切合图的内容,必要时可注明时 间、地点。图号文章中若有几幅画,则需按其出现的先后次序编上序号,写在图 题的作前方。标目:对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及 其尺度。图形:图形线在图中为最粗,而且要清晰。图注:图注不是图中必要组 成部分。 2)、表示间断变量的统计图 (1)直条图是用直条的长短表示统计事项数量的图形。它主要是用来比较性质 相似的间断性资料。用一些垂直条画在每个分数之上 垂直条的高度代表次数 垂直条的宽度代表分数的精确区间, 只有数据是等距或等比量度时,才能用直方图 (2)圆形图是用来表示间断性资料构成比的图形。 3)、表示连续变量的统计图 (1)线形图用来表示连续性资料。它能表示两个变量之间的函数关系 一种事物随另一种事物变化的情况:某种事物随时间推移的发展趋势等。 (2)常用的频数分布图有直方图、多边图和累积多边图
的描述,加强学生的动手实践能力。 实践环节:样本数字特征分析的 SPSS 操作 课后练习:P39 1-6 题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第四章 统计图 (一) 目的与要求 会对数据制作统计图,包括条形图、线性图、时序图、饼图、散点图、 箱形图、茎叶图、直方图和多边图。 (二) 教学内容 1、主要内容:各种统计图的介绍与绘图 2、基本概念与知识点: 1)、统计图的结构及其绘制规则 统计图由标题、图号、标目、图形、图注等项构成。下面按其构成部分说明 绘图的基本规则。标题:图的名称应简明扼要,切合图的内容,必要时可注明时 间、地点。图号 文章中若有几幅画,则需按其出现的先后次序编上序号,写在图 题的作前方。标目:对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及 其尺度。图形:图形线在图中为最粗,而且要清晰。图注:图注不是图中必要组 成部分。 2)、表示间断变量的统计图 (1)直条图是用直条的长短表示统计事项数量的图形。它主要是用来比较性质 相似的间断性资料。用一些垂直条画在每个分数之上 垂直条的高度代表次数 垂直条的宽度代表分数的精确区间. 只有数据是等距或等比量度时,才能用直方图 (2)圆形图是用来表示间断性资料构成比的图形。 3)、表示连续变量的统计图 (1)线形图用来表示连续性资料。它能表示两个变量之间的函数关系; 一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。 (2)常用的频数分布图有直方图、多边图和累积多边图
直方图用面积表示频数分布。用各组上下限上的矩形面积表示各组频数 多边图以纵轴上的高度表示频数的多少。 (3)累积频数和累积百分比多边图 (三) 思考与实践 思考:本章属于描述性统计,本章的应用性很强,加强学生的动手 实践。 实践环节:统计图分析的SPSS操作 课后练习:P6014题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第五章概率基本知识 (一) 目的与要求 推断统计的基础是概率论,了解事件及其运算、事件的概率、概率的性 质和运算以及全概密公式。通讨概率的学习,让学牛东分了解赌博、买采影票 都是独立事件,从概率意义上说,中奖都是小概率事件,是很难中奖的,坚 决不赌博、不买彩票。通过诚实劳动才获得财物。 (二)教学内容 1、主要内容:概率的基本知识 2、基本概念与知识点: 1)、概率的定义 概率因寻求的方法不同有两种定义,即后验概率和先验概率。(一)后验概率的 定义以随机事件A在大量重复试验中出现的稳定频率制作为随机事件A概率的估计 值,这样寻得的概率称为后验概率。(二)先验概率的定义先验概率是通过古典概率模 型加以定义的,故又称为古典概率。古典概率模型要求满足两个条件: a试验的所有可能结果是有限的 b.每一种可能结果出现的可能性(概率)相等 2)、概率的性质 a.任何随机事件A的概率都是介于0与1之间的正数 b.不可能事件的概率等于0 C必然事件的概率等于1 3)、概率的加法和乘法 a概率的加法在一次试验中不可能同时出现的事件称为互不相容的事件。两个 互不相容事件和的概率,等于这两个事件概率之和 b.概率的乘法A事件出现的概率不影响B事件出现的概率,这两个事件为独
直方图用面积表示频数分布。用各组上下限上的矩形面积表示各组频数。 多边图以纵轴上的高度表示频数的多少。 (3)累积频数和累积百分比多边图 (三) 思考与实践 思考:本章属于描述性统计,本章的应用性很强,加强学生的动手 实践。 实践环节:统计图分析的 SPSS 操作 课后练习:P60 1-4 题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第五章 概率基本知识 (一) 目的与要求 推断统计的基础是概率论,了解事件及其运算、事件的概率、概率的性 质和运算以及全概率公式。通过概率的学习,让学生充分了解赌博、买彩票 都是独立事件,从概率意义上说,中奖都是小概率事件,是很难中奖的,坚 决不赌博、不买彩票。通过诚实劳动才获得财物。 (二) 教学内容 1、主要内容:概率的基本知识 2、基本概念与知识点: 1)、概率的定义 概率因寻求的方法不同有两种定义,即后验概率和先验概率。(一)后验概率的 定义以随机事件A 在大量重复试验中出现的稳定频率制作为随机事件A 概率的估计 值,这样寻得的概率称为后验概率。(二)先验概率的定义先验概率是通过古典概率模 型加以定义的,故又称为古典概率。古典概率模型要求满足两个条件: a.试验的所有可能结果是有限的 b.每一种可能结果出现的可能性(概率)相等 2)、概率的性质 a.任何随机事件A 的概率都是介于0 与1 之间的正数 b.不可能事件的概率等于0 c.必然事件的概率等于1 3)、概率的加法和乘法 a.概率的加法在一次试验中不可能同时出现的事件称为互不相容的事件。两个 互不相容事件和的概率,等于这两个事件概率之和。 b.概率的乘法A 事件出现的概率不影响B 事件出现的概率,这两个事件为独
立事件。两个独立事件的概率,等于这两个事件概率的乘积。为获得正确定义的概率 个体的选取(取样)一定要通过随机取样,随机取样应满足以下两个条件: (1)·总体中的每个个体有同样的机会被选择 (2)·如果样本中要选择多于一个的个体,每次选择的概率应当恒定 (三)思考与实践 思考:本章的理论性较强,只要是概率理论,本章的重要性在于概率是统计 的基础。 课后练习:P74-751-9题 (四)教学方法与手段 本章教学主要采用课堂讲授、课堂讨论等。 第六章随机变量及其分布 (一) 目的与要求 概率统计中,所说的变量都是随机变量,了解常用的离散型随机变量和 连续性随机变量 (二)教学内容 1、主要内容:随机变量的概率分布 2、基本概念与知识点: 1)随机变量:定义在事件集合上的函数,简称为变量。 例如抛掷一枚硬币,正面朝上的次数: 三个孩子家庭,男孩的个数: 2)二项分布 二项分布是一种离散型随机变量的概率分布.用n次方的二项展开式来表达在n次 二项试验中成功事件出现不同次数(X=0,1,,)的概念分布叫做二项分布。二项 展开式的通式就是二项分布函数,运用这一函数式可以直接求出成功事件恰好出现X 次的概率。 3)正态分布 正态分布有如下性质: .正态曲线关于μ对称,成一口钟形,单峰状。通俗地说,是“中间 大,两头小”。 2.当x→o0时,曲线右尾以x轴为渐近线当x→oo时,曲线左尾也以x 轴为渐近线。 3.曲线下方与x轴所围面积正好是1,由对称性,在=μ左方或右方的面 积均为0.5。 4.当μ变小时,曲线向左平移:当μ变大时,曲线向右平移。当。变 小时,曲线变得“瘦高”:当。变大时,曲线变得“矮胖
立事件。两个独立事件的概率,等于这两个事件概率的乘积。为获得正确定义的概率, 个体的选取 (取样) 一定要通过随机取样,随机取样应满足以下两个条件: (1).总体中的每个个体有同样的机会被选择 (2).如果样本中要选择多于一个的个体,每次选择的概率应当恒定 (三) 思考与实践 思考:本章的理论性较强,只要是概率理论,本章的重要性在于概率是统计 的基础。 课后练习:P74-75 1-9 题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论等。 第六章 随机变量及其分布 (一) 目的与要求 概率统计中,所说的变量都是随机变量,了解常用的离散型随机变量和 连续性随机变量 (二) 教学内容 1、主要内容:随机变量的概率分布 2、基本概念与知识点: 1)随机变量:定义在事件集合上的函数,简称为变量。 例如 抛掷一枚硬币,正面朝上的次数; 三个孩子家庭,男孩的个数; 2)二项分布 二项分布是一种离散型随机变量的概率分布。用n 次方的二项展开式来表达在n 次 二项试验中成功事件出现不同次数(X=0,1,…,n)的概念分布叫做二项分布。二项 展开式的通式就是二项分布函数,运用这一函数式可以直接求出成功事件恰好出现X 次的概率。 3)正态分布 正态分布有如下性质: 1.正态曲线关于x=μ对称,成一口钟形,单峰状。通俗地说,是“中间 大,两头小”。 2.当x→∞时,曲线右尾以x轴为渐近线;当x→-∞时,曲线左尾也以x 轴为渐近线。 3.曲线下方与x轴所围面积正好是1,由对称性,在x=μ左方或右方的面 积均为0.5。 4.当 μ 变小时,曲线向左平移;当 μ 变大时,曲线向右平移。当 σ 变 小时,曲线变得“瘦高”;当 σ 变大时,曲线变得“矮胖
(三) 思考与实践 思考:本章的正态分布是重中之重,随机变量的概率分布是后面假设检验 的基础。本章的理论性较强,实践性仅现在正态分布的应用上。 实践环节:正态分布分析的SPSS操作 课后练习:P101-1031-7题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第七章参数估计和假设检验 (一)目的与要求 参数估计和假设检验是推断统计的两个重要组成部分。了解参数的点估 计和区间估计。掌握检验的基本知识。掌握均值检验的检验方法和分布检验 的检验方法。 (二)教学内容 第一节参数估计 1、主要内容:参数的点估计和区间估计 2、基本概念与知识点: 1、参数的点估计:用某一样本统计量的值来估计相应总体参数的值叫总体参 数的点估计。 2、参数的区间估计:以样本统计量的抽样分布(概率分布)为理论依据,按 一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估 计。区间估计涉及置信水平和置信区间。 第二节假设检验概述 1、主要内容:假设检验的原理和逻辑 2、基本概念与知识点: 利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留 的决断,称为假设检验。 1、假设:假设检验一般有两个相互对立的假设。即零假设(或称原假设、虚 无假设、解消假设)和备择假设(或称研究假设、对立假设)。假设检验是从零假设出 发,视其被拒绝的机会,从而得出决断。 2、小概率事件:把出现小概率的随机事件称为小概率事件。小概率事件是否 出现,这是对假设做出决断的依据。 3、显著性水平:拒绝零假设的概率称为显著性水平。显著性水平和可靠性程
(三) 思考与实践 思考:本章的正态分布是重中之重,随机变量的概率分布是后面假设检验 的基础。本章的理论性较强,实践性仅现在正态分布的应用上。 实践环节:正态分布分析的 SPSS 操作 课后练习:P101-103 1-7 题 (四) 教学方法与手段 本章教学主要采用课堂讲授、课堂讨论、实践操作等。 第七章 参数估计和假设检验 (一)目的与要求 参数估计和假设检验是推断统计的两个重要组成部分。了解参数的点估 计和区间估计。掌握检验的基本知识。掌握均值检验的检验方法和分布检验 的检验方法。 (二)教学内容 第一节 参数估计 1、主要内容:参数的点估计和区间估计 2、基本概念与知识点: 1、 参数的点估计:用某一样本统计量的值来估计相应总体参数的值叫总体参 数的点估计。 2、 参数的区间估计:以样本统计量的抽样分布(概率分布)为理论依据,按 一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估 计。区间估计涉及置信水平和置信区间。 第二节 假设检验概述 1、主要内容:假设检验的原理和逻辑 2、基本概念与知识点: 利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留 的决断,称为假设检验。 1、 假设:假设检验一般有两个相互对立的假设。即零假设(或称原假设、虚 无假设、解消假设)和备择假设(或称研究假设、对立假设)。假设检验是从零假设出 发,视其被拒绝的机会,从而得出决断。 2、 小概率事件:把出现小概率的随机事件称为小概率事件。小概率事件是否 出现,这是对假设做出决断的依据。 3、 显著性水平:拒绝零假设的概率称为显著性水平。显著性水平和可靠性程
度之间的关系是:两者之和为1。 4、统计决断的两类错误及其控制: 如果拒绝了属于真实的零假设,即如果样本统计量的总体参数正是假设的总体参 数,但是由于样本统计量的值落入了拒绝区域。而零假设遭到拒绝,这时就会犯第 类型的错误。这种错误的可能性大小正是显著性水平的大小,故又称这类错误为α错 误。如果保留了属于不真实的零假设,就会犯第二类型的错误。犯这种“假设属伪而被 保留”的第二类错误的概率,等于B值,故又称这类错误为B错误。 要使第一类错误的概率保持在需要的水平上,而控制第二类错误的概率,有以下 方法: (1)利用已知的实际总体参数与假设参数值之间的大小关系,合理安排拒绝领 域的位置,选择双侧检验还是单侧检验,左侧检验还是右侧检验。 (2)加大样本容量。 5)、统计结果的表述 要研究小学毕业生男女生的阅读理解能力是否相同,要检验的假设是: (1)如果检验结果是拒绝零假设,则说“小学毕业生男女生的阅读理解能力有显 着差异”或者“小学毕业生阅读理解能力的性别差异显着”。这时,要看哪组的阅读理解 成绩的均值比较高。如果男生组的均值较高,则进一步说“男生的阅读理解能力显著高 于女生”。 (2)如果检验结果是不拒绝零假设,则说“小学毕业生男女生的阅读理解能力没 有显着差异”。此时没有必要比较哪组的阅读理解成绩的均值较高。 第三节总体均值的检验 1、主要内容:总体均值的Z检验和t检验 2、基本概念与知识点: 1)、检验的步骤: (1).提出假设H0:H1:(假设检验一般有两个互相对立的假设 零假设和备择假设。所谓零假设就是关于当前样本所属的总体与假设总体无区别的假 设。零假设一般用H0表示。所谓备择假设是与零假设相排斥的假设。备择假设一般用 H1表示。) (2).选择检验统计量并计算其值 (3).确定检验形式:因为没有资料可以说明应届毕业生汉语拼音测验成 绩是高于还是低于历届毕业生,故采用双侧检验。 (4).统计决断:先根据显著性水平查相应的理论概率分布表,寻找相应
度之间的关系是:两者之和为 1。 4、 统计决断的两类错误及其控制: 如果拒绝了属于真实的零假设,即如果样本统计量的总体参数正是假设的总体参 数,但是由于样本统计量的值落入了拒绝区域。而零假设遭到拒绝,这时就会犯第一 类型的错误。这种错误的可能性大小正是显著性水平的大小,故又称这类错误为 α 错 误。如果保留了属于不真实的零假设,就会犯第二类型的错误。犯这种“假设属伪而被 保留”的第二类错误的概率,等于 β 值,故又称这类错误为 β 错误。 要使第一类错误的概率保持在需要的水平上,而控制第二类错误的概率,有以下 方法: (1)利用已知的实际总体参数与假设参数值之间的大小关系,合理安排拒绝领 域的位置,选择双侧检验还是单侧检验,左侧检验还是右侧检验。 (2)加大样本容量。 5)、统计结果的表述 要研究小学毕业生男女生的阅读理解能力是否相同,要检验的假设是: (1)如果检验结果是拒绝零假设,则说“小学毕业生男女生的阅读理解能力有显 着差异”或者“小学毕业生阅读理解能力的性别差异显着”。这时,要看哪组的阅读理解 成绩的均值比较高。如果男生组的均值较高,则进一步说“男生的阅读理解能力显著高 于女生”。 (2)如果检验结果是不拒绝零假设,则说“小学毕业生男女生的阅读理解能力没 有显着差异”。此时没有必要比较哪组的阅读理解成绩的均值较高。 第三节 总体均值的检验 1、主要内容:总体均值的 Z 检验和 t 检验 2、基本概念与知识点: 1)、检验的步骤: (1).提出假设 H0: H1 : (假设检验一般有两个互相对立的假设: 零假设和备择假设。所谓零假设就是关于当前样本所属的总体与假设总体无区别的假 设。零假设一般用 H0 表示。所谓备择假设是与零假设相排斥的假设。备择假设一般用 H1 表示。) (2).选择检验统计量并计算其值 (3).确定检验形式:因为没有资料可以说明应届毕业生汉语拼音测验成 绩是高于还是低于历届毕业生,故采用双侧检验。 (4).统计决断:先根据显著性水平查相应的理论概率分布表,寻找相应