第三章统计基础 第一节几个基本概念 第二节异常数据的剔除 第三节统计假设检验 第四节Exc在统计假设检验中的应用
第三章 统计基础 第一节 几个基本概念 第二节 异常数据的剔除 第三节 统计假设检验 第四节 Excel在统计假设检验中的应用
第一节几个基本概念 、数学期望 二、方差 总体和样本 四、统计量 五、变异系数
第一节 几个基本概念 一、数学期望 二、方 差 三、总体和样本 四、统计量 五、变异系数
第一节几个基本概念 在重复测定某种食品的糖度时,由于种种偶然的 因素的影响,测定结果是一个随机变量。在这种情况 下,我们关心的是: (1)测定的平均值是多少? (2)测定的精密度如何?即测定值与平均值的离散程 度如何?离散程度越小。测定结果越精确
第一节 几个基本概念 在重复测定某种食品的糖度时,由于种种偶然的 因素的影响,测定结果是一个随机变量。在这种情况 下,我们关心的是: (1)测定的平均值是多少? (2)测定的精密度如何?即测定值与平均值的离散程 度如何?离散程度越小。测定结果越精确
随机变量的平均值和离散程度虽然不能完整地描述随机 变量,但是它们能描述随机变量某些特征。常用来描述随机 变量特征的量为数学期望和方差。 、数学期望 例:对某种食品的水分进行了n次测定,m次测定的结果 为X1,m2次测定的结果为X2,…,m次测定的结果为X, 则测定结果的平均值为 2=(X1*m1+X2m2+……+xk*m)n 其中n=m1+m2+…+m,m为X出现的频数,m/n为X 出现的频率
随机变量的平均值和离散程度虽然不能完整地描述随机 变量,但是它们能描述随机变量某些特征。常用来描述随机 变量特征的量为数学期望和方差。 一、数学期望 例:对某种食品的水分进行了n次测定,m1次测定的结果 为X1, m2次测定的结果为X2,……, mk次测定的结果为Xk, 则测定结果的平均值为 = (X1*m1+X2*m2+……+Xk*mk )/n 其中n=m1+m2+……+mk,mi为Xi出现的频数, mi /n为Xi 出现的频率。
因此,平均值就是随机变量所取值与对应的频率 乘积之和。由于频率具有偶然性,通常用频率的稳定 值——概率来代替频率,这样就消除了偶然性,从本 质上反映了随机变量的平均值。习惯上,把这个平均 结果叫做数学期望或均值。 数学期望的含义就是通过大量观察,可以期望这 个随机变量取这个值
因此,平均值就是随机变量所取值与对应的频率 乘积之和。由于频率具有偶然性,通常用频率的稳定 值——概率来代替频率,这样就消除了偶然性,从本 质上反映了随机变量的平均值。习惯上,把这个平均 结果叫做数学期望或均值。 数学期望的含义就是通过大量观察,可以期望这 个随机变量取这个值
二、方差 它是描述测定值对数学期望的平均偏离程度。 、总体和样本 总体:在数理统计中,把所有要研究对象的全体叫 做总体。 个体:构成总体的每个单元 样本:从总体中抽取的一部分个体叫做总体的一个 样本。 样本容量:样本中个体的数目。 任何一个总体都可以用一个随机变量来代表
二、方差 它是描述测定值对数学期望的平均偏离程度。 三、总体和样本 总体:在数理统计中,把所有要研究对象的全体叫 做总体。 个体:构成总体的每个单元。 样本:从总体中抽取的一部分个体叫做总体的一个 样本。 样本容量:样本中个体的数目。 任何一个总体都可以用一个随机变量来代表
例:某饮料厂某班生产汽水1000瓶,则这个班生 产的汽水的全体(1000)瓶是总体,每一瓶是个体。 如果我关心的是这班产品的细菌总数(个/mL),则这 班产品的细菌总数就可视为一个随机变量,每瓶汽水的 细菌数就是随机变量的一个取值。 研究中总是把总体和他所对应的一个随机变量等同 起来,因此,凡是提到总体就是指一个随机变量,提到 一个随机变量就是指一个总体
例:某饮料厂某班生产汽水1000瓶,则这个班生 产的汽水的全体(1000)瓶是总体,每一瓶是个体。 如果我关心的是这班产品的细菌总数(个/mL),则这 班产品的细菌总数就可视为一个随机变量,每瓶汽水的 细菌数就是随机变量的一个取值。 研究中总是把总体和他所对应的一个随机变量等同 起来,因此,凡是提到总体就是指一个随机变量,提到 一个随机变量就是指一个总体
四、统计量 为了从总体的一个样本推得总体的一些性质,就需要 对所取得的样本做一些计算,即构成样本的某种函数,这 种函数称为统计量。由于样本是一个随机变量,因此作为 样本的函数的统计量也是随机变量。 数理统计中,常用的统计量有中数、众数、样本均值、 标准误、样本方差、样本标准差和极差等
四、统计量 为了从总体的一个样本推得总体的一些性质,就需要 对所取得的样本做一些计算,即构成样本的某种函数,这 种函数称为统计量。由于样本是一个随机变量,因此作为 样本的函数的统计量也是随机变量。 数理统计中,常用的统计量有中数、众数、样本均值、 标准误、样本方差、样本标准差和极差等
(1)中数 将样本内所有变量从小到大依次排列,处于中间位 置的变量即为中数( median)。如果变量的个数为偶数, 即中间两个变量的平均数为中数。 (2)众数 样本中最常见的一个数值或出现次数最多的一组的 中点,即为众数(mode) (3)样本均值(算术平均值)(mean) x1+x2+…+xn
(1)中数 将样本内所有变量从小到大依次排列,处于中间位 置的变量即为中数(median)。如果变量的个数为偶数, 即中间两个变量的平均数为中数。 (2)众数 样本中最常见的一个数值或出现次数最多的一组的 中点,即为众数(mode) (3)样本均值(算术平均值)(mean) n x n x x x x n i i n = = + + + = 1 2 1
(4)样本极差: R=max(X1,X2,,xn)—min(X1,X2,…,Xn) (5)样本方差( mean square缩写为MS),又称,记 为s2,即 s2=>a=x)m=1
(4)样本极差: R=max(X1,X2,……,Xn)—min( X1,X2,……,Xn) (5) 样本方差( mean square缩写为MS),又称,记 为s 2,即 = − −1 2 2 s (x x) /n