数学建模与数学实验 数据的统计描述和分析 后勤工程学院数学教研室
2021/2/20 1 数学建模与数学实验 后勤工程学院数学教研室 数据的统计描述和分析
实验目的 1、直观了解统计基本内容。 2、掌握用数学软件包求解统计问题。 验内 1、统计的基本理论。 2、用数学软件包求解统计问题。 3、实验作业
实验目的 实验内容 2、掌握用数学软件包求解统计问题。 1、直观了解统计基本内容。 1、统计的基本理论。 3、实验作业。 2、用数学软件包求解统计问题
数据的统计描述和分析 统计的基本概念 参数估计 假设检验 2021/2/20
2021/2/20 3 统计的基本概念 参数估计 假设检验 数据的统计描述和分析
统计量 1、表示位置的统计量一平均值和中位数 平均值(或均值,数学期望):X ∑ 中位数:将数据由小到大排序后位于中间位置的那个数值 2、表示变异程度的统计量一标准差、方差和极差 标准差:s=[,∑(x-) 它是各个数据与均值偏离程度的度量. 方差:标准差的平方 极差:样本中最大值与最小值之差 2021/2/20 4
2021/2/20 4 1、表示位置的统计量—平均值和中位数 平均值(或均值,数学期望): = = n i Xi n X 1 1 中位数:将数据由小到大排序后位于中间位置的那个数值. 2、表示变异程度的统计量—标准差、方差和极差 标准差: 2 1 1 2 ( ) ] 1 1 [ = − − = n i Xi X n s 它是各个数据与均值偏离程度的度量. 方差:标准差的平方. 极差:样本中最大值与最小值之差. 一、统计量
3.表示分布形状的统计量一偏度和峰度 偏度:81=∑(X-X)峰度:82=∑(X1-X) i=1 偏度反映分布的对称性,g>0称为右偏态,此时数据位于均值 右边的比位于左边的多;g1<0称为左偏态,情况相反;而g接近0 则可认为分布是对称的 峰度是分布形状的另一种度量,正态分布的峰度为3,若g比3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数 据,因而峰度可用作衡量偏离正态分布的尺度之 4.k阶原点矩: ∑X 7k阶中心矩:U 4=元(x-x 2021/220
2021/2/20 5 3. 表示分布形状的统计量—偏度和峰度 偏度: = = − n i Xi X s g 1 3 1 3 ( ) 1 峰度: = = − n i Xi X s g 1 4 2 4 ( ) 1 偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数 据,因而峰度可用作衡量偏离正态分布的尺度之一. 4. k 阶原点矩: = = n i k k Xi n V 1 1 k 阶中心矩: = = − n i k k Xi X n U 1 ( ) 1
分布函数的近似求法 1、整理资料:把样本值ⅹ,ⅹ,…,x进行分组,先将它们依大小次序排列 得x1≤x2≤…≤xn在包含[x1,xn]的区间[a,b]内插入一些等分点 a<x, <x 2 <xn<b,注意要使每一个区间(x +1/( F 内都有样本观测值x1(i=1,2,…,n-1)落入其中 2、求出各组的频数和频率:统计出样本观测值在每个区间(x12x+]中出 现的次数n,它就是这区间或这组的频数计算频率f 、作频率直方图:在直角坐标系的横轴上,标出x12x2…,xn各点,分别以 (x,2x+]为底边,作高为,的矩形,Ax1=x1-x12i=1,2,…n-1,即得 x 频率直方图 2021/2/20 6
2021/2/20 6 二、分布函数的近似求法 1、整理资料 : 把样本值 x1,x2,…,xn 进行分组,先将它们依大小次序排列, 得 * * 2 * 1 n x x x .在包含[ , ] * * 1 n x x 的区间[ a,b]内插入一些等分点: , ' ' 2 ' a x1 x xn b 注意要使每一个区间( , ] ' 1 ' i i+ x x (i=1,2,…,n-1) 内都有样本观测值 xi(i=1,2,…,n-1)落入其中. 2、求出各组的频数和频率:统计出样本观测值在每个区间( , ] ' 1 ' i i+ x x 中出 现的次数ni ,它就是这区间或这组的频数.计算频率 n n f i i = . 3、作频率直方图:在直角坐标系的横轴上,标出 ' ' 2 ' 1 , , , n x x x 各点,分别以 ( , ] ' 1 ' i i+ x x 为底边,作高为 ' i i x f 的矩形, , 1,2, , 1 ' ' 1 ' xi = xi+ − xi i = n − ,即得 频率直方图
三、几个在统计中常用的概率分布 正态分布N(,G2) 密度函数:p(x)=e20分布函数:F(x) 2σ 2丌O 2丌O 其中为均值,σ为方差,-∞<x<+0 标准正态分布:N(0,1) 0 密度函数 035 P(x) 2丌 0.2 分布函数 2丌 2021/2/20
2021/2/20 7 三、几个在统计中常用的概率分布 -4 -2 0 2 4 6 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 1.正态分布 ( , ) 2 N m s 密度函数: 2 2 2 ( ) 2 1 ( ) s m ps − − = x p x e 分布函数:F x e dy y x 2 2 2 ( ) 2 1 ( ) s m ps − − − = 其中m 为均值, 2 s 为方差,− x +. 标准正态分布:N(0,1) 密度函数 2 2 2 1 ( ) x x e − = p j x e dy y x 2 2 2 1 ( ) − − F = p 分布函数
2、x2分布x2(n) 若随机变量Ⅹ1,X2 Xn相互独 立,都服从标准正态分布N(0,1),则随机 变量 Y=X12+X2+…+X, 服从自由度为n的x分布,记为Y2(n) Y的均值为n,方差为2n 2021/2/20
2021/2/20 8 0 5 10 15 20 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 2、 2 分布 2 (n) 若随机变量 X1,X2,… Xn 相互独 立,都服从标准正态分布 N(0,1),则随机 变量 Y= 2 2 2 2 X1 + X ++ X n 服从自由度为 n 的 2 分布,记为 Y~ 2 (n). Y 的均值为 n,方差为 2n
3、t分布t(n) 若XN(0,1),Yy2(n),且相互 独立,则随机变量 服从自由度为n的t分布,记为T~t(n) t分布t(20)的密度函数曲线和N(0,1)的 曲线形状相似理论上n→时,Tt(n)→N(0,1) 2021/2/20
2021/2/20 9 3、 t 分布 t(n) 若 X~N(0,1),Y~ 2 (n),且相互 独立,则随机变量 n Y X T = 服从自由度为 n 的 t 分布,记为 T~t(n). t 分布 t(20)的密度函数曲线和 N(0,1)的 曲线形状相似.理论上 n → 时,T~t(n) → N(0,1). -6 -4 -2 0 2 4 6 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4
4.F分布F(n1,n2) 若X~x2(n1),Y~x2(n2),且相互独立,则随机变量 X 服从自由度为(n1,n2)的F分布,记作F~F(n1,n2) 由F分布的定义可以得到F分布 的一个重要性质: 若F~F(n1,n2),则~F(n2,n1) 81654 F分布F(10,50)的密度函数曲线 2021/2/20 返回
2021/2/20 10 4. F 分布 F(n1,n2) 若 X~ 2 (n1),Y~ 2 (n2),且相互独立,则随机变量 2 1 n Y n X F = 服从自由度为(n1,n2)的 F 分布,记作 F~ F(n1,n2). 由 F 分布的定义可以得到 F 分布 的一个重要性质: 若 F~ F(n1,n2),则 ~ ( , ) 1 F n2 n1 F 0 0.5 1 1.5 2 2.5 3 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 返回 F分布F(10,50)的密度函数曲线