数学实验 Experiments in Mathematics 数据的统计描述和分析
2021/2/23 1 数学实验 Experiments in Mathematics 数据的统计描述和分析
实验目的 1、直观了解统计基本内容。 2、掌握用数学软件包求解统计问题。 实验内 1、统计的基本理论。 2、用数学软件包求解统计问题。 3、实验作业。 所用软件 MATLAB
实验目的 实验内容 MATLAB 2、掌握用数学软件包求解统计问题。 所用软件 1、直观了解统计基本内容。 1、统计的基本理论。 3、实验作业。 2、用数学软件包求解统计问题
数据的统计描述和分析 统计的基本理论 统计工具箱中的基本统计命令 实验作业 2021/2/23
2021/2/23 3 数据的统计描述和分析 统计的基本理论 统计工具箱中的基本统计命令 实验作业
数据的统计描述和分析 统计的基本概念 参数估计 假设检验 2021/2/23
2021/2/23 4 统计的基本概念 参数估计 假设检验 数据的统计描述和分析
统计量 表示位置的统计量一平均值和中位数 平均值(或均值,数学期望X=1∑x 中位数:将数据由小到大排序后位于中间位置的那个数值 2、表示变异程度的统计量一标准差、方差和极差 标准差:s=[,∑(x-) 它是各个数据与均值偏离程度的度量. 方差:标准差的平方 极差:样本中最大值与最小值之差 2021/2/23
2021/2/23 5 1、表示位置的统计量—平均值和中位数 平均值(或均值,数学期望): = = n i Xi n X 1 1 中位数:将数据由小到大排序后位于中间位置的那个数值. 2、表示变异程度的统计量—标准差、方差和极差 标准差: 2 1 1 2 ( ) ] 1 1 [ = − − = n i Xi X n s 它是各个数据与均值偏离程度的度量. 方差:标准差的平方. 极差:样本中最大值与最小值之差. 一、统计量
3.表示分布形状的统计量一偏度和峰度 偏度:81=3∑(X-X)峰度:82=∑(x1-X) S1=1 偏度反映分布的对称性,g1>0称为右偏态,此时数据位于均值 右边的比位于左边的多;g1<0称为左偏态,情况相反;而g接近0 则可认为分布是对称的 峰度是分布形状的另一种度量,正态分布的峰度为3,若g2比3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数 据,因而峰度可用作衡量偏离正态分布的尺度之 4.k阶原点矩:Vknk阶中心矩:C1、1 ∑X k ∑(X1-X) 2021/2/23
2021/2/23 6 3. 表示分布形状的统计量—偏度和峰度 偏度: = = − n i Xi X s g 1 3 1 3 ( ) 1 峰度: = = − n i Xi X s g 1 4 2 4 ( ) 1 偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数 据,因而峰度可用作衡量偏离正态分布的尺度之一. 4. k 阶原点矩: = = n i k k Xi n V 1 1 k 阶中心矩: = = − n i k k Xi X n U 1 ( ) 1
、分布函数的近似求法 1、整理资料:把样本值ⅹ,ⅹ,…,xn进行分组,先将它们依大小次序排列 得x1≤x2≤…≤xn在包含[x12xn的区间[a,b]内插入一些等分点: a<x1<x2<…<xn<b,注意要使每一个区间(x12x1](i=1,2,…,n-1) 内都有样本观测值x1(i1,2,…,n-1)落入其中 求出各组的频数和频率:统计出样本观测值在每个区间(x2x+1]中出 现的次数n1,它就是这区间或这组的频数计算频率厂 作频率直方图:在直角坐标系的横轴上,标出x12x2…2xn各点,分别以 (x,2x+]为底边,作高为,的矩形,△x1=x1-x1,i=1,2,,n-1,即得 频率直方图 2021/2/23
2021/2/23 7 二、分布函数的近似求法 1、整理资料 : 把样本值 x1,x2,…,xn 进行分组,先将它们依大小次序排列, 得 * * 2 * 1 n x x x .在包含[ , ] * * 1 n x x 的区间[ a,b]内插入一些等分点: , ' ' 2 ' a x1 x xn b 注意要使每一个区间( , ] ' 1 ' i i+ x x (i=1,2,…,n-1) 内都有样本观测值 xi(i=1,2,…,n-1)落入其中. 2、求出各组的频数和频率:统计出样本观测值在每个区间( , ] ' 1 ' i i+ x x 中出 现的次数ni ,它就是这区间或这组的频数.计算频率 n n f i i = . 3、作频率直方图:在直角坐标系的横轴上,标出 ' ' 2 ' 1 , , , n x x x 各点,分别以 ( , ] ' 1 ' i i+ x x 为底边,作高为 ' i i x f 的矩形, , 1,2, , 1 ' ' 1 ' xi = xi+ − xi i = n − ,即得 频率直方图
三、几个在统计中常用的概率分布 正态分布N(A,G2) 密度函数:p(x)= e20分布函数:F(x) 2σ 2丌O 2丌 其中为均值,σ为方差,-∞<x<+0 标准正态分布:N(0,1) 密度函数 035 P(x) 2丌 0.2 分布函数 2丌 2021/2/23
2021/2/23 8 三、几个在统计中常用的概率分布 -4 -2 0 2 4 6 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 1.正态分布 ( , ) 2 N m s 密度函数: 2 2 2 ( ) 2 1 ( ) s m ps − − = x p x e 分布函数:F x e dy y x 2 2 2 ( ) 2 1 ( ) s m ps − − − = 其中m 为均值, 2 s 为方差,− x +. 标准正态分布:N(0,1) 密度函数 2 2 2 1 ( ) x x e − = p j x e dy y x 2 2 2 1 ( ) − − F = p 分布函数
2、x2分布x2(n) 若随机变量X1,X2,…Xn相互独 立,都服从标准正态分布N(0,1),则随机 变量 Y=X1+X2+…+X 服从自由度为n的x分布,记为Y2(n) Y的均值为n,方差为2n 2021/2/23
2021/2/23 9 0 5 10 15 20 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 2、 2 分布 2 (n) 若随机变量 X1,X2,… Xn 相互独 立,都服从标准正态分布 N(0,1),则随机 变量 Y= 2 2 2 2 X1 + X ++ X n 服从自由度为 n 的 2 分布,记为 Y~ 2 (n). Y 的均值为 n,方差为 2n
3、t分布t(n) 若XN(0,1),Yx2(n),且相互 独立,则随机变量 T 服从自由度为n的t分布,记为Tt(n) t分布t(20)的密度函数曲线和N(0,1)的 曲线形状相似理论上n时,Tt(n)N(0,1) 2021/2/23
2021/2/23 10 3、 t 分布 t(n) 若 X~N(0,1),Y~ 2 (n),且相互 独立,则随机变量 n Y X T = 服从自由度为 n 的 t 分布,记为 T~t(n). t 分布 t(20)的密度函数曲线和 N(0,1)的 曲线形状相似.理论上 n → 时,T~t(n) → N(0,1). -6 -4 -2 0 2 4 6 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4