Chapter 2 数据整理及数据的描述
Chapter 2 数据整理及数据的描述
2.1统计数据 来源:统计报表(制度) 全面调查:如第五次人口普查 专门调查 重点调查 非全面调查:典型调查 抽样调查 22频数(率)分布直方图 适当分组,确定组限、组中值 编织频数分布表
2.1统计数据 来源:统计报表(制度) 2.2频数(率)分布 直方图 -适当分组,确定组限、组中值 -编织频数分布表 重点调查 典型调查 抽样调查 非全面调查: 全面调查:如第五次人口普查 专门调查
例共50人50-605人 60-7011人 70-80 17人 80-9011人 90-100 6人 成绩(分)频数(次)频率(%)累计频率(%) 50-60 5 10.0 10.0 6070 11 22.0 32.0 70-80 17 34.0 660 80-90 11 22 2.0 88.0 90-1006 12.0 1000 计 50 100
例 共50人 50—60 5人 60—70 11人 70—80 17人 80—90 11人 90—100 6人 成绩(分) 频数(次) 频率(%) 累计频率(%) 50—60 5 10.0 10.0 60—70 11 22.0 32.0 70—80 17 34.0 66.0 80—90 11 22.0 88.0 90—100 6 12.0 100.0 合计 50 100 ------
直方图 频数 频率 22 510 5565758595
直方图 频率 (%) 频数 (人) 11 22 5 10 55 65 75 85 95
●分布特征从直方图到分布曲线 ●直方图给出一种“分布”的直观形式 ●钟型分布 如身高、体重、成绩 ●U型分布 如人群健康(生病) ●正反J型
●分布特征 从直方图到分布曲线 ●直方图给出一种“分布”的直观形式 ●钟型分布 如身高、体重、成绩 ● U型分布 如人群健康(生病) ●正反J型
●劳伦兹曲线 本世纪初 将两种累计频率对应图示 前例50人 100 总分3770分 85 60 26.5 7.3 010 32 66 88100
●劳伦兹曲线 本世纪初 将两种累计频率对应图示 前例50人 总分3770分 0 10 32 66 88 100 100 85 60 26.5 7.3
基尼系数 A(A+B) 越小越均匀(公平) ●思考:与ABC分类法的关系? ●例6,9,12,15,18 100 宽度定为1时,所绘图形上 20 可以面积表示频率大小 任何一个关于频率的直方图,可 以经适当度量变换,以分布形状 75% 的面积大小来度量频率大小 如某地区 0.31.642.1
●基尼系数 A/(A+B) 越小越均匀(公平) ●思考:与ABC分类法的关系? ●例 6,9,12,15,18 宽度定为1时,所绘图形上 可以面积表示频率大小 任何一个关于频率的直方图,可 以经适当度量变换,以分布形状 的面积大小来度量频率大小。 如某地区 20 100 75% 0.3 1.64 2.1
2.3分布的数字特征 均值:X=(∑×n 离散趋势方差:S2=[∑(XX)2]/(n-1) 例:6,9,12,15,18 均值:X=(6+9+12+15+18)/5=12 方差:S2=[36+9+0+9+36]/4=225
2.3分布的数字特征 均值:X=(∑Xi )/n 离散趋势方差:S2= [∑(Xi-X)2 ]/(n-1) 例:6,9,12,15,18 均值:X=(6+9+12+15+18)/5 =12 方差:S2= [36+9+0+9+36]/4=22.5
Chapter 3 从直方图描述到分布描述
Chapter 3 从直方图描述到分布描述
3.1随机变量及其概率分布 前例6,9,12,15,18可以看作一种客观存在的分布 从另一个观点,如果5个数中每次取一个,则有 P(X=6)=1/5, P(x=9)=1/5,,P(X=18)=1/5 由6,9,12,15,18等可能的随机产生的性质,我们得 到了概率分布图。若适当选取度量单位,如使每个直方条 的宽度为1,则可以用面积大小表示概率大小,如 P(9<=X<=15)=06,即途中三个直方条的面积总和。于是 现在我们可以用函数描述与处理随机现象。 概率意义上的平均值,称数学期望 (有时我们不再区分两者,其意自明)
3.1随机变量及其概率分布 前例6,9,12,15,18可以看作一种客观存在的分布 从另一个观点,如果5个数中每次取一个,则有 P(X=6)=1/5, P(X=9)= 1/5,…,P(X=18)=1/5. 由6,9,12,15,18等可能的随机产生的性质,我们得 到了概率分布图。若适当选取度量单位,如使每个直方条 的宽度为1,则可以用面积大小表示概率大小,如 P(9<=X<=15)=0.6,即途中三个直方条的面积总和。于是 现在我们可以用函数描述与处理随机现象。 概率意义上的平均值,称数学期望 (有时我们不再区分两者,其意自明)