新 闻 传 播 第三讲 基础统计学 主讲教师:沈浩 北京广播学院新闻传播学院 副教授 北京广播学院调查统计研究所副所长 Journalism Communication School
Journalism & Communication School Journalism & Communication School 新闻传播学院 主讲教师:沈浩 北京广播学院新闻传播学院 副教授 北京广播学院调查统计研究所 副所长 基础统计学 第三讲
篇统计分析 传 播根据概率论和数理统计理论,依不同的目的收集不同的数据用不 学同的分析方法进行分析! 确定调研的目的 明确研究对象,确定感兴趣的总体 确定是否需要抽样 确定需要记录的数据项目 普查←抽样调查
新闻传播学院 2 根据概率论和数理统计理论,依不同的目的收集不同的数据并用不 同的分析方法进行分析! 确定调研的目的 确定调研的目的 明确研究对象,确定感兴趣的 明确研究对象,确定感兴趣的总体 确定是否需要抽样 确定需要记录的数据项目 确定需要记录的数据项目 普查普查 抽样调查 抽样调查 统计分析
统计分析的基本概念 传 播 学 根据研究目的 样本 院 关注每个对象的某些 从总体中得到的 定性或定量指标 个子集 指标测量值的集合 样本要有代表性 总体 抽样 样本 (Population) 抽样方法 Sample) 统计推断 计算 理论 描述 平均值 特征 指标 统计量 最大值 方差 参数在许多方面有相似的特征 (Statistics) 标准差 ·运算加工 凡是由样本数据进行 制作图形 各种加工得到的量
新闻传播学院 3 统计分析的基本概念 统计分析的基本概念 总体 (Population) 总体 (Population Population) 样本 (Sample) 样本 (Sample) 抽样 抽样方法 •特征 •指标 •参数 •特征 •指标 •参数 统计量 (Statistics) 统计量 在许多方面有相似的特征 (Statistics) Statistics) •平均值 •最大值 •方差 •标准差 •平均值 •最大值 •方差 •标准差 理论 • 运算加工 • 制作图形 样本: 从总体中得到的 一个子集; 样本要有代表性 根据研究目的: 关注每个对象的某些 定性或定量指标; 指标测量值的集合 凡是由样本数据进行 各种加工得到的量 统计推断 描述 计算
闻统计过程 传 播 学 总体 院 抽样本 统计 样 推断 计算 统计量 描述 统计量
新闻传播学院 4 统计过程 总体总体 样本样本 统计量 统计量 计算 统计量 抽 样 描 述 统计 推断
简利用样本统计量(包括图形)可以 ●描述统计:描述样本的各主要特征 ●推断统计:扩大所收集的信息的使 用范围,用样本的特征来推断总体 的特征
新闻传播学院 5 z描述统计:描述样本的各主要特征 描述样本的各主要特征 z推断统计:扩大所收集的信息的使 扩大所收集的信息的使 用范围,用样本的特征来推断总体 用范围,用样本的特征来推断总体 的特征 利用样本统计量(包括图形)可以 利用样本统计量(包括图形)可以
描述性统计学 传 播 学 变量:测量等级 离散型随机变量 晚低 名称级—定类变量 定性→非数量型 顺序级—定序变量 换 间隔级一—定距变量 比例级一定比变量 定量一数量型 连续型随机变量 统说分彻宠法的应用有候变星的测星等级来别公
新闻传播学院 6 描述性统计学 变量:测量等级 •名称级----定类变量 •顺序级----定序变量 •间隔级----定距变量 •比例级----定比变量 低 高 转换 定性 定量 非数量型 数量型 离散型随机变量 连续型随机变量 统计分析方法的应用有时候按变量的测量等级来划分。 统计分析方法的应用有时候按变量的测量等级来划分
样本数据集 传 播 变量 4+ ID NAME AGE SEX HEIGHT WEIGHT HID NAME AGE SEX HEIGHT I WEIGHT KATIE 12 145.043.121| FREDRICK14 154.042.2 院 2 LOUISE 149.0 55.8 22 ALFRED 14 3 JANE 23 HENRY 159 4 JacLYN 162.065.824 LEWIS 14 157.0 5 LILLIE 29.1 25 EDWARD 4404 记 12 147 38.1 26 CHRIS 14 录7As|12 149.58.127 EFFERY14 169.0 51.3 8 ROBERT 12 35.928|MARY 152.041.8 9 BARBARAI13 147.050.8129|AMY 157.050.8 10 ALICE 13 48.6 30 ROBERT 164.058 30.431LAM15 12|0N 159.04.532LAY 162.047.7 13 JOE 13 女女女女女男男男女女女男男男男女女女女女 154.047.7133|MARK 152.047.2 14 MICHAEL 43.1 34 DANNY 15 DAVID 13 145.035.9135| MARTHA 159 50 16 JUDY 149.d36.836 MARIAN16 男男男男男男男女女男男男男男女女男女男男 147.052 17 ELIZABET 14 152.041.3137 PHILLIP 16 167.058 18 LESLIE 159 64.538|INDA 19 CAROL 154.038.139kIRK 167.060.8 20 PATTY 152 38.6 40 LAWRENCE17 72.078 一行:一条纪录,一个样本,一个被访者,一个case,一份问卷
新闻传播学院 7 样本数据集 ID NAME AGE SEX HEIGHT WEIGHT ID NAME AGE SEX HEIGHT WEIGHT 1 KATIE 12 女 145.0 43.1 21 FREDRICK 14 男 154.0 42.2 2 LOUISE 12 女 149.0 55.8 22 ALFRED 14 男 157.0 44.9 3 JANE 12 女 135.0 33.6 23 HENRY 14 男 159.0 54.0 4 JACLYN 12 女 162.0 65.8 24 LEWIS 14 男 157.0 41.8 5 LILLIE 12 女 127.0 29.1 25 EDWARD 14 男 167.0 50.8 6 TIM 12 男 147.0 38.1 26 CHRIS 14 男 157.0 44.9 7 JAMES 12 男 149.0 58.1 27 JEFFERY 14 男 169.0 51.3 8 ROBERT 12 男 125.0 35.9 28 MARY 15 女 152.0 41.8 9 BARBARA 13 女 147.0 50.8 29 AMY 15 女 157.0 50.8 10 ALICE 13 女 149.0 48.6 30 ROBERT 15 男 164.0 58.1 11 SUSAN 13 女 137.0 30.4 31 WILLIAM 15 男 159.0 50.4 12 JOHN 13 男 159.0 44.5 32 CLAY 15 男 162.0 47.7 13 JOE 13 男 154.0 47.7 33 MARK 15 男 152.0 47.2 14 MICHAEL 13 男 142.0 43.1 34 DANNY 15 男 162.0 48.1 15 DAVID 13 男 145.0 35.9 35 MARTHA 16 女 159.0 50.8 16 JUDY 14 女 149.0 36.8 36 MARIAN 16 女 147.0 52.2 17 ELIZABET 14 女 152.0 41.3 37 PHILLIP 16 男 167.0 58.1 18 LESLIE 14 女 159.0 64.5 38 LINDA 17 女 152.0 52.7 19 CAROL 14 女 154.0 38.1 39 KIRK 17 男 167.0 60.8 20 PATTY 14 女 152.0 38.6 40 LAWRENCE 17 男 172.0 78.1 记录 变量 一行:一条纪录,一个样本,一个被访者,一个case,一份问卷
新 闻频数统计与直方图 传 播 学 ■■■■口 频数 百分 有效百分比累计百分比 院 变量 LAGE ■■■ Valid Cumulative 频数表 Frequency PercentPercentPercent Valid 12 8 20.0 0.0 17.5 37.5 14 12300 30.0 675 取 17.5 17.5 850 16 3 7.5 7.5 92.5 7.5 7.51000 Total 401000 1000
新闻传播学院 8 频数统计与直方图 频数统计与直方图 AGE 8 20.0 20.0 20.0 7 17.5 17.5 37.5 12 30.0 30.0 67.5 7 17.5 17.5 85.0 3 7.5 7.5 92.5 3 7.5 7.5 100.0 40 100.0 100.0 12 13 14 15 16 17 Total Valid Frequency Percent Valid Percent Cumulative Percent 频数 百分比 有效百分比 累计百分比 取值 变量 频数表
新 闻 直方图 传 播 学 AGE 院 12 10 Std Dev=1. 48 Mean=14.0 N=4000 12.0 AGE
新闻传播学院 9 AGE 12.0 13.0 14.0 15.0 16.0 17.0 AGE Frequency 14 12 10 8 6 4 2 0 Std. Dev = 1.48 Mean = 14.0 N = 40.00 3 3 7 12 7 8 直方图
闻问题? 陕●如果你是一个身高180的不会游泳的人,想涉 水过河,已知河的平均深度为1米,你是否过河? ●为什么?能说明理由吗?
新闻传播学院 10 z 如果你是一个身高 如果你是一个身高180的不会游泳的人,想涉 的不会游泳的人,想涉 水过河,已知河的平均深度为 已知河的平均深度为1米,你是否过河? z 为什么? 能说明理由吗? 能说明理由吗? 问题?