市场调研 Marketing research 主讲人:胡健颖教授 北京大学光华管理学院 2005年5月 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 1 市场调研 Marketing Research 主讲人:胡健颖教授 北京大学光华管理学院 2005年5月
市场调研 第六章频数分布:列联表和假设检验 参考书第14章和第15章 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 2 市场调研 第六章 频数分布:列联表和假设检验 参考书第14章和第15章
1.数据处理 ●确认与编辑 1)确认:目的是尽可能确保每份调查问卷都是有效问 卷 2)编辑整理:确认是对访问员的欺骗行为及调查是否 严守程序进行核实, 而编辑是对访问员和应答者的错误进行检查。 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 3 1.数据处理 ⚫确认与编辑 1)确认:目的是尽可能确保每份调查问卷都是有效问 卷 2)编辑整理:确认是对访问员的欺骗行为及调查是否 严守程序进行核实, 而编辑是对访问员和应答者的错误进行检查
1.数据处理 下面情况的问卷一般是不能接受的: ①所回收的问卷是明显不完整的,例如缺了一页或半页 ②问卷从整体上是回答不完整的 ③问卷的几个部分是回答不完整的 ④回答的模式说明调査员(或被访者)并没有理解或遵循 访问(回答)指南,例如没有按要求跳答,等等 ⑤问卷是在事先规定的截止日期以后回收的 ⑥问卷是不合要求的被访者回答的 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 4 1.数据处理 下面情况的问卷一般是不能接受的: ①所回收的问卷是明显不完整的,例如缺了一页或半页 ②问卷从整体上是回答不完整的 ③问卷的几个部分是回答不完整的 ④回答的模式说明调查员(或被访者)并没有理解或遵循 访问(回答)指南,例如没有按要求跳答,等等 ⑤问卷是在事先规定的截止日期以后回收的 ⑥问卷是不合要求的被访者回答的
1.数据处理 数据编码 数据录入 数据清理 在录入数据后,利用计算机来检査数据的一致性,处理缺失值。 致性检査:超出数据范围、逻辑问题、极端值 处理缺失值:中性值代替(如均值);估计值代替;删除 (去掉有缺失值的样本);结对删除(每一步计算中采用有完整 答案得样本) 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 5 1.数据处理 ⚫ 数据编码 ⚫ 数据录入 ⚫ 数据清理 在录入数据后,利用计算机来检查数据的一致性,处理缺失值。 ⚫ 一致性检查:超出数据范围、逻辑问题、极端值 ⚫ 处理缺失值:中性值代替(如均值);估计值代替;删除 (去掉有缺失值的样本);结对删除(每一步计算中采用有完整 答案得样本)
2.数据的表现一统计数字和统计图表 ●假如你已经获得了所要的全部数据; ●认识数据的第一步:你得到的是什么类型的数 据 ●利用图和表来展示数据中的信息; ●运用指标刻画数据的某些特征和程度; ●使用 EXCEL来完成对数据的描述 2021/2/22 北京大学光华管理学院胡健颖 6
2021/2/22 北京大学光华管理学院 胡健颖 6 2.数据的表现—统计数字和统计图表 ⚫ 假如你已经获得了所要的全部数据; ⚫ 认识数据的第一步:你得到的是什么类型的数 据? ⚫ 利用图和表来展示数据中的信息; ⚫ 运用指标刻画数据的某些特征和程度; ⚫ 使用EXCEL来完成对数据的描述
数据变量的分类 ●按照取值类型:品质数据和数量数据; ●按照测量水平:定类( Nominal)、定序 ( Ordinal)、定距( Interval)、定比( Ratio) 等四类; 按照获取时间:截面数据、时间序列; 不同类型的数据应使用不同的统计方法; 问题:刚才的数据表中分别是什么类型? 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 7 数据变量的分类 ⚫ 按照取值类型:品质数据和数量数据; ⚫ 按照测量水平:定类(Nominal)、定序 (Ordinal)、定距(Interval)、定比(Ratio) 等四类; ⚫ 按照获取时间:截面数据、时间序列; ⚫ 不同类型的数据应使用不同的统计方法; ⚫ 问题:刚才的数据表中分别是什么类型?
区分不同的测量水平 ●区分原则:定类数据没有大小之分;定序数据 有大小之分,差值有意义;定距数据有大小之 分,差值有意义,但其比值无意义;定比数据 比值有意义。 ●定比定距数据可以向前化成定序或者定类数据, 但是将损失一定信息;反之,不能将定序定类 数据化成定距定比数据 2021/2/22 北京大学光华管理学院胡健颖 8
2021/2/22 北京大学光华管理学院 胡健颖 8 区分不同的测量水平 ⚫ 区分原则:定类数据没有大小之分;定序数据 有大小之分,差值有意义;定距数据有大小之 分,差值有意义,但其比值无意义;定比数据 比值有意义。 ⚫ 定比定距数据可以向前化成定序或者定类数据, 但是将损失一定信息;反之,不能将定序定类 数据化成定距定比数据
品质标志的描述方法(1) 频数分布、相对分布、百分比频数分布 某校学生对体育锻炼的态度 是否锻炼人数(频数)相对频数百分比累计百分比 非常喜欢 0.2 20.00%20.00 喜欢 0.330.00%50.00 般 0.2525.00%75.00% 不太喜欢 0.5 5.00% 80.00% 讨厌 465122 0.110.00%90.00% 很讨厌 0.110.00%100.00% 求和 20 100.00% 100 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 9 品质标志的描述方法(1) 频数分布、相对分布、百分比频数分布 是否锻炼 人数(频数) 相对频数 百分比 累计百分比 非常喜欢 4 0.2 20.00% 20.00% 喜欢 6 0.3 30.00% 50.00% 一般 5 0.25 25.00% 75.00% 不太喜欢 1 0.5 5.00% 80.00% 讨厌 2 0.1 10.00% 90.00% 很讨厌 2 0.1 10.00% 100.00% 求和 20 1 100.00% 100% 某校学生对体育锻炼的态度
品质标志描述方法(2) 一条形图、柱形图 某校学生对体育锻炼态度调査结果 35.00% 30.00 25.00% 20.00% 15.00% 10.00% 5.00% 0.00% 非常喜欢喜欢般不太喜欢讨厌很讨厌 2021/2/22 北京大学光华管理学院胡健颖
2021/2/22 北京大学光华管理学院 胡健颖 10 品质标志描述方法(2) ————条形图、柱形图 某校学生对体育锻炼态度调查结果 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% 35.00% 非常喜欢 喜 欢 一 般 不太喜欢 讨 厌 很讨厌