Dr, Elizabeth newton 幻灯片主要由 Elizabeth Newton((麻省理工学院) 制作,其中一部分是由 Roy Welsch(麻省理工学 院)和 Gordon kaufman(麻省理工学院)制作
1 幻灯片主要由Elizabeth Newton(麻省理工学院) 制作,其中一部分是由Roy Welsch(麻省理工学 院)和Gordon Kaufman(麻省理工学院)制作
15075应用统计学 主课程:星期一、星期三10:001:30 辅导:R45 教材: Statistics and data analysis((由 Tamhane和 Dunlop著) 计算:S-Plus 考试:期中考试(随堂)和考试周的期末考试 必备知识:微积分,概率论,线性代数
2 15.075应用统计学 主课程:星期一、星期三10:00—11:30 辅导:R 4-5 教材:Statistics and Data Analysis(由Tamhane和 Dunlop著) 计算:S-Plus 考试:期中考试(随堂)和考试周的期末考试 必备知识:微积分,概率论,线性代数
15.075,应用统计学课程大纲 数据收集 数据分析和总结 概率论回顾 统计的抽样分布 推断:点估计和置信区间估计,假设检验 线性回归 方差分析 非参数方法 ·专题(数据挖掘?)
3 15.075,应用统计学课程大纲 • 数据收集 • 数据分析和总结 • 概率论回顾 • 统计的抽样分布 • 推断:点估计和置信区间估计,假设检验 • 线性回归 • 方差分析 • 非参数方法 • 专题(数据挖掘?)
统计学 收集和分析数据以得到结论并作出决策 的科学”。 Tamhane, a jit C, Dorothy D. Dunlop statistics and Data Analysis from Elementary to Intermediate, Prentice Hall, 2000, pp. I 统计不能完全代替判断” Henry c
4 统计学 “收集和分析数据以得到结论并作出决策 的科学”。 Tamhane ,Ajit C.,Dorothy D.Dumlop Statistics and Data Analysis from Elementary to Intermediate, Prentice Hall,2000,pp.1. “统计不能完全代替判断”。 Henry Clay
“米”是怎样被定义的? 本初子午线(从赤道到南极或北极的距 离)的四十万分之一。 但是—这是不精确的。 为什么?
5 “米”是怎样被定义的? 本初子午线(从赤道到南极或北极的距 离)的四十万分之一。 但是——这是不精确的。 为什么?
Ken alder著的 The measure of all things中描 述了两个法国天文学家 Delambre和 Mechain在 法国大革命时期测量地球圆周的尝试 利用三角测量法测定巴塞罗那和敦克尔克之间 的距离。 需要知道每个末端的纬度(通过测量星星的高 度)。 几个月延伸到几年。 Mechain得到了相互矛盾的信息,隐瞒了一些 他的数据
6 Ken Alder著的The Measure of All Things 中描 述了两个法国天文学家Delambre 和 Mechain 在 法国大革命时期测量地球圆周的尝试。 利用三角测量法测定巴塞罗那和敦克尔克之间 的距离。 需要知道每个末端的纬度(通过测量星星的高 度)。 几个月延伸到几年。 Mechain得到了相互矛盾的信息,隐瞒了一些 他的数据
The measure of all things第214页 错误是什么?当出现错误时,谁能指出 来呢?精确到什么程度就足够精确了呢? Mechain和他的同事都没有给出令人信服 的答案,他们完全不懂得统计方法。” 引自 Alder Ken, The measure of all things;:The Seven-Year odyssey and hidden error that transformed the World, Free Press. 2003
7 The Measure of All Things 第214 页 “错误是什么?当出现错误时,谁能指出 来呢 ?精确到什么程度就足够精确了呢? Mechain和他的同事都没有给出令人信服 的答案,他们完全不懂得统计方法。 ” 引自Alder,Ken,The Measure of All Things :The Seven-Year Odyssey and Hidden Error that Transformed the World,Free Press,2003
数据:一系列的度量 特征型 名义型:例如颜色:红,绿,蓝。 二值型:例如(MF),(HT),(0,1)。 序次型:例如对战争的态度:同意,中立,不同意。 数值刑 离散型:例如儿童的数量。 连续型:例如距离,时间,温度。 间距型:例如华氏温度。 比率型(存在真正的零点):例如距离,儿童的数
8 数据:一系列的度量 特征型: 名义型:例如颜色:红,绿,蓝。 二值型:例如(M,F),(H,T),(0,1)。 序次型:例如 对战争的态度:同意,中立,不同意 。 数值型: 离散型:例如儿童的数量。 连续型:例如距离,时间,温度。 间距型:例如华氏温度。 比率型(存在真正的零点):例如距离,儿童的数 量
S-P!us数据文件: cu summary
9 S-Plus数据文件:cu.summary
概念 总体 所有个体的总和(有限的或者无限的)。 例如麻省理工学院的所有学生。 样本: 实际观察到的总体的一个子集。 例如在这个教室的学生。 变 里: 每个个体的性质或属性。例如:年龄,高度。 观测值: 每个个体所有变量的值。 数据文件通常被设计成矩阵形式,行对应于观测 值,列对应于变量
10 概念 总体: 所有个体的总和(有限的或者无限的)。 例如麻省理工学院的所有学生。 样本: 实际观察到的总体的一个子集。 例如在这个教室的学生。 变量: 每个个体的性质或属性。例如:年龄,高度。 观测值: 每个个体所有变量的值。 数据文件通常被设计成矩阵形式,行对应于观测 值,列对应于变量