系统分析方法 秦华鹏 北京大学深圳研究生院 环境与城市学院 办公室:E414 电话:0755-26035291 Email:ginhuapeng@iee.pku.edu.cn 2006年3月
系统分析方法 秦华鹏 北京大学深圳研究生院 环境与城市学院 办公室:E414 电话:0755-26035291 Email:qinhuapeng@iee.pku.edu.cn 2006年3月
第3讲系统分类与因子分析 聚类分析 主成分分析 三因子分析
第3讲 系统分类与因子分析 一 聚类分析 二 主成分分析 三 因子分析
聚类分析 o引言 o距离与相似系数 o类间距离 o数据标准化处理 o系统聚类分析 o应用实例
一 聚类分析 引言 距离与相似系数 类间距离 数据标准化处理 系统聚类分析 应用实例
1.1引言 o从实例谈起 o聚类的功能 o聚类为探索性分析方法 o聚类的几何表达
1.1引言 从实例谈起 聚类的功能 聚类为探索性分析方法 聚类的几何表达
从实例谈起 o分类现象无所不在 >医学领域 图书馆 >生活中 >经济领域 o分类是认识世界的方式,也是管理世界的 有效手段。许多科学的研究都是从分类研 究出发的
从实例谈起 分类现象无所不在 ➢ 医学领域 ➢ 图书馆 ➢ 生活中 ➢ 经济领域 ➢ … 分类是认识世界的方式,也是管理世界的 有效手段。许多科学的研究都是从分类研 究出发的
聚类的功能 o是一种建立分类的多元统计方法,它将 组样品或变量,按照它们在性质上的“亲 疏程度”,在“没有先验知识”的情况下, 进行自动分类。 指没有事先指定分类标准
聚类的功能 是一种建立分类的多元统计方法,它将一 组样品或变量,按照它们在性质上的“亲 疏程度”,在“没有先验知识”的情况下, 进行自动分类。 指没有事先指定分类标准
聚类为探索性分析方法 o根据数据自动分类 o事先不用给出分类的标准 o聚类方法不同,结果有可能不同
聚类为探索性分析方法 根据数据自动分类 事先不用给出分类的标准 聚类方法不同,结果有可能不同
聚类的几何表达 o对于单一指标或两指标聚类,可以在一维 或二维空间中将样本点的分布直观表达 o例:商厦的客户评分数据 商厦客户评分 100 怄80 次70 60 50 50 60 70 90 购物环境
聚类的几何表达 对于单一指标或两指标聚类,可以在一维 或二维空间中将样本点的分布直观表达 例:商厦的客户评分数据 编号 购物环境 服务质量 A商厦 73 68 B商厦 66 64 C商厦 84 82 D商厦 91 88 E商厦 94 90 商厦客户评分 50 60 70 80 90 100 50 60 70 80 90 100 购物环境 服务质量
12距离和相似系数 o聚类分析是根据相似性和差异性来进行 o距离是事物之间差异性的测度 o相似系数则是其相似性的测度
1.2 距离和相似系数 聚类分析是根据相似性和差异性来进行 距离是事物之间差异性的测度 相似系数则是其相似性的测度
(1)距离测量方法 o以对样本的聚类为例: o样本若有n个变量,则可以将样本看成是 个n维空间的一个点,样本之间的距离 就是n维空间点与点之间的距离
(1)距离测量方法 以对样本的聚类为例: 样本若有n个变量,则可以将样本看成是 一个n维空间的一个点,样本之间的距离 就是n维空间点与点之间的距离