
机器学习与智能金融第五章物以类聚聚类
机器学习与智能金融 第五章 物以类聚 聚类

本讲主要内容聚类的经济学需求聚类算法与实现三聚类的金融案例
本讲主要内容 一 聚类的经济学需求 二 聚类算法与实现 三 聚类的金融案例

聚类分析(ClusterAnalysis)指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,聚类所要求划分的类是未知的。聚类是搜索簇的无监督学习过程。聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类
聚类分析(Cluster Analysis) 指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。 聚类所要求划分的类是未知的。 聚类是搜索簇的无监督学习过程。 聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个 分类的标准,聚类分析能够从样本数据出发,自动进行分类

为什么要聚类?商业领域其他面向客户动植物聚类、基因确定客户群聚类,获取对种群描绘客户特征固有结构的认识。压缩图片、影像,定制化客户管理修复文档
为什么要聚类? 商业领域 ——面向客户 ⚫ 确定客户群 其他 ⚫ 动植物聚类、基因 聚类,获取对种群 固有结构的认识。 ⚫ 描绘客户特征 ⚫ 定制化客户管理 ⚫ 压缩图片、影像, 修复文档

聚类的金融应用对企业客户进行聚类·贷款、存款、其他业务等为个人客户(家庭)推荐金融服务收入情况、消费习惯、风险偏好等为保险客户推荐适宜的保险合约等保险意识、健康需求、年龄层聚类分析在金融投资分析中的应用股票特征等
聚类的金融应用 对企业客户进行聚类 • 贷款、存款、其他业务等 为个人客户(家庭)推荐金融服务 • 收入情况、消费习惯、风险偏好等 为保险客户推荐适宜的保险合约等 • 保险意识、健康需求、年龄层 聚类分析在金融投资分析中的应用 • 股票特征等

本讲主要内容聚类的经济学需求聚类算法与实现三聚类的金融案例
本讲主要内容 一 聚类的经济学需求 二 聚类算法与实现 三 聚类的金融案例

聚类的金融应用K-means01层次聚类02
聚类的金融应用 K-means 层次聚类 01 02

(1)K-means算法K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。目标函数为最小化:(,-c)J(C.C.....C.) =1(=I j=)
(1)K-means算法 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小, 将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离 尽量的大。 目标函数为最小化:

原理图a表达了初始的数据集(2维)。假设分组数k-2。在图b中,随机选择两个点,标记为红色“质心”和蓝色“质心”,然后分别求样本中所有点到这两个质心的距离,并标记每个样本的类别为和该样本距离最小的质心的类别,如图c所示:(a)(b)(c)
原理 图a表达了初始的数据集(2维)。假设分组数k=2。 在图b中,随机选择两个点,标记为红色“质心”和蓝色“质心” ,然后分 别求样本中所有点到这两个质心的距离,并标记每个样本的类别为和该样本 距离最小的质心的类别,如图c所示:

原理对我们红色和蓝色两组点分别求其新的质心,如图d所示。图e和图f不断迭代图c和图d的过程,即将所有点的类别标记为距离最近的质心的类别并求新的质心,直到分类不再改变。(d)(f)e
原理 对我们红色和蓝色两组点分别求其新的质心,如图d所示。 图e和图f不断迭代图c和图d的过程,即将所有点的类别标记为距离最近的质 心的类别并求新的质心,直到分类不再改变