
第六讲树类分析及其在金融领域ATAO的应用
树类分析及其在金融领域 的应用 第六讲

章前导读树类分析是数据挖掘技术领域的一种重要方法,能够从一系列具有众多特征和标签的数据中总结出决策规则并用树状图的结构呈现这些规则作为金融平台来说,为了把控风险保证资金的流动性,就要提前预测未来一段时间内的用户购买和提现金额准确预测用户到期是否复投就变得至关重要
树类分析是数据挖掘技术领域的一种 重要方法,能够从一系列具有众多特 征和标签的数据中总结出决策规则, 并用树状图的结构呈现这些规则。 作为金融平台来说,为了把控风险, 保证资金的流动性,就要提前预测未 来一段时间内的用户购买和提现金额。 准确预测用户到期是否复投就变得至 关重要。 章前导读

学习目标熟悉决策树方法和随熟悉各种模型的优缺机森林的原理与代码点与评价指标20.55611.31掌握各种模型的具体了解树类分析方熟练运用回归决策应用情景,特别是金法的基本原理树和分析决策树等融领域的应用
1 2 3 4 5 了解树类分析方 法的基本原理 熟悉决策树方法和随 机森林的原理与代码 熟练运用回归决策 树和分析决策树等 熟悉各种模型的优缺 点与评价指标 掌握各种模型的具体 应用情景,特别是金 融领域的应用 学习目标

本讲内容树类分析方法概随机森林算法原理述及其应用场景04树类分析方法在02决策树算法原理金融领域的应用
树类分析方法概 述及其应用场景 随机森林算法原理 决策树算法原理 树类分析方法在 金融领域的应用 本讲内容

一、树类分析方法概述及其应用场景
一、树类分析方法 概述及其应用场景

第一节树类分析方法概述及其运用场景树类分析的应用场景树类分析主要包括非金融领域:决策树临床医学企业决策企业营销随机森林天文学基因研究.梯度提升决策树金融领域资产定价风险预测股票市场
第一节 树类分析方法概述及其运用场景 树类分析主要包括 决策树 随机森林 梯度提升决策树 树类分析的应用场景 临床医学 非金融领域: 企业营销 企业决策 天文学 基因研究 . 金融领域: 资产定价 风险预测 股票市场

树类方法概述与比较决策树最早产生于20世纪60年代,是由享特(Hunt)等人-研究人类概念建模时建立的学习系统(ConceptLearningSystem关键难点口建立决策树只六六人优点计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以直接处理分类型变量而不需要创建亚变量不足品存在过拟合的问题,泛化能力差
树类方法概述与比较 最早产生于20世纪60年代,是由亨特(Hunt)等人 研究人类概念建模时建立的学习系统(Concept Learning System) 优点 计算复杂度不高,输出结果易于理解,对中间值的缺失 不敏感,可以直接处理分类型变量而不需要创建哑变量 关键难点 建立决策树 不足 存在过拟合的问题,泛化能力差 决策树

树类方法概述与比较随机森林相比决策树的优点基本流程:不足:随机选择样本数据量大的情况下预算量大的问题随机选择特征在数据噪音比较大解决了模型的抗干扰能力的情况下会过拟合构建决策树易于实现:训练速度快突出优良特征随机森林投票
随机选择特征 构建决策树 随机森林投票 在数据噪音比较大 的情况下会过拟合 基本流程: 相比决策树的优点: 不足: 随机选择样本 解决了模型的抗干扰能力 易于实现;训练速度快; 突出优良特征 数据量大的情况下预算量 大的问题 树类方法概述与比较 随机森林

树类方法概述与比较梯度提升决策树Qlo0-0-0-0可00ola优点:训练效果好、适合低维以决策树为基分类器(一般是不足:弱学习器之间相互依赖稠密数据模型可解释性好CART树)进行选代的决策树难以并行训练数据、不适用高不需要做特征的归一化、可以算法维稀疏特征等自动选择特征、不易过拟合
树类方法概述与比较 优点:训练效果好、适合低维 稠密数据,模型可解释性好, 不需要做特征的归一化、可以 自动选择特征、不易过拟合 以决策树为基分类器(一般是 CART树)进行迭代的决策树 算法 不足:弱学习器之间相互依赖, 难以并行训练数据、不适用高 维稀疏特征等 梯度提升决策树

树类分析方法在金融领域的应用AB在资产定价中的应用在股票市场中的应用在风险预测中的应用决策树预测用户违约:获取项式期权定价模型充分利用庞大的交易数用户的历史数据,将贷款客使用离散概率来确定期据进行股票涨跌预测户不断分类,简化树的复杂权到期时的价值度,评估客户的信用等级
树类分析方法在金融领域的应用 在资产定价中的应用 在风险预测中的应用 二项式期权定价模型: 使用离散概率来确定期 权到期时的价值 在股票市场中的应用 决策树预测用户违约:获取 用户的历史数据,将贷款客 户不断分类,简化树的复杂 度,评估客户的信用等级 充分利用庞大的交易数 据进行股票涨跌预测