
第十二讲大数据在证券投资领域的运用
大数据在证券投资 领域的运用 第十二讲

章前导读证券投资领域大数据类型繁多结构复杂18.88结构化数据38.9922.88>使用优化的机器学习算法预测资产价格12.9811非结构化数据>扩展了大数据的来源56.18·大数据在证券投资领域应用程序化交易、量化交易、高频交易18.88》客户画像、精准营销
• 证券投资领域大数据类型繁多、结构复杂 结构化数据 ➢ 使用优化的机器学习算法预测资产价格 非结构化数据 ➢ 扩展了大数据的来源 • 大数据在证券投资领域应用 ➢ 程序化交易、量化交易、高频交易 ➢ 客户画像、精准营销

学习目标掌握机器学习预测资产价格的基本算法掌握文本分析构建金融情感字典的基本原理掌握量化交易、程序化交易、高频交易等概念掌握大数据在智能投顾中运用的基本原理及发展方向了解金融情感字典在预测未来股票价格的效果了解量化交易在中国发展的现状

目录CONTENT01020304机器学习文本分析大数据与证券大数据与智能投顾预测资产价格预测资产价格交易实践
C O N T E N T 目 录 01 02 03 04 机器学习 预测资产价格 文本分析 预测资产价格 大数据与证券 交易实践 大数据与智能投顾

PART01机器学习预测资产价格Q0e.eQe.0

机器学习预测A股市场资产价格020301女日研究目的研究对象研究发现1997年1月至2018比较经典OLS模型机器学习算法可年10月期间A股市场96以更好地挖掘因子与和多种机器学习和深个重要投资异象度学习模型对资产价股票未来收益之间的线性与非线性关系。格的预测能力
机器学习预测A股市场资产价格 1997年1月至2018 年10月期间A股市场96 个重要投资异象。 研究对象 01 02 比较经典OLS模型 和多种机器学习和深 度学习模型对资产价 格的预测能力。 研究目的 03 机器学习算法可 以更好地挖掘因子与 股票未来收益之间的 线性与非线性关系。 研究发现

机器学习预测A股市场资产价格传统模型非线性机器学习算法普通最小二乘法(OLS)支持向量机(SVM)、集成神经网络(EN-ANN)、极端梯度提升树(XGBoost)梯度提升树(GBDT)A线性机器学习算法深度学习算法同岭回归(Ridge)、Lasso深度前馈网络(DFN)、循弹性网络回归(Elastic环神经网络(RNN)、长短Net)、偏最小二乘(PLS)期记忆网络(LSTM)
机器学习预测A股市场资产价格 ◆传统模型 • 普通最小二乘法(OLS) ◆线性机器学习算法 • 岭回归(Ridge)、Lasso、 弹性网络回归(Elastic Net)、偏最小二乘(PLS) ◆深度学习算法 • 深度前馈网络(DFN)、循 环神经网络(RNN)、长短 期记忆网络(LSTM) ◆非线性机器学习算法 • 支持向量机(SVM)、集成 神经网络(EN-ANN)、极 端梯度提升树(XGBoost)、 梯度提升树(GBDT)

研究发现线性机器学习模型表现均略优于OLS。01驱动机器学习可预测性的核心因素与美02国股票市场有显著的差异。中国股市中的国有企业与国有持股的存03在可能会显著影响交易行为和定价
研究发现 • 线性机器学习模型表现均略优于OLS。 01 • 驱动机器学习可预测性的核心因素与美 国股票市场有显著的差异。 02 • 中国股市中的国有企业与国有持股的存 在可能会显著影响交易行为和定价。 03

PART02文本分析预测资产价格Q0e.eQe.0

文本分析大数据特征数据来源多样化发布主体:个人(如投资者、消费者)、企业、媒体、机构和政府相关职能部门数据体量呈几何级增长具体形式丰富多样FX数据发布频率高
文本分析大数据特征 ◆ 数据来源多样化 ➢ 发布主体:个人(如投资者、消费者)、企 业、媒体、机构和政府相关职能部门 ➢ 具体形式丰富多样 ◆ 数据体量呈几何级增长 ◆ 数据发布频率高