综合搜索课件包文库(113)
文档格式:PDF 文档大小:831.52KB 文档页数:8
1.1 什么是数据挖掘. 2 1.2 数据挖掘的步骤. 2 1.3 数据挖掘的主要功能. 4 1.3.1 预测性.4 1.3.2 描述性.5 1.4 在何种数据上进行数据挖掘. 7 1.4.1 数据库数据.7 1.4.2 数据仓库.8 1.4.3 事务数据.8 1.5 数据挖掘的工具. 8 1.6 数据挖掘研究的主要方向. 9 1.6.1 数据挖掘的方法.9 1.6.2 用户交互技术.9 1.6.3 数据挖掘的性能和可扩展性.9 1.6.4 针对不同数据或数据源的数据挖掘技术 .9 1.7 数据挖掘的应用领域. 10 1.8 SPSS Modeler 软件使用概述. 10 1.8.1 软件简介.10 1.8.2 软件窗口.12 1.8.3 数据流的基本操作.13
文档格式:PDF 文档大小:496.04KB 文档页数:6
2.1 数据类型. 2 2.1.1 离散型数据.2 2.1.2 连续型数据.2 2.2 数据预处理. 2 2.2.1 数据预处理的原因.2 2.2.2 数据预处理的主要步骤.3 2.3 数据清理. 5 2.3.1 空缺值.5 2.3.2 噪声数据.5 2.4 数据集成. 7 2.4.1 实体识别问题.7 2.4.2 数据冗余.7 2.4.3 元组重复.8 2.5 数据归约. 8 2.5.1 数据立方体聚集.9 2.5.2 维归约.10 2.5.3 数量归约.11 2.5.4 数据压缩.12 2.6 数据变换. 12 2.6.1 数据规范化.12 2.6.2 数据离散化与概念分层.13 2.7 数据预处理的软件操作(SPSS Modeler). 16 2.7.1 数据类型.16 2.7.2 数据清理.17 (1)缺失值与无效值.17 (2)孤立值和极值.22 2.7.3 数据集成.25 (1)纵向追加.25 (2)横向合并.26 (3)元组重复.28 2.7.4 数据归约.29 (1)抽样.29 (2)分箱.32 (3)特征选择.36 (4)因子分析.37 2.7.5 数据变换.40
文档格式:PDF 文档大小:1.93MB 文档页数:427
应用经济学 计量经济学前沿 数据分析软件应用 Python数据分析 博弈论与信息经济学 产业经济学 产业经济学前沿 产业政策专题 发展经济学 环境经济学 机器学习与深度学习 金融风险管理 金融工程 金融经济学 金融实证研究 金融学前沿 科技金融 量化金融前沿 商业伦理与社会责任 生态经济学 时间序列分析 实验经济学 数量经济研究方法 数字经济发展与治理 数字经济学 数字经济专题 投资学 文献阅读与写作 文献阅读与学术写作实践 新制度经济学 中级宏观经济学 中级计量经济学 中级微观经济学 工商管理学 数字营销与消费者行为学 创新创业研究 大数据分析与挖掘 高级管理会计(双语) 会计前沿研究 领导力与组织沟通 企业文化与跨文化管理 数字企业管理 现代企业管理前沿讲座 应用计量经济学 运营管理专题 战略管理研究 质量管理前沿讲座 高级审计理论与实务 公司治理前沿研究 社会科学研究方法 组织行为学 MBA 新时代中国特色社会主义理论与实践 高级商务英语 数据分析与决策 信息系统与信息资源管理 会计学 运营管理 管理经济学 管理学 战略管理 营销管理 人力资源管理 财务管理 公司治理 MBA管理案例研究 项目管理 数字化运营管理 数字化营销 资本运作 数字化商业模式创新 数据资产与数据治理 企业经营模拟实训 大数据财务决策 专业实践 创新创业管理 MPACCS 宏观经济学 公司战略与风险管理 财务会计理论与实务 管理会计理论与实务 财务管理理论与实务 审计理论与实务 商业伦理与会计职业道德 会计专业英语(双语) RPA财务机器人开发与应用 企业数字化运营沙盘模拟 财务报表分析 会计应用研究方法与学位论文写作 大数据审计 机器学习与财务数据挖掘 ESG理论与实务 会计前沿专题
文档格式:PPT 文档大小:917.5KB 文档页数:62
从数据分析的角度看,数据挖掘可以分为描述 性挖掘和预测性挖掘 描述性挖掘:以简洁概要的方式描述数据,并提供 数据的有趣的一般性质。 预测性数据挖掘:通过分析数据建立一个或一组模 型,并试图预测新数据集的行为
文档格式:PDF 文档大小:952.1KB 文档页数:52
1 降维算法简介 2 四大降维算法 3 主成分分析
文档格式:PPT 文档大小:102.5KB 文档页数:23
一、理解对大型的、复杂的和信息丰富的数据集进行分析的必要性。 二、明确数据挖掘过程的目标和首要任务。 三、描述数据挖掘技术的起源。 四、了解数据挖掘过程所具有的迭代过程和基本步骤。 五、解释数据的质量对数据挖掘过程的影响。 六、建立数据仓库和数据挖掘之间的联系
文档格式:PDF 文档大小:809.62KB 文档页数:12
4.1 概述. 1 4.1.1 什么是聚类分析.1 4.1.2 基本聚类方法概述.2 4.1.3 文本聚类.3 4.2 数据间的相似性度量. 4 4.2.1 数据对象间的距离.4 4.2.2 数据对象间的相似系数.5 4.2.3 数据类间的距离.5 4.2.4 数据标准化.7 4.3 基本聚类方法. 7 4.3.1 k-均值聚类方法 .7 4.3.2 层次聚类方法.8 4.3.3 聚类要注意的问题.10 4.4 基于密度的聚类(待更新). 10 4.5 聚类结果的评估. 10 4.5.1 基于用户验证的评估方法.11 4.5.2 基于真实数据的聚类结果评估.11 4.6 聚类分析的案例与软件操作. 11 4.6.1 K-MEANS 聚类案例(SPSS Modeler).11 4.6.2 K-MEANS 聚类案例(R 语言) .15 4.6.3 层次聚类案例(SPSS).20 4.6.4 层次聚类案例(R 语言).23
文档格式:PPTX 文档大小:2.37MB 文档页数:50
• 业务理解 • 数据理解 • 数据质量问题与预处理 • 数据分析常见陷阱 • 数据分析方法的选择 • 数据分析结果的评价 • 数据分析团队的组建 • 数据分析人才培养的难题
文档格式:PDF 文档大小:5.2MB 文档页数:61
 机器学习是数据分析与挖掘的一种手段  机器学习是什么?  利用经验改善系统自身的性能  关于T和P,程序对E进行学习  Looking for a function  机器学习发展史  人工智能三阶段:推理期、知识期、学习期  深度学习∈机器学习∈人工智能  机器学习基本术语  回归、分类;模型、学习器;样本、样例……  模型选择:奥卡姆剃刀?NFL?
文档格式:PPTX 文档大小:5.33MB 文档页数:33
• 数据挖掘算法没有好坏,根据数据与数据分析需求的特点确定算法 • 数据挖掘建模标准(CRISP-DM) – 定义商业问题,理解业务背景,了解业务需求 – 数据探索、预处理与分析 – 确定可能的模型,并验证评估 – 选择分析较优算法,并进一步调优 – 应用部署模型
12345678下页末页
热门关键字
搜索一下,找到相关课件或文库资源 113 个  
©2008-现在 cucdc.com 高等教育资讯网 版权所有