点击切换搜索课件文库搜索结果(101)
文档格式:PDF 文档大小:3.13MB 文档页数:77
• 聚类概述 • 什么是聚类?在IR中如何用聚类?聚类的几个术语 • K-均值聚类算法 • K-均值聚类中的基本准则 • K-均值算法中簇的个数 • 聚类评价 • purity、NMI(Normalized Mutual Information,)、RI(Rand Index)、F measure • 基于模型的聚类 • 层次聚类简介 • 层次聚类的簇相似度计算 • 四种HAC算法:单连接、全连接 、组平均、质心法
文档格式:PDF 文档大小:2.17MB 文档页数:73
如何建立词项词典? 文档解析:格式?语言?编码方式? 词条化:词条(Tokens)/词项(Terms) 停用词:停用词表?查表法 or 基于文档频率 词项归一化:等价类同义词扩展表 词形归并:am, are, is be 词干还原:去除单词两端词缀、Porter算法 如何实现倒排记录表? • 跳表:跳表指针(位置、个数、更新问题) • 短语查询 • 二元词索引扩展的二元词索引:词性标注 • 位置信息索引邻近查询 • 增加倒排记录表 • 混合索引机制
文档格式:PPTX 文档大小:23.47MB 文档页数:97
• 客户信用等级影响因素 – 客户信用卡申请数据预处理 – 信用卡申请成功影响因素 • 信用卡客户信用等级影响因素 • 基于消费的信用等级影响因素 • 信用卡欺诈判断模型 – 基于Apriori算法的欺诈模型 – 基于判别的欺诈模型 – 基于分类算法的欺诈模型
文档格式:PPTX 文档大小:2.54MB 文档页数:31
• 香水销售数据预处理 • 香水销售数据统计分析 • 影响香水销量的因素分析 • 香水适用场所关联分析 • 香水聚类分析 • 香水营销建议
文档格式:PDF 文档大小:465.96KB 文档页数:9
带钢热连轧是一个多阶段的生产过程,在工序繁多的加工过程中与产品质量直接相关的控制参数和目标参数近百个.如何找到控制参数和目标参数之间存在的信息加以利用,提高热轧带钢产品质量一直是科研人员和工程技术人员努力的目标.研究表明,利用数据挖掘方法结合热连轧生产的工业特点,提取潜在的、有用的、最终可理解的工艺知识,得到质量缺陷与控制状态的对应关联关系,通过控制变量权值向量和数据挖掘高危关联状态集合综合分析,可以迅速对带钢质量问题的产生原因进行定位,找出关键控制变量做出调整,减少经济损失,提高生产效率,为热轧带钢产品质量问题分析提供科学、准确的思路
文档格式:PPT 文档大小:208.5KB 文档页数:32
一、 商业电子表格制模(Excel) 二、 概率与统计简介 三、基础运筹学 四、数据挖掘技术
文档格式:PPT 文档大小:1.55MB 文档页数:56
6.1 机器学习概述 6.2 符号学习 6.3 神经网络学习 6.4 知识发现与数据挖掘
文档格式:PPTX 文档大小:2.51MB 文档页数:34
同济大学:《大数据分析与数据挖掘 Big Data Analysis and Mining》课程教学资源(PPT课件讲稿)K-means & EM
文档格式:PDF 文档大小:1.41MB 文档页数:21
中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)Accelerating Innovation Through Analogy Mining
文档格式:PDF 文档大小:1.07MB 文档页数:9
中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)BitFunnel Revisiting Signatures for Search
上页12345678下页末页
热门关键字
搜索一下,找到相关课件或文库资源 101 个  
©2008-现在 cucdc.com 高等教育资讯网 版权所有