点击切换搜索课件文库搜索结果(859)
文档格式:PDF 文档大小:1.21MB 文档页数:13
针对分类数据, 通过数据对象在属性值上的集中程度定义了新的基于属性值集中度的类内相似度(similarity based on concentration of attribute values, CONC), 用于衡量聚类结果中类内各数据对象之间的相似度; 通过不同类的特征属性值的差异程度定义了基于强度向量差异的类间差异度(dissimilarity based on discrepancy of SVs, DCRP), 用于衡量两个类之间的差异度.基于CONC和DCRP提出了新的分类数据聚类有效性内部评价指标(clustering validation based on concentration of attribute values, CVC), 它具有以下3个特点: (1)在评价每个类内相似度时, 不仅依靠类内各数据对象的特征, 还考虑了整个数据集的信息; (2)采用几个特征属性值的差异评价两个类的差异度, 确保评价过程不丢失有效的聚类信息, 同时可以消除噪音的影响; (3)在评价类内相似度及类间差异度时, 消除了数据对象个数对评价过程的影响.采用加州大学欧文分校提出的用于机器学习的数据库(UCI)进行实验, 将CVC与类别效用(category utility, CU)指标、基于主观因素的分类数据指标(categorical data clustering with subjective factors, CDCS)指标和基于信息熵的内部评价指标(information entropy, IE)等内部评价指标进行对比, 通过外部评价指标标准交互信息(normalized mutual information, NMI)验证内部评价效果.实验表明相对其他内部评价指标, CVC指标可以更有效地评价聚类结果.此外, CVC指标相对于NMI指标, 不需要数据集以外的信息, 更具实用性
文档格式:PDF 文档大小:358.08KB 文档页数:8
CABOSFV_C是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩.该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导.针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法(heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的角度出发,在聚类数上限参数的约束下,应用新的内部聚类有效性评价指标(clustering validation index based on sparse feature dissimilarity,CVISFD)进行启发式度量,从而实现对聚类层次的自动选取.UCI基准数据集的实验结果表明,HABOS有效地提高了聚类准确性和稳定性
文档格式:PDF 文档大小:466.76KB 文档页数:42
南京大学:《面向对象技术 OOT》课程教学资源(教材电子版)06 Abstract data types
文档格式:PDF 文档大小:315.71KB 文档页数:4
上海交通大学:《电力系统自动化》课程教学资源(推荐论文)A universal system for laboratory data acquisition and control
文档格式:PDF 文档大小:4.64MB 文档页数:112
《现代通信网》课程教学资源(参考教材)Data Networks(Second Edition)Point-to-Point Protocols and Links
文档格式:PDF 文档大小:2.11MB 文档页数:37
上海交通大学:《现代通信网》课程教学资源(讲义)DELAY MODELS IN&DATA NETWORKS
文档格式:PDF 文档大小:10.23MB 文档页数:283
第一章EViews软件使用初步 第二章线性回归分析 第三章非线性模型 第四章传统时间序列分析 第五章ARMA模型应用 第六章动态计量模型基础 第七章多方程模型 第八章条件异方差模型 第九章Panel Data模型 第十章离散及受限因变量模型 第十一章EViews编程基础
文档格式:PDF 文档大小:1.26MB 文档页数:16
上海交通大学:《热力学 Thermodynamics(I)》课程教学资源(课件讲义)Lecture 31_Retrieve entropy data
文档格式:PDF 文档大小:1.13MB 文档页数:49
Overview UML Component Diagram and Deployment Diagram Hardware Software Mapping Data Management Global Resource Handling and Access Control Software Control Boundary Conditions
文档格式:PPT 文档大小:278.5KB 文档页数:72
❖ 线性表 ❖ 顺序表 ❖ 链表 ❖ 顺序表与链表的比较
首页上页3031323334353637下页末页
热门关键字
搜索一下,找到相关课件或文库资源 859 个  
©2008-现在 cucdc.com 高等教育资讯网 版权所有