点击切换搜索课件文库搜索结果(384)
文档格式:PDF 文档大小:1.21MB 文档页数:13
针对分类数据, 通过数据对象在属性值上的集中程度定义了新的基于属性值集中度的类内相似度(similarity based on concentration of attribute values, CONC), 用于衡量聚类结果中类内各数据对象之间的相似度; 通过不同类的特征属性值的差异程度定义了基于强度向量差异的类间差异度(dissimilarity based on discrepancy of SVs, DCRP), 用于衡量两个类之间的差异度.基于CONC和DCRP提出了新的分类数据聚类有效性内部评价指标(clustering validation based on concentration of attribute values, CVC), 它具有以下3个特点: (1)在评价每个类内相似度时, 不仅依靠类内各数据对象的特征, 还考虑了整个数据集的信息; (2)采用几个特征属性值的差异评价两个类的差异度, 确保评价过程不丢失有效的聚类信息, 同时可以消除噪音的影响; (3)在评价类内相似度及类间差异度时, 消除了数据对象个数对评价过程的影响.采用加州大学欧文分校提出的用于机器学习的数据库(UCI)进行实验, 将CVC与类别效用(category utility, CU)指标、基于主观因素的分类数据指标(categorical data clustering with subjective factors, CDCS)指标和基于信息熵的内部评价指标(information entropy, IE)等内部评价指标进行对比, 通过外部评价指标标准交互信息(normalized mutual information, NMI)验证内部评价效果.实验表明相对其他内部评价指标, CVC指标可以更有效地评价聚类结果.此外, CVC指标相对于NMI指标, 不需要数据集以外的信息, 更具实用性
文档格式:PDF 文档大小:1.37MB 文档页数:11
针对经典K–means算法对不均衡数据进行聚类时产生的“均匀效应”问题,提出一种基于近邻的不均衡数据聚类算法(Clustering algorithm for imbalanced data based on nearest neighbor,CABON)。CABON算法首先对数据对象进行初始聚类,通过定义的类别待定集来确定初始聚类结果中类别归属有待进一步核定的数据对象集合;并给出一种类别待定集的动态调整机制,利用近邻思想实现此集合中数据对象所属类别的重新划分,按照从集合边缘到中心的顺序将类别待定集中的数据对象依次归入其最近邻居所在的类别中,得到最终的聚类结果,以避免“均匀效应”对聚类结果的影响。将该算法与K–means、多中心的非平衡K_均值聚类方法(Imbalanced K–means clustering method with multiple centers,MC_IK)和非均匀数据的变异系数聚类算法(Coefficient of variation clustering for non-uniform data,CVCN)在人工数据集和真实数据集上分别进行实验对比,结果表明CABON算法能够有效消减K–means算法对不均衡数据聚类时所产生的“均匀效应”,聚类效果明显优于K–means、MC_IK和CVCN算法
文档格式:PPT 文档大小:1.09MB 文档页数:56
6.1 数据库系统概述 1.1数据与信息 1.2计算机数据管理的发展 1.3数据库系统的组成 1.4数据和数据的联系 6.2 关系数据模型 2.1非关系模型与关系模型 2.2关系运算 2.3关系数据库标准语言SQL 6.3 关系数据库设计 6.4 数据库技术的发展动态
文档格式:PPT 文档大小:181.5KB 文档页数:34
9.1系统详细设计概述 9.1.1软件系统的详细设计 9.1.2数据库系统的详细设计 9.2数据库的逻辑设计 9.2.1数据库逻辑设计的过程 9.2.2关系数据库的逻辑设计 9.3数据库的物理设计 9.3.1获取数据库系统事务对象的基本信息 9.3.2确定数据库的存取方法 9.3.3确定数据库的存储结构 9.3.4数据的物理结构评价 9.4详细设计的工具 9.4.1程序流程图 9.4.2IPO图
文档格式:PPT 文档大小:348KB 文档页数:37
第9章DDB与WWW数据库和移动数据库 1.WW数据库系统的产生及其运行环境 2.WW数据库系统的体系结构 3.WW数据库 4.移动计算环境和移动数据系统参考模型 5.移动数据库中的数据管理 6.移动数据库系统实现技术和应用研究
文档格式:PPT 文档大小:259KB 文档页数:74
6.5 数据库的物理设计 6.5.1 数据库的物理设计的内容和方法 6.5.2 关系模式存取方法选择 6.5.3 确定数据库的存储结构 6.5.4 评价物理结构 6.6 数据库的实施 6.7 数据库运行与维护 6.8 小结
文档格式:PPT 文档大小:603KB 文档页数:39
• 1. 一组数据向其中心值靠拢的倾向和程度 • 2. 测度集中趋势就是寻找数据一般水平的 代表值或中心值 • 3. 不同类型的数据用不同的集中趋势测度 值 • 4. 低层次数据的集中趋势测度值适用于高 层次的测量数据,反过来,高层次数据的 集中趋势测度值并不适用于低层次的测量 数据 • 5. 选用哪一个测度值来反映数据的集中趋 势,要根据所掌握的数据的类型来确定
文档格式:PPT 文档大小:592KB 文档页数:16
第15章数据转换 15-1数据转换概 15-2导入数据 15-3导出数据 15-4DTS设计器 SQL Server2000为了支持企事业决策支持中浩瀚数据的处理,提供了令人欣慰的数据转换服务。本章介绍了DTS包、DTS任务、DTS连接和DTS工具,并叙述了 SQL Server中导入数据与导出数据的方法和DTS设计器的运用
文档格式:PPT 文档大小:252.5KB 文档页数:46
◼ 13.1 从数据库到数据仓库 ◼ 13.2 数据仓库的结构 ◼ 13.3 数据仓库的设计 ◼ 13.4 OLAP与数据仓库 ◼ 13.5 数据挖掘(data mining,DM) ◼ 13.6 决策支持系统与数据仓库 ◼ 13.7 SQL Server 2000的数据仓库 ◼ 13.8 小结 ◼ 13.9 习题
文档格式:PPT 文档大小:722.5KB 文档页数:52
数据库的存储结构分为逻辑存储结构和物理存储结构两种。 1、数据库的逻辑存储结构指的是数据库是由哪些性质的信息所 组成, SQL Server的数据库不仅仅只是数据的存储,所有与数 据处理操作相关的信息都存储在数据库中。实际上,sQL Server的数据库是由诸如表、视图、索引等各种不同的数据库 对象所组成,它们分别用来存储特定信息并支持特定功能,构 成数据库的逻辑存储结构
首页上页1314151617181920下页末页
热门关键字
搜索一下,找到相关课件或文库资源 384 个  
©2008-现在 cucdc.com 高等教育资讯网 版权所有