正在加载图片...
数据挖掘对聚类分析的要求(1) 可扩展性( Scalability) 口大多数来自于机器学习和统计学领域的聚类算法在处理数百 条数据时能表现出高效率 处理不同数据类型的能力 ¤数字型;二元类型,分类型/标称型,序数型,比例标度型等 ■发现任意形状的能力 口基于距离的聚类算法往往发现的是球形的聚类,其实现实的 聚类是任意形状的 用于决定输入参数的领域知识最小化 ¤对于高维数据,参数很难决定,聚类的质量也很难控制 处理噪声数据的能力 口对空缺值、孤立点、数据噪声不敏感数据挖掘对聚类分析的要求 (1) ◼ 可扩展性(Scalability) ❑ 大多数来自于机器学习和统计学领域的聚类算法在处理数百 条数据时能表现出高效率 ◼ 处理不同数据类型的能力 ❑ 数字型;二元类型,分类型/标称型,序数型,比例标度型等 等 ◼ 发现任意形状的能力 ❑ 基于距离的聚类算法往往发现的是球形的聚类,其实现实的 聚类是任意形状的 ◼ 用于决定输入参数的领域知识最小化 ❑ 对于高维数据,参数很难决定,聚类的质量也很难控制 ◼ 处理噪声数据的能力 ❑ 对空缺值、孤立点、数据噪声不敏感
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有