正在加载图片...
果瓦系数可以用于各种测度的变量。 (1)简单匹配系数 对于二分类变量,关联测度的出发点是要估计研究对象在回答这些问题时的 致程度,所以最简单的关联测度是两个案例在所有的聚类变量上答案相同的情 况出现的频率,它被定义为简单匹配系数。 如果我们用1代表“是”,0代表“否”,任意两个案例的回答结果表示如下 案例2 案例1 0 1aC b 0 d 则简单匹配系数可以表示为 atd h+c+d S为两个案例之间的相似性,变化范围从0到1。 其中,a表示两个案例都回答是“1”的频数;b表示案例1回答是“I”,案 例2回答是“0”的频数;c表示案例1回答是“0”,案例2回答是“1”的频数; d表示两个案例都回答是“0”的频数 (2)雅科比系数 简单匹配系数的缺点是,两个案例相似可能是因为他们都共同拥有某些特 征,也可能是因为他们都缺乏某些特征。雅科比系数在简单匹配系数的基础上 做了一些改进,它把两个案例都回答“否”的部分从公式中去掉,只考虑回答 ¨是”的部分,计算公式为 b+ (3)果瓦系数 果瓦系数优于前两个关联测度之处在于它允许聚类变量可以是名义变量、序 次变量和间距测度变量。定义为
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有