正在加载图片...
第3期 蔡文,等:评价信息元及其原信息元的获取方法 .237· 0. Ct, c(0)1 C,1☒2⑧…☒n) , c3(0) 例如,某企业的电费这一评价特征对应的评价 : 信息元可以用各部门用电量之和与电价之积来计 c,c(0) 算.因而,各部门和它们用电量组成的信息元就是该 是评价信息元D=(I,d,d(I))的原信息元. 企业和电费组成的信息元的原信息元, 若评价特征d的相关特征为d',d又与C中的 3.1.3用信息元的蕴含性确定原信息元 特征c'相关,由相关性的传递性,d与c'相关,因此, 有的评价信息元在已有的数据库中无法得到, c'可以是d的原特征.进而,若d的相关特征集为 但利用信息元的蕴含性,可以从数据库中找到相应 {d'},数据库中的特征集为{c},则{d'}∩{c}= 的原信息元.根据信息元的蕴含性,有如下规则: {c(d')}中的特征也是d的原特征.由此可见,要找 规则4给定信息元集 到数据库中d的原特征,可以先求出d的相关特征 {I}={L1I=(0,C,V),i=1,2,…,n}, 集,再找它与{c}的交集, 若 3.1.2用信息元的可扩性确定原信息元 D=(0,d,)=(O,c',)=, 利用信息元的可结合性和可分解性,可以从数 则是D的原信息元,c'是d的原特征. 据库得到评价信息元的原信息元.例如,对移动电话 3.1.4用信息元的发散性确定原信息元 的通讯数据而言,可以按以下几类消费者进行分类: 利用信息元的发散性,也可以获得评价信息元 1)稳定型消费者,他们使用移动电话不随时间 的原信息元,有如下规则: 的变化而变化; 规则5给定信息元集 2)增长型消费者,他们使用移动电话的时间不 {L}={L1L=(0,C,y),i=1,2,…,n}, 断增加; 和评价信息元 3)接受型消费者,他们大多只接收电话: D=(I,d,a)=[(0,c,),d,a], 4)发送型消费者,他们大多数情况下向外打电话. 若 那么,如何确定这4类消费者呢?可以用“使 I=(0,c,)一1=(0。,c,) 用电话稳定度”和“使用时间增长度”这2个评价特 一l=(0。,C,Vo)e{I}, 征.但数据库中并没有这2个特征,却有“通话次 其中ioe{i=1,2,…,n},则"是D的原信息元 数”和“通话时间”2个特征,利用后两个特征的信息 3.2寻找原信息元的注意事项 元按月份进行分解,再汇总,可以得到所需要的2个 寻找原信息元要依靠人们和计算机的知识库中 评价特征的原信息元。 的知识,包括:常识、公式、领域知识等.在可拓数据 与相关特征类似,对于评价特征d,可以先求出 挖掘工作中,不断积累这些原特征和原信息元,可以 d的可扩特征集{d,},那么,{c(d,)}={d,}n{c} 为下一次挖掘工作服务. 中的特征可以作为d的原特征,再计算出相应的原 寻找原信息元是为了挖掘有用的知识因此,对 信息元和评价特征元, 所得到的原信息元必须进行评价,选择优者,淘汰劣 以下规则中的符号,如无特别说明,均与规则1 者.这种评价可以利用已有的知识、历史资料和数据 相同,此处不再赘述 挖掘得到的专业知识以及优度评价法综合处理.有 根据信息元的可扩性,有如下规则: 时,若干原信息元可以表示同一件事情,则择其优者 规则2给定信息元集 而用之 {I}={Ill=(0,C,),i=1,2,…,n}, 4结束语 若c·a=d,即和ca是d的原特征,则(0,S, ,)和(0,C2,2)是(0,d,u)的原信息元,且 本文研究了评价信息元及其相应的原信息元的 获取方法与规则,这是可拓数据挖掘的基础工作,为 (1,d,a)=(0,G·c五,·"影) 从数据库中获取可拓分类知识提供了理论基础。 规则3给定信息元集 {L}={Il1=(0,C,),i=,1,2,…,n}, 参考文献: 9是d的原特征,且01⑧02⑧…⑧0,=0,则(0,9, [1]陈安,陈宁,周龙骧,等.数据挖掘技术及应用[M] 1⑧m2⑧…⑧,)是(I,d,u)的原信息元,且 北京:科学出版社,2006 (1,d,)=(01☒02☒…☒0, [2]陈文伟.数据仓库与数据挖掘教程[M].北京:清华大
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有