第9卷第1期 智能系统学报 Vol.9 No.1 2014年2月 CAAI Transactions on Intelligent Systems Feb.2014 D0:10.3969/j.issn.1673-4785.201208037 网络出版地址:htp:/www.cmki.net/kcms/doi/10.3969/j.issn.1673-4785.201208037.html 本体知识拓展分析树在可拓策略生成系统的应用 温树勇,李卫华 (广东工业大学计算机学院,广东广州510006) 摘要:针对现有可拓策略生成系统分析矛盾问题难度较大这一问题,利用本体知识和决策树技术共同建立本体知 识拓展分析树。首先介绍本体知识拓展分析树模型的建立过程,研究本体知识拓展分析树在可拓策略生成中的应 用。然后通过所设计的算法分析本体知识拓展分析树的特征,找出矛盾的核心问题。最后以提高客户价值为例进 行实验,实验结果表明,对核心问题的相关特征进行可拓变换,比传统的可拓策略生成系统能更有效生成解决矛盾 问题的策略。 关键词:可拓变换;可拓策略生成;本体知识拓展分析树:本体知识:决策树 中图分类号:TP311文献标志码:A文章编号:1673-4785(2014)01-0115-06 中文引用格式:温树勇,李卫华.本体知识拓展分析树在可拓策略生成系统的应用[J].智能系统学报,2014,9(1):115120. 英文引用格式:WEN Shuyong,LI Weihua.Application of ontology knowledge expansion analysis tree in the extension strategy gen- eration system[J].CAAI Transactions on Intelligent Systems,2014,9(1):115-120. Application of ontology knowledge expansion analysis tree in the extension strategy generation system WEN Shuyong,LI Weihua (Faculty of Computer.Guangdong University of Technology,Guangzhou 510006,China) Abstract:In regard to the phenomenon that it is difficult for the existing extension strategy generating system to ana- lyze a contradiction problem,this paper discusses the ontology knowledge and the decision tree technology being u- tilized to jointly establish an ontology knowledge expansion analysis tree.The authors present the establishment process for the model of ontology knowledge expansion analysis tree,research the application of the ontology knowl- edge expanded analysis tree in extension strategy generation,analyze the features of the ontology knowledge expan- sion analysis tree using the designed algorithm,and find the core problem of contradiction.Finally,an experiment is done with improving a customer's value as example.The results show that,in comparison with the traditional gen- eration system of expandable strategy,carrying out expandable transform for the related characteristics of the core problem may more effectively generate strategies to solve contradiction problems. Keywords:extension transform;extension strategy generation;ontology knowledge expansion analysis tree;ontolo- gy knowledge;decision tree 在可拓学)的实践应用中,为了协助人们产生 法改进分析过程。 解决矛盾问题的策略,创建了一种可拓策略生成系 决策树)在分类和预测上有着广泛的应用,包 (extension strategy generating system,ESGS)(2 括在客户价值分析中的应用。本体是共享概念 但传统的ESGS分析矛盾问题的核心问题时比较困 的显式形式化说明),因此可以用可拓学的基元甚 难,产生策略的过程效率不高,因此必须结合其他方 至复合元[6建立该领域客观事物关系的可拓模型, 供计算机存储、检索和处理。 收稿日期:2012-08-28.网络出版日期:2014-02-20 本文将利用本体知识和决策树技术,构造出本 基金项目:广东省自然科学基金资助项目(10151009001000044). 体知识拓展分析树,探讨本体知识拓展分析树在可 通信作者:温树勇.E-mail:wenfengshanl11@163.com
第 9 卷第 1 期 智 能 系 统 学 报 Vol.9 №.1 2014 年 2 月 CAAI Transactions on Intelligent Systems Feb. 2014 DOI:10.3969 / j.issn.1673⁃4785.201208037 网络出版地址:http: / / www.cnki.net / kcms/ doi / 10.3969 / j.issn.1673⁃4785.201208037.html 本体知识拓展分析树在可拓策略生成系统的应用 温树勇,李卫华 (广东工业大学 计算机学院,广东 广州 510006) 摘 要:针对现有可拓策略生成系统分析矛盾问题难度较大这一问题,利用本体知识和决策树技术共同建立本体知 识拓展分析树。 首先介绍本体知识拓展分析树模型的建立过程,研究本体知识拓展分析树在可拓策略生成中的应 用。 然后通过所设计的算法分析本体知识拓展分析树的特征,找出矛盾的核心问题。 最后以提高客户价值为例进 行实验,实验结果表明,对核心问题的相关特征进行可拓变换,比传统的可拓策略生成系统能更有效生成解决矛盾 问题的策略。 关键词:可拓变换;可拓策略生成;本体知识拓展分析树;本体知识;决策树 中图分类号:TP311 文献标志码:A 文章编号:1673⁃4785(2014)01⁃0115⁃06 中文引用格式:温树勇,李卫华.本体知识拓展分析树在可拓策略生成系统的应用[J]. 智能系统学报, 2014, 9(1): 115⁃120. 英文引用格式:WEN Shuyong, LI Weihua. Application of ontology knowledge expansion analysis tree in the extension strategy gen⁃ eration system[J]. CAAI Transactions on Intelligent Systems, 2014, 9(1): 115⁃120. Application of ontology knowledge expansion analysis tree in the extension strategy generation system WEN Shuyong, LI Weihua (Faculty of Computer, Guangdong University of Technology, Guangzhou 510006, China) Abstract:In regard to the phenomenon that it is difficult for the existing extension strategy generating system to ana⁃ lyze a contradiction problem, this paper discusses the ontology knowledge and the decision tree technology being u⁃ tilized to jointly establish an ontology knowledge expansion analysis tree. The authors present the establishment process for the model of ontology knowledge expansion analysis tree, research the application of the ontology knowl⁃ edge expanded analysis tree in extension strategy generation, analyze the features of the ontology knowledge expan⁃ sion analysis tree using the designed algorithm, and find the core problem of contradiction. Finally, an experiment is done with improving a customers value as example. The results show that, in comparison with the traditional gen⁃ eration system of expandable strategy, carrying out expandable transform for the related characteristics of the core problem may more effectively generate strategies to solve contradiction problems. Keywords:extension transform; extension strategy generation; ontology knowledge expansion analysis tree; ontolo⁃ gy knowledge; decision tree 收稿日期:2012⁃08⁃28. 网络出版日期:2014⁃02⁃20. 基金项目:广东省自然科学基金资助项目(10151009001000044). 通信作者:温树勇. E⁃mail: wenfengshan111@ 163.com. 在可拓学[1]的实践应用中,为了协助人们产生 解决矛盾问题的策略,创建了一种可拓策略生成系 统( extension strategy generating system, ESGS) [2] 。 但传统的 ESGS 分析矛盾问题的核心问题时比较困 难,产生策略的过程效率不高,因此必须结合其他方 法改进分析过程。 决策树[3]在分类和预测上有着广泛的应用,包 括在客户价值分析中的应用[4] 。 本体是共享概念 的显式形式化说明[5] ,因此可以用可拓学的基元甚 至复合元[6]建立该领域客观事物关系的可拓模型, 供计算机存储、检索和处理。 本文将利用本体知识和决策树技术,构造出本 体知识拓展分析树,探讨本体知识拓展分析树在可
·116· 智能系统学报 第9卷 拓策略生成系统的应用问题,改进可拓策略生成系 一定条件下希望达到的结果,而L为影响目标实现 统分析核心问题的过程。以提高企业的客户价值为 的主客观因素,即条件。 研究点,通过决策树技术对客户样本训练集分类,找 由于决策树是数据挖掘的有效分类工具,通过 出分类的实质,即该矛盾的核心问题,以方便后面对 决策树分析原始数据,可以得到类似“如果L,则G 该问题应用可拓方法进行可拓变换,达到较快解决 的规则知识集。因此,可以利用本体知识和决策树 矛盾问题的目的。 技术建立本体知识拓展分析树,通过本体知识拓展 1传统可拓策略生成系统分析核问题 分析树分析矛盾问题中的条件L,找到影响目标G 实现的关键因素l。,建立核问题P。=go*。 的不足 本体知识拓展分析树的生成步骤如下。 目前,ESGS通常是先建立可拓模型,即建立问 1)根据实际问题,建立问题领域本体知识模 题P的核问题P的可拓模型为P。=g*o,其中, 型,得到相关领域知识。可拓策略生成系统中的本 g为问题的目标,,为问题的条件。再确定问题的 体是用基元/复合元表示。 关联函数K,然后对问题P。进行相容性分析,若不 2)以本体知识模型为基础,利用决策树技术, 相容(目标与条件有矛盾),则对问题的目标或条件 建立本体知识拓展分析树,这里的拓展分析主要指 进行可拓分析,得到问题的发散树或相关树,通过对 相关分析,但在某些情况下也能用发散、蕴含、可扩 问题发散树或相关树的“叶”基元进行可拓变换,生 分析。根据文献[7]介绍的决策树方法原理,求出 成候选策略集合。最后对策略集合中的策略进行优 针对所有属性c(=1,2,…,s)的信息增益G(c), 度评价,推荐优度较高的策略供决策者选择。这种 选择信息增益G(c:)最大的属性c,作为决策树的根 对问题发散树或相关树进行可拓变换的方法,采用 节点,并用相同的办法建立子树,直到递归划分完 的是从“叶子”到“根”,即从下到上的遍历方法,存 样本集为止,从而逐步生成了本体知识拓展分析树。 在着以下一些不足之处。 2.2本体知识拓展分析树在可拓策略生成中的应用 1)这种采用试探性解决矛盾问题的方法,需要 根据上述建立的本体知识拓展分析树,分析矛 依次对“叶”基元,即最小子问题进行可拓变换。当 盾问题中的条件,可以得到影响样本分类的关键节 采取某些变换后综合关联函数仍小于零时,则放弃 点,即核心问题。 这些变换(不成为策略),相当于试错法中发现了错 记样本为信息元Z。,假设得到一条矛盾问题样 的一步。这种方法不仅增加了程序运行的时间,而 本从根到该叶子节点路径为K:(c,),(c,), 且生成策略针对性不强。 …,(c。,),其中c。,c,…,c。为信息元Z中的任意 2)当变换一个“叶”基元满足不了目的时,需要 评价特征,,,…,为评价特征相对应的取值, 再对其他“叶”基元进行可拓变换,而这种可拓变换 对比另外一条相容问题的样本路径K2:(c。,:), 又可能产生传导变换,因此,这种试探性方法容易产 (c,),…,(c。,),就可以确定导致矛盾问题的关 生“组合爆炸”的计算复杂性问题,导致计算机无法 键节点为c。 解决。 因此可以通过下面算法得到本体知识拓展分析 可见,在ESGS中,有效找到核心问题并对其进 树中每个样本的路径。 行可拓变换至关重要,使可拓策略生成系统更加智 FineTreeNode Tree t,Node c) 能化。本文将介绍本体知识拓展分析树在可拓策略 Begin 生成系统中的应用,首先对训练集生成本体知识拓 If(t=null)return OK; 展分析树,通过分析该分析树,有效找出核心问题并 If(t→children!=nullt=c)Return t; 对其进行可拓变换生成策略,并且通过分析树预测 For (INT i=0;i<c-childs.length;i++) 变换的效果,产生准确的策略,减少策略生成中人为 FineTreeNode (Tree t-childs[i],Node c); 原因产生的误差。 End 2本体知识拓展分析树 在一般的实际应用中,可以根据相关实际,对特 征值分为高、中、低3个层次,因此可以设计以下算 2.1本体知识拓展分析树的生成 法,得到该路径中的关键节点,即核心问题。 根据文献[1-2]阐述:问题由目标和条件构成, CoreProblem(Node c) 可用一般模型P=G*L,其中G为目标,是问题P在 Begin
拓策略生成系统的应用问题,改进可拓策略生成系 统分析核心问题的过程。 以提高企业的客户价值为 研究点,通过决策树技术对客户样本训练集分类,找 出分类的实质,即该矛盾的核心问题,以方便后面对 该问题应用可拓方法进行可拓变换,达到较快解决 矛盾问题的目的。 1 传统可拓策略生成系统分析核问题 的不足 目前,ESGS 通常是先建立可拓模型,即建立问 题 P 的核问题 P0的可拓模型为 P0 = g0∗l 0 , 其中, g0为问题的目标,l 0为问题的条件。 再确定问题的 关联函数 K,然后对问题 P0进行相容性分析,若不 相容(目标与条件有矛盾),则对问题的目标或条件 进行可拓分析,得到问题的发散树或相关树,通过对 问题发散树或相关树的“叶”基元进行可拓变换,生 成候选策略集合。 最后对策略集合中的策略进行优 度评价,推荐优度较高的策略供决策者选择。 这种 对问题发散树或相关树进行可拓变换的方法,采用 的是从“叶子”到“根”,即从下到上的遍历方法,存 在着以下一些不足之处。 1)这种采用试探性解决矛盾问题的方法,需要 依次对“叶”基元,即最小子问题进行可拓变换。 当 采取某些变换后综合关联函数仍小于零时,则放弃 这些变换(不成为策略),相当于试错法中发现了错 的一步。 这种方法不仅增加了程序运行的时间,而 且生成策略针对性不强。 2)当变换一个“叶”基元满足不了目的时,需要 再对其他“叶”基元进行可拓变换,而这种可拓变换 又可能产生传导变换,因此,这种试探性方法容易产 生“组合爆炸”的计算复杂性问题,导致计算机无法 解决。 可见,在 ESGS 中,有效找到核心问题并对其进 行可拓变换至关重要,使可拓策略生成系统更加智 能化。 本文将介绍本体知识拓展分析树在可拓策略 生成系统中的应用,首先对训练集生成本体知识拓 展分析树,通过分析该分析树,有效找出核心问题并 对其进行可拓变换生成策略,并且通过分析树预测 变换的效果,产生准确的策略,减少策略生成中人为 原因产生的误差。 2 本体知识拓展分析树 2.1 本体知识拓展分析树的生成 根据文献[1⁃2]阐述:问题由目标和条件构成, 可用一般模型 P =G∗L,其中 G 为目标,是问题 P 在 一定条件下希望达到的结果,而 L 为影响目标实现 的主客观因素,即条件。 由于决策树是数据挖掘的有效分类工具,通过 决策树分析原始数据,可以得到类似“如果 L,则 G” 的规则知识集。 因此,可以利用本体知识和决策树 技术建立本体知识拓展分析树,通过本体知识拓展 分析树分析矛盾问题中的条件 L,找到影响目标 G 实现的关键因素 l 0 ,建立核问题 P0 = g0∗l 0 。 本体知识拓展分析树的生成步骤如下。 1)根据实际问题,建立问题领域本体知识模 型,得到相关领域知识。 可拓策略生成系统中的本 体是用基元/ 复合元表示。 2)以本体知识模型为基础,利用决策树技术, 建立本体知识拓展分析树,这里的拓展分析主要指 相关分析,但在某些情况下也能用发散、蕴含、可扩 分析。 根据文献[7]介绍的决策树方法原理,求出 针对所有属性 cj( j = 1,2,…,s)的信息增益 G( cj ), 选择信息增益 G(ci)最大的属性 ci作为决策树的根 节点,并用相同的办法建立子树,直到递归划分完 样本集为止,从而逐步生成了本体知识拓展分析树。 2.2 本体知识拓展分析树在可拓策略生成中的应用 根据上述建立的本体知识拓展分析树,分析矛 盾问题中的条件,可以得到影响样本分类的关键节 点,即核心问题。 记样本为信息元 Z0 ,假设得到一条矛盾问题样 本从根到该叶子节点路径为 K1 :( c 1 o,v 1 z ),( c 2 o,v 2 z ), …,(c i o,v i z),其中 c 1 o,c 2 o,…,c i o 为信息元 Z0中的任意 评价特征,v 1 z ,v 2 z ,…,v i z 为评价特征相对应的取值, 对比另外一条相容问题的样本路径 K2 :( c 1 o,v 1 z ), (c 2 o,v 2 z ),…,(c i o,v i z),就可以确定导致矛盾问题的关 键节点为 c l o。 因此可以通过下面算法得到本体知识拓展分析 树中每个样本的路径。 FineTreeNode ( Tree t, Node c) Begin If(t = null) return OK; If(t→children! = null ‖t = c)Return t; For (INT i =0;i<c→childs.length;i++) FineTreeNode (Tree t→childs[i],Node c); End 在一般的实际应用中,可以根据相关实际,对特 征值分为高、中、低 3 个层次,因此可以设计以下算 法,得到该路径中的关键节点,即核心问题 l 0 。 CoreProblem(Node c) Begin ·116· 智 能 系 统 学 报 第 9 卷
第1期 温树勇,等:本体知识拓展分析树在可拓策略生成系统的应用 .117. If(c.parentArrtibute.equals(middle)ll 高客户价值”,L是“存在潜在价值客户”,要用本体 c.parentArrtibute.equals(low)) 知识拓展分析树分析条件一“潜在价值客户”。 return c→parent 1)根据文献[10],建立客户价值的本体知识模 Else 型,如图1所示。根据当前价值和潜在价值进行客 While(c→parent!=null) 户细分,可以得到低价值、潜价值、次价值和价值客 Begin 户群体[。从本体知识中得知,客户价值与购买数 c=c-parent 量、品牌忠诚度等属性有关。 CoreProblem(c-parent) End 客户价值 For Int i=0;i<c-childs.length;i++) CoreProblem(c-childs[i]) End 当前价值 潜在价值 这里,如果该叶子所对应的父节点属性为“中” 或“低”时,父节点即核心矛盾,如果叶子所在父节 点为“高”时,其核心问题应用同样的方法分析其父 节点。 毛利润 购买量 务成本 此外,还可以通过决策树对可拓策略的结果进 诚或信任 行定性的预测,提高策略的准确性。Forecast(String []data)的算法如下所示。 图1客户价值的本体知识模型 Forecast(String[data,Node node) Fig.1 The ontology model of customer value Begin 2)根据文献[7]中的方法,利用综合关联函数 If(c→children!=null)Return t; 对原始数据表进行处理,从表1中的前5个属性可 Node[childs=node.childNodesArray; 以看出,客户的平均单位产品支付最高为750元,最 For Int i=0;i<c-childs.length;i++) 低为180元:购买数量最多为10件,最少为1件:月 Begin 收入最高为6500元,最低为2500元:品牌忠诚度 f(c→childs[i]!=null) 最高为5,最低为1。为简单起见,利用可拓学的简 If(c-childs[i].parentArrtibute. 单关联函数和离散关联函数分别建立关于评价特征 equals(printData[index])) d(i=1,2,…,13:j=1,2,3,4)的关联函数K(x): Forecast(data,c-childs[i]) End K.()=-300-4-300 750-180570 End K()=-3-3 提高客户价值实验 10-1- 9 3 x-4000x:-4000 3.1客户价值案例 K(x)=6500-2500 4000 文献[8]提出:根据帕累托原则,一个公司80% 1, x4k=5 的盈利是由20%的客户创造的。从收益管理的角 0.5,x=4 度,并非所有的客户对企业都是同等重要,这就要求 K(x4:)= 0, x6=3 企业按照一定的规则对客户进行分类,能够根据不 -0.5,x5=2 同的客户群体进行有目的性、针对性的投入,从而提 高客户价值,减少因为盲目投入造成不必要的浪费。 -1, x4h=1 在对客户群体进行分类时,不仅要参照该客户 根据客户价值理论,客户价值分为当前价值CV 和潜在价值PV,其关联函数为 群体当前的价值表现,而且还需要对客户群体潜在 价值进行预测判断。因此,客户价值应该从客户当 Kcv=(K(x)+K2(x)+K3(x))/3 前价值和潜在价值2个方面进行评价[)。以提高 Kpy =K4(x4) 因此,可以对客户群体进行分类,得到的关联函 客户价值为例,问题模型为P=G*L,其中G是“提 数值和客户分类如表1所示
If(c.parentArrtibute.equals(middle)‖ c.parentArrtibute.equals(low)) return c→parent Else While(c→parent! = null) Begin c = c→parent CoreProblem(c→parent) End For (Int i =0; i<c→childs.length; i++) CoreProblem(c→childs[i]) End 这里,如果该叶子所对应的父节点属性为“中” 或“低”时,父节点即核心矛盾,如果叶子所在父节 点为“高”时,其核心问题应用同样的方法分析其父 节点。 此外,还可以通过决策树对可拓策略的结果进 行定性的预测,提高策略的准确性。 Forecast( String [] data)的算法如下所示。 Forecast(String[] data, Node node) Begin If(c→children! = null) Return t; Node[] childs = node.childNodesArray; For (Int i=0; i<c→childs.length;i++) Begin If (c→childs[i]! = null) If(c→childs[i].parentArrtibute. equals(printData[index])) Forecast(data, c→childs[i]) End End 3 提高客户价值实验 3.1 客户价值案例 文献[8]提出:根据帕累托原则,一个公司 80% 的盈利是由 20%的客户创造的。 从收益管理的角 度,并非所有的客户对企业都是同等重要,这就要求 企业按照一定的规则对客户进行分类,能够根据不 同的客户群体进行有目的性、针对性的投入,从而提 高客户价值,减少因为盲目投入造成不必要的浪费。 在对客户群体进行分类时,不仅要参照该客户 群体当前的价值表现,而且还需要对客户群体潜在 价值进行预测判断。 因此,客户价值应该从客户当 前价值和潜在价值 2 个方面进行评价[9] 。 以提高 客户价值为例,问题模型为 P = G∗L,其中 G 是“提 高客户价值”,L 是“存在潜在价值客户”,要用本体 知识拓展分析树分析条件———“潜在价值客户”。 1)根据文献[10],建立客户价值的本体知识模 型,如图 1 所示。 根据当前价值和潜在价值进行客 户细分,可以得到低价值、潜价值、次价值和价值客 户群体[10] 。 从本体知识中得知,客户价值与购买数 量、品牌忠诚度等属性有关。 图 1 客户价值的本体知识模型 Fig.1 The ontology model of customer value 2)根据文献[7] 中的方法,利用综合关联函数 对原始数据表进行处理,从表 1 中的前 5 个属性可 以看出,客户的平均单位产品支付最高为 750 元,最 低为 180 元;购买数量最多为 10 件,最少为 1 件;月 收入最高为 6 500 元,最低为 2 500 元;品牌忠诚度 最高为 5,最低为 1。 为简单起见,利用可拓学的简 单关联函数和离散关联函数分别建立关于评价特征 dji(i = 1,2,…,13;j = 1,2,3,4)的关联函数Kji(xji): K1i(x1i) = x1i - 300 750 - 180 = x1i - 300 570 K2i(x2i) = x2i - 3 10 - 1 = x2i - 3 9 K3i(x3i) = x3i - 4 000 6 500 - 2 500 = x3i - 4 000 4 000 K4i(x4 i) = 1, x4i = 5 0.5, x4i = 4 0, x4i = 3 - 0.5, x4i = 2 - 1, x4i = 1 ì î í ï ï ïï ï ï ï 根据客户价值理论,客户价值分为当前价值 CV 和潜在价值 PV,其关联函数为 KCV = (K1i(x1i)+K2i(x2i)+K3i(x3i)) / 3 KPV =K4i(x4i) 因此,可以对客户群体进行分类,得到的关联函 数值和客户分类如表 1 所示。 第 1 期 温树勇,等:本体知识拓展分析树在可拓策略生成系统的应用 ·117·
·118, 智能系统学报 第9卷 表1关联函数值和客户群体分类 Table 1 Correlation function value and customer groups classification 单位产品 购买数量 月收入 品牌忠 客户名称 支付d/元 Kpy 客户分类 d/件 d/元 诚度d Kcv 客户0 550 6500 4 0.502680312 0.5 价值客户 客户02 180 10 4500 0.230750487 1 价值客户 客户0 190 3200 1 -0.205068226 -1 低价值客户 客户0 450 2 3300 3 -0.007651072 0 潜价值客户 客户0 325 2 6200 2 0.160916179 -0.5 次价值客户 客户0。 265 3 3500 4 -0.062134503 0.5 潜价值客户 客户0 220 5 3000 3 -0.056042885 0 潜价值客户 客户0 260 2500 -0.185428850 -0.5 低价值客户 客户0 375 5 3900 0.109600390 1 价值客户 客户00 400 3 4300 2 0.083479532 -0.5 次价值客户 客户01 280 3500 1 -0.127436647 -1 低价值客户 客户02 500 3800 0.100292398 -1 次价值客户 客户0 750 8 5500 4 0.573343080 0.5 价值客户 为了计算方便,分别用M、N、H、L表示价值客 G(d)=Info (D)-Entropy(d)= 户、次价值客户、潜价值客户和低价值客户4类,根据 1.988-1.662=0.326 表1提供的信息,计算建树所需的信息量: 同理可得 Info(D)=-】 4 G(d2)=Info (D)-Entropy(d2)= i=1 1.988-1.238=0.750 音-=19 G(da)=Info (D)-Entropy(d3)= 1.988-1.488=0.5 公司决策层认为:属性单位产品支付d,在[180, G(da)=Info (D)-Entropy(da)= 250)为低,[250,450)为中,[450,750]为高:属性购 1.988-0.739=1.249 买数量d,在[1,4]为低,[5,10]为高:属性月收入d 因此,根节点选择“品牌忠诚度d”,并以此类推 在[2500,4000)为低,[4000,6500]为高:属性忠诚 建立子树的节点,建立拓展分析树如图2所示。 度d,在{1,2}为低,3为中,{4,5}为高。因此,属性 d,的信息量为 品牌忠诚度d, Enm(4-会a)+ 高 低 为 购买数量d H 月收入d m2+n2+h2+l2 m+hnfo(D:)+ 高 低 高 低 H N 单位产品支付d, m3+n3+h3+l3 Info(D3)= 高 低 m n+h +l 1 N L 4,22111 13- -lb 44444 图2本体知识拓展分析树 -lb Fig.2 Ontology knowledge expand analysis tree 5 55 当公司需要提高“次价值客户群(N)”的客户价 值时,通过调用FineTreeNode(Tree T,Node H),得到 故,d,的信息增益是 “品牌忠诚度一月收入一单位产品支付一N”和“品牌
表 1 关联函数值和客户群体分类 Table 1 Correlation function value and customer groups classification 客户名称 单位产品 支付 d1 / 元 购买数量 d2 / 件 月收入 d3 / 元 品牌忠 诚度 d4 KCV KPV 客户分类 客户 O1 550 7 6 500 4 0.502 680 312 0.5 价值客户 客户 O2 180 10 4 500 5 0.230 750 487 1 价值客户 客户 O3 190 1 3 200 1 -0.205 068 226 -1 低价值客户 客户 O4 450 2 3 300 3 -0.007 651 072 0 潜价值客户 客户 O5 325 2 6 200 2 0.160 916 179 -0.5 次价值客户 客户 O6 265 3 3 500 4 -0.062 134 503 0.5 潜价值客户 客户 O7 220 5 3 000 3 -0.056 042 885 0 潜价值客户 客户 O8 260 2 2 500 2 -0.185 428 850 -0.5 低价值客户 客户 O9 375 5 3 900 5 0.109 600 390 1 价值客户 客户 O10 400 3 4 300 2 0.083 479 532 -0.5 次价值客户 客户 O11 280 1 3 500 1 -0.127 436 647 -1 低价值客户 客户 O12 500 3 3 800 1 0.100 292 398 -1 次价值客户 客户 O13 750 8 5 500 4 0.573 343 080 0.5 价值客户 为了计算方便,分别用 M、N、H、L 表示价值客 户、次价值客户、潜价值客户和低价值客户 4 类,根据 表 1 提供的信息,计算建树所需的信息量: Info(D) = - ∑ m i = 1 pi lb(pi) = - 3 13 lb 3 13 - 4 13 lb 4 13 - 3 13 lb 3 13 - 3 13 lb 3 13 = 1.988 公司决策层认为:属性单位产品支付 d1在[180, 250)为低,[250,450)为中,[450,750]为高;属性购 买数量 d2在[1,4]为低,[5,10]为高;属性月收入 d3 在[2 500,4 000)为低,[4 000,6 500]为高;属性忠诚 度 d4在{1,2}为低,3 为中,{4,5}为高。 因此,属性 d1的信息量为 Entropy(d1 ) = m1 + n1 + h1 + l 1 m + n + h + l Info(D1 ) + m2 + n2 + h2 + l 2 m + n + h + l Info(D2 ) + m3 + n3 + h3 + l 3 m + n + h + l Info(D3 ) = 4 13 ( - 2 4 lb 2 4 - 1 4 lb 1 4 - 1 4 lb 1 4 ) + 5 13 ( - 1 5 lb 1 5 - 2 5 lb 2 5 - 1 5 lb 1 5 - 1 5 lb 1 5 ) + 4 13 ( - 1 4 lb 1 4 - 1 4 lb 1 4 - 2 4 lb 2 4 ) = 1.662 故,d1的信息增益是 G(d1 )= Info(D)- Entropy(d1 )= 1.988-1.662 = 0.326 同理可得 G(d2 )= Info(D)- Entropy(d2 )= 1.988-1.238 = 0.750 G(d3 )= Info(D)- Entropy(d3 )= 1.988-1.488 = 0.5 G(d4 )= Info(D)- Entropy(d4 )= 1.988-0.739 = 1.249 因此,根节点选择“品牌忠诚度 d4 ”,并以此类推 建立子树的节点,建立拓展分析树如图 2 所示。 图 2 本体知识拓展分析树 Fig.2 Ontology knowledge expand analysis tree 当公司需要提高“次价值客户群(N)”的客户价 值时,通过调用 FineTreeNode(Tree T, Node H),得到 “品牌忠诚度—月收入—单位产品支付—N”和“品牌 ·118· 智 能 系 统 学 报 第 9 卷
第1期 温树勇,等:本体知识拓展分析树在可拓策略生成系统的应用 ·119· 忠诚度一月收入一N”2条路径,调用CoreProblem (N)函数得到影响“次价值客户群(N)”的核心问题 可拓变换分析 是“品牌忠诚度”,因此,可以对“品牌忠诚度”采取可 拓变换,生成提高“品牌忠诚度”策略供企业管理者 可拓变旗的对象为客驴加核心问题力可布支黄的属性为变黄因子为变族的结果为变颜的饮数为 选择。同理,当公司需要提高“低价值客户群(L)”的 着价值 客利购帜数国 unitpayent 1,05后 情客户 客户价值时,产生提高“品牌忠诚度”、“单位产品支 值的 客的解数量 uitpayent 1,05 值户 6次 付”和更换“月收入”客户群等策略:当公司需要对 的值客护 驴1帜数量 unitpayaent L5倍价情客户 7波 “潜价值客户群(H)”提高客户价值时,产生提高“购 图4“单位产品支付”1.05倍的变换结果 买数量”的策略供企业管理者选择。 Fig.4 The transform results of "unitpayment"1.05 times 此外,还可以通过本体知识拓展分析树对变换后 进行预测,在本例子中,为提高“潜价值客户群 从实验结果来看,当对“潜价值客户”的“购买数 (H)”,通过对“购买数量”进行可拓变换,可以调用 量”属性进行加1因子可拓变换时,客户4、客户6、客 预测函数Forecast(String[]data,Node node)做定性分 户7分别由原来的2、3、5增加到3、5和7时就发生 析,发现当“购买数量”变为“高”时,“潜价值客户”了质变,变换次数分别是1次、2次和2次:当对“单 将质变为“价值客户”。 位产品支付”属性进行1.05倍因子可拓变换时,客户 32实验结果与分析 4、客户6、客户7分别由原来的450、260、220增加到 一般使用Java技术实现可拓策略生成系 472.52、372.88和325.04才发生质变,其变换次数分 统。本实验也通过Java技术编码实现,得到如 别是1次、6次和7次。从企业的角度来看,提高低 价值客户的“购买数量”更具有实践性和效益性。这 图2的本体知识拓展分析树,并且可以得到从根节点 到任何叶子节点的路径。 意味着,通过实验获得了一个可拓知识:改变潜价值 客户的“购买数量”属性,比改变其“单位产品支付” 在实验中,由于每个客户的当前价值由购买数 属性能更快提高客户价值。 量、单位产品支付和月收入3个属性所决定,并且各 实验结果表明,通过建立本体知识拓展分析树, 个属性只占1/3的比例,在不考虑传导变换的情况 有效地找到了矛盾的核心问题,使得下一步有目的地 下,仅对其个别属性进行数值变换。 对有关客户属性进行可拓变换,可以减少变换的次 在这里,由于“低价值客户(L)”的核心矛盾是 数,改变了以往可拓策略生成系统中通过从下(叶) “品牌忠诚度”、“单位产品支付”和“月收入”,不具 到上(根)试探性的变换模式,提高了可拓策略生成 有对比性:“次价值客户群(N)”的核心矛盾是“品牌 效率。 忠诚度”,这符合客户价值理论。因此,选用“潜价值 客户群(H)”进行分析,通过函数CoreProblem(H)的4结束语 调用,得到“潜价值客户”的核心问题是“购买数量”, 本文结合可拓学和决策树2个不同领域的知识, 通过对潜价值客户群体的“购买数量”和“单位产品 提出了本体知识拓展分析树建立的方法,重点论述了 支付”这2个属性进行可拓变换对比分析,得到实验 本体知识拓展分析树在可拓策略生成系统的作用。 结果如图3、4所示。 通过分析本体知识拓展分析树得到矛盾问题的核心 可拓变换分析 问题,使系统更有效地生成可拓策略解决矛盾。以提 高客户价值为例进行实验,其结果说明了所提方法的 可拓变黄的对橡为客户加装心门通为可拓变换的胜为变横因子为变续的结果为变慎的饮望为 有效性,使得对基元的可拓变换有依据,生成更客观、 智价值客驴客户刊买数里 g灯 加 价值智户 次 更合理的策略,同时也提高了系统的智能化水平。 智的值客户 客6买数里 goantit灯 如 价值客户 2次 将本体知识拓展分析树应用到可拓策略生成系 著价值客户 客1买数量 gtit灯 价值客户 2次 统中,还需要进行大量的研究。比如,本体知识拓展 分析树的剪枝和算法优化,如何对大量样本集数据进 图3“购买数量”加1的变换结果 行处理,以及建立领域本体知识拓展分析树等,这些 Fig.3 The transform results of "quantity"plus 1 都将是下一步研究的重要内容
忠诚度—月收入—N” 2 条路径, 调用 CoreProblem (N)函数得到影响“次价值客户群(N)”的核心问题 是“品牌忠诚度”,因此,可以对“品牌忠诚度”采取可 拓变换,生成提高“品牌忠诚度”策略供企业管理者 选择。 同理,当公司需要提高“低价值客户群(L)”的 客户价值时,产生提高“品牌忠诚度”、“单位产品支 付”和更换“月收入” 客户群等策略;当公司需要对 “潜价值客户群(H)”提高客户价值时,产生提高“购 买数量”的策略供企业管理者选择。 此外,还可以通过本体知识拓展分析树对变换后 进行 预 测, 在 本 例 子 中, 为 提 高 “ 潜 价 值 客 户 群 (H)”,通过对“购买数量”进行可拓变换,可以调用 预测函数 Forecast(String[]data,Node node)做定性分 析,发现当“购买数量” 变为“高” 时,“潜价值客户” 将质变为“价值客户”。 3.2 实验结果与分析 一般 使 用 Java 技 术 实 现 可 拓 策 略 生 成 系 统[11⁃12] 。 本实验也通过 Java 技术编码实现,得到如 图 2 的本体知识拓展分析树,并且可以得到从根节点 到任何叶子节点的路径。 在实验中,由于每个客户的当前价值由购买数 量、单位产品支付和月收入 3 个属性所决定,并且各 个属性只占 1 / 3 的比例,在不考虑传导变换的情况 下,仅对其个别属性进行数值变换。 在这里,由于“低价值客户( L)” 的核心矛盾是 “品牌忠诚度”、“单位产品支付” 和“月收入”,不具 有对比性;“次价值客户群(N)”的核心矛盾是“品牌 忠诚度”,这符合客户价值理论。 因此,选用“潜价值 客户群(H)”进行分析,通过函数 CoreProblem(H)的 调用,得到“潜价值客户”的核心问题是“购买数量”, 通过对潜价值客户群体的“购买数量”和“单位产品 支付”这 2 个属性进行可拓变换对比分析,得到实验 结果如图 3、4 所示。 图 3 “购买数量”加 1 的变换结果 Fig.3 The transform results of “quantity” plus 1 图 4 “单位产品支付”1.05 倍的变换结果 Fig.4 The transform results of “unitpayment” 1.05 times 从实验结果来看,当对“潜价值客户”的“购买数 量”属性进行加 1 因子可拓变换时,客户 4、客户 6、客 户 7 分别由原来的 2、3、5 增加到 3、5 和 7 时就发生 了质变,变换次数分别是 1 次、2 次和 2 次;当对“单 位产品支付”属性进行 1.05 倍因子可拓变换时,客户 4、客户 6、客户 7 分别由原来的 450、260、220 增加到 472.52、372.88 和 325.04 才发生质变,其变换次数分 别是 1 次、6 次和 7 次。 从企业的角度来看,提高低 价值客户的“购买数量”更具有实践性和效益性。 这 意味着,通过实验获得了一个可拓知识:改变潜价值 客户的“购买数量”属性,比改变其“单位产品支付” 属性能更快提高客户价值。 实验结果表明,通过建立本体知识拓展分析树, 有效地找到了矛盾的核心问题,使得下一步有目的地 对有关客户属性进行可拓变换,可以减少变换的次 数,改变了以往可拓策略生成系统中通过从下(叶) 到上(根)试探性的变换模式,提高了可拓策略生成 效率。 4 结束语 本文结合可拓学和决策树 2 个不同领域的知识, 提出了本体知识拓展分析树建立的方法,重点论述了 本体知识拓展分析树在可拓策略生成系统的作用。 通过分析本体知识拓展分析树得到矛盾问题的核心 问题,使系统更有效地生成可拓策略解决矛盾。 以提 高客户价值为例进行实验,其结果说明了所提方法的 有效性,使得对基元的可拓变换有依据,生成更客观、 更合理的策略,同时也提高了系统的智能化水平。 将本体知识拓展分析树应用到可拓策略生成系 统中,还需要进行大量的研究。 比如,本体知识拓展 分析树的剪枝和算法优化,如何对大量样本集数据进 行处理,以及建立领域本体知识拓展分析树等,这些 都将是下一步研究的重要内容。 第 1 期 温树勇,等:本体知识拓展分析树在可拓策略生成系统的应用 ·119·
·120. 智能系统学报 第9卷 YANG Lanlu,RUN De.Customer classification based on cus- 参考文献: tomer value[J].Modern Management Science,2007(11): [1]杨春燕,蔡文.可拓工程[M].北京:科学出版社,2007:1- 95-96. 344. [10]权明富,齐佳音,舒华英.客户价值评价指标体系设计 [2]李立希,杨春燕,李铧汶可拓策略生成系统[M].北京:科 [J].南开管理评论,2004,7(3):17-23 学出版社,2006:1-231. QUAN Mingfu,QI Jiayin,SHU Huaying.An evaluation in- [3]HAN Jiawei,KAMBER M.数据挖掘概念与技术[M].范 dex system to assess customer value[J].Nankai Business 明,孟小峰.译.北京:机械工业出版社,2008:188-200. Review,2004,7(3):17-23. [4]孟飞翔,帅立国,姜昌金决策树在客户价值分析中的应用[11]方卓君,李卫华,李承晓.自助游可拓策略生成系统的研 [J]计算机技术与发展,2007,17(4):60-63 究与实现[J]广东工业大学学报,2009,26(2):83-89. MENG Feixiang,SHUAI Liguo,JIANG Changjin.An appli- FANG Zhoujun,LI Weihua,LI Chengxiao.Research and cation of decision tree to analyze the value of customer[]]. realization of extension strategy generating system for inde- Computer Technology and Development,2007,17(4):60- pendent travel [J].Guangdong University of Technology, 63. 2009,26(2):83-89. [5]GRUBER T R.A translation approach to portable ontology [12]李承晓,李卫华.租房可拓策略生成系统[J].智能系统 specification[J].Knowledge Acquisition,1995,5(2):199- 学报,2011,6(3):272-278 220. LI Chengxiao,LI Weihua.Research on a tenement extension [6]刘宗妹本体可拓模型的复合元实现及应用研究[D]广 strategy generation system[J].CAAI Transactions on Intelli- 州:广东工业大学,2010:1-48. gent Systems,.2011,6(3):272-278. LIU Zongmei.Realization and application study of composite 作者简介: element of ontology extension model[].Guangzhou:Guang- 温树勇,男,1986年生,硕士生研究 dong University of Technology,2010:1-48. 生,主要研究方向为智能软件。 [7]杨春燕,李小妹,陈文伟,等.可拓数据挖掘方法及其计算 机实现[M].广州:广东高等教育出版社,2010:84-92. [8]演克武,张磊,孙强决策树分类法中D3算法在航空市场 客户价值细分中的应用[J].商业研究,2008,371(3): 24-29. YAN Kewu,ZHANG Lei.SUN Qiang.The application of de- 李卫华,女,1957年生,教授,主要研 cision making tree classification ID3 algorithm in customer 究方向为面向Agent计算、网络信息系 value segmentation in aviation market[J].Commercial Re- 统、智能软件,发表学术论文40余篇。 search,2008,371(3):24-29. [9]杨兰卢,润德.基于客户价值的客户分类方法研究[」].现 代管理科学,2007(11):95-96
参考文献: [1]杨春燕,蔡文.可拓工程[M].北京:科学出版社, 2007: 1⁃ 344. [2]李立希,杨春燕,李铧汶.可拓策略生成系统[M].北京:科 学出版社, 2006: 1⁃231. [3]HAN Jiawei, KAMBER M.数据挖掘概念与技术 [M]. 范 明,孟小峰.译.北京:机械工业出版社, 2008: 188⁃200. [4]孟飞翔,帅立国,姜昌金.决策树在客户价值分析中的应用 [J].计算机技术与发展, 2007, 17(4): 60⁃63. MENG Feixiang, SHUAI Liguo, JIANG Changjin. An appli⁃ cation of decision tree to analyze the value of customer[ J]. Computer Technology and Development, 2007, 17( 4): 60⁃ 63. [5] GRUBER T R. A translation approach to portable ontology specification[J]. Knowledge Acquisition, 1995, 5(2): 199⁃ 220. [6]刘宗妹.本体可拓模型的复合元实现及应用研究[D].广 州:广东工业大学, 2010: 1⁃48. LIU Zongmei. Realization and application study of composite element of ontology extension model[D]. Guangzhou: Guang⁃ dong University of Technology, 2010: 1⁃48. [7]杨春燕,李小妹,陈文伟,等.可拓数据挖掘方法及其计算 机实现[M].广州:广东高等教育出版社, 2010: 84⁃92. [8]演克武,张磊,孙强.决策树分类法中 ID3 算法在航空市场 客户价值细分中的应用[ J].商业研究, 2008, 371( 3): 24⁃29. YAN Kewu, ZHANG Lei, SUN Qiang. The application of de⁃ cision making tree classification ID3 algorithm in customer value segmentation in aviation market [ J]. Commercial Re⁃ search, 2008, 371(3): 24⁃29. [9]杨兰卢,润德.基于客户价值的客户分类方法研究[ J].现 代管理科学, 2007(11): 95⁃96. YANG Lanlu, RUN De. Customer classification based on cus⁃ tomer value[ J]. Modern Management Science, 2007 ( 11): 95⁃96. [10]权明富,齐佳音,舒华英. 客户价值评价指标体系设计 [J].南开管理评论, 2004, 7(3): 17⁃23. QUAN Mingfu, QI Jiayin, SHU Huaying. An evaluation in⁃ dex system to assess customer value [ J]. Nankai Business Review, 2004, 7(3): 17⁃23. [11]方卓君,李卫华,李承晓.自助游可拓策略生成系统的研 究与实现[J].广东工业大学学报, 2009, 26(2): 83⁃89. FANG Zhoujun, LI Weihua, LI Chengxiao. Research and realization of extension strategy generating system for inde⁃ pendent travel [ J]. Guangdong University of Technology, 2009, 26(2): 83⁃89. [12]李承晓,李卫华.租房可拓策略生成系统[ J] . 智能系统 学报, 2011, 6(3): 272⁃278. LI Chengxiao, LI Weihua. Research on a tenement extension strategy generation system[J]. CAAI Transactions on Intelli⁃ gent Systems, 2011, 6(3): 272⁃278. 作者简介: 温树勇,男,1986 年生,硕士生研究 生,主要研究方向为智能软件。 李卫华,女,1957 年生,教授,主要研 究方向为面向 Agent 计算、网络信息系 统、智能软件,发表学术论文 40 余篇。 ·120· 智 能 系 统 学 报 第 9 卷