数来判断子句集的可满足性不同，该方法直接计算出不能由子句集扩展出来的相对

正在加载图片...

第1期王金艳，等：扩展规则方法研究综述 5 数来判断子句集的可满足性不同，该方法直接计算现有其他知识编译方法对偶的一种方法2]。出不能由子句集扩展出来的相对极大项个数，然后 2)基于启发式策略的知识编译方法。根据相对极大项个数来判断子句集的可满足性，避在知识编译中，离线编译后生成的目标知识库开了容斥原理的复杂性。进一步，他们在基本MC 的规模对在线查询的效率起着至关重要的作用。算算法的基础上提出了8种优化策略，极大地提高了法KCER在选择子句和变量进行扩展时，都采用顺算法的求解效率。序扩展的方式，几乎没有使用任何启发式策略。对 3)碰集方法。于有些问题，这会导致编译后的子句集规模过大，从 Xu等[242]找出了不能被扩展出的极大项具有而影响之后的在线推理的效率。为此，笔者提出了的特征，以此来回避容斥原理所带来的计算量。他 2种启发式策略MCN(minimum complementary num- 们发现，若极大项与子句集Σ中的某个子句互补， ber)和MO(maximum occurrences)分别用于指导待则该极大项不能由这个子句扩展出来。进而可知，扩展的子句和变量的选择[]，MCN策略是优先选如果极大项与Σ中所有子句都互补，那么该极大项择与其他子句互补的子句数较少的子句进行扩展，就不能由Σ扩展出来。假定存在与Σ中任意子句 MO策略是在待扩展的子句中优先选择在其他未扩都互补的极大项C,那么由C,可以构造极大项展子句中出现次数最多的变量进行扩展。前者使得 CM,其中C,由Cv中每个文字的补文字构成。如果需要扩展的子句数较少，后者使得子句被扩展出的将子句看作文字集合，Σ看作文字集合簇，那么C 子句数较少。使用随机生成的样例和处于相变区的与Σ中任意子句的交都不为空，即C,是Σ的碰集。 Uniform Random-3-SAT标准用例进行测试，实验结基于此，Xu等证明了子句集是可满足的，当且仅当果表明，MCN和MO策略都能大幅度地减小编译后该子句集存在不包含互补文字的碰集，这样就将的子句集规模，其中MCN的效果比MO更为明显。 SAT问题转化成判定是否存在不含互补文字的碰集同时使用MCN和MO策略，可以使扩展后的子句集问题，并且提出了2种有效的方法CBHST(comple- mentary binary hitting set tree)RNHST(revised new 规模为算法KCER的J 3399 hitting set tree)来进行求解。这2种算法与DR相 3)新的EPCCL编译框架。比，在效率方面都有1~2个数量级的提高。RNHST 赖永[0证明了如下定理：给定子句集∑=1∧ 算法与CBHST算法相比，RNHST更适合长子句的 ,和EPCCL编译算法f,f八∑，)Af(,VΣ2)是情况，而CBHST更适合短子句的情况。与Σ等价的EPCCL理论。基于该定理，他提出了一 2.1.6基于扩展规则的知识编译方法种新的关于EPCCL理论的知识编译思想：对于给定 I)基于KCER的知识编译方法。的子句集，首先将其划分为2个子句集三，和2，然 Lin和Sum26指出扩展规则方法可以被应用于后对它们分别进行编译，合取编译后的结果即可得知识编译列中，他们定义了EPCCL(each pair con- 到与原子句集等价的EPCCL理论。根据划分后 tains complementary literal)理论（任意2个子句都含 I三I、I,I的不同，存在多种划分方式。如何编译互补对子句集)，证明了EPCCL理论是在“可满足 Σ，V,又分为2种方式。根据子句集的划分方可控制类”和“蕴含可控制类”中，并证明对于任意式、∑，V∑2的编译方式和将DNF(disjunctive nor- 子句集一定能找到一个与之等价的EPCCL理论，因 mal form)编译为EPCCL理论的方法的不同，给出多此EPCCL理论可以作为知识编译的目标语言，进而种不同的编译方法。利用“桶删除”的思想提出将给定子句集编译成由于编译后的EPCCL理论的规模直接影响到 EPCCL理论的算法KCER(knowledge compilation u- 在线查询效率，刘大有等3)定义了一个规约规则， sing the extension rule)。该方法与现有其他知识编基于该规则提出了用于缩减EPCCL理论规模的算译方法的不同之处在于：在编译阶段和推理阶段该法，该算法具有多项式时间复杂度，然后结合基于方法都是基于扩展规则的，而其他的知识编译方法 DPLL KCDP knowledge compilation based on 都是基于归结原理的：当互补因子较大的时候，该方 DPLL)算法，实现了C2E编译器。实验结果表明，法得到的子句集规模相对较小，特别地，当待编译的不论是编译效率还是编译后子句集的规模都优于基子句集本身就是一个EPCCL理论，用该方法编译后于KCER的编译器。在目前的基于DPLL的SAT求的结果就是其本身，而用其他方法编译，结果可能是解中，存在许多高效的技术，这些技术都能用于改进指数级大的。因此，该方法被Murray教授看作是与 KCDP的编译效果，提升C2E编译器的性能。数来判断子句集的可满足性不同，该方法直接计算出不能由子句集扩展出来的相对极大项个数，然后根据相对极大项个数来判断子句集的可满足性，避开了容斥原理的复杂性。进一步，他们在基本ＭＣ算法的基础上提出了８种优化策略，极大地提高了算法的求解效率。３）碰集方法。Ｘｕ等［２４⁃２５］找出了不能被扩展出的极大项具有的特征，以此来回避容斥原理所带来的计算量。他们发现，若极大项与子句集 Σ 中的某个子句互补，则该极大项不能由这个子句扩展出来。进而可知，如果极大项与 Σ 中所有子句都互补，那么该极大项就不能由 Σ 扩展出来。假定存在与 Σ 中任意子句都互补的极大项ＣＭ，那么由ＣＭ可以构造极大项ＣＭ ′ ，其中ＣＭ ′ 由ＣＭ中每个文字的补文字构成。如果将子句看作文字集合，Σ 看作文字集合簇，那么ＣＭ ′ 与 Σ 中任意子句的交都不为空，即ＣＭ ′ 是 Σ 的碰集。基于此，Ｘｕ等证明了子句集是可满足的，当且仅当该子句集存在不包含互补文字的碰集，这样就将ＳＡＴ问题转化成判定是否存在不含互补文字的碰集问题，并且提出了２种有效的方法ＣＢＨＳＴ（ｃｏｍｐｌｅ⁃ ｍｅｎｔａｒｙｂｉｎａｒｙｈｉｔｔｉｎｇｓｅｔｔｒｅｅ）和ＲＮＨＳＴ（ｒｅｖｉｓｅｄｎｅｗｈｉｔｔｉｎｇｓｅｔｔｒｅｅ）来进行求解。这２种算法与ＤＲ相比，在效率方面都有１～２个数量级的提高。ＲＮＨＳＴ算法与ＣＢＨＳＴ算法相比，ＲＮＨＳＴ更适合长子句的情况，而ＣＢＨＳＴ更适合短子句的情况。２．１．６基于扩展规则的知识编译方法１）基于ＫＣＥＲ的知识编译方法。Ｌｉｎ和Ｓｕｎ［２６］指出扩展规则方法可以被应用于知识编译［２７］中，他们定义了ＥＰＣＣＬ（ｅａｃｈｐａｉｒｃｏｎ⁃ ｔａｉｎｓｃｏｍｐｌｅｍｅｎｔａｒｙｌｉｔｅｒａｌ）理论（任意２个子句都含互补对子句集），证明了ＥＰＣＣＬ理论是在“可满足可控制类”和“蕴含可控制类”中，并证明对于任意子句集一定能找到一个与之等价的ＥＰＣＣＬ理论，因此ＥＰＣＣＬ理论可以作为知识编译的目标语言，进而利用“桶删除” 的思想提出将给定子句集编译成ＥＰＣＣＬ理论的算法ＫＣＥＲ（ｋｎｏｗｌｅｄｇｅｃｏｍｐｉｌａｔｉｏｎｕ⁃ ｓｉｎｇｔｈｅｅｘｔｅｎｓｉｏｎｒｕｌｅ）。该方法与现有其他知识编译方法的不同之处在于：在编译阶段和推理阶段该方法都是基于扩展规则的，而其他的知识编译方法都是基于归结原理的；当互补因子较大的时候，该方法得到的子句集规模相对较小，特别地，当待编译的子句集本身就是一个ＥＰＣＣＬ理论，用该方法编译后的结果就是其本身，而用其他方法编译，结果可能是指数级大的。因此，该方法被Ｍｕｒｒａｙ教授看作是与现有其他知识编译方法对偶的一种方法［２８］。２）基于启发式策略的知识编译方法。在知识编译中，离线编译后生成的目标知识库的规模对在线查询的效率起着至关重要的作用。算法ＫＣＥＲ在选择子句和变量进行扩展时，都采用顺序扩展的方式，几乎没有使用任何启发式策略。对于有些问题，这会导致编译后的子句集规模过大，从而影响之后的在线推理的效率。为此，笔者提出了２种启发式策略ＭＣＮ（ｍｉｎｉｍｕｍｃｏｍｐｌｅｍｅｎｔａｒｙｎｕｍ⁃ ｂｅｒ）和ＭＯ（ｍａｘｉｍｕｍｏｃｃｕｒｒｅｎｃｅｓ）分别用于指导待扩展的子句和变量的选择［２９］，ＭＣＮ策略是优先选择与其他子句互补的子句数较少的子句进行扩展，ＭＯ策略是在待扩展的子句中优先选择在其他未扩展子句中出现次数最多的变量进行扩展。前者使得需要扩展的子句数较少，后者使得子句被扩展出的子句数较少。使用随机生成的样例和处于相变区的ＵｎｉｆｏｒｍＲａｎｄｏｍ⁃３⁃ＳＡＴ标准用例进行测试，实验结果表明，ＭＣＮ和ＭＯ策略都能大幅度地减小编译后的子句集规模，其中ＭＣＮ的效果比ＭＯ更为明显。同时使用ＭＣＮ和ＭＯ策略，可以使扩展后的子句集规模为算法ＫＣＥＲ的１３～１３９。３）新的ＥＰＣＣＬ编译框架。赖永［３０］证明了如下定理：给定子句集 Σ ＝ Σ１ ∧ Σ２和ＥＰＣＣＬ编译算法ｆ，ｆ（Σ１） ∧ ｆ（ØΣ１ ∨ Σ２）是与 Σ 等价的ＥＰＣＣＬ理论。基于该定理，他提出了一种新的关于ＥＰＣＣＬ理论的知识编译思想：对于给定的子句集，首先将其划分为２个子句集 Σ１和 Σ２，然后对它们分别进行编译，合取编译后的结果即可得到与原子句集等价的ＥＰＣＣＬ理论。根据划分后｜ Σ１｜、｜ Σ２｜的不同，存在多种划分方式。如何编译 ØΣ１ ∨ Σ２又分为２种方式。根据子句集的划分方式、 ØΣ１ ∨ Σ２的编译方式和将ＤＮＦ（ｄｉｓｊｕｎｃｔｉｖｅｎｏｒ⁃ ｍａｌｆｏｒｍ）编译为ＥＰＣＣＬ理论的方法的不同，给出多种不同的编译方法。由于编译后的ＥＰＣＣＬ理论的规模直接影响到在线查询效率，刘大有等［３１］定义了一个规约规则，基于该规则提出了用于缩减ＥＰＣＣＬ理论规模的算法，该算法具有多项式时间复杂度，然后结合基于ＤＰＬＬ的ＫＣＤＰ（ｋｎｏｗｌｅｄｇｅｃｏｍｐｉｌａｔｉｏｎｂａｓｅｄｏｎＤＰＬＬ）算法，实现了Ｃ２Ｅ编译器。实验结果表明，不论是编译效率还是编译后子句集的规模都优于基于ＫＣＥＲ的编译器。在目前的基于ＤＰＬＬ的ＳＡＴ求解中，存在许多高效的技术，这些技术都能用于改进ＫＣＤＰ的编译效果，提升Ｃ２Ｅ编译器的性能。第１期王金艳，等：扩展规则方法研究综述 ·５·

<<向上翻页向下翻页>>

点击下载：【学术论文】扩展规则方法研究综述