保护客户代码的目的．代码迷惑以前的研究主要集中在构造有效的代码迷惑算法

正在加载图片...

5期高鹰等：基于抽象解释的代码迷惑有效性比较框架 807 保护客户代码的目的. 针对目前代码迷惑研究中缺乏基于语义的有效代码迷惑以前的研究主要集中在构造有效的代性证明以及缺乏限定环境下有效性证明的问题，本码迷惑算法.Collbergt)中给出了有关这方面研究文以代码迷惑引起的语义信息变化来刻画有效性，比较完整的综述，引入了代码迷惑的定义，代码迷惑提出了与语言无关的代码迷惑有效性比较框架，能是一种以增加理解难度为目的的程序变换技术. 够为迷惑算法在静态分析这样的限定环境下提供严 Wang建立了针对恶意主机问题的代码安全体系，格的有效性证明，也能够严格比较不同迷惑算法之该安全体系的主要部件基于代码迷惑技术构造，间的有效性.静态分析作为限定环境是指，攻击者使而其中迷惑算法的核心思想是破坏程序的控制信用静态分析作为攻击手段的攻击场景。息.Ogiso)推广了Wang的算法，不仅破坏程序控本文第2节概述代码迷惑有效性比较框架组成制流信息，还进一步地破坏程序过程间的调用信息，部分；第3节采用抽象解释理论形式化有效性比较 Douglas)针对Java语言的特征，通过构造复杂数框架；第4节结合具体的迷惑算法描述如何实例化据结构来增加代码的理解难度，关于构造代码迷惑有效性比较框架：最后给出相关工作比较和结论. 算法的研究已经比较成熟. 但是，对于构造的代码迷惑算法是否有效，这些 2问题的提出研究都没有提供严格证明，代码迷惑算法的构造缺乏有效性证明的理论支持.而另一方面，许多研究已建立代码迷惑有效性比较框架分两个部分进经从理论上证明了代码迷惑作为安全方法的局限行：形式化代码迷惑空间；形式地定义代码迷惑有效性[5]，即证明了不存在代码迷惑能够完全保证信息性度量的安全性，经过迷惑后的代码总还或多或少存在信第一步，形式化迷惑算法组成的代码迷惑空间. 息泄漏关于代码迷惑，Collberg)给出了非形式的定义. 尽管在理论上代码迷惑并不能保证高机密信息定义1.代码迷惑.程序变换τ。是代码迷惑是的安全，但代码迷惑仍是代码安全问题中一种有效指：(1)变换x保持程序可观察语义的等价性：(2)经的安全技术，其原因是在很多场合下它能提供安全过变换x使得程序某些属性的理解难度增加. 性，因此代码迷惑的研究一直活跃.一些具有代表性根据上述定义，代码迷惑包含了两个性质，与程的代码迷惑应用如下：序变换一样保证程序可观察语义等价以及使得属性恶意移动代理.移动代理在主机之间移动时，的理解难度增加.形式化代码迷惑定义，也需要从刻代码和执行的中间结果可能会被主机恶意获取篡画这两个性质进行. 改.SPMA[]的研究表明，代码迷惑技术能够保证代代码迷惑是一类特殊的程序变换，因此与程序理在其移动存活期内被攻击的难度增加，从而达到变换同样需要满足正确性性质.程序变换正确性是保护移动代理的安全，对于恶意攻击者来说，恶意移指变换前和变换后程序具有可观察语义等价性，由动代理是一种时间受限环境，因为代理驻留在主机文献[8]可知，可观察语义是对标准语义的抽象，程上的时间是有限的。序变换正确性等价于要求变换前后程序的标准语义恶意逆向工程，越来越多的代码使用容易被反在某种层次的抽象下相等，这为定义代码迷惑正确编译的中间代码发布，使得软件开发者需要更多地性提供了理论基础.属性是指从程序中提取的信息，考虑其竞争者可能会反编译发布的代码，进而获取可以使用上界闭包来刻画町，属性组成的属性空间软件的设计以及其中的重要算法.虽然代码迷惑技可定义偏序结构，属性的理解难度增加是通过属性术无法为代码提供完全保护.但是，代码迷惑能够使空间上的偏序关系来定义，攻击者发现：复用反迷惑后得到的代码要比其重写第二步，给出代码迷惑的有效性度量.代码迷惑等效代码更加困难。的有效性证明是基于定义的有效性度量.我们采用这些都说明代码迷惑能够提供限定环境下的安语义信息的变化来刻画有效性，通过迷惑前后的语全性，如上述的时间受限环境以及不可复用环境等，义信息来度量代码迷惑的有效性.语义信息通常是限定环境是针对攻击者所处的攻击场景受到某些限不可计算的，静态分析是对程序语义信息的保守近制的情况，如在时间受限环境下，攻击者必须在代理似，静态分析的结果能够可计算地反映语义信息的存活期内篡改程序，攻击者的攻击时间是受限的. 变化.而且静态分析具有动态分析所不具备的可靠保护客户代码的目的．代码迷惑以前的研究主要集中在构造有效的代码迷惑算法．Ｃｏｌｌｂｅｒｇ［１］中给出了有关这方面研究比较完整的综述，引入了代码迷惑的定义，代码迷惑是一种以增加理解难度为目的的程序变换技术．Ｗａｎｇ［２］建立了针对恶意主机问题的代码安全体系，该安全体系的主要部件基于代码迷惑技术构造，而其中迷惑算法的核心思想是破坏程序的控制信息．Ｏｇｉｓｏ［３］推广了Ｗａｎｇ的算法，不仅破坏程序控制流信息，还进一步地破坏程序过程间的调用信息．Ｄｏｕｇｌａｓ［４］针对Ｊａｖａ语言的特征，通过构造复杂数据结构来增加代码的理解难度．关于构造代码迷惑算法的研究已经比较成熟．但是，对于构造的代码迷惑算法是否有效，这些研究都没有提供严格证明，代码迷惑算法的构造缺乏有效性证明的理论支持．而另一方面，许多研究已经从理论上证明了代码迷惑作为安全方法的局限性［５６］，即证明了不存在代码迷惑能够完全保证信息的安全性，经过迷惑后的代码总还或多或少存在信息泄漏．尽管在理论上代码迷惑并不能保证高机密信息的安全，但代码迷惑仍是代码安全问题中一种有效的安全技术，其原因是在很多场合下它能提供安全性，因此代码迷惑的研究一直活跃．一些具有代表性的代码迷惑应用如下：恶意移动代理．移动代理在主机之间移动时，代码和执行的中间结果可能会被主机恶意获取篡改．ＳＰＭＡ［７］的研究表明，代码迷惑技术能够保证代理在其移动存活期内被攻击的难度增加，从而达到保护移动代理的安全．对于恶意攻击者来说，恶意移动代理是一种时间受限环境，因为代理驻留在主机上的时间是有限的．恶意逆向工程．越来越多的代码使用容易被反编译的中间代码发布，使得软件开发者需要更多地考虑其竞争者可能会反编译发布的代码，进而获取软件的设计以及其中的重要算法．虽然代码迷惑技术无法为代码提供完全保护．但是，代码迷惑能够使攻击者发现：复用反迷惑后得到的代码要比其重写等效代码更加困难．这些都说明代码迷惑能够提供限定环境下的安全性，如上述的时间受限环境以及不可复用环境等．限定环境是针对攻击者所处的攻击场景受到某些限制的情况，如在时间受限环境下，攻击者必须在代理存活期内篡改程序，攻击者的攻击时间是受限的．针对目前代码迷惑研究中缺乏基于语义的有效性证明以及缺乏限定环境下有效性证明的问题，本文以代码迷惑引起的语义信息变化来刻画有效性，提出了与语言无关的代码迷惑有效性比较框架，能够为迷惑算法在静态分析这样的限定环境下提供严格的有效性证明，也能够严格比较不同迷惑算法之间的有效性．静态分析作为限定环境是指，攻击者使用静态分析作为攻击手段的攻击场景．本文第２节概述代码迷惑有效性比较框架组成部分；第３节采用抽象解释理论形式化有效性比较框架；第４节结合具体的迷惑算法描述如何实例化有效性比较框架；最后给出相关工作比较和结论．２问题的提出建立代码迷惑有效性比较框架分两个部分进行：形式化代码迷惑空间；形式地定义代码迷惑有效性度量．第一步，形式化迷惑算法组成的代码迷惑空间．关于代码迷惑，Ｃｏｌｌｂｅｒｇ［１］给出了非形式的定义．定义１．代码迷惑．程序变换τ狅犫是代码迷惑是指：（１）变换τ狅犫保持程序可观察语义的等价性；（２）经过变换τ狅犫使得程序某些属性的理解难度增加．根据上述定义，代码迷惑包含了两个性质，与程序变换一样保证程序可观察语义等价以及使得属性的理解难度增加．形式化代码迷惑定义，也需要从刻画这两个性质进行．代码迷惑是一类特殊的程序变换，因此与程序变换同样需要满足正确性性质．程序变换正确性是指变换前和变换后程序具有可观察语义等价性．由文献［８］可知，可观察语义是对标准语义的抽象，程序变换正确性等价于要求变换前后程序的标准语义在某种层次的抽象下相等．这为定义代码迷惑正确性提供了理论基础．属性是指从程序中提取的信息，可以使用上界闭包来刻画［９］，属性组成的属性空间可定义偏序结构，属性的理解难度增加是通过属性空间上的偏序关系来定义．第二步，给出代码迷惑的有效性度量．代码迷惑的有效性证明是基于定义的有效性度量．我们采用语义信息的变化来刻画有效性，通过迷惑前后的语义信息来度量代码迷惑的有效性．语义信息通常是不可计算的，静态分析是对程序语义信息的保守近似，静态分析的结果能够可计算地反映语义信息的变化．而且静态分析具有动态分析所不具备的可靠５期高鹰等：基于抽象解释的代码迷惑有效性比较框架８０７

<<向上翻页向下翻页>>

点击下载：《计算机学报》：基于抽象解释的代码迷惑有效性比较框架