１），因此以下分析执行一组样本检测时１）所需的运算量。在ｍ＝４

正在加载图片...

第4期杨先伟，等：随机序列的扑克检测优化研究 .515. 1),因此以下分析执行一组样本检测时1)所需的运数据并更新频数，即算量。在m=4和m=8时1)需分别执行n次 SHIFT、n次LOAD和2n次ADD,即合计总共需执行 C[E]=c[E]+1,0≤i≤g-1(5) 2n次SHIFT、2n次LOAD和4n次ADD。1)进行一参数m=4时的频数统计方式为先加载字节数组样本检测所需执行的操作数详情如表1。据，接着获取高半字节和低半字节，表1扑克检测算法的操作数量 Table 1 The calculation of poker test H=E≥4L=E,N0F,0≤i≤ -1(6) 步骤1 运算量最后利用获取的高半字节和低半字节更新对应 m=4 nSHIFT nLOAD +2nADD 的频数，即 m=8 nSHIFT +nLOAD +2nADD C4[H]=C4[H]+1,C4[L]=C4[L]+1(7) 合计 2nSHIFT +2nLOAD +4nADD 参数m=4时和m=8时的统计过程分开实现会使得待检数据序列重复加载，这也是扑克检测效按我国随机性检测规范规定一组样本的大小n为率不高的主要原因之一。如果能更进一步将参数在 10bit,因此由表1的统计结果可知，算法的运算量不两种不同取值时的统计过程合并在一起，则可以减小，执行效率不会太快。在实际检测中，需要加快扑克少大量的数据重复加载。参数m取4和8合并实检测的执行速度，以增强它的基础筛选作用。现时的频数统计方式为先加载字节数据，然后获取 3 优化思想和优化算法高半字节和低半字节，最后更新m=4的频数和m= 8的频数，合并式(5)~(7)，可得根据上一节的分析可知，扑克检测的效率不高的主要原因是计算统计量时出现了以下问题： H=E:≥4，L=E:∧0xF,0≤i≤n/8-1 1)采用了单比特统计方式，每次仅仅处理一个 C4[H]=C4[H]+1,C4[L]=C4[L]+1 比特，CPU的字长没有得到充分利用：如果一次处 Cs[E:]=Cs[E;]+1 (8) 理多个比特则处理速度将有明显的提升：统计量的计算和判断过程还可以进行精简和优 2)对参数m=4和m=8,传统实现方式会各执化：可根据余不完全伽马函数的性质预先求出行一遍算法中的1)~4)的操作，存在相同数据反复 P.le≥a时统计量V的阈值，让统计值V直接和此加载的情况：阈值比较，如此可以减少余不完全伽马函数的计算 3)算法的统计量计算和判断过程没有精简和次数。优化，存在不必要的余不完全伽马函数的计算。记m=4时的统计量为V,即 15 针对扑克检测原算法出现的效率不高问题，下 -642c,[)-4 (9) 面有针对性地提出几点优化想法。具体的优化想法 n 0 如下：记m=8时的统计量为V,即 255 1)一次处理多个比特，比如一个字节或半个字 -2048 (10) 节，加快频数统计过程： n =0 2)对m=4和m=8整合在一起实现，减少不必计算统计值所用的余不完全伽马函数满足性质要的数据加载： igame(a,0)=1,igamc(a,o)=0。经简单计算可 3)精简并优化统计量的计算和判断过程，事先知，当显著水平α=0.01，m=4时，统计量V,的阈值计算P≥a时统计量V的阈值，让统计值直接和为入4=30.577914：当显著水平a=0.01,m=8时，此阈值比较，避免每个样本都计算两次余不完全伽统计量V.的阈值为入g=310.457388。即如果V,< 马函数。入，且'。<入g则认为待检序列通过检测。根据以上记待检序列为n/8字节的字节数据E:,E:= 描述，优化实现的扑克检测算法如下。 E+:‖E数+2‖…‖eg:+8,0≤i≤n/8-1。为区分两算法1优化实现的扑克检测算法种不同参数取值时各种序列模式出现的频数，记输入n/8字节的数据E:,0≤i≤n/8-1: C.[],0≤i≤15为m=4时各种序列模式出现的输出检测结果。频数，记Cg[i],0≤i≤255为m=8时各种序列模 1)初始化数据：i=0。式出现的频数。 C4[j]=0,0≤j≤15，参数m=8时的频数统计方式为直接加载字节 Cg[j]=0,0≤j≤255。１），因此以下分析执行一组样本检测时１）所需的运算量。在ｍ＝４和ｍ＝８时１）需分别执行ｎ次ＳＨＩＦＴ、ｎ次ＬＯＡＤ和２ｎ次ＡＤＤ，即合计总共需执行２ｎ次ＳＨＩＦＴ、２ｎ次ＬＯＡＤ和４ｎ次ＡＤＤ。１）进行一组样本检测所需执行的操作数详情如表１。表１扑克检测算法的操作数量Ｔａｂｌｅ１Ｔｈｅｃａｌｃｕｌａｔｉｏｎｏｆｐｏｋｅｒｔｅｓｔ步骤１运算量ｍ＝４ｎＳＨＩＦＴ＋ｎＬＯＡＤ＋２ｎＡＤＤｍ＝８ｎＳＨＩＦＴ＋ｎＬＯＡＤ＋２ｎＡＤＤ合计２ｎＳＨＩＦＴ＋２ｎＬＯＡＤ＋４ｎＡＤＤ按我国随机性检测规范规定一组样本的大小ｎ为１０６ｂｉｔ，因此由表１的统计结果可知，算法的运算量不小，执行效率不会太快。在实际检测中，需要加快扑克检测的执行速度，以增强它的基础筛选作用。３优化思想和优化算法根据上一节的分析可知，扑克检测的效率不高的主要原因是计算统计量时出现了以下问题：１）采用了单比特统计方式，每次仅仅处理一个比特，ＣＰＵ的字长没有得到充分利用；如果一次处理多个比特则处理速度将有明显的提升；２）对参数ｍ＝４和ｍ＝８，传统实现方式会各执行一遍算法中的１）～４）的操作，存在相同数据反复加载的情况；３）算法的统计量计算和判断过程没有精简和优化，存在不必要的余不完全伽马函数的计算。针对扑克检测原算法出现的效率不高问题，下面有针对性地提出几点优化想法。具体的优化想法如下：１）一次处理多个比特，比如一个字节或半个字节，加快频数统计过程；２）对ｍ＝４和ｍ＝８整合在一起实现，减少不必要的数据加载；３）精简并优化统计量的计算和判断过程，事先计算Ｐｖａｌｕｅ ≥ α 时统计量Ｖ的阈值，让统计值直接和此阈值比较，避免每个样本都计算两次余不完全伽马函数。记待检序列为ｎ／８字节的字节数据 Εｉ， Εｉ＝ ε８ｉ＋１‖ε８ｉ＋２‖…‖ε８ｉ＋８，０ ≤ ｉ ≤ ｎ／８－１。为区分两种不同参数取值时各种序列模式出现的频数，记Ｃ４［ｉ］，０ ≤ ｉ ≤ １５为ｍ＝４时各种序列模式出现的频数，记Ｃ８［ｉ］，０ ≤ ｉ ≤ ２５５为ｍ＝８时各种序列模式出现的频数。参数ｍ＝８时的频数统计方式为直接加载字节数据并更新频数，即Ｃ８［Ｅｉ］＝Ｃ８［Ｅｉ］＋１，０ ≤ ｉ ≤ ｎ８－１（５）参数ｍ＝４时的频数统计方式为先加载字节数据，接着获取高半字节和低半字节，Ｈ＝Ｅｉ ≫ ４，Ｌ＝Ｅｉ ∧ ０ｘＦ，０ ≤ ｉ ≤ ｎ８－１（６）最后利用获取的高半字节和低半字节更新对应的频数，即Ｃ４［Ｈ］＝Ｃ４［Ｈ］＋１，Ｃ４［Ｌ］＝Ｃ４［Ｌ］＋１（７）参数ｍ＝４时和ｍ＝８时的统计过程分开实现会使得待检数据序列重复加载，这也是扑克检测效率不高的主要原因之一。如果能更进一步将参数在两种不同取值时的统计过程合并在一起，则可以减少大量的数据重复加载。参数ｍ取４和８合并实现时的频数统计方式为先加载字节数据，然后获取高半字节和低半字节，最后更新ｍ＝４的频数和ｍ＝８的频数，合并式（５）～（７），可得Ｈ＝Ｅｉ ≫ ４，Ｌ＝Ｅｉ ∧ ０ｘＦ，０ ≤ ｉ ≤ ｎ／８－１Ｃ４［Ｈ］＝Ｃ４［Ｈ］＋１，Ｃ４［Ｌ］＝Ｃ４［Ｌ］＋１Ｃ８［Ｅｉ］＝Ｃ８［Ｅｉ］＋１（８）统计量的计算和判断过程还可以进行精简和优化：可根据余不完全伽马函数的性质预先求出Ｐｖａｌｕｅ ≥α 时统计量Ｖ的阈值，让统计值Ｖ直接和此阈值比较，如此可以减少余不完全伽马函数的计算次数。记ｍ＝４时的统计量为Ｖ４，即Ｖ４＝６４ｎ ∑ １５ｉ＝０Ｃ４［ｉ］２ ( ) －ｎ４（９）记ｍ＝８时的统计量为Ｖ８，即Ｖ８＝２０４８ｎ ∑ ２５５ｉ＝０Ｃ８［ｉ］２ ( ) －ｎ８（１０）计算统计值所用的余不完全伽马函数满足性质ｉｇａｍｃ（α，０）＝１，ｉｇａｍｃ（α，¥）＝０。经简单计算可知，当显著水平 α ＝０．０１，ｍ＝４时，统计量Ｖ４的阈值为 λ４＝３０．５７７９１４；当显著水平 α ＝０．０１，ｍ＝８时，统计量Ｖ８的阈值为 λ８＝３１０．４５７３８８。即如果Ｖ４＜ λ４且Ｖ８＜ λ８则认为待检序列通过检测。根据以上描述，优化实现的扑克检测算法如下。算法１优化实现的扑克检测算法输入ｎ／８字节的数据 Εｉ，０ ≤ ｉ ≤ ｎ／８－１；输出检测结果。１）初始化数据：ｉ＝０。Ｃ４［ｊ］＝０，０ ≤ ｊ ≤ １５，Ｃ８［ｊ］＝０，０ ≤ ｊ ≤ ２５５。第４期杨先伟，等：随机序列的扑克检测优化研究 ·５１５·

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】随机序列的扑克检测优化研究