随着生成密码数量的增加，本文提出的 PGRNN 方法与 PassGAN

正在加载图片...

·894· 智能系统学报第13卷随着生成密码数量的增加，本文提出的PG- 到。但是，与训练集的匹配度可以较好地表现出 RNN方法与PassGAN相比，在匹配度的优势愈发模型的学习能力的。值得一提的是，我们的RNN 明显；当生成密码数量在103时，PG-RNN模型达模型生成密码的重复率要远远小于PassGAN,而到了x2.24倍以上的匹配度（由于数据切分比例在PassGAN模型生成的密码中，密码的重复率非不同，我们的训练集包含的密码个数为9804818 (无重复)，文献[11]为9926278（无重复）)。由于与常的高，达到80%以上（随着生成密码数增加，甚训练集匹配上的密码是已知的，因此这部分密码至大于90%)，事实上大量输出重复的密码并没有完全可以通过基于训练集的字典攻击方式而得多大意义，反而会增加密码生成的时间。表3不同训练密码集和规模约为训练集1倍、10倍的新生成密码集在密码字符结构类型的统计情况 Table 3 Character structure categories on training dataset and new generated passwords at the scale of x1,x10 respectively on different datasets 网站名称数据集纯数字纯字母数字+字母特殊字符训练集密码库 0.454 0.124 0.388 0.035 CSDN PG-RNN-x1 0.445 0.117 0.396 0.041 PG-RNN-x10 0.445 0.113 0.403 0.039 训练集密码库 0.166 0.288 0.484 0.062 Rockyou PG-RNN-xI 0.156 0.285 0.491 0.068 PG-RNN-x10 0.168 0.285 0.473 0.074 训练集密码库 0.524 0.206 0.25 0.02 RenRen PG-RNN-x1 0.515 0.203 0.259 0.023 PG-RNN-x10 0.516 0.209 0.25 0.025 训练集密码库 0.057 0.346 0.57 0.028 Yahoo PG-RNN-x1 0.052 0.341 0.572 0.036 PG-RNN-x10 0.051 0.342 0.571 0.035 训练集密码库 0.006 0.061 0.828 0.104 Myspace PG-RNN-x1 0.013 0.061 0.817 0.11 PG-RNN-x10 0.013 0.062 0.816 0.109 3.4 在测试集上的评估效果的新密码，在测试集上进行了对比测试。详细的此外，对PG-RNN和PassGAN两个模型生成对比结果如表4所示。表4PG-RNN与PassGAN各自的生成密码在Rockyou训练集上的评估结果 Table 4 The evaluation results between PG-RNN and PassGAN on Rockyou training dataset 生成模型总生成密码数去重后密码数重复率/% 在训练集中匹配上的密码数匹配度% 1000000 996808 0.319 31530 0.327 PG-RNN 10000000 9814651 1.853 246170 2.517 100000000 92363373 7.637 1081612 11.027 1000000 182036 81.796 27320 0.28 Pass-GAN 10000000 1357874 86.421 134647 1.36 100000000 10969748 89.030 487878 4.92 其中，第3列和第5列分别表示的是在测试以看出，我们的模型在生成的密码数多于集中匹配上但是没有出现在训练集中的密码个 PassGAN的情况下，能够在测试集上匹配上的比数（有重复）、在测试集中但不在训练集中的密码例大于后者，这是理所当然的（由于切分比例不个数（无重复）。对比两个模型的前两行数据，可同，我们的测试集包含无重复密码个数是4201550，随着生成密码数量的增加，本文提出的 PGRNN 方法与 PassGAN 相比，在匹配度的优势愈发明显；当生成密码数量在 108 时，PG-RNN 模型达到了 x2.24 倍以上的匹配度 (由于数据切分比例不同，我们的训练集包含的密码个数为 9 804 818 (无重复)，文献[11]为 9 926 278(无重复))。由于与训练集匹配上的密码是已知的，因此这部分密码完全可以通过基于训练集的字典攻击方式而得到。但是，与训练集的匹配度可以较好地表现出模型的学习能力的。值得一提的是，我们的 RNN 模型生成密码的重复率要远远小于 PassGAN，而在 PassGAN 模型生成的密码中，密码的重复率非常的高，达到 80% 以上 (随着生成密码数增加，甚至大于 90%)，事实上大量输出重复的密码并没有多大意义，反而会增加密码生成的时间。 3.4 在测试集上的评估效果此外，对 PG-RNN 和 PassGAN 两个模型生成的新密码，在测试集上进行了对比测试。详细的对比结果如表 4 所示。其中，第 3 列和第 5 列分别表示的是在测试集中匹配上但是没有出现在训练集中的密码个数 (有重复)、在测试集中但不在训练集中的密码个数 (无重复)。对比两个模型的前两行数据，可以看出，我们的模型在生成的密码数多于 PassGAN 的情况下，能够在测试集上匹配上的比例大于后者，这是理所当然的 (由于切分比例不同，我们的测试集包含无重复密码个数是 4 201 550，表 3 不同训练密码集和规模约为训练集 1 倍、10 倍的新生成密码集在密码字符结构类型的统计情况 Table 3 Character structure categories on training dataset and new generated passwords at the scale of x1, x10 respectively on different datasets 网站名称数据集纯数字纯字母数字+字母特殊字符 CSDN 训练集密码库 0.454 0.124 0.388 0.035 PG-RNN-x1 0.445 0.117 0.396 0.041 PG-RNN-x10 0.445 0.113 0.403 0.039 Rockyou 训练集密码库 0.166 0.288 0.484 0.062 PG-RNN-x1 0.156 0.285 0.491 0.068 PG-RNN-x10 0.168 0.285 0.473 0.074 RenRen 训练集密码库 0.524 0.206 0.25 0.02 PG-RNN-x1 0.515 0.203 0.259 0.023 PG-RNN-x10 0.516 0.209 0.25 0.025 Yahoo 训练集密码库 0.057 0.346 0.57 0.028 PG-RNN-x1 0.052 0.341 0.572 0.036 PG-RNN-x10 0.051 0.342 0.571 0.035 Myspace 训练集密码库 0.006 0.061 0.828 0.104 PG-RNN-x1 0.013 0.061 0.817 0.11 PG-RNN-x10 0.013 0.062 0.816 0.109 表 4 PG-RNN 与 PassGAN 各自的生成密码在 Rockyou 训练集上的评估结果 Table 4 The evaluation results between PG-RNN and PassGAN on Rockyou training dataset 生成模型总生成密码数去重后密码数重复率/% 在训练集中匹配上的密码数匹配度/% PG-RNN 1 000 000 996 808 0.319 31 530 0.327 10 000 000 9 814 651 1.853 246 170 2.517 100 000 000 92 363 373 7.637 1 081 612 11.027 Pass-GAN 1 000 000 182 036 81.796 27 320 0.28 10 000 000 1 357 874 86.421 134 647 1.36 100 000 000 10 969 748 89.030 487 878 4.92 ·894· 智能系统学报第 13 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】PG-RNN一种基于递归神经网络的密码猜测模型