正在加载图片...
·894· 智能系统学报 第13卷 随着生成密码数量的增加,本文提出的PG- 到。但是,与训练集的匹配度可以较好地表现出 RNN方法与PassGAN相比,在匹配度的优势愈发 模型的学习能力的。值得一提的是,我们的RNN 明显;当生成密码数量在103时,PG-RNN模型达 模型生成密码的重复率要远远小于PassGAN,而 到了x2.24倍以上的匹配度(由于数据切分比例 在PassGAN模型生成的密码中,密码的重复率非 不同,我们的训练集包含的密码个数为9804818 (无重复),文献[11]为9926278(无重复))。由于与 常的高,达到80%以上(随着生成密码数增加,甚 训练集匹配上的密码是已知的,因此这部分密码 至大于90%),事实上大量输出重复的密码并没有 完全可以通过基于训练集的字典攻击方式而得 多大意义,反而会增加密码生成的时间。 表3不同训练密码集和规模约为训练集1倍、10倍的新生成密码集在密码字符结构类型的统计情况 Table 3 Character structure categories on training dataset and new generated passwords at the scale of x1,x10 respectively on different datasets 网站名称 数据集 纯数字 纯字母 数字+字母 特殊字符 训练集密码库 0.454 0.124 0.388 0.035 CSDN PG-RNN-x1 0.445 0.117 0.396 0.041 PG-RNN-x10 0.445 0.113 0.403 0.039 训练集密码库 0.166 0.288 0.484 0.062 Rockyou PG-RNN-xI 0.156 0.285 0.491 0.068 PG-RNN-x10 0.168 0.285 0.473 0.074 训练集密码库 0.524 0.206 0.25 0.02 RenRen PG-RNN-x1 0.515 0.203 0.259 0.023 PG-RNN-x10 0.516 0.209 0.25 0.025 训练集密码库 0.057 0.346 0.57 0.028 Yahoo PG-RNN-x1 0.052 0.341 0.572 0.036 PG-RNN-x10 0.051 0.342 0.571 0.035 训练集密码库 0.006 0.061 0.828 0.104 Myspace PG-RNN-x1 0.013 0.061 0.817 0.11 PG-RNN-x10 0.013 0.062 0.816 0.109 3.4 在测试集上的评估效果 的新密码,在测试集上进行了对比测试。详细的 此外,对PG-RNN和PassGAN两个模型生成 对比结果如表4所示。 表4PG-RNN与PassGAN各自的生成密码在Rockyou训练集上的评估结果 Table 4 The evaluation results between PG-RNN and PassGAN on Rockyou training dataset 生成模型 总生成密码数 去重后密码数 重复率/% 在训练集中匹配上的密码数 匹配度% 1000000 996808 0.319 31530 0.327 PG-RNN 10000000 9814651 1.853 246170 2.517 100000000 92363373 7.637 1081612 11.027 1000000 182036 81.796 27320 0.28 Pass-GAN 10000000 1357874 86.421 134647 1.36 100000000 10969748 89.030 487878 4.92 其中,第3列和第5列分别表示的是在测试 以看出,我们的模型在生成的密码数多于 集中匹配上但是没有出现在训练集中的密码个 PassGAN的情况下,能够在测试集上匹配上的比 数(有重复)、在测试集中但不在训练集中的密码 例大于后者,这是理所当然的(由于切分比例不 个数(无重复)。对比两个模型的前两行数据,可 同,我们的测试集包含无重复密码个数是4201550,随着生成密码数量的增加,本文提出 的 PG￾RNN 方法与 PassGAN 相比,在匹配度的优势愈发 明显;当生成密码数量在 108 时,PG-RNN 模型达 到了 x2.24 倍以上的匹配度 (由于数据切分比例 不同,我们的训练集包含的密码个数为 9 804 818 (无重复),文献[11]为 9 926 278(无重复))。由于与 训练集匹配上的密码是已知的,因此这部分密码 完全可以通过基于训练集的字典攻击方式而得 到。但是,与训练集的匹配度可以较好地表现出 模型的学习能力的。值得一提的是,我们的 RNN 模型生成密码的重复率要远远小于 PassGAN,而 在 PassGAN 模型生成的密码中,密码的重复率非 常的高,达到 80% 以上 (随着生成密码数增加,甚 至大于 90%),事实上大量输出重复的密码并没有 多大意义,反而会增加密码生成的时间。 3.4 在测试集上的评估效果 此外,对 PG-RNN 和 PassGAN 两个模型生成 的新密码,在测试集上进行了对比测试。详细的 对比结果如表 4 所示。 其中,第 3 列和第 5 列分别表示的是在测试 集中匹配上但是没有出现在训练集中的密码个 数 (有重复)、在测试集中但不在训练集中的密码 个数 (无重复)。对比两个模型的前两行数据,可 以看出,我们的模型在生成的密码数多 于 PassGAN 的情况下,能够在测试集上匹配上的比 例大于后者,这是理所当然的 (由于切分比例不 同,我们的测试集包含无重复密码个数是 4 201 550, 表 3 不同训练密码集和规模约为训练集 1 倍、10 倍的新生成密码集在密码字符结构类型的统计情况 Table 3 Character structure categories on training dataset and new generated passwords at the scale of x1, x10 respectively on different datasets 网站名称 数据集 纯数字 纯字母 数字+字母 特殊字符 CSDN 训练集密码库 0.454 0.124 0.388 0.035 PG-RNN-x1 0.445 0.117 0.396 0.041 PG-RNN-x10 0.445 0.113 0.403 0.039 Rockyou 训练集密码库 0.166 0.288 0.484 0.062 PG-RNN-x1 0.156 0.285 0.491 0.068 PG-RNN-x10 0.168 0.285 0.473 0.074 RenRen 训练集密码库 0.524 0.206 0.25 0.02 PG-RNN-x1 0.515 0.203 0.259 0.023 PG-RNN-x10 0.516 0.209 0.25 0.025 Yahoo 训练集密码库 0.057 0.346 0.57 0.028 PG-RNN-x1 0.052 0.341 0.572 0.036 PG-RNN-x10 0.051 0.342 0.571 0.035 Myspace 训练集密码库 0.006 0.061 0.828 0.104 PG-RNN-x1 0.013 0.061 0.817 0.11 PG-RNN-x10 0.013 0.062 0.816 0.109 表 4 PG-RNN 与 PassGAN 各自的生成密码在 Rockyou 训练集上的评估结果 Table 4 The evaluation results between PG-RNN and PassGAN on Rockyou training dataset 生成模型 总生成密码数 去重后密码数 重复率/% 在训练集中匹配上的密码数 匹配度/% PG-RNN 1 000 000 996 808 0.319 31 530 0.327 10 000 000 9 814 651 1.853 246 170 2.517 100 000 000 92 363 373 7.637 1 081 612 11.027 Pass-GAN 1 000 000 182 036 81.796 27 320 0.28 10 000 000 1 357 874 86.421 134 647 1.36 100 000 000 10 969 748 89.030 487 878 4.92 ·894· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有