·786· 智能系统学报 第12卷 表3正常路径序列模式集 到如下结果,图像如图2所示。 Table 3 Normal set of road sequences f(△)=0.1726×(2.11×△)°.308 支持度 高频行为规则数 支持度 高频行为规则数 R2为0.983,证明该函数对数据有较好的拟合 200 4663 280 1433 效果。 210 3992 290 1277 100 220 3417 300 1111 230 2917 310 961 40 240 2516 320 853 250 2211 330 745 10 2030405060 260 1891 340 675 刷卡间隔/min 270 1639 350 592 图2刷卡间隔与累积频率拟合曲线 100 Fig.2 Fitted curve of swiping card interval and cumulat- 90 ive frequency 0100000020200 4.3异常行为发现及对比 该部门的人员有不同程度的加班行为,但是早 上的正常工作时间多为8点开始,不少工作人员7点 0 51015202530354045505560 刷卡间隔/min 多就会到达工作地点进行准备,因此设定threshold 图1刷卡间隔与累积频率曲线 为7,即异常时间段阈值为早上7点。采集该部门 Fig.1 Curve of swiping card interval and cumulative fre- 门禁记录中的剩余数据,处理后得到无标签的测试 quency 路径序列数据库(620条),对得到的测试路径序列 从图1中可以看出刷卡间隔和累积频率存在较 数据库计算序列异常度分数,得到在不同支持度下 明显的函数关系,利用MATLAB对其进行拟合,得 的结果,部分结果如图3所示。 300r 300r 250 250 200 150 100 100 50 50 10 2030 40 50 607080 0 1020 30 40 50607080 分数 分数 (a)支持度=200 (b)支持度=250 300, 300 250 250 200 200 150 8150 100 100 50 50 1020304050607080 01020304050607080 分数 分数 (c)支持度=300 (d支持度=350 图3序列异常度分数分布 Fig.3 Distribution of score of sequence's abnormal degree 从图3中可以看出,随着支持度的增加,计算下通过将计算得到的待评价序列的序列异常度分数 得到的序列异常度分数整体增大,高分段的集中区 集合中的最高值减去当前差值后成为当前阈值。利 域在x轴上向右推进,计算得到的最大分数也逐渐 用本文方法得到在不同支持度下的结果后,为了便 增大。接下来,进行报警率曲线的绘制,在报警率 于比较和传统方法得到结果的差别,在此一并绘制 曲线中,纵轴为报警率,即在当前阈值下报警的异 了利用精确匹配得到的结果图像,部分结果如图4 常行为序列数占总序列数的百分比;横轴为人工设 所示。 定的差值,从0开始递增,间隔为l,在每个min_sup 从图4中可以看出,在本文方法得到的曲线从图 1 中可以看出刷卡间隔和累积频率存在较 明显的函数关系,利用 MATLAB 对其进行拟合,得 到如下结果,图像如图 2 所示。 f (∆t) = 0.172 6×(2.11×∆t) 0.370 8 R 2 为 0.983,证明该函数对数据有较好的拟合 效果。 4.3 异常行为发现及对比 该部门的人员有不同程度的加班行为,但是早 上的正常工作时间多为 8 点开始,不少工作人员 7 点 多就会到达工作地点进行准备,因此设定 threshold 为 7,即异常时间段阈值为早上 7 点。采集该部门 门禁记录中的剩余数据,处理后得到无标签的测试 路径序列数据库(620 条),对得到的测试路径序列 数据库计算序列异常度分数,得到在不同支持度下 的结果,部分结果如图 3 所示。 从图 3 中可以看出,随着支持度的增加,计算 得到的序列异常度分数整体增大,高分段的集中区 域在 x 轴上向右推进,计算得到的最大分数也逐渐 增大。接下来,进行报警率曲线的绘制,在报警率 曲线中,纵轴为报警率,即在当前阈值下报警的异 常行为序列数占总序列数的百分比;横轴为人工设 定的差值,从 0 开始递增,间隔为 1,在每个 min_sup 下通过将计算得到的待评价序列的序列异常度分数 集合中的最高值减去当前差值后成为当前阈值。利 用本文方法得到在不同支持度下的结果后,为了便 于比较和传统方法得到结果的差别,在此一并绘制 了利用精确匹配得到的结果图像,部分结果如图 4 所示。 从图 4 中可以看出,在本文方法得到的曲线 表 3 正常路径序列模式集 Table 3 Normal set of road sequences 支持度 高频行为规则数 支持度 高频行为规则数 200 4 663 280 1 433 210 3 992 290 1 277 220 3 417 300 1 111 230 2 917 310 961 240 2 516 320 853 250 2 211 330 745 260 1 891 340 675 270 1 639 350 592 0 10 20 30 40 50 60 70 80 90 100 ㉛⼛䶽⢳/% ࢍݣ䬠䯀/NJO 5 10 15 20 25 30 35 40 45 50 55 60 图 1 刷卡间隔与累积频率曲线 Fig. 1 Curve of swiping card interval and cumulative frequency 20 40 60 80 100 ㉛⼛䶽⢳/% 0 10 20 30 40 50 60 ࢍݣ䬠䯀/NJO 图 2 刷卡间隔与累积频率拟合曲线 Fig. 2 Fitted curve of swiping card interval and cumulative frequency 0 10 20 30 40 50 60 70 80 50 100 150 200 250 300 ܲ 䛻 (a) ᩛᠭᏒ=200 0 10 20 30 40 50 60 70 80 50 100 150 200 250 300 ܲ 䛻 (b) ᩛᠭᏒ=250 0 10 20 30 40 50 60 70 80 50 100 150 200 250 300 ܲ 䛻 (c) ᩛᠭᏒ=300 0 10 20 30 40 50 60 70 80 50 100 150 200 250 300 ܲ 䛻 (d) ᩛᠭᏒ=350 图 3 序列异常度分数分布 Fig. 3 Distribution of score of sequence’s abnormal degree ·786· 智 能 系 统 学 报 第 12 卷