正在加载图片...
·254. 智能系统学报 第11卷 小错误率上却能够优于DTW和DDTW的错误率。 290.5 90.5 然而,在有些数据集如ECG,不管0取何值,新方法 0.4 解0.4 飞 的分类错误率都是低于另外两者的错误率。 =0.3 誓0.3 罕 0.35-PADD-DTW 0.25 0.2 DDTW --PADD-DTW S01 0.1 03 0.20 aavd DDTW 0 0.1 0.20.30.40.5 0 0.10.20.30.40.5 张 DTW错误率I% DDTW错误率/% 0.25 彩 (a)PADD平均错误率vs (b)PADD平均错误率vs 0.10 DTW错误率 DDTW错误率 0.5 0.5t 0.20 0.05 246 810 6 8 10 卧0.4 解0.4 (a)Sony AlBO RobotSurface (b)ECG 0.3 点 +++ 把0.3 + 图5分类错误率和时间序列分段聚合长度的关系 Fig.5 The relationship of classification and the length 0.1 十 of time series piecewise aggregation 0 0.10.20.30.40.5 0 0.10.20.30.40.5 从图5中发现,不同数据集呈现出来的性能不 DTW错误率/% DDTW错误率/% 一样。由于分段聚合近似采用的是均值作为替代 (c)PADD最小错误率vs (d)PADD最小错误率vs DTW错误率 DDTW错误率 值,这并非最佳的降维方法,因此,若数据集中的序 图7分类错误率的比较 列数据波动较多、振幅较大,会对降维效果造成一定 Fig.7 Comparison of classification error rates 的影响。如图6所示。 图7中子图(a)、(b)分别描述PADD的平均错 误率与DTW、DDTW的错误率比较,子图(c)、(d) 分别描述PADD最小错误率与DTW、DDTW错误率 比较。结果分析表明,不管从平均错误率还是最小 错误率角度来比较,PADD错误率所对应的坐标纵 10203040506070 轴值相对较小,使其偏向于DTW和DDTW所代表 时间戳/s (a)Sony AIBO Robot Surface 的横轴值较大,大多散点都偏向于DTW和DDTW, 故说明PADD具有较小的分类错误率,进行验证了 本文新方法在时间序列度量中的有效性和优越性。 3.2时间效率分析 本实验使用“留一法”(leave-one-out)求解参 20 4060 80 100 数,参数确定后立即构建度量距离公式。特征序列 时间戰/s 长度越长,计算所要消耗的时间越大,且成数量级增 (b)ECG 图6实验数据集序列示例 长。如图8所示,描述了数据集Sony AIB0 Robot Fig.6 The example of datasets Surface和ECG在不同o条件下PADD时间效率与 图6分别给出的是训练集Sony AIBO Robot DTW、DDTW的时间效率比较。 Surface和ECG的3条时间序列,可以观察到子图 由于DDTW需要利用式(4)预先对时间序列数 (a)的序列在整体波动上比子图(b)的多。因此, 据进行求导,因此DDTW时间效率略高于DTW时 影响了序列降维的效果,给后续的相似性度量造成 间效率。另外,随着特征序列长度0的增长,PADD 了一定的影响。由于数据集的特性会给本方法造成 消耗的时间也随之增长。当分段数目增长到 一定的影响,因此,本方法适合波动较为平缓的数据 定程度时,PADD的计算时间消耗会大于传统DTW 集,并会取得较好的效果。 和DDTW方法。理论上结合时间复杂度的分析可 图7描述的是PADD的平均分类错误率以及最 知,PADD的时间复杂度近似为O(202+4n),DTW 小分类错误率与DTW、DDTW的错误率的比较,为 和DDTW的时间复杂度为O(n2),当且仅当0< 了便于直观比较,数值均经过归一化后取值范围为 (n-2)2-4 时,PADD的时间效率要低于DTW [0,0.5],数值偏向方表示对应方法的错误率较大。小错误率上却能够优于 DTW 和 DDTW 的错误率。 然而,在有些数据集如 ECG,不管 w 取何值,新方法 的分类错误率都是低于另外两者的错误率。 图 5 分类错误率和时间序列分段聚合长度的关系 Fig.5 The relationship of classification and the length of time series piecewise aggregation 从图 5 中发现,不同数据集呈现出来的性能不 一样。 由于分段聚合近似采用的是均值作为替代 值,这并非最佳的降维方法,因此,若数据集中的序 列数据波动较多、振幅较大,会对降维效果造成一定 的影响。 如图 6 所示。 图 6 实验数据集序列示例 Fig.6 The example of datasets 图 6 分别给出的是训练集 Sony AIBO Robot Surface 和 ECG 的 3 条时间序列,可以观察到子图 (a) 的序列在整体波动上比子图( b)的多。 因此, 影响了序列降维的效果,给后续的相似性度量造成 了一定的影响。 由于数据集的特性会给本方法造成 一定的影响,因此,本方法适合波动较为平缓的数据 集,并会取得较好的效果。 图 7 描述的是 PADD 的平均分类错误率以及最 小分类错误率与 DTW、DDTW 的错误率的比较,为 了便于直观比较,数值均经过归一化后取值范围为 [0,0.5],数值偏向方表示对应方法的错误率较大。 图 7 分类错误率的比较 Fig.7 Comparison of classification error rates 图 7 中子图(a)、(b)分别描述 PADD 的平均错 误率与 DTW、DDTW 的错误率比较,子图( c)、( d) 分别描述 PADD 最小错误率与 DTW、DDTW 错误率 比较。 结果分析表明,不管从平均错误率还是最小 错误率角度来比较,PADD 错误率所对应的坐标纵 轴值相对较小,使其偏向于 DTW 和 DDTW 所代表 的横轴值较大,大多散点都偏向于 DTW 和 DDTW, 故说明 PADD 具有较小的分类错误率,进行验证了 本文新方法在时间序列度量中的有效性和优越性。 3.2 时间效率分析 本实验使用“留一法” ( leave⁃one⁃out) 求解参 数,参数确定后立即构建度量距离公式。 特征序列 长度越长,计算所要消耗的时间越大,且成数量级增 长。 如图 8 所示,描述了数据集 Sony AIBO Robot Surface 和 ECG 在不同 w 条件下 PADD 时间效率与 DTW、DDTW 的时间效率比较。 由于 DDTW 需要利用式(4)预先对时间序列数 据进行求导,因此 DDTW 时间效率略高于 DTW 时 间效率。 另外,随着特征序列长度 w 的增长,PADD 消耗的时间也随之增长。 当分段数目 w 增长到一 定程度时,PADD 的计算时间消耗会大于传统 DTW 和 DDTW 方法。 理论上结合时间复杂度的分析可 知,PADD 的时间复杂度近似为 O(2w 2 + 4n) ,DTW 和 DDTW 的时间复杂度为 O(n 2 ) ,当且仅当 w < (n - 2) 2 - 4 2 时,PADD 的时间效率要低于 DTW ·254· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有