小错误率上却能够优于ＤＴＷ和ＤＤＴＷ的错误率。然而，在有些数据集

正在加载图片...

·254. 智能系统学报第11卷小错误率上却能够优于DTW和DDTW的错误率。 290.5 90.5 然而，在有些数据集如ECG,不管0取何值，新方法 0.4 解0.4 飞的分类错误率都是低于另外两者的错误率。 =0.3 誓0.3 罕 0.35-PADD-DTW 0.25 0.2 DDTW --PADD-DTW S01 0.1 03 0.20 aavd DDTW 0 0.1 0.20.30.40.5 0 0.10.20.30.40.5 张 DTW错误率I% DDTW错误率/% 0.25 彩 (a)PADD平均错误率vs (b)PADD平均错误率vs 0.10 DTW错误率 DDTW错误率 0.5 0.5t 0.20 0.05 246 810 6 8 10 卧0.4 解0.4 (a)Sony AlBO RobotSurface (b)ECG 0.3 点 +++ 把0.3 + 图5分类错误率和时间序列分段聚合长度的关系 Fig.5 The relationship of classification and the length 0.1 十 of time series piecewise aggregation 0 0.10.20.30.40.5 0 0.10.20.30.40.5 从图5中发现，不同数据集呈现出来的性能不 DTW错误率/% DDTW错误率/% 一样。由于分段聚合近似采用的是均值作为替代 (c)PADD最小错误率vs (d)PADD最小错误率vs DTW错误率 DDTW错误率值，这并非最佳的降维方法，因此，若数据集中的序图7分类错误率的比较列数据波动较多、振幅较大，会对降维效果造成一定 Fig.7 Comparison of classification error rates 的影响。如图6所示。图7中子图(a)、(b)分别描述PADD的平均错误率与DTW、DDTW的错误率比较，子图(c)、(d) 分别描述PADD最小错误率与DTW、DDTW错误率比较。结果分析表明，不管从平均错误率还是最小错误率角度来比较，PADD错误率所对应的坐标纵 10203040506070 轴值相对较小，使其偏向于DTW和DDTW所代表时间戳/s (a)Sony AIBO Robot Surface 的横轴值较大，大多散点都偏向于DTW和DDTW, 故说明PADD具有较小的分类错误率，进行验证了本文新方法在时间序列度量中的有效性和优越性。 3.2时间效率分析本实验使用“留一法”(leave-one-out)求解参 20 4060 80 100 数，参数确定后立即构建度量距离公式。特征序列时间戰/s 长度越长，计算所要消耗的时间越大，且成数量级增 (b)ECG 图6实验数据集序列示例长。如图8所示，描述了数据集Sony AIB0 Robot Fig.6 The example of datasets Surface和ECG在不同o条件下PADD时间效率与图6分别给出的是训练集Sony AIBO Robot DTW、DDTW的时间效率比较。 Surface和ECG的3条时间序列，可以观察到子图由于DDTW需要利用式(4)预先对时间序列数 (a)的序列在整体波动上比子图(b)的多。因此，据进行求导，因此DDTW时间效率略高于DTW时影响了序列降维的效果，给后续的相似性度量造成间效率。另外，随着特征序列长度0的增长，PADD 了一定的影响。由于数据集的特性会给本方法造成消耗的时间也随之增长。当分段数目增长到一定的影响，因此，本方法适合波动较为平缓的数据定程度时，PADD的计算时间消耗会大于传统DTW 集，并会取得较好的效果。和DDTW方法。理论上结合时间复杂度的分析可图7描述的是PADD的平均分类错误率以及最知，PADD的时间复杂度近似为O(202+4n),DTW 小分类错误率与DTW、DDTW的错误率的比较，为和DDTW的时间复杂度为O(n2),当且仅当0< 了便于直观比较，数值均经过归一化后取值范围为 (n-2)2-4 时，PADD的时间效率要低于DTW [0,0.5],数值偏向方表示对应方法的错误率较大。小错误率上却能够优于ＤＴＷ和ＤＤＴＷ的错误率。然而，在有些数据集如ＥＣＧ，不管ｗ取何值，新方法的分类错误率都是低于另外两者的错误率。图５分类错误率和时间序列分段聚合长度的关系Ｆｉｇ．５Ｔｈｅｒｅｌａｔｉｏｎｓｈｉｐｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎａｎｄｔｈｅｌｅｎｇｔｈｏｆｔｉｍｅｓｅｒｉｅｓｐｉｅｃｅｗｉｓｅａｇｇｒｅｇａｔｉｏｎ从图５中发现，不同数据集呈现出来的性能不一样。由于分段聚合近似采用的是均值作为替代值，这并非最佳的降维方法，因此，若数据集中的序列数据波动较多、振幅较大，会对降维效果造成一定的影响。如图６所示。图６实验数据集序列示例Ｆｉｇ．６Ｔｈｅｅｘａｍｐｌｅｏｆｄａｔａｓｅｔｓ图６分别给出的是训练集ＳｏｎｙＡＩＢＯＲｏｂｏｔＳｕｒｆａｃｅ和ＥＣＧ的３条时间序列，可以观察到子图（ａ）的序列在整体波动上比子图（ｂ）的多。因此，影响了序列降维的效果，给后续的相似性度量造成了一定的影响。由于数据集的特性会给本方法造成一定的影响，因此，本方法适合波动较为平缓的数据集，并会取得较好的效果。图７描述的是ＰＡＤＤ的平均分类错误率以及最小分类错误率与ＤＴＷ、ＤＤＴＷ的错误率的比较，为了便于直观比较，数值均经过归一化后取值范围为［０，０．５］，数值偏向方表示对应方法的错误率较大。图７分类错误率的比较Ｆｉｇ．７Ｃｏｍｐａｒｉｓｏｎｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎｅｒｒｏｒｒａｔｅｓ图７中子图（ａ）、（ｂ）分别描述ＰＡＤＤ的平均错误率与ＤＴＷ、ＤＤＴＷ的错误率比较，子图（ｃ）、（ｄ）分别描述ＰＡＤＤ最小错误率与ＤＴＷ、ＤＤＴＷ错误率比较。结果分析表明，不管从平均错误率还是最小错误率角度来比较，ＰＡＤＤ错误率所对应的坐标纵轴值相对较小，使其偏向于ＤＴＷ和ＤＤＴＷ所代表的横轴值较大，大多散点都偏向于ＤＴＷ和ＤＤＴＷ，故说明ＰＡＤＤ具有较小的分类错误率，进行验证了本文新方法在时间序列度量中的有效性和优越性。３．２时间效率分析本实验使用“留一法” （ｌｅａｖｅ⁃ｏｎｅ⁃ｏｕｔ）求解参数，参数确定后立即构建度量距离公式。特征序列长度越长，计算所要消耗的时间越大，且成数量级增长。如图８所示，描述了数据集ＳｏｎｙＡＩＢＯＲｏｂｏｔＳｕｒｆａｃｅ和ＥＣＧ在不同ｗ条件下ＰＡＤＤ时间效率与ＤＴＷ、ＤＤＴＷ的时间效率比较。由于ＤＤＴＷ需要利用式（４）预先对时间序列数据进行求导，因此ＤＤＴＷ时间效率略高于ＤＴＷ时间效率。另外，随着特征序列长度ｗ的增长，ＰＡＤＤ消耗的时间也随之增长。当分段数目ｗ增长到一定程度时，ＰＡＤＤ的计算时间消耗会大于传统ＤＴＷ和ＤＤＴＷ方法。理论上结合时间复杂度的分析可知，ＰＡＤＤ的时间复杂度近似为Ｏ（２ｗ２＋４ｎ），ＤＴＷ和ＤＤＴＷ的时间复杂度为Ｏ（ｎ２），当且仅当ｗ＜（ｎ－２）２－４２时，ＰＡＤＤ的时间效率要低于ＤＴＷ ·２５４· 智能系统学报第１１卷

<<向上翻页向下翻页>>

点击下载：【人工智能基础】分段聚合近似和数值导数的动态时间弯曲方法编辑部