正在加载图片...
·1196· 智能系统学报 第14卷 像序列在不同维度上的实验结果,如图15~17 确的,例如图I7中的Multiplication序列和Nes- 所示(其中包括正确的预测和错误的预测)。 td序列等。3)结果输出中的位数越大,其预测出 Linear Multiplication 错的可能性就会越大,因为计算位数越大,相对 559 而言,其难度就会越大,预测错误的可能性就会 input 495 2237 加大。 158 Linear Multiplication output 3428 521 6928 35B01 352 ground truth 342 51通 316928 358016 input 5 predict correct correct 42541 wrong wrong FIo Nested 408 378 64238 29792 162 427 2084548 input output 305 2312552 14591837 ground truth 4463 3052 2312582414591837 output 3g 160 predict correct wrong wrong ground truth 30g 160 6180 F10 Nested predict wrong correct wrong 5267 551 29 18 图154维图像序列 input 46 437 25 Fig.15 4-dimensional image sequences 399 645 Linear Multiplication 863 2 11034 661 4281 output 1253 176 467 input 35 493 63 ground truth 1263 2 17680 1261 predict C0元e时 2I937 wrong correct wrong 图176维图像序列 output 5 2520 Fig.17 6-dimensional image sequences ground truth 5697 43羽 25200 659125 predict correct wrong correct wrong 3结束语 Fio Nested 数字序列逻辑学习任务一直以来都是人工智 能的一个研究热点。而且未知的数字和规则的模 input 型构建数字序列问题的预测始终是一个具有挑战 性的任务。传统的数字序列技术是基于已知数字 的含义下,并根据序列本身的规律特征构造满足 output 145 53 该规律的模式,以便进行数字序列的预测。本文 ground truth 20 816 5279 的方法是在不知道图像间关系和图像内包含的内 predict correct wrong correct wrong 容的意义的情况下利用深度学习的方法完成数字 图165维图像序列 序列逻辑学习任务来预测下一张图像内容。同 Fig.16 5-dimensional image sequences 时,人类对于这种未知的数字和规则的模型构建 本文仅展示了4维、5维、6维图像序列的部 的数字序列极易限制其中,无法快速计算出结果 分实验结果。从这些实验结果发现预测误差的原 甚至无法得到正确结果。而本文所提出的方法为 因可能如下:1)当输出图像模糊时,很容易引起 解决此类序列问题提供了一种可能。 OCR工具识别错误,例如图15中的Fio序列,观 在未来的工作中,我们将进一步探索如何提 察错误的那一栏,当输出图像模糊时,图像中输 高精度及对缺失数据的预测,同时期望可以对任 出结果的第2位(从右往左)有可能是6或8,这 意位置的图像内容进行预测,而非单一地对下一 就极易导致OCR的识别出错,再如,图15~16 张的图像内容进行预测,特别地,下一步希望可 中的Multiplication序列,图l6中的Linear序列和 以提出更适用于数字预测逻辑学习任务的模型以 Fo序列等。2)其对负号的图像预测有时是不准 求精度上面的突破。像序列在不同维度上的实验结果,如图 15~17 所示 (其中包括正确的预测和错误的预测)。 Linear Multiplication input output ground truth predict input output ground truth predict correct wrong correct wrong correct wrong correct wrong Fio Nested 图 15 4 维图像序列 Fig. 15 4-dimensional image sequences Linear Multiplication input output ground truth predict input output ground truth predict correct wrong correct wrong correct wrong correct wrong Fio Nested 图 16 5 维图像序列 Fig. 16 5-dimensional image sequences 本文仅展示了 4 维、5 维、6 维图像序列的部 分实验结果。从这些实验结果发现预测误差的原 因可能如下:1) 当输出图像模糊时,很容易引起 OCR 工具识别错误,例如图 15 中的 Fio 序列,观 察错误的那一栏,当输出图像模糊时,图像中输 出结果的第 2 位 (从右往左) 有可能是 6 或 8,这 就极易导致 OCR 的识别出错,再如,图 15~16 中的 Multiplication 序列,图 16 中的 Linear 序列和 Fio 序列等。2) 其对负号的图像预测有时是不准 确的,例如图 17 中的 Multiplication 序列和 Nes￾ted 序列等。3) 结果输出中的位数越大,其预测出 错的可能性就会越大,因为计算位数越大,相对 而言,其难度就会越大,预测错误的可能性就会 加大。 Linear Multiplication input output ground truth predict input output ground truth predict correct wrong correct wrong correct wrong correct wrong Fio Nested 图 17 6 维图像序列 Fig. 17 6-dimensional image sequences 3 结束语 数字序列逻辑学习任务一直以来都是人工智 能的一个研究热点。而且未知的数字和规则的模 型构建数字序列问题的预测始终是一个具有挑战 性的任务。传统的数字序列技术是基于已知数字 的含义下,并根据序列本身的规律特征构造满足 该规律的模式,以便进行数字序列的预测。本文 的方法是在不知道图像间关系和图像内包含的内 容的意义的情况下利用深度学习的方法完成数字 序列逻辑学习任务来预测下一张图像内容。同 时,人类对于这种未知的数字和规则的模型构建 的数字序列极易限制其中,无法快速计算出结果 甚至无法得到正确结果。而本文所提出的方法为 解决此类序列问题提供了一种可能。 在未来的工作中,我们将进一步探索如何提 高精度及对缺失数据的预测,同时期望可以对任 意位置的图像内容进行预测,而非单一地对下一 张的图像内容进行预测,特别地,下一步希望可 以提出更适用于数字预测逻辑学习任务的模型以 求精度上面的突破。 ·1196· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有