像序列在不同维度上的实验结果，如图 15~17 所示 (其中包括正确的预测

正在加载图片...

·1196· 智能系统学报第14卷像序列在不同维度上的实验结果，如图15~17 确的，例如图I7中的Multiplication序列和Nes- 所示（其中包括正确的预测和错误的预测）。 td序列等。3)结果输出中的位数越大，其预测出 Linear Multiplication 错的可能性就会越大，因为计算位数越大，相对 559 而言，其难度就会越大，预测错误的可能性就会 input 495 2237 加大。 158 Linear Multiplication output 3428 521 6928 35B01 352 ground truth 342 51通 316928 358016 input 5 predict correct correct 42541 wrong wrong FIo Nested 408 378 64238 29792 162 427 2084548 input output 305 2312552 14591837 ground truth 4463 3052 2312582414591837 output 3g 160 predict correct wrong wrong ground truth 30g 160 6180 F10 Nested predict wrong correct wrong 5267 551 29 18 图154维图像序列 input 46 437 25 Fig.15 4-dimensional image sequences 399 645 Linear Multiplication 863 2 11034 661 4281 output 1253 176 467 input 35 493 63 ground truth 1263 2 17680 1261 predict C0元e时 2I937 wrong correct wrong 图176维图像序列 output 5 2520 Fig.17 6-dimensional image sequences ground truth 5697 43羽 25200 659125 predict correct wrong correct wrong 3结束语 Fio Nested 数字序列逻辑学习任务一直以来都是人工智能的一个研究热点。而且未知的数字和规则的模 input 型构建数字序列问题的预测始终是一个具有挑战性的任务。传统的数字序列技术是基于已知数字的含义下，并根据序列本身的规律特征构造满足 output 145 53 该规律的模式，以便进行数字序列的预测。本文 ground truth 20 816 5279 的方法是在不知道图像间关系和图像内包含的内 predict correct wrong correct wrong 容的意义的情况下利用深度学习的方法完成数字图165维图像序列序列逻辑学习任务来预测下一张图像内容。同 Fig.16 5-dimensional image sequences 时，人类对于这种未知的数字和规则的模型构建本文仅展示了4维、5维、6维图像序列的部的数字序列极易限制其中，无法快速计算出结果分实验结果。从这些实验结果发现预测误差的原甚至无法得到正确结果。而本文所提出的方法为因可能如下：1)当输出图像模糊时，很容易引起解决此类序列问题提供了一种可能。 OCR工具识别错误，例如图15中的Fio序列，观在未来的工作中，我们将进一步探索如何提察错误的那一栏，当输出图像模糊时，图像中输高精度及对缺失数据的预测，同时期望可以对任出结果的第2位（从右往左）有可能是6或8，这意位置的图像内容进行预测，而非单一地对下一就极易导致OCR的识别出错，再如，图15~16 张的图像内容进行预测，特别地，下一步希望可中的Multiplication序列，图l6中的Linear序列和以提出更适用于数字预测逻辑学习任务的模型以 Fo序列等。2)其对负号的图像预测有时是不准求精度上面的突破。像序列在不同维度上的实验结果，如图 15~17 所示 (其中包括正确的预测和错误的预测)。 Linear Multiplication input output ground truth predict input output ground truth predict correct wrong correct wrong correct wrong correct wrong Fio Nested 图 15 4 维图像序列 Fig. 15 4-dimensional image sequences Linear Multiplication input output ground truth predict input output ground truth predict correct wrong correct wrong correct wrong correct wrong Fio Nested 图 16 5 维图像序列 Fig. 16 5-dimensional image sequences 本文仅展示了 4 维、5 维、6 维图像序列的部分实验结果。从这些实验结果发现预测误差的原因可能如下：1) 当输出图像模糊时，很容易引起 OCR 工具识别错误，例如图 15 中的 Fio 序列，观察错误的那一栏，当输出图像模糊时，图像中输出结果的第 2 位 (从右往左) 有可能是 6 或 8，这就极易导致 OCR 的识别出错，再如，图 15~16 中的 Multiplication 序列，图 16 中的 Linear 序列和 Fio 序列等。2) 其对负号的图像预测有时是不准确的，例如图 17 中的 Multiplication 序列和 Nested 序列等。3) 结果输出中的位数越大，其预测出错的可能性就会越大，因为计算位数越大，相对而言，其难度就会越大，预测错误的可能性就会加大。 Linear Multiplication input output ground truth predict input output ground truth predict correct wrong correct wrong correct wrong correct wrong Fio Nested 图 17 6 维图像序列 Fig. 17 6-dimensional image sequences 3 结束语数字序列逻辑学习任务一直以来都是人工智能的一个研究热点。而且未知的数字和规则的模型构建数字序列问题的预测始终是一个具有挑战性的任务。传统的数字序列技术是基于已知数字的含义下，并根据序列本身的规律特征构造满足该规律的模式，以便进行数字序列的预测。本文的方法是在不知道图像间关系和图像内包含的内容的意义的情况下利用深度学习的方法完成数字序列逻辑学习任务来预测下一张图像内容。同时，人类对于这种未知的数字和规则的模型构建的数字序列极易限制其中，无法快速计算出结果甚至无法得到正确结果。而本文所提出的方法为解决此类序列问题提供了一种可能。在未来的工作中，我们将进一步探索如何提高精度及对缺失数据的预测，同时期望可以对任意位置的图像内容进行预测，而非单一地对下一张的图像内容进行预测，特别地，下一步希望可以提出更适用于数字预测逻辑学习任务的模型以求精度上面的突破。 ·1196· 智能系统学报第 14 卷

<<向上翻页向下翻页>>

点击下载：【知识工程】图像情境下的数字序列逻辑学习