５增量学习未来研究方向展望目前，增量学习在智能交互、物体识别等许多方

正在加载图片...

.146 智能系统学报第12卷 5 增量学习未来研究方向展望进行增量学习。由此看来，增量学习的内容也应当是多模态的。目前，增量学习在智能交互、物体识别等许多方智能系统通过多模态交互进行增量学习，反过面都得到了广泛的研究，但由于应用环境远比训练来，增量学习的结果也会提升多模态交互的性能。环境更加复杂多变，离智能交互系统真正走出实验听觉、视觉和文字是智能交互系统感知外界环室，进入真实应用场景还有一段距离。本文将对增境信息最主要的3种形式。通过声图文融合的增量量学习未来的研究方向进行展望。学习方式，可以使智能交互系统逐步全面地适应不 5.1面向大规模数据集的增量学习断变化的外界环境。近年来，随着信息技术的发展，数据呈现爆炸式 5.4知识条目和识别能力的增量学习增长的趋势，这使得模型的训练和更新都变得更加现在的大部分研究工作更加关注于独立的视觉困难并且耗时。概念的识别或是单纯知识条目的增加构建。但实际在面向大规模数据集时，增量学习的优点尤为生活中不同的概念之间具有或隐性或显性的关系，突出。一方面，在训练数据规模扩大的同时，训练需物体也拥有不同的属性。这些概念和属性可以构成要的时间和计算能力都随之增加。当新数据或新类关于交互物体、交互者和外界环境的知识条目。人别出现时，非增量的离线方法需要重新训练已经学类可以基于这些额外的关系或属性信息学习到更多习过的数据，这会导致资源的浪费。而增量学习方的知识。智能交互系统也应该利用这些信息进行更法则可以在原始模型的基础上继续学习，不需要重全面的学习，对周围环境或任务目标得到一个更加新训练所有数据。另一方面，非增量方法重新训练全面的认识。全部数据，这也就意味着全部的或绝大部分的数据另一个值得关注的方面是，智能交互系统应该或都必须保留，当数据量非常庞大时，数据的存储也能够系统并有效地组织已学习到的知识。文献是一个问题。而增量学习不需要原始数据，所以不 [55]指出，将小规模的信息加入到已经组织好的大需要考虑数据存储的问题。规模信息中是人类感知，学习，和组织信息等过程中 5.2面向深度学习的增量学习十分重要的部分。因此，智能交互系统应该拥有一深度学习技术被大量应用到图像、视频、文本等个合理的学习机制，并可以自动在学习到的知识间多媒体相关的任务上。一方面，深度网络可以直接建立合理有效的联系。完成图像分类，物体识别等任务。另一方面，这些任 6结束语务所产生的标签又可以应用到图像检索相关的任务中。深度网络又可以间接地扩展到其他任务中去。目前，增量学习在智能交互、物体识别等许多方所有这些任务的真实场景中，数据及其标记的总是面都得到了广泛的研究，由于应用环境远比训练环境更加复杂多变，它更加注重于解决自动学习，改善以增量的方式进行收集的。因此在数据方面来说，应用效果的问题。这说明智能交互系统从实验环境面向深度学习的增量学习是合理的。逐渐开始走向真实的应用场景。深度学习技术在图像分类任务中的应用取得了由于不同任务关注方面各不相同，大多数研究快速的进步，它的性能迅速提升。当前限制深度神经工作都无法完全满足增量学习的定义。但真实场景网络性能进一步提升的一个可能性是网络容量。因的复杂多变是单一任务目标无法模拟的，若要智能此，一个可能的解决方案是增加网络容量[5)。但是交互系统真正走向现实，需要综合解决增量学习4 这个方案面临着两个困难：一方面，大网络的训练难个方面的问题，这是增量学习算法本身的发展趋势。度可能成倍增长：另一方面，如何增加网络容量还不同时也应该结合不同的任务，实现适用于不同明确。因此，应该更加谨慎地增加网络容量，提升网场景、不同侧重点的智能增量学习系统。根据任务络能力。而增量学习则为逐步的、增量的改善网络提本身设计不同的策略实现个性化的应用。这是从应供了一种可能性，当前已经有一些相关的工作对这种用场景来看的增量学习发展趋势。可能性展开了一定的研究9,2-刘]。因此在模型方面当这些发展趋势真正变为现实的时候，智能交来说，面向深度学习的增量学习也是合理的。互系统有望真正走进人类社会，为我们的日常生活 5.3声图文融合的多模态增量学习带来更多帮助，安全、便捷和高效地辅助我们完成更基于智能交互的增量学习系统通过多模态交互多任务。５增量学习未来研究方向展望目前，增量学习在智能交互、物体识别等许多方面都得到了广泛的研究，但由于应用环境远比训练环境更加复杂多变，离智能交互系统真正走出实验室，进入真实应用场景还有一段距离。本文将对增量学习未来的研究方向进行展望。５．１面向大规模数据集的增量学习近年来，随着信息技术的发展，数据呈现爆炸式增长的趋势，这使得模型的训练和更新都变得更加困难并且耗时。在面向大规模数据集时，增量学习的优点尤为突出。一方面，在训练数据规模扩大的同时，训练需要的时间和计算能力都随之增加。当新数据或新类别出现时，非增量的离线方法需要重新训练已经学习过的数据，这会导致资源的浪费。而增量学习方法则可以在原始模型的基础上继续学习，不需要重新训练所有数据。另一方面，非增量方法重新训练全部数据，这也就意味着全部的或绝大部分的数据或都必须保留，当数据量非常庞大时，数据的存储也是一个问题。而增量学习不需要原始数据，所以不需要考虑数据存储的问题。５．２面向深度学习的增量学习深度学习技术被大量应用到图像、视频、文本等多媒体相关的任务上。一方面，深度网络可以直接完成图像分类，物体识别等任务。另一方面，这些任务所产生的标签又可以应用到图像检索相关的任务中。深度网络又可以间接地扩展到其他任务中去。所有这些任务的真实场景中，数据及其标记的总是以增量的方式进行收集的。因此在数据方面来说，面向深度学习的增量学习是合理的。深度学习技术在图像分类任务中的应用取得了快速的进步，它的性能迅速提升。当前限制深度神经网络性能进一步提升的一个可能性是网络容量。因此，一个可能的解决方案是增加网络容量［５１］。但是这个方案面临着两个困难：一方面，大网络的训练难度可能成倍增长；另一方面，如何增加网络容量还不明确。因此，应该更加谨慎地增加网络容量，提升网络能力。而增量学习则为逐步的、增量的改善网络提供了一种可能性，当前已经有一些相关的工作对这种可能性展开了一定的研究［３９，５２－５４］。因此在模型方面来说，面向深度学习的增量学习也是合理的。５．３声图文融合的多模态增量学习基于智能交互的增量学习系统通过多模态交互进行增量学习。由此看来，增量学习的内容也应当是多模态的。智能系统通过多模态交互进行增量学习，反过来，增量学习的结果也会提升多模态交互的性能。听觉、视觉和文字是智能交互系统感知外界环境信息最主要的３种形式。通过声图文融合的增量学习方式，可以使智能交互系统逐步全面地适应不断变化的外界环境。５．４知识条目和识别能力的增量学习现在的大部分研究工作更加关注于独立的视觉概念的识别或是单纯知识条目的增加构建。但实际生活中不同的概念之间具有或隐性或显性的关系，物体也拥有不同的属性。这些概念和属性可以构成关于交互物体、交互者和外界环境的知识条目。人类可以基于这些额外的关系或属性信息学习到更多的知识。智能交互系统也应该利用这些信息进行更全面的学习，对周围环境或任务目标得到一个更加全面的认识。另一个值得关注的方面是，智能交互系统应该能够系统并有效地组织已学习到的知识。文献［５５］指出，将小规模的信息加入到已经组织好的大规模信息中是人类感知，学习，和组织信息等过程中十分重要的部分。因此，智能交互系统应该拥有一个合理的学习机制，并可以自动在学习到的知识间建立合理有效的联系。６结束语目前，增量学习在智能交互、物体识别等许多方面都得到了广泛的研究，由于应用环境远比训练环境更加复杂多变，它更加注重于解决自动学习，改善应用效果的问题。这说明智能交互系统从实验环境逐渐开始走向真实的应用场景。由于不同任务关注方面各不相同，大多数研究工作都无法完全满足增量学习的定义。但真实场景的复杂多变是单一任务目标无法模拟的，若要智能交互系统真正走向现实，需要综合解决增量学习４个方面的问题，这是增量学习算法本身的发展趋势。同时也应该结合不同的任务，实现适用于不同场景、不同侧重点的智能增量学习系统。根据任务本身设计不同的策略实现个性化的应用。这是从应用场景来看的增量学习发展趋势。当这些发展趋势真正变为现实的时候，智能交互系统有望真正走进人类社会，为我们的日常生活带来更多帮助，安全、便捷和高效地辅助我们完成更多任务。 ·１４６· 智能系统学报第１２卷

<<向上翻页向下翻页>>

点击下载：【综述】智能交互的物体识别增量学习技术综述