正在加载图片...
.146 智能系统学报 第12卷 5 增量学习未来研究方向展望 进行增量学习。由此看来,增量学习的内容也应当 是多模态的。 目前,增量学习在智能交互、物体识别等许多方 智能系统通过多模态交互进行增量学习,反过 面都得到了广泛的研究,但由于应用环境远比训练 来,增量学习的结果也会提升多模态交互的性能。 环境更加复杂多变,离智能交互系统真正走出实验 听觉、视觉和文字是智能交互系统感知外界环 室,进入真实应用场景还有一段距离。本文将对增 境信息最主要的3种形式。通过声图文融合的增量 量学习未来的研究方向进行展望。 学习方式,可以使智能交互系统逐步全面地适应不 5.1面向大规模数据集的增量学习 断变化的外界环境。 近年来,随着信息技术的发展,数据呈现爆炸式 5.4知识条目和识别能力的增量学习 增长的趋势,这使得模型的训练和更新都变得更加 现在的大部分研究工作更加关注于独立的视觉 困难并且耗时。 概念的识别或是单纯知识条目的增加构建。但实际 在面向大规模数据集时,增量学习的优点尤为 生活中不同的概念之间具有或隐性或显性的关系, 突出。一方面,在训练数据规模扩大的同时,训练需 物体也拥有不同的属性。这些概念和属性可以构成 要的时间和计算能力都随之增加。当新数据或新类 关于交互物体、交互者和外界环境的知识条目。人 别出现时,非增量的离线方法需要重新训练已经学 类可以基于这些额外的关系或属性信息学习到更多 习过的数据,这会导致资源的浪费。而增量学习方 的知识。智能交互系统也应该利用这些信息进行更 法则可以在原始模型的基础上继续学习,不需要重 全面的学习,对周围环境或任务目标得到一个更加 新训练所有数据。另一方面,非增量方法重新训练 全面的认识。 全部数据,这也就意味着全部的或绝大部分的数据 另一个值得关注的方面是,智能交互系统应该 或都必须保留,当数据量非常庞大时,数据的存储也 能够系统并有效地组织已学习到的知识。文献 是一个问题。而增量学习不需要原始数据,所以不 [55]指出,将小规模的信息加入到已经组织好的大 需要考虑数据存储的问题。 规模信息中是人类感知,学习,和组织信息等过程中 5.2面向深度学习的增量学习 十分重要的部分。因此,智能交互系统应该拥有一 深度学习技术被大量应用到图像、视频、文本等 个合理的学习机制,并可以自动在学习到的知识间 多媒体相关的任务上。一方面,深度网络可以直接 建立合理有效的联系。 完成图像分类,物体识别等任务。另一方面,这些任 6结束语 务所产生的标签又可以应用到图像检索相关的任务 中。深度网络又可以间接地扩展到其他任务中去。 目前,增量学习在智能交互、物体识别等许多方 所有这些任务的真实场景中,数据及其标记的总是 面都得到了广泛的研究,由于应用环境远比训练环 境更加复杂多变,它更加注重于解决自动学习,改善 以增量的方式进行收集的。因此在数据方面来说, 应用效果的问题。这说明智能交互系统从实验环境 面向深度学习的增量学习是合理的。 逐渐开始走向真实的应用场景。 深度学习技术在图像分类任务中的应用取得了 由于不同任务关注方面各不相同,大多数研究 快速的进步,它的性能迅速提升。当前限制深度神经 工作都无法完全满足增量学习的定义。但真实场景 网络性能进一步提升的一个可能性是网络容量。因 的复杂多变是单一任务目标无法模拟的,若要智能 此,一个可能的解决方案是增加网络容量[5)。但是 交互系统真正走向现实,需要综合解决增量学习4 这个方案面临着两个困难:一方面,大网络的训练难 个方面的问题,这是增量学习算法本身的发展趋势。 度可能成倍增长:另一方面,如何增加网络容量还不 同时也应该结合不同的任务,实现适用于不同 明确。因此,应该更加谨慎地增加网络容量,提升网 场景、不同侧重点的智能增量学习系统。根据任务 络能力。而增量学习则为逐步的、增量的改善网络提 本身设计不同的策略实现个性化的应用。这是从应 供了一种可能性,当前已经有一些相关的工作对这种 用场景来看的增量学习发展趋势。 可能性展开了一定的研究9,2-刘]。因此在模型方面 当这些发展趋势真正变为现实的时候,智能交 来说,面向深度学习的增量学习也是合理的。 互系统有望真正走进人类社会,为我们的日常生活 5.3声图文融合的多模态增量学习 带来更多帮助,安全、便捷和高效地辅助我们完成更 基于智能交互的增量学习系统通过多模态交互 多任务。5 增量学习未来研究方向展望 目前,增量学习在智能交互、物体识别等许多方 面都得到了广泛的研究,但由于应用环境远比训练 环境更加复杂多变,离智能交互系统真正走出实验 室,进入真实应用场景还有一段距离。 本文将对增 量学习未来的研究方向进行展望。 5.1 面向大规模数据集的增量学习 近年来,随着信息技术的发展,数据呈现爆炸式 增长的趋势,这使得模型的训练和更新都变得更加 困难并且耗时。 在面向大规模数据集时,增量学习的优点尤为 突出。 一方面,在训练数据规模扩大的同时,训练需 要的时间和计算能力都随之增加。 当新数据或新类 别出现时,非增量的离线方法需要重新训练已经学 习过的数据,这会导致资源的浪费。 而增量学习方 法则可以在原始模型的基础上继续学习,不需要重 新训练所有数据。 另一方面,非增量方法重新训练 全部数据,这也就意味着全部的或绝大部分的数据 或都必须保留,当数据量非常庞大时,数据的存储也 是一个问题。 而增量学习不需要原始数据,所以不 需要考虑数据存储的问题。 5.2 面向深度学习的增量学习 深度学习技术被大量应用到图像、视频、文本等 多媒体相关的任务上。 一方面,深度网络可以直接 完成图像分类,物体识别等任务。 另一方面,这些任 务所产生的标签又可以应用到图像检索相关的任务 中。 深度网络又可以间接地扩展到其他任务中去。 所有这些任务的真实场景中,数据及其标记的总是 以增量的方式进行收集的。 因此在数据方面来说, 面向深度学习的增量学习是合理的。 深度学习技术在图像分类任务中的应用取得了 快速的进步,它的性能迅速提升。 当前限制深度神经 网络性能进一步提升的一个可能性是网络容量。 因 此,一个可能的解决方案是增加网络容量[51] 。 但是 这个方案面临着两个困难:一方面,大网络的训练难 度可能成倍增长;另一方面,如何增加网络容量还不 明确。 因此,应该更加谨慎地增加网络容量,提升网 络能力。 而增量学习则为逐步的、增量的改善网络提 供了一种可能性,当前已经有一些相关的工作对这种 可能性展开了一定的研究[39,52-54] 。 因此在模型方面 来说,面向深度学习的增量学习也是合理的。 5.3 声图文融合的多模态增量学习 基于智能交互的增量学习系统通过多模态交互 进行增量学习。 由此看来,增量学习的内容也应当 是多模态的。 智能系统通过多模态交互进行增量学习,反过 来,增量学习的结果也会提升多模态交互的性能。 听觉、视觉和文字是智能交互系统感知外界环 境信息最主要的 3 种形式。 通过声图文融合的增量 学习方式,可以使智能交互系统逐步全面地适应不 断变化的外界环境。 5.4 知识条目和识别能力的增量学习 现在的大部分研究工作更加关注于独立的视觉 概念的识别或是单纯知识条目的增加构建。 但实际 生活中不同的概念之间具有或隐性或显性的关系, 物体也拥有不同的属性。 这些概念和属性可以构成 关于交互物体、交互者和外界环境的知识条目。 人 类可以基于这些额外的关系或属性信息学习到更多 的知识。 智能交互系统也应该利用这些信息进行更 全面的学习,对周围环境或任务目标得到一个更加 全面的认识。 另一个值得关注的方面是,智能交互系统应该 能够系统并有效地组织已学习到的知识。 文献 [55]指出,将小规模的信息加入到已经组织好的大 规模信息中是人类感知,学习,和组织信息等过程中 十分重要的部分。 因此,智能交互系统应该拥有一 个合理的学习机制,并可以自动在学习到的知识间 建立合理有效的联系。 6 结束语 目前,增量学习在智能交互、物体识别等许多方 面都得到了广泛的研究,由于应用环境远比训练环 境更加复杂多变,它更加注重于解决自动学习,改善 应用效果的问题。 这说明智能交互系统从实验环境 逐渐开始走向真实的应用场景。 由于不同任务关注方面各不相同,大多数研究 工作都无法完全满足增量学习的定义。 但真实场景 的复杂多变是单一任务目标无法模拟的,若要智能 交互系统真正走向现实,需要综合解决增量学习 4 个方面的问题,这是增量学习算法本身的发展趋势。 同时也应该结合不同的任务,实现适用于不同 场景、不同侧重点的智能增量学习系统。 根据任务 本身设计不同的策略实现个性化的应用。 这是从应 用场景来看的增量学习发展趋势。 当这些发展趋势真正变为现实的时候,智能交 互系统有望真正走进人类社会,为我们的日常生活 带来更多帮助,安全、便捷和高效地辅助我们完成更 多任务。 ·146· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有