正在加载图片...
·178· 智能系统学 报 第15卷 1.3.2神经网络结构搜索的常用方法 距离真正的完全自动化还有一定的距离。 神经网络结构搜索中搜索空间指在搜索过程 中所有可成为搜索对象的神经网络结构。可以想 2博弈论与深度学习 象,在对神经网络的连接方式不做任何限制的情 2.1博弈的基本概念 况下,搜索空间的大小随着规模的增长是呈指数 1944年冯诺伊曼与奥斯卡·摩根斯特恩合著 增长的。在有限的计算资源下进行搜索时,可能 的《博弈论与经济行为》2阿出版,标志着现代博 导致无法搜索较大规模的神经网络。同时,过于 弈论思想登上了历史舞台。博弈论主要研究的是 限制搜索空间的大小,可能并不能搜索出对效果 为博弈的参与者谋取最大利益,也就是“两害相权 有较大提升的神经网络模型。较为简单的神经网 取其轻,两利相权取其重”。 络搜索的搜索空间使用的是链式模型92,即网 博弈中,参与博弈的决策主体被称为玩家或 络的每一层级依次链接,另一种较为复杂的搜索 参与者,这些参与者总能或多或少的获得一些与 空间使用的是分支模型,即允许网络中存在跨层 博弈相关的知识,这些知识被称为信息,如果并 的跳跃链接,整个网络结构是一个有向无环图22。 非所有的参与者都了解其他参与者所有可选的行 使用分支模型的效果明显优于使用链式模型,但 动、每种局势下的收益等信息,这种博弈被称为 是从搜索速度来说,链式模型的搜索空间更小, 不完全信息博弈,反之被称为完全信息博弈。博 搜索时间更短。 弈的参与者还需要遵守一定的规则,符合规则的 搜索策略是根据模型评价反馈的结果不断遍 行动方案被称为策略。 历搜索空间的策略,搜索的过程面临着探索和利 参与者采取了各自的行动之后的博弈状态被 用的权衡,在利用的过程中,要快速找到效果较 称为局势,而在不同的局势下,各个参与者所得 好的神经网络结构,在探索的过程中,要积极遍 到的利益或回报被称为博弈的收益。 历搜索空间中更多的结构避免陷入局部最优解。 博弈的稳定局势即为纳什均衡(Nash equilib 常用的搜索策略主要有随机搜索、进化算法2] rium)P,其指参与者做出了这样一种策略组合, 强化学习19等。 在该策略组合上,任何参与者单独改变策略,其 模型评估是对搜索得到的神经网络结构做一 收益都不会增加。 次性能评价,评价的结果可以指导搜索策略选择 2.2纳什均衡与纳什定理 下一次的神经网络结构,当然如果性能评价是通 2.2.1纳什定理 过在训练集上做训练后,验证集上的表现来评 约翰纳什(John Forbes Nash Jr..)在提出纳什均 估,这样一次完整的搜索过程可能需要几千个 衡的同时,还提出了纳什定理27。纳什定理指出: GPU日(GPUdays)I&2州。如何在保证模型评价准 若参与者有限,每位参与者采取策略的集合有 确性的情况下,提升模型评估的效率是这一问题 限,收益函数为实值函数,则博弈对抗必存在混 的研究重点。 合策略意义下的纳什均衡。所谓混合策略(miⅸed 13.3神经网络结构搜索的优劣 strategy)指参与者可以按照一定的概率来随机选 总体上神经网络结构搜索还处于起步阶段, 择若干不同的行动,相应地,如果参与者能够确 距离真正的应用还有一段距离。但是这种自动化 定地选择行为,这种策略被称为纯策略(pure 的模型结构设计能够极大程度的减少人力物力, strategy). 让深度学习更广泛地应用于更多领域,而且相比 纳什定理仅仅是一个存在性定理,但是这一 人为设计,自动化的搜索能够显著提升网络的效 定理为许多博弈论相关研究提供了理论基础。 果,甚至能够删除网络中的冗余部分,提升网络 2.2.2均衡解与最优解 推理速度,使其更容易应用于前端芯片。 在博弈论的观点中,所有博弈的参与者都是 当然,神经网络结构搜索还存在一些问题,目 足够理性的,也就是他们都会采取使自己收益最 前普遍的搜索方法都需要耗费大量的计算资源, 大化的行动,这样做的最终结果就是导致博弈最 这是导致神经网络结构搜索难以真正投入应用的 终的局势总是稳定的,也就是最终总会达成纳什 关键问题。此外,从超参数优化的角度来讲,即 均衡的局势。但是,值得注意的是,均衡解并不 使神经网络结构搜索能够自动化的选择最合理的 是最优解,最优解关注的是平均利益的最大化, 超参数,但是本身搜索过程也是需要人为控制超 而均衡解是最有利于参与者的局势。 参数的,这就会造成“高维”的超参数调优问题, 在博弈论的经典案例囚徒困境(prisoner's1.3.2 神经网络结构搜索的常用方法 神经网络结构搜索中搜索空间指在搜索过程 中所有可成为搜索对象的神经网络结构。可以想 象,在对神经网络的连接方式不做任何限制的情 况下,搜索空间的大小随着规模的增长是呈指数 增长的。在有限的计算资源下进行搜索时,可能 导致无法搜索较大规模的神经网络。同时,过于 限制搜索空间的大小,可能并不能搜索出对效果 有较大提升的神经网络模型。较为简单的神经网 络搜索的搜索空间使用的是链式模型[19-21] ,即网 络的每一层级依次链接,另一种较为复杂的搜索 空间使用的是分支模型,即允许网络中存在跨层 的跳跃链接,整个网络结构是一个有向无环图[22-24]。 使用分支模型的效果明显优于使用链式模型,但 是从搜索速度来说,链式模型的搜索空间更小, 搜索时间更短。 搜索策略是根据模型评价反馈的结果不断遍 历搜索空间的策略,搜索的过程面临着探索和利 用的权衡,在利用的过程中,要快速找到效果较 好的神经网络结构,在探索的过程中,要积极遍 历搜索空间中更多的结构避免陷入局部最优解。 常用的搜索策略主要有随机搜索、进化算法[25] 、 强化学习[18-19] 等。 模型评估是对搜索得到的神经网络结构做一 次性能评价,评价的结果可以指导搜索策略选择 下一次的神经网络结构,当然如果性能评价是通 过在训练集上做训练后,验证集上的表现来评 估,这样一次完整的搜索过程可能需要几千个 GPU 日 (GPU days)[18, 24]。如何在保证模型评价准 确性的情况下,提升模型评估的效率是这一问题 的研究重点。 1.3.3 神经网络结构搜索的优劣 总体上神经网络结构搜索还处于起步阶段, 距离真正的应用还有一段距离。但是这种自动化 的模型结构设计能够极大程度的减少人力物力, 让深度学习更广泛地应用于更多领域,而且相比 人为设计,自动化的搜索能够显著提升网络的效 果,甚至能够删除网络中的冗余部分,提升网络 推理速度,使其更容易应用于前端芯片。 当然,神经网络结构搜索还存在一些问题,目 前普遍的搜索方法都需要耗费大量的计算资源, 这是导致神经网络结构搜索难以真正投入应用的 关键问题。此外,从超参数优化的角度来讲,即 使神经网络结构搜索能够自动化的选择最合理的 超参数,但是本身搜索过程也是需要人为控制超 参数的,这就会造成“高维”的超参数调优问题, 距离真正的完全自动化还有一定的距离。 2 博弈论与深度学习 2.1 博弈的基本概念 1944 年冯·诺伊曼与奥斯卡·摩根斯特恩合著 的《博弈论与经济行为》[26] 出版,标志着现代博 弈论思想登上了历史舞台。博弈论主要研究的是 为博弈的参与者谋取最大利益,也就是“两害相权 取其轻,两利相权取其重”。 博弈中,参与博弈的决策主体被称为玩家或 参与者,这些参与者总能或多或少的获得一些与 博弈相关的知识,这些知识被称为信息,如果并 非所有的参与者都了解其他参与者所有可选的行 动、每种局势下的收益等信息,这种博弈被称为 不完全信息博弈,反之被称为完全信息博弈。博 弈的参与者还需要遵守一定的规则,符合规则的 行动方案被称为策略。 参与者采取了各自的行动之后的博弈状态被 称为局势,而在不同的局势下,各个参与者所得 到的利益或回报被称为博弈的收益。 博弈的稳定局势即为纳什均衡 (Nash equilib￾rium)[27] ,其指参与者做出了这样一种策略组合, 在该策略组合上,任何参与者单独改变策略,其 收益都不会增加。 2.2 纳什均衡与纳什定理 2.2.1 纳什定理 约翰纳什 (John Forbes Nash Jr.) 在提出纳什均 衡的同时,还提出了纳什定理[27]。纳什定理指出: 若参与者有限,每位参与者采取策略的集合有 限,收益函数为实值函数,则博弈对抗必存在混 合策略意义下的纳什均衡。所谓混合策略 (mixed strategy) 指参与者可以按照一定的概率来随机选 择若干不同的行动,相应地,如果参与者能够确 定地选择行为,这种策略被称为纯策略 (pure strategy)。 纳什定理仅仅是一个存在性定理,但是这一 定理为许多博弈论相关研究提供了理论基础。 2.2.2 均衡解与最优解 在博弈论的观点中,所有博弈的参与者都是 足够理性的,也就是他们都会采取使自己收益最 大化的行动,这样做的最终结果就是导致博弈最 终的局势总是稳定的,也就是最终总会达成纳什 均衡的局势。但是,值得注意的是,均衡解并不 是最优解,最优解关注的是平均利益的最大化, 而均衡解是最有利于参与者的局势。 在博弈论的经典案例囚徒困境 (prisoner’s ·178· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有