正在加载图片...
第15卷第1期 智能系统学报 Vol.15 No.I 2020年1月 CAAI Transactions on Intelligent Systems Jan.2020 联邦学习:人工智能的最后一公里 Federated learning:the last on kilometer of artificial intelligence 杨强2 (1.深圳前海微众银行,广东深圳,518000:2.香港科技大学计算机科学和工程学系,香港) 我们看一下深度学习的一些限制,大家现在 迁移学习:衡量效果 都在大数据领域有很大的突破,一个代表性突破 学习效果 就是AlphaGo,AlphaGo在19x19的棋盘上可以说 健益学习 P1 蝶用2 是举世无双。但是只要换一下棋盘的大小,或者 学习 换一下棋盘的种类,原来的模型就完全无能为力 了,就得重新做一个训练,这个例子引起了我们 的深思。 o 当前人工智能领域需要大数据的推动,这个 D1 D2 目标领域数据量D 推动如果换一个新的领域很可能只有小数据。小 数据的场景是不是也可以用深度学习来解决呢? 我们针对这样的情况提出了一个迁移学习 我们认为是很有困难的,因为依据深度学习现在 的理论算法框架,这个算法框架的目标是模拟人 的进展,还没有很多的算法能够在小数据情况下 类小样本的快速学习能力。我们可以通过样本 发挥作用。 与样本的分布来做迁移,同时还可以基于特征来 有很多原因造成我们面对小数据这种状态, 做迁移。即便是两个领域,比如说一个是计算机 比方说由于行业性质使得不同部门之间没有办法 视觉,一个是自然语言处理,它们只要语义上有 交换数据,加之考虑到用户隐私、商业利益、监管 沟通的话,还是可以做迁移,这是基于特征的迁 的要求等,我们面临的是小数据和一个个数据孤 移。我们还可以基于模型来做迁移,比如说我们 岛。把小数据变成大数据,又需要做很多数据标 可以做一个预训练模型,在一个新的领域下,可 注,比方在医疗或者金融方面,时间不允许我们 以在某一个预训练的层次上做小的改动,就把这 很快把小数据变成大数据。 个模型做迁移。甚至我们在任务上也可以做迁 针对小数据的问题,我和团队长期做的研究是 移,这样就可以实现零样本或者单一样本的学习 迁移学习。迁移学习就是像人类一样,能够进行举 能力。 一反三,把模型从一个场景迁移到另外一个场景的 在此基础上,我们还可以把迁移学习在时间 动作。目标是突破传统机器学习必须有大数据作 维度上加以扩展,形成一个传递式的迁移学习, 为前提的要求。人类是怎么做的呢?我们在解决 就好像踩着石头过河,一步步地走。我们也可以 一个新问题的时候,会利用联想能力想一下:过去 先把一个领域的模型迁移到第2个领域,再从第 遇到过类似的场景吗?那么能不能将一个模型通 2个领域迁移到第3个领域,依此类推。 过小小的改动,让其在当前的场景下使用?这种联 我们还可以依赖于一个深度学习和一系列的 想能力是我们举一反三的迁移能力的关键。 中间领域来做传递式的迁移。传递式迁移有一个 什么叫具有迁移能力?以这两条曲线为例, 很好的例子,这个是斯坦福大学和世界银行一起 在一定的数据量下,学习效果如红线所示,有迁移 合作的,利用卫星图像来获得经济状况,尤其是 学习,学习效果会更好一些,同时它的增长会更快 贫困地区的经济状况。通过将ImageNet的数据 一些,这就是迁移学习所带来的两个好处。因此 迁移到夜空图像,再通过夜空图像迁移到白天图 我们说,一个领域,它的迁移效果好不好,是由多 像,经过这两步的迁移,我们就能自动得到一个 个指标来衡量的。像这两条曲线所示,在数据一 对于卫星图像的二维图的经济状况的估算,这个 定和效果一定的情况下,迁移学习的指标都好。 估算也是非常准的。联邦学习:人工智能的最后一公里 Federated learning: the last on kilometer of artificial intelligence 杨强1,2 (1. 深圳前海微众银行,广东 深圳, 518000; 2. 香港科技大学 计算机科学和工程学系,香港) 我们看一下深度学习的一些限制,大家现在 都在大数据领域有很大的突破,一个代表性突破 就是 AlphaGo,AlphaGo 在 19×19 的棋盘上可以说 是举世无双。但是只要换一下棋盘的大小,或者 换一下棋盘的种类,原来的模型就完全无能为力 了,就得重新做一个训练,这个例子引起了我们 的深思。 当前人工智能领域需要大数据的推动,这个 推动如果换一个新的领域很可能只有小数据。小 数据的场景是不是也可以用深度学习来解决呢? 我们认为是很有困难的,因为依据深度学习现在 的进展,还没有很多的算法能够在小数据情况下 发挥作用。 有很多原因造成我们面对小数据这种状态, 比方说由于行业性质使得不同部门之间没有办法 交换数据,加之考虑到用户隐私、商业利益、监管 的要求等,我们面临的是小数据和一个个数据孤 岛。把小数据变成大数据,又需要做很多数据标 注,比方在医疗或者金融方面,时间不允许我们 很快把小数据变成大数据。 针对小数据的问题,我和团队长期做的研究是 迁移学习。迁移学习就是像人类一样,能够进行举 一反三,把模型从一个场景迁移到另外一个场景的 动作。目标是突破传统机器学习必须有大数据作 为前提的要求。人类是怎么做的呢?我们在解决 一个新问题的时候,会利用联想能力想一下:过去 遇到过类似的场景吗?那么能不能将一个模型通 过小小的改动,让其在当前的场景下使用?这种联 想能力是我们举一反三的迁移能力的关键。 什么叫具有迁移能力?以这两条曲线为例, 在一定的数据量下,学习效果如红线所示,有迁移 学习,学习效果会更好一些,同时它的增长会更快 一些,这就是迁移学习所带来的两个好处。因此 我们说,一个领域,它的迁移效果好不好,是由多 个指标来衡量的。像这两条曲线所示,在数据一 定和效果一定的情况下,迁移学习的指标都好。 我们针对这样的情况提出了一个迁移学习 的理论算法框架,这个算法框架的目标是模拟人 类小样本的快速学习能力。我们可以通过样本 与样本的分布来做迁移,同时还可以基于特征来 做迁移。即便是两个领域,比如说一个是计算机 视觉,一个是自然语言处理,它们只要语义上有 沟通的话,还是可以做迁移,这是基于特征的迁 移。我们还可以基于模型来做迁移,比如说我们 可以做一个预训练模型,在一个新的领域下,可 以在某一个预训练的层次上做小的改动,就把这 个模型做迁移。甚至我们在任务上也可以做迁 移,这样就可以实现零样本或者单一样本的学习 能力。 在此基础上,我们还可以把迁移学习在时间 维度上加以扩展,形成一个传递式的迁移学习, 就好像踩着石头过河,一步步地走。我们也可以 先把一个领域的模型迁移到第 2 个领域,再从第 2 个领域迁移到第 3 个领域,依此类推。 我们还可以依赖于一个深度学习和一系列的 中间领域来做传递式的迁移。传递式迁移有一个 很好的例子,这个是斯坦福大学和世界银行一起 合作的,利用卫星图像来获得经济状况,尤其是 贫困地区的经济状况。通过将 ImageNet 的数据 迁移到夜空图像,再通过夜空图像迁移到白天图 像,经过这两步的迁移,我们就能自动得到一个 对于卫星图像的二维图的经济状况的估算,这个 估算也是非常准的。 第 15 卷第 1 期 智 能 系 统 学 报 Vol.15 No.1 2020 年 1 月 CAAI Transactions on Intelligent Systems Jan. 2020
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有