联邦学习：人工智能的最后一公里 Federated learning: t

正在加载图片...

第15卷第1期智能系统学报 Vol.15 No.I 2020年1月 CAAI Transactions on Intelligent Systems Jan.2020 联邦学习：人工智能的最后一公里 Federated learning:the last on kilometer of artificial intelligence 杨强2 (1.深圳前海微众银行，广东深圳，518000：2.香港科技大学计算机科学和工程学系，香港) 我们看一下深度学习的一些限制，大家现在迁移学习：衡量效果都在大数据领域有很大的突破，一个代表性突破学习效果就是AlphaGo,AlphaGo在19x19的棋盘上可以说健益学习 P1 蝶用2 是举世无双。但是只要换一下棋盘的大小，或者学习换一下棋盘的种类，原来的模型就完全无能为力了，就得重新做一个训练，这个例子引起了我们的深思。 o 当前人工智能领域需要大数据的推动，这个 D1 D2 目标领域数据量D 推动如果换一个新的领域很可能只有小数据。小数据的场景是不是也可以用深度学习来解决呢？我们针对这样的情况提出了一个迁移学习我们认为是很有困难的，因为依据深度学习现在的理论算法框架，这个算法框架的目标是模拟人的进展，还没有很多的算法能够在小数据情况下类小样本的快速学习能力。我们可以通过样本发挥作用。与样本的分布来做迁移，同时还可以基于特征来有很多原因造成我们面对小数据这种状态，做迁移。即便是两个领域，比如说一个是计算机比方说由于行业性质使得不同部门之间没有办法视觉，一个是自然语言处理，它们只要语义上有交换数据，加之考虑到用户隐私、商业利益、监管沟通的话，还是可以做迁移，这是基于特征的迁的要求等，我们面临的是小数据和一个个数据孤移。我们还可以基于模型来做迁移，比如说我们岛。把小数据变成大数据，又需要做很多数据标可以做一个预训练模型，在一个新的领域下，可注，比方在医疗或者金融方面，时间不允许我们以在某一个预训练的层次上做小的改动，就把这很快把小数据变成大数据。个模型做迁移。甚至我们在任务上也可以做迁针对小数据的问题，我和团队长期做的研究是移，这样就可以实现零样本或者单一样本的学习迁移学习。迁移学习就是像人类一样，能够进行举能力。一反三，把模型从一个场景迁移到另外一个场景的在此基础上，我们还可以把迁移学习在时间动作。目标是突破传统机器学习必须有大数据作维度上加以扩展，形成一个传递式的迁移学习，为前提的要求。人类是怎么做的呢？我们在解决就好像踩着石头过河，一步步地走。我们也可以一个新问题的时候，会利用联想能力想一下：过去先把一个领域的模型迁移到第2个领域，再从第遇到过类似的场景吗？那么能不能将一个模型通 2个领域迁移到第3个领域，依此类推。过小小的改动，让其在当前的场景下使用？这种联我们还可以依赖于一个深度学习和一系列的想能力是我们举一反三的迁移能力的关键。中间领域来做传递式的迁移。传递式迁移有一个什么叫具有迁移能力？以这两条曲线为例，很好的例子，这个是斯坦福大学和世界银行一起在一定的数据量下，学习效果如红线所示，有迁移合作的，利用卫星图像来获得经济状况，尤其是学习，学习效果会更好一些，同时它的增长会更快贫困地区的经济状况。通过将ImageNet的数据一些，这就是迁移学习所带来的两个好处。因此迁移到夜空图像，再通过夜空图像迁移到白天图我们说，一个领域，它的迁移效果好不好，是由多像，经过这两步的迁移，我们就能自动得到一个个指标来衡量的。像这两条曲线所示，在数据一对于卫星图像的二维图的经济状况的估算，这个定和效果一定的情况下，迁移学习的指标都好。估算也是非常准的。联邦学习：人工智能的最后一公里 Federated learning: the last on kilometer of artificial intelligence 杨强1,2 （1. 深圳前海微众银行，广东深圳， 518000; 2. 香港科技大学计算机科学和工程学系，香港）我们看一下深度学习的一些限制，大家现在都在大数据领域有很大的突破，一个代表性突破就是 AlphaGo，AlphaGo 在 19×19 的棋盘上可以说是举世无双。但是只要换一下棋盘的大小，或者换一下棋盘的种类，原来的模型就完全无能为力了，就得重新做一个训练，这个例子引起了我们的深思。当前人工智能领域需要大数据的推动，这个推动如果换一个新的领域很可能只有小数据。小数据的场景是不是也可以用深度学习来解决呢？我们认为是很有困难的，因为依据深度学习现在的进展，还没有很多的算法能够在小数据情况下发挥作用。有很多原因造成我们面对小数据这种状态，比方说由于行业性质使得不同部门之间没有办法交换数据，加之考虑到用户隐私、商业利益、监管的要求等，我们面临的是小数据和一个个数据孤岛。把小数据变成大数据，又需要做很多数据标注，比方在医疗或者金融方面，时间不允许我们很快把小数据变成大数据。针对小数据的问题，我和团队长期做的研究是迁移学习。迁移学习就是像人类一样，能够进行举一反三，把模型从一个场景迁移到另外一个场景的动作。目标是突破传统机器学习必须有大数据作为前提的要求。人类是怎么做的呢？我们在解决一个新问题的时候，会利用联想能力想一下：过去遇到过类似的场景吗？那么能不能将一个模型通过小小的改动，让其在当前的场景下使用？这种联想能力是我们举一反三的迁移能力的关键。什么叫具有迁移能力？以这两条曲线为例，在一定的数据量下，学习效果如红线所示，有迁移学习，学习效果会更好一些，同时它的增长会更快一些，这就是迁移学习所带来的两个好处。因此我们说，一个领域，它的迁移效果好不好，是由多个指标来衡量的。像这两条曲线所示，在数据一定和效果一定的情况下，迁移学习的指标都好。我们针对这样的情况提出了一个迁移学习的理论算法框架，这个算法框架的目标是模拟人类小样本的快速学习能力。我们可以通过样本与样本的分布来做迁移，同时还可以基于特征来做迁移。即便是两个领域，比如说一个是计算机视觉，一个是自然语言处理，它们只要语义上有沟通的话，还是可以做迁移，这是基于特征的迁移。我们还可以基于模型来做迁移，比如说我们可以做一个预训练模型，在一个新的领域下，可以在某一个预训练的层次上做小的改动，就把这个模型做迁移。甚至我们在任务上也可以做迁移，这样就可以实现零样本或者单一样本的学习能力。在此基础上，我们还可以把迁移学习在时间维度上加以扩展，形成一个传递式的迁移学习，就好像踩着石头过河，一步步地走。我们也可以先把一个领域的模型迁移到第 2 个领域，再从第 2 个领域迁移到第 3 个领域，依此类推。我们还可以依赖于一个深度学习和一系列的中间领域来做传递式的迁移。传递式迁移有一个很好的例子，这个是斯坦福大学和世界银行一起合作的，利用卫星图像来获得经济状况，尤其是贫困地区的经济状况。通过将 ImageNet 的数据迁移到夜空图像，再通过夜空图像迁移到白天图像，经过这两步的迁移，我们就能自动得到一个对于卫星图像的二维图的经济状况的估算，这个估算也是非常准的。第 15 卷第 1 期智能系统学报 Vol.15 No.1 2020 年 1 月 CAAI Transactions on Intelligent Systems Jan. 2020

向下翻页>>

点击下载：【AI人工智能】联邦学习：人工智能的最后一公里