Date

2019.03

主题:联邦学习(Federated Machine Learning)技术及数据隐私保护

物联网(IoT)由2009年8月温总理视察无锡时提出,是基于互联网、传统电信网等信息传输渠道,让所有具备通信功能的独立物体实现互联互通的网络。物联网的应用之一,是透过收集多个节点的小数据,聚集成大数据来建立应用模型。而边缘计算(Edge Computing)则致力于通过依靠集网络、计算、存储、应用核心能力为一体的开放平台,就近提供最近端服务,从而产生更快的网络服务响应,满足不同行业的实时业务需求。物联网、边缘计算和与人工智能(AI) 的有机结合离不开分布式大数据的安全、合法的管理。近些年来,这些技术虽然成功突破技术与算力上的限制,但依然面临着与数据安全紧密相关的问题。由于竞争关系、安全问题、审批流程等因素,数据在不同拥有方,云和端以及物联网节点之间的流通存在着难以打破的壁垒,形成所谓的“数据孤岛”问题。面临各样的“孤岛”,即便不同行业之间有意愿交换数据,也可能遭遇政策问责和竞争保护。重视数据隐私和安全已经成为世界性的趋势,如欧盟去年5月通过的最新法案——《通用数据保护条例》(General Data Protection Regulation, GDPR) 就是一个最佳证明。

针对以上问题,谷歌公司率先提出了基于个人终端设备的“联邦学习” (Federated Learning)算法框架,而微众银行AI团队随后提出了基于“联邦学习”的系统性的通用解决方案,可以解决个人(to C)和公司间(to B)联合建模的问题。

“联邦机器学习”(Federated Machine Learning)实际上是一种加密的分布式机器学习技术,参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。它可以实现各个企业的自有数据不出本地,通过加密机制下的参数交换方式,就能在不违反数据隐私法规情况下,建立一个虚拟的共有模型。在这样一个机制下,参与各方的身份和地位相同,成功实现了打通“数据孤岛”走向“共同富裕”的目标。

所以我们不禁好奇,联邦学习是如何具体应用在AI领域的? 联邦学习又是如何促进物联网与边缘计算的?多方的“共同富裕”是如何达成的?联邦学习还会带给我们怎样的惊喜?CCFTF14期研讨会期待和业界的“探索者们”一起探讨这些问题。