栏目导航
人人网配资
联系我们
一校区:美院点校区
二校区:长安南路校区(西安市长安南路58号)
电话:18502955858 15339265858 029-89311989
国际人工智能联合会议理事会主席:破题安全高压下的数据聚合
浏览: 发布日期:2019-09-21

  在8月29日下午举行的2019年世界人工智能大会科学前沿高峰主论坛上,国际人工智能联合会议(IJCAI)理事会主席、香港科技大学教授杨强发表了题为“人工智能最后一公里”的主旨演讲。杨强表示,人工智能,尤其今天像深度学习这样的成就,离不开大数据,但是数据却非常的有限。比如说,法律领域,往往积累一条有效的数据是需要很长时间。尤其还面临数据割裂的现象,比如说在医疗领域每个医院可能都有很多的医疗影像数据,但是却形不成合力,不同的医院之间的数据往往不能互相传递的。原因则包括监管、安全的、利益等。在这种情况下,业内有强烈的需求把数据聚合起来,但是却很难。杨强表示,这个难度也来自其他的方面,有一个很重要的方面就是社会现在对于用户隐私的要求越来越高。这就意味着,一方面面临数据割裂,大家没有大数据来训练人工智能,另一方面法律法规和社会的要求使得安全变成一个非常严格的要求。在这两者之间,大数据的形成就变成我们的一个挑战。如何应对挑战?放弃做人工智能,或者仅仅允许拥有大数据的公司才能做人工智能?杨强认为这两者显然都不是答案,“我们的回答是我们要积极地回答一些新的方向,来解决刚才提出的数据挑战,我们提出的这个方法和方向,叫做联邦学习,英文叫做Federated learning。”所谓的联邦学习,大概的概念是,在数据不出本地的情况下,利用各个拥有方的数据把模型建立起来,并且模型共享。在建立模型的过程中,不违反用户的隐私。整个建模的过程就叫做联邦学习的框架和算法。首先横向联邦学习,不同的机构,每个机构都有一部分的用户,但是不同的机构共享一些用户的特征,他们可以通过横向联邦学习聚合,这个过程中可以保护隐私。还有叫做纵向联邦学习,虽然不同的机构可能不共享一些用户的特征,但是他们共享用户的ID,这样可以利用散落的数据形成整体的联邦,这也可以进行用户隐私的保密,使得各个数据不出本地。最后大家会问,如果既不共享特征又不共享用户怎么办?这个场景下提出联邦迁移学习,可以用迁移学习的方式把两个模型的本质挖掘出来,能够把抽象的模型加以聚合,在聚合的过程中保护用户隐私。最后,杨强表示,虽然联邦学习的框架最近才提出,但是它在产业界的应用已经有长足的进展。“机器学习离不开大数据,大数据离不开安全保护隐私的考虑,联邦学习是既能够建立大数据模型,又能够保证用户安全,数据隐私、数据安全和用户隐私的一个有力的工具。”