英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络,英伟达声称这是医学影像分析的第一个里程碑。这项技术可以在医院和研究人员之间共享数据,同时保护患者隐私。
联合学习是一种
机器学习方法,当使用CS(客户端-服务器)方法时,可以不再需要创建单个数据湖(Data Lake)以训练模型。相反,模型在设备上进行本地训练,然后将洞察( insights)从多台机器传输到一个中心模型。
“你要得到这些创新,我相信有两种方法。其中一个,就是创建最好的通用模型,即你今天所拥有的我们去年8月发布的模型。只要把它送到这些医院,他们便可以根据自己的病人进行本地化,”英伟达卫生保健主任Abdul Halabi在电话采访中告诉VentureBeat。“另一个是说,让我们从一开始就并肩作战,尽可能多地建立这个健壮的模型或可推广的模型,我认为这项研究表明,在这里确实有可能做到这一点。您可以实现高质量的模型,而不必真正将所有数据汇集在一起,这就是它真正令人兴奋的原因。”
该模型使用了来自285例脑肿瘤患者挑战的BraTS(Multimodal Brain Tumor Segmentation)数据集。这项工作近日将在中国深圳召开的医学影像计算和计算机辅助干预协会(MICCAI)会议上发表。
Halabi对VentureBeat说:“大多数已经完成的实验都是在合成数据上进行的,或者只是随机化数据集。”“但
应用这项技术是在用真实的医院数据进行实验,使用brats挑战,据我所知,目前还没有结果,这将进入隐私领域。”
如今机器学习在医疗健康领域的潜在影响已经很明显了,一些计算机视觉系统已经证明了其超越人类放射科专家的能力,但是由于医疗健康领域的大量隐私要求,数十万个病例的不同数据集并不总是可用。
Nvidia高级研究人员Nicola Reike说,这就是为什么该领域的许多研究人员使用了合成数据集或是为应对挑战而编制的数据集。
她说:“所以我们说,这项研究确实是朝着可靠联合学习部署所迈出的重要一步,我们希望它能够在非常大的范围内实现数据驱动的精确性。”
这项工作探索了差异化隐私的限制,这是一种向数据集添加噪声以使联合学习模型更安全的技术。研究表明,如果没有差异隐私的应用,神经网络仍然可以从暴露的底层数据中产生一些洞察。
苹果和谷歌将同样的技术应用于android和ios设备上键盘定制模型的联合学习。Reike说,用于医学影像分析的联合学习有其自身的一系列挑战,比如3D医学影像的大小,需要更多的计算能力。
Reike说:“我们通过向每个参与节点注入噪声来实现这一点,这样它就存储了更新,并限制了我们在机构间实际共享的信息的粒度。”
英伟达和伦敦国王学院的工作特别关注当共享的部分被有意隐藏时复制模型的能力。
“如果你只看到50%或60%的模型更新,我们还能以全局模型聚合的方式结合贡献吗?我们发现是的,我们可以。这真是令人印象深刻。因此,甚至如果你只分享10%的模型,也有可能以某种方式聚合模型,”她说。“所以只能分享40%的模型。我们仍然可以达到同样的精度或性能,就好像模型是在集合数据上进行训练一样。”
在其他关于医学影像的新闻中,美国放射学院(ACR)数据科学研究所(Data Science Institute)今年春季表示,将把Nvidia的Clara AI工具包纳入其平台。
爱吧机器人网易明小智原创,转载请注明。