百度提出NCRF：深度学习癌症图像检测效率再提升-神经网络-技术-爱吧机器人网

百度提出NCRF：深度学习癌症图像检测效率再提升

2018-06-25 机器之心浏览量：

选自Baidu Research
作者：Yi Li、Wei Ping
机器之心编译
参与：李泽南、李亚洲

深度学习在医疗图像疾病检测方向上的发展很快，但目前仍面临着易出现假阳性的问题。近日，百度研究人员提出了 NCRF（神经条件随机场）方法，在提升肿瘤图像准确率的同时也减少了假阳性的出现几率。该研究的论文已被即将在 7 月举行的深度学习医疗图像大会 MIDL 2018 接收。

NCRF 项目已开源：https://github.com/baidu-research/NCRF

目前在医疗领域有很多癌症诊断方法，其中病理学活体检测被认为是最为可信的标准。然而，对病理学切片进行分析并不是一件容易的事，即使对于经验丰富的病理学家而言也是有挑战的事情。一个放大 40 倍的病理切片数字图像通常包含数十亿像素，而在这样大规模的内容里，病理学家有时需要找寻微转移、肿瘤细胞细小群体等早期癌症征兆。这些任务让审查病理切片，而不遗漏任何临床证据成为了一项非常复杂耗时的工作。

随着人工智能的发展，人们已经提出了各种基于深度学习的算法来帮助病理学家有效审查这些切片，并检测癌症转移。由于切片的原始数字图像非常大，大多数算法目前会将图片切割成大量小图片 (patch) 进行处理，如 256×256 像素尺寸的图片——然后训练并使用深度卷积神经网络来对肿瘤细胞和正常细胞进行分类。然而，这种方法有时难以在不知晓周围内容的情况下预测小图片中是否存在肿瘤，特别是在肿瘤/正常区域的边界上，经常会出现假阳性。

图 2 展示了这类方法的困难：

百度研究人员近日提出了一个新的深度学习算法，该方法不仅分析单个小图片，也将图片四周临近的网格一并输入进行肿瘤细胞分析。就像放大图片，看到更大区域从而做出更有置信度的判断一样。在这里，相邻切片之间的空间相关性通过特定类型的概率图形模型（条件随机场）进行建模。整个深度学习框架可以在 GPU 上进行端到端的训练，无需任何后处理过程。

图 3 展示了该算法的架构：

百度研究人员称，通过考虑相邻图片之间的相关性，新算法发生的误报次数少了很多。图 4 展示了在示例肿瘤图片上，新算法与不考虑临近图片的算法之间的预测效果比较。我们可以看到，除了基本的真肿瘤区域以外，新算法的假阳性区域相较基准算法要少很多。

图 4.（a) 原始的完整切片图像；（b) 病理学家注释的图像，白色区域表示癌症转移；（c) 通过之前的算法预测癌症区域，不考虑临近图像块；（d) 通过百度的算法预测癌症区域。

在 Camelyon16 挑战赛测试集上，百度的算法在癌症定位上的得分（FROC）为 0.8096，超越了专业的病理学家（0.7240）和前一个 Camelyon16 挑战赛冠军（0.8074）。此外，百度还在 Github 上开源了此算法，希望能够促进病理分析领域的 AI 研究。

这种全新的癌症检测算法有潜力改进病理切片镜检的效率与准确率。这能使得病理学家更加关注算法重点强调的癌症区域，而不是检查整个切片。不过，要综合评估该算法，还需要在更大数据集上做进一步的临床研究。

更多信息可查看以下论文：

注：在数字病理切片中，在 40 倍的放大下一个像素大概长 0.243 微米。微转移一般定义为一组癌细胞最大直径超过 200 微米，也就是大概 823 像素。

论文：Cancer Metastasis Detection With Neural Conditional Random Field

论文链接：https://openreview.net/forum?id=S1aY66iiM

摘要：乳腺癌诊断通常要求通过全切片数字化图像（WSI）对淋巴结癌细胞转移进行准确检测。近期深度卷积神经网络的发展使得医疗影像分析取得了极大成功，尤其是在计算病理组织学方面。由于 WSI 非常大，大部分方法都将整张图像切分成很多小的图像块，再对每个图像块分别进行分类。但是，相邻图像块通常具备空间关联，忽视此类关联可能会导致预测结果不一致。本论文提出一种神经条件随机场（neural conditional random field，NCRF）深度学习框架，来检测 WSI 中的癌细胞转移。NCRF 通过一个直接位于 CNN 特征提取器上方的全连接 CRF，来考虑相邻图像块之间的空间关联。整个深度网络可以使用标准反向传播算法，以最小算力进行端到端的训练。CNN 特征提取器也可以从利用 CRF 考虑空间关联中受益。与不考虑空间关联的基线方法相比，NCRF 框架可获取更高视觉质量的图像块预测概率图。我们还展示了在 Camelyon16 数据集上该方法在癌细胞转移检测方面优于基线方法，在测试集上取得了 0.8096 的平均 FROC 分数。

原文链接：https://research.baidu.com/Blog/index-view?id=104

本文为机器之心编译，转载请联系本公众号获得授权。

精选推荐

集群机器人领域最新研究：一种用于探测未知环境的微型无人机群

[2019-10-26] （图：无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向，它将试图飞到另一个方向。若首选方向冲突，低优先 ...

通过对抗性图像黑入大脑

[2018-03-02] 在上面的图片中，左边是一张猫的照片。在右边，你能分辨出它是同一只猫的图片，还是一张看起来相似的狗的图片？这两张图片之间的区别在于， ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14] 英伟达（Nvidia）和伦敦国王学院（King’s College London）的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络， ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24] 机器人的研究在过去10年中得益于一个具有嵌入式人工智能（AI）的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建，如今在欧洲、美国、韩国、新加坡和日本的实验室......

一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04] Context是指用来解释一段给定文本或语句的来源框架，我们可以翻译为上下文或语境。维基百科将context定义为：*在符号学、语言学、社会学和 ...

九台“猎豹”机器人组队踢球，麻省理工高材生们的高级趣味

[2019-11-09] 本周，在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上，一群由人工智能驱动的机器人就是这场比赛的 ...

2017年：AI渗入云端

[2017-12-29] 云中的人工智能不仅仅是科技巨头的权力游戏，它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

麻省理工学院最新研究：优化软体机器人的控制和设计

[2019-11-24] 软体机器人属于一个新的领域，它可能在诸如外科手术等领域发挥重要作用（手术时的纳米机器人需要在人体内部移动而不损伤软组织）。软体机器 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

飞桨火力全开，重磅上线3D模型：PointNet++、PointRCNN！

[2020-03-26] 11 年前的「阿凡达」让少年的我们第一次戴上 3D 眼镜，声势浩大的瀑布奔流而下，星罗棋布飘浮在空中的群山，无一不体现着对生命的敬意， ...

神经网络结构在命名实体识别（NER）中的应用

[2018-01-17] 近年来，基于神经网络的深度学习方法在自然语言处理领域已经取得了不少进展。作为NLP领域的基础任务—命名实体识别（Named Entity Recognition，NER）也不例外，神经网络结......

从基础概念到数学公式，这是一份520页的机器学习笔记（图文并茂）

[2018-06-19] 近日，来自SAP（全球第一大商业软件公司）的梁劲（Jim Liang）公开了自己所写的一份 520 页的学习教程（英文版），详细、明了地介绍了机器学习中的相关概念、数学知识和各......

50行代码玩转生成对抗网络GAN模型！（附源码）

[2018-07-30] 本文为大家介绍了生成对抗网络（Generate Adversarial Network，GAN），以最直白的语言来讲解它，最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06] 爱吧机器人网编者按：近日，《自然-神经科学》发表了一篇论文，研究人员创建了一种深度人工神经网络，能够准确预测生物大脑对视觉刺激所产 ...