爱吧机器人网 » 技术 > 机器学习 > 正文

转人工智能+基因,机器学习算法提升人类认知

  日前,外媒采访了Deep Genomics CEO Brendan Frey博士,解读了人工智能+基因组学这个热得发烫的词。

  Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。

  Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。

  如今Deep Genomics已经走出了人工智能和基因组数据整合商业化的一步,而中国会在这条道路上前进多远?

  谈及人工智能,首先要先说说“深度学习”这个词。

  深度学习,Deep Learning,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。

  深度学习算法将基因组学带到何处?Brendan Frey博士带你玩转人工智能+基因。

  记者:请您解释为何深度学习算法有助于发现致病基因突变?

  Brendan Frey博士:想要深入理解遗传疾病,首先要了解与疾病有关的突变。然而这样做几乎总是不能识别引起疾病的突变,因为突变是成群发生的,且与疾病有关因果关系常常被埋葬在一堆非因果关系的变异中。

  真正的因果变异通过一连串的细胞过程来引起基因突变,确定因果变异对疾病的确定非常重要,同时对如何使用药物或基因编辑来治疗疾病也非常重要。最近的数据显示,此类遗传信息可使医药研发的成功机会增加三倍。深度学习算法可在计算机系统中分析因果变异的级联过程。

  记者:评估一个基因突变是否会导致疾病,为何预测蛋白绑定尤其重要?

  Brendan Frey博士:DNA通常被称为“生命之书”,那么细胞如何阅读这本书?它们利用蛋白质来识别DNA中的每个单词,并将这些词绑定起来产生其他效果。蛋白质在细胞级联过程中起着重要的作用。DNA突变经常会干扰蛋白质的绑定作用,使其绑定在错误的位置。因此,精准确定蛋白质在何时何地绑定对理解和治疗疾病非常重要。

  记者:为何很难预测蛋白质何时何地绑定到DNA和RNA序列上?

  Brendan Frey博士:蛋白质是否绑定是由复杂的生化反应决定的,事实上,蛋白质是否绑定是一个级联反应过程,涉及到DNA和RNA中的每个碱基以及碱基的组合,同时还涉及到其他蛋白质。

  记者:请您概述一下DeepBind,并解释它是怎样计算蛋白质是否会绑定到一个序列上,从而影响细胞过程?

  Brendan Frey博士:顾名思义,DeepBind将深度学习算法与DNA或RNA序列级联反应识别模式相结合,用于确定蛋白质是否绑定到序列上。由DeepBind得到的级联反应可能与细胞内的情况不符,但重要的是DeepBind可以解释DNA或RNA中每个碱基的复杂组合。

  由于实际的细胞过程包括这些复杂的组合,DeepBind可以找到这些组合的关系。然而DeepBind并不能完美的预测,但与其他技术相比DeepBind的表现最好。

  记者:DeepBind对人类基因数据分析有何帮助?

  Brendan Frey博士:我们很兴奋,DeepBind可能打开世界临床和研究工作的新大门。我们已经利用DeepBind来识别破坏蛋白质绑定的突变位点。在这一点上,很明显DeepBind可以识别突变与疾病之间的关系,而行业标准方法是无法办到的。例如我们使用DeepBind来检查与家族性高胆固醇血症和卵巢癌疾病有关的,破坏蛋白质绑定或导致蛋白质绑定错误的突变。

  记者:如何在SPIDEX系统建立DeepBind?这两个工具要连接到电脑系统上吗?

  Brendan Frey博士:Deep Genomics有一个先进的科学技术路线用于构建一个可以连接解释不同细胞过程的大量组件的计算机系统。对于人类突变,SPIDEX系统正如谷歌引擎的一部分。事实上,SPIDEX依赖一个简单的系统来预测蛋白质的绑定作用。如今我们打算用DeepBind替换这个简单的系统,使SPIDEX生成更准确的数据。所有组件的交互作用以及改进其中的某个组件将大大提高其他组件的作用。这就是深入学习算法的工作原理。

  记者:谈谈Deep Genomics下一步的开发计划以及深度学习算法和生物基因组学的未来。

  Brendan Frey博士:这是个很好的问题。我们正在开发的是技术而不是工具。我们开发的每一个组件都可以作为一种工具,但是作为“引擎”的动态组件,它们的价值会大得多。

  送入Deep Genomics引擎的基因数据可以生成与病人有关的重要的疾病信息,这些信息可以用于确定治疗方案,反过来又可提高引擎本身。在Deep Genomics引擎中,细胞过程之间的连接方式与谷歌搜索引擎中网页之间的连接类似,当我们收集的数据越多,我们就越能提高生物连接的准确性。

  机器学习算法和基因组学的未来是什么?我相信,基因生物学是深入学习算法的下一个主攻领域。十年前,我在一个深度学习算法早期研讨会中就有提到这个观点。当时其他与会者正在研究计算机视觉、语音识别和文本处理。当时我就指出虽然这些都是引人注目的问题,但人类在这方面做得已经很好了,相反,人类不擅长理解基因组。

  因此,使用深度学习算法来了解基因组和基因突变使人类达到一个新的认识高度:理解人类不曾理解的事情。Deep Genomics的基因组科学顾问——“深度学习之父” Yann LeCun是Facebook人工智能的主导者并不是一个巧合。深度学习算法将给基因组学带来新的里程碑。

  关于Brendan Frey博士

  Brendan博士是机器学习专家、基因组学专家,他领导的团队开发的用于预测基因组突变对RNA剪切的影响,该研究成果与今年一月份在线发表于《Science》上。在过去的20年中,Brendan博士曾在《Science》《Nature》《Cell》上发表过12篇论文。1995年在《Science》中发表了第一篇关于深度学习算法的文章,2010年在《Nature 》发表了一篇文章描述计算机系统预测可变剪接的细胞过程。Brendan曾是微软研究院的技术顾问,拥有七项专利,并是专利诉讼专家证人。

上一篇:机器学习算法可预测出乳腺癌治疗率(图)
下一篇:未来机器人或将能“察言观色”
精选推荐
MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

麻省理工最新机器人“装配工”未来可建造太空基地
麻省理工最新机器人“装配工”未来可建造太空基地

[2019-10-17]  两个机器人原型把一系列小单元组装成大结构体麻省理工学院科研人员最近提出一种新型机器人技术,即一种小型机器人系统,能够自主地用统一规 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

集群机器人领域最新研究:一种用于探测未知环境的微型无人机群
集群机器人领域最新研究:一种用于探测未知环境的微型无人机群

[2019-10-26]  (图:无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向,它将试图飞到另一个方向。若首选方向冲突,低优先 ...

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸

[2019-11-05]  莱布尼茨,德国哲学家、数学家、律师,历史上少见的通才1666年,德国博学家戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)发 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......