爱吧机器人网 » 技术 > 机器学习 > 正文

转人工智能+基因,机器学习算法提升人类认知

  日前,外媒采访了Deep Genomics CEO Brendan Frey博士,解读了人工智能+基因组学这个热得发烫的词。

  Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。

  Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。

  如今Deep Genomics已经走出了人工智能和基因组数据整合商业化的一步,而中国会在这条道路上前进多远?

  谈及人工智能,首先要先说说“深度学习”这个词。

  深度学习,Deep Learning,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。

  深度学习算法将基因组学带到何处?Brendan Frey博士带你玩转人工智能+基因。

  记者:请您解释为何深度学习算法有助于发现致病基因突变?

  Brendan Frey博士:想要深入理解遗传疾病,首先要了解与疾病有关的突变。然而这样做几乎总是不能识别引起疾病的突变,因为突变是成群发生的,且与疾病有关因果关系常常被埋葬在一堆非因果关系的变异中。

  真正的因果变异通过一连串的细胞过程来引起基因突变,确定因果变异对疾病的确定非常重要,同时对如何使用药物或基因编辑来治疗疾病也非常重要。最近的数据显示,此类遗传信息可使医药研发的成功机会增加三倍。深度学习算法可在计算机系统中分析因果变异的级联过程。

  记者:评估一个基因突变是否会导致疾病,为何预测蛋白绑定尤其重要?

  Brendan Frey博士:DNA通常被称为“生命之书”,那么细胞如何阅读这本书?它们利用蛋白质来识别DNA中的每个单词,并将这些词绑定起来产生其他效果。蛋白质在细胞级联过程中起着重要的作用。DNA突变经常会干扰蛋白质的绑定作用,使其绑定在错误的位置。因此,精准确定蛋白质在何时何地绑定对理解和治疗疾病非常重要。

  记者:为何很难预测蛋白质何时何地绑定到DNA和RNA序列上?

  Brendan Frey博士:蛋白质是否绑定是由复杂的生化反应决定的,事实上,蛋白质是否绑定是一个级联反应过程,涉及到DNA和RNA中的每个碱基以及碱基的组合,同时还涉及到其他蛋白质。

  记者:请您概述一下DeepBind,并解释它是怎样计算蛋白质是否会绑定到一个序列上,从而影响细胞过程?

  Brendan Frey博士:顾名思义,DeepBind将深度学习算法与DNA或RNA序列级联反应识别模式相结合,用于确定蛋白质是否绑定到序列上。由DeepBind得到的级联反应可能与细胞内的情况不符,但重要的是DeepBind可以解释DNA或RNA中每个碱基的复杂组合。

  由于实际的细胞过程包括这些复杂的组合,DeepBind可以找到这些组合的关系。然而DeepBind并不能完美的预测,但与其他技术相比DeepBind的表现最好。

  记者:DeepBind对人类基因数据分析有何帮助?

  Brendan Frey博士:我们很兴奋,DeepBind可能打开世界临床和研究工作的新大门。我们已经利用DeepBind来识别破坏蛋白质绑定的突变位点。在这一点上,很明显DeepBind可以识别突变与疾病之间的关系,而行业标准方法是无法办到的。例如我们使用DeepBind来检查与家族性高胆固醇血症和卵巢癌疾病有关的,破坏蛋白质绑定或导致蛋白质绑定错误的突变。

  记者:如何在SPIDEX系统建立DeepBind?这两个工具要连接到电脑系统上吗?

  Brendan Frey博士:Deep Genomics有一个先进的科学技术路线用于构建一个可以连接解释不同细胞过程的大量组件的计算机系统。对于人类突变,SPIDEX系统正如谷歌引擎的一部分。事实上,SPIDEX依赖一个简单的系统来预测蛋白质的绑定作用。如今我们打算用DeepBind替换这个简单的系统,使SPIDEX生成更准确的数据。所有组件的交互作用以及改进其中的某个组件将大大提高其他组件的作用。这就是深入学习算法的工作原理。

  记者:谈谈Deep Genomics下一步的开发计划以及深度学习算法和生物基因组学的未来。

  Brendan Frey博士:这是个很好的问题。我们正在开发的是技术而不是工具。我们开发的每一个组件都可以作为一种工具,但是作为“引擎”的动态组件,它们的价值会大得多。

  送入Deep Genomics引擎的基因数据可以生成与病人有关的重要的疾病信息,这些信息可以用于确定治疗方案,反过来又可提高引擎本身。在Deep Genomics引擎中,细胞过程之间的连接方式与谷歌搜索引擎中网页之间的连接类似,当我们收集的数据越多,我们就越能提高生物连接的准确性。

  机器学习算法和基因组学的未来是什么?我相信,基因生物学是深入学习算法的下一个主攻领域。十年前,我在一个深度学习算法早期研讨会中就有提到这个观点。当时其他与会者正在研究计算机视觉、语音识别和文本处理。当时我就指出虽然这些都是引人注目的问题,但人类在这方面做得已经很好了,相反,人类不擅长理解基因组。

  因此,使用深度学习算法来了解基因组和基因突变使人类达到一个新的认识高度:理解人类不曾理解的事情。Deep Genomics的基因组科学顾问——“深度学习之父” Yann LeCun是Facebook人工智能的主导者并不是一个巧合。深度学习算法将给基因组学带来新的里程碑。

  关于Brendan Frey博士

  Brendan博士是机器学习专家、基因组学专家,他领导的团队开发的用于预测基因组突变对RNA剪切的影响,该研究成果与今年一月份在线发表于《Science》上。在过去的20年中,Brendan博士曾在《Science》《Nature》《Cell》上发表过12篇论文。1995年在《Science》中发表了第一篇关于深度学习算法的文章,2010年在《Nature 》发表了一篇文章描述计算机系统预测可变剪接的细胞过程。Brendan曾是微软研究院的技术顾问,拥有七项专利,并是专利诉讼专家证人。

上一篇:机器学习算法可预测出乳腺癌治疗率(图)
下一篇:未来机器人或将能“察言观色”
精选推荐
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来使消费者受益
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来

[2018-12-08]  市场研究公司IHS Markit预测,到2020年,专业无人机市场将通过农业,能源和建筑等行业利用测量,制图,规划等技术实现77 1%的复合年增长率(CAGR)。与此同时,消费者无人......

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站

[2019-12-09]  12月5日,搭载人工智能的太空机器人西蒙2号(CIMON 2)乘坐SpaceX火箭Dragon货运舱,从佛罗里达州卡纳维拉尔角空军基地升空,前往国际空间 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

南加州大学机器人学家:机器人更适合粗暴的爱
南加州大学机器人学家:机器人更适合粗暴的爱

[2019-11-07]  图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱,当人类粗暴的将物体从机器人手中敲掉,看似残忍,实际上却能帮助机器人找到最好的握持物 ...

基于生物启发的机器人很容易适应丢失附属器官
基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17]  很多机器人被设计应用在危险环境,如灾难现场。在这些地方,他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗?也许不是,如果它们像日本的东北和北海道大学创造的......

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......