爱吧机器人网 » 技术 > 机器学习 > 正文

转人工智能+基因,机器学习算法提升人类认知

  日前,外媒采访了Deep Genomics CEO Brendan Frey博士,解读了人工智能+基因组学这个热得发烫的词。

  Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。

  Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。

  如今Deep Genomics已经走出了人工智能和基因组数据整合商业化的一步,而中国会在这条道路上前进多远?

  谈及人工智能,首先要先说说“深度学习”这个词。

  深度学习,Deep Learning,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。

  深度学习算法将基因组学带到何处?Brendan Frey博士带你玩转人工智能+基因。

  记者:请您解释为何深度学习算法有助于发现致病基因突变?

  Brendan Frey博士:想要深入理解遗传疾病,首先要了解与疾病有关的突变。然而这样做几乎总是不能识别引起疾病的突变,因为突变是成群发生的,且与疾病有关因果关系常常被埋葬在一堆非因果关系的变异中。

  真正的因果变异通过一连串的细胞过程来引起基因突变,确定因果变异对疾病的确定非常重要,同时对如何使用药物或基因编辑来治疗疾病也非常重要。最近的数据显示,此类遗传信息可使医药研发的成功机会增加三倍。深度学习算法可在计算机系统中分析因果变异的级联过程。

  记者:评估一个基因突变是否会导致疾病,为何预测蛋白绑定尤其重要?

  Brendan Frey博士:DNA通常被称为“生命之书”,那么细胞如何阅读这本书?它们利用蛋白质来识别DNA中的每个单词,并将这些词绑定起来产生其他效果。蛋白质在细胞级联过程中起着重要的作用。DNA突变经常会干扰蛋白质的绑定作用,使其绑定在错误的位置。因此,精准确定蛋白质在何时何地绑定对理解和治疗疾病非常重要。

  记者:为何很难预测蛋白质何时何地绑定到DNA和RNA序列上?

  Brendan Frey博士:蛋白质是否绑定是由复杂的生化反应决定的,事实上,蛋白质是否绑定是一个级联反应过程,涉及到DNA和RNA中的每个碱基以及碱基的组合,同时还涉及到其他蛋白质。

  记者:请您概述一下DeepBind,并解释它是怎样计算蛋白质是否会绑定到一个序列上,从而影响细胞过程?

  Brendan Frey博士:顾名思义,DeepBind将深度学习算法与DNA或RNA序列级联反应识别模式相结合,用于确定蛋白质是否绑定到序列上。由DeepBind得到的级联反应可能与细胞内的情况不符,但重要的是DeepBind可以解释DNA或RNA中每个碱基的复杂组合。

  由于实际的细胞过程包括这些复杂的组合,DeepBind可以找到这些组合的关系。然而DeepBind并不能完美的预测,但与其他技术相比DeepBind的表现最好。

  记者:DeepBind对人类基因数据分析有何帮助?

  Brendan Frey博士:我们很兴奋,DeepBind可能打开世界临床和研究工作的新大门。我们已经利用DeepBind来识别破坏蛋白质绑定的突变位点。在这一点上,很明显DeepBind可以识别突变与疾病之间的关系,而行业标准方法是无法办到的。例如我们使用DeepBind来检查与家族性高胆固醇血症和卵巢癌疾病有关的,破坏蛋白质绑定或导致蛋白质绑定错误的突变。

  记者:如何在SPIDEX系统建立DeepBind?这两个工具要连接到电脑系统上吗?

  Brendan Frey博士:Deep Genomics有一个先进的科学技术路线用于构建一个可以连接解释不同细胞过程的大量组件的计算机系统。对于人类突变,SPIDEX系统正如谷歌引擎的一部分。事实上,SPIDEX依赖一个简单的系统来预测蛋白质的绑定作用。如今我们打算用DeepBind替换这个简单的系统,使SPIDEX生成更准确的数据。所有组件的交互作用以及改进其中的某个组件将大大提高其他组件的作用。这就是深入学习算法的工作原理。

  记者:谈谈Deep Genomics下一步的开发计划以及深度学习算法和生物基因组学的未来。

  Brendan Frey博士:这是个很好的问题。我们正在开发的是技术而不是工具。我们开发的每一个组件都可以作为一种工具,但是作为“引擎”的动态组件,它们的价值会大得多。

  送入Deep Genomics引擎的基因数据可以生成与病人有关的重要的疾病信息,这些信息可以用于确定治疗方案,反过来又可提高引擎本身。在Deep Genomics引擎中,细胞过程之间的连接方式与谷歌搜索引擎中网页之间的连接类似,当我们收集的数据越多,我们就越能提高生物连接的准确性。

  机器学习算法和基因组学的未来是什么?我相信,基因生物学是深入学习算法的下一个主攻领域。十年前,我在一个深度学习算法早期研讨会中就有提到这个观点。当时其他与会者正在研究计算机视觉、语音识别和文本处理。当时我就指出虽然这些都是引人注目的问题,但人类在这方面做得已经很好了,相反,人类不擅长理解基因组。

  因此,使用深度学习算法来了解基因组和基因突变使人类达到一个新的认识高度:理解人类不曾理解的事情。Deep Genomics的基因组科学顾问——“深度学习之父” Yann LeCun是Facebook人工智能的主导者并不是一个巧合。深度学习算法将给基因组学带来新的里程碑。

  关于Brendan Frey博士

  Brendan博士是机器学习专家、基因组学专家,他领导的团队开发的用于预测基因组突变对RNA剪切的影响,该研究成果与今年一月份在线发表于《Science》上。在过去的20年中,Brendan博士曾在《Science》《Nature》《Cell》上发表过12篇论文。1995年在《Science》中发表了第一篇关于深度学习算法的文章,2010年在《Nature 》发表了一篇文章描述计算机系统预测可变剪接的细胞过程。Brendan曾是微软研究院的技术顾问,拥有七项专利,并是专利诉讼专家证人。

上一篇:机器学习算法可预测出乳腺癌治疗率(图)
下一篇:未来机器人或将能“察言观色”
精选推荐
MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸

[2019-11-05]  莱布尼茨,德国哲学家、数学家、律师,历史上少见的通才1666年,德国博学家戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)发 ...

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

机器人从工业走向家庭  库卡KUKA目标是引领中国市场
机器人从工业走向家庭 库卡KUKA目标是引领中国市场

[2017-12-08]  机器人正在改变着人们的生活方式,而库卡KUKA想要在中国这个大蛋糕中占有一块大份额,库卡公司正在引领市场...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......