爱吧机器人网 » 技术 > 大数据 > 正文

云计算和大数据延伸至生命信息领域:生物云计算

随着互联网的普及和技术的发展,大数据和云计算已经渗透在人们的生活的各个方面,在金融,零售,能源,交通等领域已经得到广泛应用。而对于生物信息来说,生物的DNA,基因序列,生物芯片等无时无刻不产生新的数据;比如说,DNA测序每年能够产生大约150亿兆(PB级)的数据,如果将这些数据存储在DVD中,那么刻录出来的DVD能够达2.5英里高。生命科学的数据来源和形式多样,包括基因测序、分子通道、不同的人群等。每个临床试验需要千上万病患的数年统计资料,而DNA测序的每个样本产生的数据则以兆兆位计算;如果能高效、高速地利用这些大数据,无疑将为生命科学领域带来无限机遇,但如何分析利用也带来了全新挑战。生物云计算便能很好的解决这些问题;

1)云存储:利用世界上成百上千台服务器云,通过分布式计算系统,取得廉价、便捷的服务;

2)云计算与大数据分析:通过大数据处理软件将复杂,繁琐的数据通过可视化,简单化的方式呈现出分析结果。

生物云计算

大数据,云计算,生物医学——三个炙手可热的关键字和在一起会是什么效果?从应用角度出发,这个可以是SaaS,可以是PaaS;下面介绍一些国内外的生物云计算公司,从四个方面来重点介绍一下在云出现的比较有影响的在云端生物学大数据的应用。这四个方面分别是基因测序,临床药物研发管理以及健康管理

1) DNAnexus

DNAnexus

DNAnexus 是一家致力于打造云端 DNA 数据库的创业公司,并把这些数据提供给研究人员和科学家。目的是将更多基因存储至云端,实现基因的便捷的访问和对比分析。该项目同时还提供人类基因数据备份,基因检索和配对等。通过检索和配对,医生可以从数千万的基因信息中找到对病人有效的药物。目前 DNAnexus 的用户已经包括斯坦福大学和哈佛大学等高校,制药公司,某些医生也会通过DNA 信息来诊断病情。公司提供的服务初衷解决在实验室经过测序仪大量数据的问题,人类基因测一次数据,原始数据在100个G到600个G之间,通过服务导入到云服务平台,后来提供了非常灵活的多样化的各类各样的关于数据的测序分析和比对的工作流程,数据可以有效的管理起来,并且测序结果能够很好的以用户很好的形式展现出来。该公司获得Google领投的1500万美元的融资。2014年1月,Google基因组开启了基因组云存储服务,目前谷歌基因组存储数据费用为100GB数据25美元一年,可满足单个人的原始基因信息存储。且在经过谷歌特殊算法的处理后,可压缩至1GB,费用也将降至25美分。

2)Seven Bridges Genomics

Seven Bridges Genomics

SevenBridges Genomics是美国一家创业公司,主要提供基因排序研究和生物制药产品服务,实现生物信息的可视化,数据分析等方面。Seven Bridges Genomics在人类基因组排序和分析中综合应用了云计算和NoSQL数据的技术,比如EC2、S3和MongoDB。为了降低数据存储成本,他们还采用了Glacier。Seven Bridges PaaS提供了一个设置数据通道的界面,这些通道可以基于预定义的模型,也可以根据当前任务进行调整。

3)crossbow

crossbow

Crossbow是一款能够用于完整基因组重新排序分析的工具。经过对多个类库进行整合,它可以借助AWS只花不到100美元的成本在3小时之内分析完一个人类基因组。对于有志于从事生物信息的开发人员来说,这是一个非常好的工具。这是对全基因分析的流程软件,它的意义在于原来开发之前,完成一个人健康分析的在单个服务器,这软件通过亚马逊云平台上的Hodoop把时间缩小了。结果来看,它现在在32CPU核上任务压缩3小时不到,整个成本不到100美元,这是众多工作中的一部分。

4)Explorys

Explorys

Explorys公司成立于2009年,是一家临床医疗数据管理应用公司,是克利夫兰诊所派生的创新公司。公司利用大数据提高医疗水平和服务质量。公司通过最强大的医疗计算平台把各个系统的数据联系在一起,提供完整的临床整合、高危人群管理、医疗费计算解决方案以及业绩计薪解决方案。该平台拥有2050亿临床、财务、运行数据元,覆盖3800万名患者、300家医院、215,000多名医疗服务提供者。18家大型综合医疗系统正在使用可靠的Explorys云计算平台确定疾病的类型、治疗方案和治疗效果。它是基于私有云的模式,向第三方机构提供服务,第三方机构可以把自己临床数据、运维数据财务数据托管到这个平台来,这个平台提供最大的好处能实时提供数据分析,这个规模托管了1300万人,大概4400亿的内容,数据规模在60个TB左右,2013年达到70个TB,顶层技术在Hodoop上走的。

5)Illumina

Illumina

Illumina公司是遗传变异和生物学功能分析领域的优秀的产品、技术和服务供应商。Illumina销售各种各样的DNA相关产品,包括基因测序仪器、分析相关数据的软件和服务。通过帮助客户加快实现生物信息的采集、分析和应用,来改善人类健康。当前,Illumina拥有基因组测序仪市场70%的份额。公司今年1月,Illumina发布了新款高端基因测序仪,可以准确测出全基因组序列,而成本还不到1000美元。当前,基因组测序已经不再是一个简单的研究工具,读取人类全部DNA的费用已经降至足够低,甚至可以用来解决一些医疗问题,并确定治疗方案。

上一页12下一页

上一篇:大数据时代之hadoop:了解hadoop数据流(生命周期)
下一篇:大数据商业化让个人隐私无处遁形
精选推荐
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

人工智能准确预测患者一年内的死亡风险,原理却无法解释
人工智能准确预测患者一年内的死亡风险,原理却无法解释

[2019-11-13]  图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示,人工智能通过查看心脏测试结果,以高达85%以上的准确率预测了一个人在一 ...

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

本周栏目热点

[1970-01-01]   这可能是未来最具发展潜力的职业之一,我们从职场角度为你解读如何成为 大数据 工程师,以及它的职业发展 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...