爱吧机器人网 » 技术 > 大数据 > 正文

埃博拉病毒——大数据时代的疫情防控

2014年时代杂志的年度人物称号由埃博拉患者护理人员获得,在向他们致敬的同时,让我们回顾一下去年这场饱受关注并且持续到今年的全球性传染病事件。

2014年继马航客机失联事件之后,始发于西非几内亚的埃博拉病毒疫情经由传统媒体和数字媒体走入全球公众视野。据世界卫生组织提供的资料[1]显示,埃博拉病毒最早在1976年同时爆发的两起疫情中首次出现的,一起在苏丹,另一起在刚果民主共和国。后者发生在位于埃博拉河附近的一处村庄,该病由此得名。该次埃博拉疫情在刚果民主共和国爆发的是扎伊尔标准亚种,累计318人患病,280人死亡,致死率88%;在苏丹爆发的则是苏丹亚种,累计284人患病,151人死亡,致死率53%;另外还有雷斯顿、科特迪瓦、邦地布优等三个亚种,对动物和人类的危害相对温和。据悉,目前正在肆虐全球的埃博拉病毒,正是致死率最高的扎伊尔标准亚种。

埃博拉病毒疫情时隔几年便爆发一次,不过之前每次疫情规模都比较小,主要集中在一个地区爆发,并且局限在中非。特别地,刚果民众共和国史上曾多次爆发埃博拉疫情。

2014年3月开始爆发的埃博拉病毒疫情的爆发规模引起了国际社会的关注,并且被世界卫生组织列为“国际间关注的公共卫生紧急事件”(历史第三次)。首先,这次疫情涉及到了多个国家和地区。全境范围受影响的国家包括几内亚、利比里亚和塞拉利昂。部分领土受影响的地区包括马里的卡伊,西班牙的马德里,美国的达拉斯、德克萨斯州和纽约市,英国苏格兰地区的格拉斯哥市,尼日利亚的拉各斯哈科特港,以及塞内加尔的达喀尔。其次,这次埃博拉病毒疫情出现的病例和死亡数字超过了所有其它疫情的总和。截止2014年12月31号,累计20206人患病,7905人死亡[2]。并且数字还在不断增加。而所有的埃博拉护理者,则被美国时代周刊选为2014年的年度人物。

回望过去几十年,人类无疑在信息、科技、生物、医疗等领域取得了今非昔比的成果。反观2014年埃博拉病毒疫情的爆发、传播、媒体报导、控制,我们不禁开始思考在这个大数据时代,数据、统计、理性思考、批判思维能为人类对疫情防控带来什么好处?这篇文章试图从三个角度去阐述大数据如何与疫情防控紧密相连。本文第一部分讨论了如何通过交通数据、移动通信数据与社交媒体数据等非传统公共卫生数据来测算乃至预测疫情风险;第二部分重点关注死亡率的不同估算方法带来的对于疫情风险的不同认知;第三部分聚焦在埃博拉病毒疫情的治疗和防控支出数据。

一、数据驱动的疫情预测

1. 由交通数据预测疫情[3]

全球人口流动的日趋频繁使某区域爆发的疫情会给全球其他国家和地区带来潜在的疫情风险,于是如何对此类疫情风险进行有效的预测和评估自然就成了一个值得探究的课题。本次埃博拉爆发的一个重大特征即是,疫情通过交通运输突破国境,在源爆发地几内亚之外多国肆虐。对于国际间的人口流动,飞机显然是最主要的交通方式,因此对机场人口流动数据的统计分析也就成了重中之重。

事实上机场数据也早已被很多领域的研究者们所重视,基于此类数据分析建模的案例也已屡见不鲜。对于埃博拉疫情传播的分析,也有研究人员给出了他们的方法,其中一种就是通过估计引入风险(import risk)的方法来量化埃博拉对某一地区可能造成的影响。

对于引入风险的估计,最核心的问题便是如何通过动态模型或是统计模型将风险量化。这里介绍一种比较直观简介的估计方式,首先把引入风险分为相对引入风险(relative import risk)和绝对引入风险(absolute import risk)。不妨假设X为疫情爆发区域的某个机场,而Y则是世界上任意一块区域,那么我们可以通过条件概率的形式来定义相对引入风险,即P(Y|X)。而对于绝对引入风险我们则可以通过联合概率来定义,即P(X,Y)=P(Y|X)P(X),这里需要注意的是P(X)往往远小于P(Y|X),因此P(X,Y)也会远远小于P(Y|X)。在实际应用中,相对风险较绝对风险而言更有价值,其主要原因在于P(X)的估计在大部分时间都难以实现,事实上P(X)的估计需要依赖于大量的参数来描述X所在地区的各类因素,而绝对风险的估计却恰恰依赖于P(X)。与此相反,相对风险的计算则仅仅需要各机场人口流动的数据即可,即无需考虑地区本身的相关因素。

将全球各地的机场数据整合后,人们即可以得到各地点相对引入风险的估计值,下一步则是考虑如何将分析结果向公众展示。显然数据可视化往往是直观有效展示分析结果的最佳方式,有人提供了一种基于D3实现的交互式网络分析图表。(图一展示了一个交互式图表的截图。有兴趣的读者可翻阅原图。图表链接:https://rocs.hu-berlin.de/D3/ebola/)

yq01

图1

2. 由移动通信数据预测疫情

埃博拉病毒在西非的爆发引起了全世界的关注,人们纷纷把注意力头像了机场等引起人口流动的公共场所,正如上一节所说,机场数据的确对于流行病学家等研究者们而言具有极高的分析价值,但除此之外,基于手机移动端产生的数据同样极具应用潜力。

用户每次利用手机通话的过程中都会同时产生相应的通话记录数据,其中自然也包含了电话号码、通话时间以及大致的通信地点等重要信息。对于运营商而言,这些数据可以为各地基站的部署提供参考从而提升通信网络。另一方面对于城市规划者而言则可以基于该数据判断相关地点是否需要拓展相应的公共交通设施。

然而除了上述这些相对常用的应用外,在流行病学的应用却更令人期待,更激动人心。事实上到目前为止一般情况下对于疾病扩散建模的常用方法依然是基于人口普查的数据以及相关调查。然而对于通信记录数据,人们却可以得到实时更新的数据,也就是说在实际应用中无需估计某地区的人口是否会迁移。同时幸运的是,在近几年中确实并不缺乏类似的成功案例。2009年在墨西哥爆发的猪流感,研究人员就曾利用通信数据监测公众对于政府发布的健康预警信息的反应。此后2010年随海地地震爆发的霍乱疫情,研究人员则同样基于手机通信数据建模并给出了最需要援助地点的最优估计。

上一页1234下一页

上一篇:数据科学家可能成为2015年最热门职业
下一篇:互联网征信:如何处理数据问题是关键
精选推荐
可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站

[2019-12-09]  12月5日,搭载人工智能的太空机器人西蒙2号(CIMON 2)乘坐SpaceX火箭Dragon货运舱,从佛罗里达州卡纳维拉尔角空军基地升空,前往国际空间 ...

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

本周栏目热点

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

[1970-01-01]   今天Fivethirtyeight(以数据为主的时政分析博客)的博主,美国著名政治评论家、 大数据 领域的超人Nate ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...