爱吧机器人网 » 技术 > 大数据 > 正文

埃博拉病毒——大数据时代的疫情防控

在对于埃博拉病毒研究的实际操作中却更为复杂,一个最主要的原因在于西非大部分民众并没有手机或者其他通信设备。不过尽管如此,某种程度上它却依然优于基于陈旧数据的统计分析。事实上研究人员如果可以从一个传染病爆发的地域追踪到人口的流动,那么对于下一个最有可能爆发传染病的地点就会有一个比较有效的估计和预测,从而可以提前展开合理有效的资源配置。遗憾的是,尽管很多相关的机构都做了很大程度的努力,但出于隐私等问题的考虑,电信运营商依然不允许研究人员使用这部分数据。

3. 由社交媒体数据预测疫情 [4]

网络和社交媒体数据,对埃博拉病毒的预警,发挥了重大作用。HealthMap是一个利用大数据反应疫情的网站/应用,它使用一定的算法来抓取来自社交媒体网站、本地新闻和政府网站、传染病医师的社交网络和其他渠道的数据,用于探测和跟踪的疾病暴发。2014年3月14号,HealthMap通过自己的系统,预警了几内亚境内爆发的“神秘出血热”。2014年3月19号,HealthMap确认其为埃博拉病毒并对世界卫生组织发出警告,还给出了其在几内亚东南部热带雨林地区传播的粗略地点和路径。2014年3月23号,世界卫生组织正式宣布埃博拉疫情爆发并报告了第一个确诊案例。在这时,HealthMap已经追踪了在几内亚的29例确诊和29人死亡 ——所有数据和报告都来源于社交媒体和当地政府网站等。

HealthMap利用复杂而算法,过滤不相关的数据,结合领域内专家的帮助,再对相关的信息进行分类,确定疾病的类型并在地图上定位爆发地点。针对这次埃博拉疫情,在世界卫生组织宣布当天,HealthMap就上线了专门的页面,其中包含一个实时可交互的地图。全球网友可以通过这个可交互地图来免费了解疫情,其中包括具体的暴发地点和跟踪新的病例和死亡人数的信息。该系统还能够记录公众的关注度。用户可以在地图上放大特定的国家和地区,上面会标记主要病例报告。用户点击标记会指向爆发的新闻报道。同时,在地图底部的滚动条可以让你通过点击关键日期,以追踪病情进展。

这不是HealthMap第一次立功了。这个组织成立于2006年,由一组研究人员,流行病学家和软件开发人员组成的团队,利用网上各式各样的数据来源,监测和预测的疾病暴发,并实现对公共健康威胁的实时监控。他们汇集了各式不相干的数据源,包括网络新闻集中平台,目击者报告,专家策划讨论和官方验证的报告。除了实时和可交互的呈现数据,HealthMap也致力于预测疾病风险。曾经有报导称,该组织成功使用boosted regression tree等模型成功预测了SARS在中国境内爆发的死亡率。

HealthMap的官网宣称,他们主要的数据来源是 ProMED(一个国际传染病协会,成员主要为一线医生和研究人员)邮件列表、世界卫生组织官网,GeoSentinel(来自国际旅行医学协会和美国疾病预防控制中心的临床医生以个人身份的检测)、世界动物健康组织官网、联合国粮农组织、EuroSurveillance(欧洲地区以同行评审为目的的传染病监测和交流的信息平台)、Wildlife Data Integration Network(一个全球野生动物基本新闻源)、谷歌新闻搜索,百度新闻和搜搜资讯。另一份公开发表的论文显示,大部分数据来自ProMED (61. 58%),谷歌等其他搜索引擎新闻则贡献了25. 24%,除此之外比较重要的来源还包括 RSS 订阅(12. 11%), 推特等社交媒体(8. 7%)[5]。这和新闻中极力鼓吹的完全通过社交媒体预测埃博拉疫情,似乎还是有一定的差距。这个社交媒体并不是大众所以为的普通公开社交媒体,而是全球一线医护人员建立的社交网络。事实上,谷歌以及其他一些社交媒体都试图通过抓取网络关键词来监控和预测疾病信息,但是并没有取得如此好的效果。谷歌曾经宣称自己的系统很好地预测了美国每一季的流感爆发,而实际数据显示,他们的系统常常高估了患病率。普通人对疾病的感知和在社交网络的分享,的确不如实际病情那么准确。另一方面,推特的数据显示,埃博拉引起了美国用户前所未有的恐慌,各州的讨论数字一片飘红,网络极端言论层出不穷。但实际上美国至今也只有4个确诊案例和一个死亡案例。

来自以色列贝斯医疗中心的临床信息学专家Brad Crotty博士在接受采访时说,HealthMap事实上还有很多工作要做,以排除“背景噪音”。这位专家并不是这个组织的成员。

Crotty博士说:“你的确可以得到早期预警,但他们并不总是正确的。”

而正在负责HealthMap运营的Sumiko Mekaru博士则称,他们的本意是作为传统和官方健康报告的辅助,而不是取代它们。

二、疫情死亡率的计算与估计[6]

死亡率的计算十分重要,特别是对于传染性疾玻病死率在流行病学中是一个非常重要的估计指标,因为它告诉我们感染特定疾病后死亡的概率。如果正在爆发中的估算准确,甚至可以帮助我们确定病毒是否在危害性方面发生变异,以及研究最合适的治疗方案。

正在西非乃至全球 肆虐的埃博拉病毒,有着众所周知的高致死率。在以往 的爆发中,高达90%的被感染者死于埃博拉。和本次大爆发同宗的扎伊尔型埃博拉病毒以往平均死亡率为80%。这也是为什么,世界卫生组织最新疫情报告中的数据看起来有那么一丁点像好消息—— 尽管埃博拉感染率正在以惊人的速度攀升,报告中整体死亡率却只有53%,从塞拉利昂的39%到几内亚的64%。这比以往几次疫情爆发要相对温和一点。难道是这次爆发的病毒比以往的致死率与危害性低一点?还是说我们已经有了更有效的治疗方案?

实际上此处有一个隐情:明显降低的死亡率可能更多是因为官方测算方式的缘故,而非病毒的致死率,或者说患者接受的治疗水平导致的。事实上,最近几周感染人数的急剧增加,正是报告死亡率看起来不那么高的其中一个主要原因。

官方所谓的死亡率,或者说一个爆发疾病的“病死率”,有若干计算方式。其中最为简单的,就是目前死亡人数除以目前总感染人数。世界卫生组织最近报告的死亡率也就是这样计算的。

上一页1234下一页

上一篇:数据科学家可能成为2015年最热门职业
下一篇:互联网征信:如何处理数据问题是关键
精选推荐
MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统
谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统

[2019-10-11]  训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统,测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件, ...

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

为未来战场创造更有效的机器人 美国陆军研究人工纳米马达
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达

[2019-10-11]  为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友,美国陆军研究人员正在执行一项任务,即研究肌肉分子生命功能的价值,以及复制过 ...

本周栏目热点

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

[1970-01-01]   今天Fivethirtyeight(以数据为主的时政分析博客)的博主,美国著名政治评论家、 大数据 领域的超人Nate ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...