在对于埃博拉病毒研究的实际操作中却更为复杂,一个最主要的原因在于西非大部分民众并没有手机或者其他通信设备。不过尽管如此,某种程度上它却依然优于基于陈旧数据的统计分析。事实上研究人员如果可以从一个传染病爆发的地域追踪到人口的流动,那么对于下一个最有可能爆发传染病的地点就会有一个比较有效的估计和预测,从而可以提前展开合理有效的资源配置。遗憾的是,尽管很多相关的机构都做了很大程度的努力,但出于隐私等问题的考虑,电信运营商依然不允许研究人员使用这部分数据。
3. 由社交媒体数据预测疫情 [4]
网络和社交媒体数据,对埃博拉病毒的预警,发挥了重大作用。HealthMap是一个利用大数据反应疫情的网站/应用,它使用一定的算法来抓取来自社交媒体网站、本地新闻和政府网站、传染病医师的社交网络和其他渠道的数据,用于探测和跟踪的疾病暴发。2014年3月14号,HealthMap通过自己的系统,预警了几内亚境内爆发的“神秘出血热”。2014年3月19号,HealthMap确认其为埃博拉病毒并对世界卫生组织发出警告,还给出了其在几内亚东南部热带雨林地区传播的粗略地点和路径。2014年3月23号,世界卫生组织正式宣布埃博拉疫情爆发并报告了第一个确诊案例。在这时,HealthMap已经追踪了在几内亚的29例确诊和29人死亡 ——所有数据和报告都来源于社交媒体和当地政府网站等。
HealthMap利用复杂而算法,过滤不相关的数据,结合领域内专家的帮助,再对相关的信息进行分类,确定疾病的类型并在地图上定位爆发地点。针对这次埃博拉疫情,在世界卫生组织宣布当天,HealthMap就上线了专门的页面,其中包含一个实时可交互的地图。全球网友可以通过这个可交互地图来免费了解疫情,其中包括具体的暴发地点和跟踪新的病例和死亡人数的信息。该系统还能够记录公众的关注度。用户可以在地图上放大特定的国家和地区,上面会标记主要病例报告。用户点击标记会指向爆发的新闻报道。同时,在地图底部的滚动条可以让你通过点击关键日期,以追踪病情进展。
这不是HealthMap第一次立功了。这个组织成立于2006年,由一组研究人员,流行病学家和软件开发人员组成的团队,利用网上各式各样的数据来源,监测和预测的疾病暴发,并实现对公共健康威胁的实时监控。他们汇集了各式不相干的数据源,包括网络新闻集中平台,目击者报告,专家策划讨论和官方验证的报告。除了实时和可交互的呈现数据,HealthMap也致力于预测疾病风险。曾经有报导称,该组织成功使用boosted regression tree等模型成功预测了SARS在中国境内爆发的死亡率。
HealthMap的官网宣称,他们主要的数据来源是 ProMED(一个国际传染病协会,成员主要为一线医生和研究人员)邮件列表、世界卫生组织官网,GeoSentinel(来自国际旅行医学协会和美国疾病预防控制中心的临床医生以个人身份的检测)、世界动物健康组织官网、联合国粮农组织、EuroSurveillance(欧洲地区以同行评审为目的的传染病监测和交流的信息平台)、Wildlife Data Integration Network(一个全球野生动物基本新闻源)、谷歌新闻搜索,百度新闻和搜搜资讯。另一份公开发表的论文显示,大部分数据来自ProMED (61. 58%),谷歌等其他搜索引擎新闻则贡献了25. 24%,除此之外比较重要的来源还包括 RSS 订阅(12. 11%), 推特等社交媒体(8. 7%)[5]。这和新闻中极力鼓吹的完全通过社交媒体预测埃博拉疫情,似乎还是有一定的差距。这个社交媒体并不是大众所以为的普通公开社交媒体,而是全球一线医护人员建立的社交网络。事实上,谷歌以及其他一些社交媒体都试图通过抓取网络关键词来监控和预测疾病信息,但是并没有取得如此好的效果。谷歌曾经宣称自己的系统很好地预测了美国每一季的流感爆发,而实际数据显示,他们的系统常常高估了患病率。普通人对疾病的感知和在社交网络的分享,的确不如实际病情那么准确。另一方面,推特的数据显示,埃博拉引起了美国用户前所未有的恐慌,各州的讨论数字一片飘红,网络极端言论层出不穷。但实际上美国至今也只有4个确诊案例和一个死亡案例。
来自以色列贝斯医疗中心的临床信息学专家Brad Crotty博士在接受采访时说,HealthMap事实上还有很多工作要做,以排除“背景噪音”。这位专家并不是这个组织的成员。
Crotty博士说:“你的确可以得到早期预警,但他们并不总是正确的。”
而正在负责HealthMap运营的Sumiko Mekaru博士则称,他们的本意是作为传统和官方健康报告的辅助,而不是取代它们。
二、疫情死亡率的计算与估计[6]
死亡率的计算十分重要,特别是对于传染性疾玻病死率在流行病学中是一个非常重要的估计指标,因为它告诉我们感染特定疾病后死亡的概率。如果正在爆发中的估算准确,甚至可以帮助我们确定病毒是否在危害性方面发生变异,以及研究最合适的治疗方案。
正在西非乃至全球 肆虐的埃博拉病毒,有着众所周知的高致死率。在以往 的爆发中,高达90%的被感染者死于埃博拉。和本次大爆发同宗的扎伊尔型埃博拉病毒以往平均死亡率为80%。这也是为什么,世界卫生组织最新疫情报告中的数据看起来有那么一丁点像好消息—— 尽管埃博拉感染率正在以惊人的速度攀升,报告中整体死亡率却只有53%,从塞拉利昂的39%到几内亚的64%。这比以往几次疫情爆发要相对温和一点。难道是这次爆发的病毒比以往的致死率与危害性低一点?还是说我们已经有了更有效的治疗方案?
实际上此处有一个隐情:明显降低的死亡率可能更多是因为官方测算方式的缘故,而非病毒的致死率,或者说患者接受的治疗水平导致的。事实上,最近几周感染人数的急剧增加,正是报告死亡率看起来不那么高的其中一个主要原因。
官方所谓的死亡率,或者说一个爆发疾病的“病死率”,有若干计算方式。其中最为简单的,就是目前死亡人数除以目前总感染人数。世界卫生组织最近报告的死亡率也就是这样计算的。