【新知】从美元旅行到流感预测
谁也想不到,10年后的今天,这些美金纸币流通的数据,会被科学家们用来预测甲型H1N1流感
打开一个网址,一个表单出现在网站首页,要你填写美元的面值、印刷年代、序列号、你所在地区的邮政编码和你是在哪里得到这张钱的。——别误会,这既不是美国政府或银行的网站,也绝不是现在流行的网上诈骗,而是一位叫汉克·艾斯金(Hank Eskin)的美国程序员发起的游戏,这是10年前网络闲人中的一个流行游戏。
家住马萨诸塞州布鲁克林的艾斯金是一位数据库专家,也许是工作原因,他对数据有着特别的兴趣。10年前,一次突发的奇想使他开始了这个游戏——看看美金纸币的流向。没有任何专业的调查机构和银行的支持,他用了一个最“笨”的方法:在每张纸币上盖上一个印章,上面仅仅留下一个网址,好奇的人一旦得到这张纸币,往往会查看这个网站,于是就出现了上面提到的这一幕:请填写你得到的是哪张钱,以及你是在哪儿得到它的。
拜当时刚普及几年的互联网所赐,许多人参与的热情很高。艾斯金获得了很多回复,不少人在得到印有标记的美元后不但把信息提交给网站,还主动要求参加进来,一起帮助在钱上盖印章。很快,关于这些钱的数据就多了起来,一些游戏也随之衍生,例如看看那张钱环游了美国50个州,或者曾经出现在一些奇怪的场所。这个游戏一下就进行了10年,艾斯金的网站积累了非常多的数据。谁也想不到,10年后的今天,这些美金纸币流通的数据,会被科学家们用来预测甲型H1N1流感。
2006年,马克斯-普朗克动力学与自组织研究所的布鲁克曼教授发表在《自然》杂志的一篇文章,根据艾斯金网站上的数据研究了人类交通活动的规律。
我们知道,有时一张钱可能反复在同一地区流通,另一方面,一些钱可能会跨越千里,出现在另一个地方,这些情况往往反映了人在不同地区的交通流动情况,而交通交流则构成了现代传染病流行的重要条件。布鲁克曼的团队通过艾斯金的数据,跟踪了40余万美金的流向,发现其流动是有规律可循的,并由此建立了一个数学模型。因为难以验证,专家对这一模型的有效性一开始有些怀疑,直到08年一个研究追踪移动电话数据,得出了和美元数据非常接近的结果。
2009年的甲型H1N1流感流行期间,布鲁克曼教授开始用研究所的超级计算机实时计算流感可能的传播趋势。这个程序运行一次需要超级计算机工作10个小时,它主要使用了航班和公共交通的数据,以及艾斯金网站上的美元流动数据。
当时,布鲁克曼的研究小组和印第安纳大学的另一个利用全球的交通数据进行预测的研究团队,都在预测甲型H1N1流感的传播趋势。两个小组的研究结果非常接近,都预言纽约、加州和得克萨斯是首当其冲的爆发热点,这与事实也基本相同。
当然,对他们的预测成果,美国疾病预防与控制中心的发言人并未发表评论。不过,今天的研究让我们看到,除了天气预报,也许有一天,疾病也能够有效预报,从而大大降低传染风险。到时不要忘了,美元流动数据曾经帮助我们建立过模型,而这些数据缘起于一个程序员的个人网站:乔治·华盛顿去哪儿了(Where is George? 指美元上印有乔治·华盛顿头像)。