玄妙的统计:从城邦政情到大数据
在抽象的意义下,一切科学都是数学;在理性的世界里,所有的判断都是统计学。——(印度)C.R.劳
责任编辑:朱力远
(本文首发于2019年2月7日《南方周末》)
在抽象的意义下,一切科学都是数学;在理性的世界里,所有的判断都是统计学。——(印度)C.R.劳
从城邦政情到统计学
统计学是通过收集、整理、分析、描述数据等手段,以达到推断所测对象的性质、本质乃至未来的一门学科,需要用到许多数学知识。统计起源于何时何地,已经很难说清了。有的说是古埃及,有的说是巴比伦,也有人认为是公元前2000年左右的夏朝,那时统治者为了征兵和征税进行了人口统计。
到了周朝(前1046-前256),又设立了“司书”一职,类似于今天的国家统计局局长。而西方最早的统计记载是《圣经·旧约》,该书引用了犹太人的人口统计结果,是公元前13世纪犹太人首领摩西对以色列军队进行的调查。
一般来说,小范围的人口统计,哪怕包括人数、年龄、收入、性别、身高、体重等多项指标,统计仍派不上大用场。随着统计人数的增加,如一座城市的市民、一个省的妇女,以及统计指标的增多,如健康、家庭经济和寿命情况,等等,统计就慢慢体现出规律和价值了。
公元前4世纪,全才的亚里士多德撰写了“城邦政情”(Matters of state),共包含150余种纪要,内容涉及希腊各城邦的历史、行政、科学、艺术、人口、资源和财富等社会、经济情况及其比较。
“城邦政情”式的统计研究延续了两千多年,直至17世纪中叶,才逐渐被“政治算术”这个颇有意味的名词替代,并且很快演化为“统计学”(statistics)。最初,它只是以德文的形式statistika(1749),依然保留了城邦(state)的词根,本意是记述国家和社会状况的数量关系。值得一提的是,英语中统计学家和统计员是同一个单词,正如数学家和数学工作者是同一个单词。
后来,欧洲各国相继把它译成本国文字,法语为statistique,意大利语为statistica,然后是英语,日语最初为“政表”“政算”“国势”“形势”,1880年才确定为“统计”。1903年,横山雅南的著作《统计讲义录》被译成中文出版,“统计”这个词也从日本传到中国,这与“数学”一词的来历一样,它们在日语里原本也是汉字。
既然统计学的主要工作是与数据打交道的,数据通常又有随机性,这就牵涉到另外一个与统计对称的术语——概率。随机意味着某种不确定性,但也并非没有规律可循,这需要用概
登录后获取更多权限
网络编辑:邵小乔