不含概率论的统计学简史
不含概率论的统计学简史
最近在mitbbs的统计版上有话题涉及到了统计学的历史。可以说统计学的历史在很多人看来是一笔糊涂账,社会科学领域倾向于将一门与数学无关、后来被发展为国势学的社会科学看成是统计学的起源;生物统计学和流行病学界倾向于以格朗特关于伦敦公共卫生方面的问题的描述称为是现代统计学的肇始;而数理统计学界则更愿意将数学在统计学中开始得到应用称为是统计学的起始。尽管本人可以得到的资料非常有限,还是愿意借此机会谈谈自己对这个问题的认识。
说到最早有文字记载的人类统计行为,可以明确地追溯到犹太人的圣经,其中有大量的统计数字和与现代统计行为一致的早期人类行为的描述。
与现代统计学具有直接血缘传承关系的早期的统计学是由17-18世纪的德国人康令、施梅泽尔和阿亨瓦尔开创的国势学(Staatenkunde,Statistik)。这个德语词汇在1787年被英国学者齐默尔曼(E. A. W. Zimmerman, ? - ?,从其家族看似乎是一个犹太人)翻译为statistic,从而成为现代使用的统计学(statistics)一词的来源。然而,事实上早在16世纪,意大利人基利尼斯就创造了拉丁语系的Statisticae(意大利语),而17世纪时期英国的格朗特和佩第便开始用简单的数学技术讨论国家政治、社会经济和公共卫生问题(也就是引入了数学计算或统计测量的国势学,即佩第所说的政治算术)。不过,所有这些人的工作都是遵循着培根的“新工具”思想,即大量观察某类现象后作出归纳性结论。
比较接近现代统计思维的统计学是在19世纪中末期开始的,主要的贡献者和奠基人当属英国的生物学家高尔顿、皮尔逊、埃奇沃斯和戈塞特等。当然,比他们稍早一点的比利时人凯特勒在运用“平均”概念、正态分布原理和基本概率论方面走在了其同时代人的前列。
有人说线性回归早在Gauss时代的天文学领域就出现了。我迄今尚未看到有关的文献。就我所知,线性回归的基本思想和数学算法是由高尔顿率先提出、埃奇沃斯加以了改进并由皮尔逊最终完善的,特别是皮尔逊的相关系数计算方法在这一领域具有决定性的意义。而戈塞特的t-test思想则开创了认识论领域的一场逻辑学革命,它的基本思维逻辑构成了当代统计学中差异性检验和关系性分析的核心基础。戈塞特的逻辑和方法论被Fisher采纳和推广,这才有了小样本理论和方差分析法的诞生。
至于说到概率论,这是一个有史以来一直主要由数学家们讨论的领域,但却是与统计学在一条历史平行线上产生和发展的。双方的交集是由凯特勒首先找到的,但皮尔逊、戈塞特和费舍尔则基本奠定了其现代应用,即卡方统计量或Chi-square distribution、t 统计量或t-distribution以及F统计量或F-distribution。所以说,我个人将英国看成是统计学家的圣地。
20世纪40年代随着概率论的公理化成熟,概率论被正式纳入了统计学的研究范畴,并由此诞生了数理统计学。统计学因此而被正式纳入了数学范畴并在其中得到进一步的发展。大半个世纪以来,统计学主要的发展在数学计算方法方面,但无论是哪个新的方法都离不开三大方法论领域:(1) 描述性方法(诞生于政治算术)、(2) 差异性分析(诞生于生物学)、(3) 关系性分析(即相关和回归分析,诞生于生物学)。
中文的“统计学”三个字是由19世纪末期到德国留学的日本人(彬亨二,名字正确与否有待确认)翻译的。
不过,无论如何,统计学不是从数学中诞生的,恰恰相反,统计学一直在解决现实世界里的认知问题的前沿上为现代数学提供无穷无尽的新的命题和机会。遗憾的是,现在许多数学背景的统计学家们不愿接受或承认上述历史事实。
戳这里 Claim your page
来源: 文学城-TNEGIETNI