女士品茶-第12章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
e)推演得出的许多统计量,其自身也服从正态分布。
正态分布只有K?皮尔逊四个参数中的两个——平均数和标准差,另外两个参数对称性偏度(symmetry)和峰度(kurtosis)均为零。因此,一量知道了平均数和标准差这两个参数值,其他的一切也就一清二楚了。费歇尔曾指出,由一组数据得出的平均数与标准差的估计值就是他所说的充分估计量(sufficient estimator),因为这两个参数值已经把这些数据中所有的信息都包括在内了。既然这两个参数值已经涵盖了能够从那些原始测量值中揭示出的一切,就根本没有必要去占有任何原始测量值了。如果有足够的测量值可以用来相当精确地估计出平均数与标准差,就不再需要其他任何测量值了,任何为搜集这些数据所做的努力,都不过是浪费时间而已。例如,有两个重要指标服从正态分布,如果你正打算得出这样一个正态分布的那两个参数,那么你只需要收集大约50个测量值就足够了。
正态分布的这种数学上便于处理的特性,使科学家能够构建一个复杂关系模型。只要其基本分布是正态的,费歇尔的似然函数通常就有了以简单代数进行处理的一种形式。即便模型复杂到必须用迭代运算法去解的程度,只要其分布是正态的,用纳恩?莱尔德(Nan Laird)和詹姆斯?韦尔(James Ware)的EM演算法去解,就变得轻而易举了。由于正态分布在数学上的计算处理非常敏捷,因此在建模时,统计学家常常要假定所有的数据都服从正态分布。不过,做这样的假定就不能不援引中心极限定理。
但是,中心极限定理是否成立?说得更准确一点,它在什么条件下成立?
在20世纪20年代和30年代,斯堪的纳维亚地区、德国、法国和苏联的一批数学家,运用20世纪早期发明的一套新的数学工具,倾心于上述这些问题的研究。但就达个时候,整个人类文明都正面临着一场日益迫近的浩劫——那些极权主义的国家的恶性膨胀。
数学家并不有昂贵设备的实验室。在20世纪二三十年代,黑板和粉笔就是一个数学家最具代表性的实验设备。对数学研究而言,用黑板比用纸张更方便,因为数学研究过程的演算总免不了出错,而黑板上的粉笔字很容易擦掉。几乎没有数学家是关起门独自做研究的,只要你是一个数学家,你就必定要同其他的数学家一起讨论自己在研究的问题,你就必定要接受别人对你那些新想法的批评审视。在数学研究过程中太容易出错,或者太容易在研究中隐含着自己毫无察觉而在别人看来却是显而易见的假设。有一个数学家的国际组织,在这个团体中,数学家们书信往来、开会、审阅彼此的论文,经常交换相互的批评和质疑,探究分歧所在。20世纪30年代初期,德国的威廉?费勒(William Feller)和里夏德?冯?米泽斯(Richard von Mises),法国的保罗?利维(Paul Lévy),俄罗斯的安德烈?柯尔莫哥洛夫(Andrei Kolmogorov),斯堪的纳维亚的亚尔?瓦尔德马?林德伯格(Jarl Waldemar Lindeberg)和哈拉尔德?克拉美(Harald Cramer),奥地利的亚伯拉罕?沃尔德(Abraham Wald)和埃尔门?哈特利(Herman Hartley),意大利的圭多?卡斯泰尔诺沃(Guido Castelnuovo),还有许多其他数学家也都在这个团体中,其中不乏那些利用新工具来检验中心极限定理这个猜想的数学家。
然而,这种自由轻松、无拘无束的相互交流不久就将不复存在。它将毁于斯大林的肃反运动、纳粹的种族灭绝和墨索里尼的帝国梦。黑暗笼罩着欧洲。斯大林正把非法操纵的示众式的公开审讯同半夜里的秘密逮捕结合运用到了极致,处决、恐吓和威胁任何一个受到他偏执狂式的无端猜疑的人。起初,希特勒及其罪大恶极有党羽把犹太裔教授从各大学里清洗出去,随后将他们关进惨无人道的集中营。墨索里尼则把国人强行禁锢在他所谓的“组合国”(Corporate state)所划定的各个社会等级中。
“死亡万岁!”
这一猖獗的、反理智主义(antiintellectualism)的极端事件,就发生在西班牙内战时期。当时长枪党的党徒们(以西班牙的法西斯主义者闻名)已经占领了古老的沙拉曼卡大学(University of Salamanca)。该大学的校长是享誉世界的西班牙哲学家米格尔?德?乌纳穆诺(Miguel de Unamuno),当时他已经70岁出头了。长枪党的米连?阿斯特赖(Millan Astray)将军,一个在先前的战争中失去了一条腿、一只手臂和一只眼睛的残疾人,当时任这个刚以武力控制了西班牙的恶势力的宣传部长。他的座右铭就是:“死亡万岁!”如同莎士比亚笔下的国王理查德三世,阿斯特赖身体上的残缺不全恰恰映射出他扭曲的邪恶心灵。有一次,长枪党在沙拉曼卡大学的纪念大厅举行盛大的庆典,台上有新指派的省长、弗朗西斯科?佛朗哥(Francisco Franco)夫人、M?阿斯特赖、沙拉曼卡的大主教,还有年事已高的乌纳穆诺,他是被当作被征服的战利品拖到台上的。
“死亡万岁!”阿斯特赖高声狂呼,挤满了人群的大厅里随声附和着他的喊叫。又有人高呼:“西班牙!”大厅里的人也跟着喊。“西班牙!死亡万岁!”穿着蓝色制服的长枪党的党徒们齐刷刷地站起来高呼,并朝着台上的佛朗哥肖像行法西斯的举手礼。就在这一浪高过一浪的叫嚣声中,乌纳穆诺站起身来,从容地走向讲台,镇静地开始演讲:
你们大家都记住我的话。你们都了解我,并且知道我不可能保持沉默,因为沉默也可以解释为默认,沉默中常常意味着谎言。我想对刚才的演讲做个评论,我们不防就叫它“M?阿斯特赖将军的演讲”吧……。就在刚才,我听见一种嗜尸成癖的愚蠢无知的叫嚣:“死亡万岁!”而我,一个终生致力于各种悖论研究的人……我必须告诉你们,作为一个权威,这种荒诞怪异、语无伦次的谬论让我恶心。阿斯特赖将军是个残疾人……他是战争造成的一个残疾人……。不幸的是,眼下的西班牙这种残疾太多了。而且不久,如果上帝不能拯救我们,这种残疾人甚至还会更多……。
M?阿斯特赖把乌纳穆诺推到边上,厉声吼叫:“该死的臭知识分子!死亡万岁!”与他的叫嚣相呼应,那些长枪党徒们蜂拥而上,抓住乌纳穆诺。但是,老校长仍然继续说道:
这里是知识的殿堂,而我才是这个殿堂的领袖。是你们亵渎了这个神圣的地方。你们可以凭借极其残暴的兽行获胜,但是你们无法得到人们的认可。因为要让人认可必须靠说服而不是压服,要达到说服的目的所必须具备的东西,恰恰是你们所没有的,那就是理智和正义……。
乌纳穆诺遭到软禁,不出一个月就被宣告“自然死亡”。
苏联的大清洗运动切断俄国数学家与欧洲其他地方的联系;希特勒的种族政策几乎毁掉了德国的大学,因为欧洲许多伟大的数学家要么是犹太人,要么是与犹太人联姻,而非犹太裔的那些数学家又大多是反纳粹的。结果,威廉?费勒去了美国的普林斯顿大学(Princeton University),亚伯拉罕?沃尔德到哥伦比亚大学(Columbia University)去了,埃尔门?哈特利和里夏德?冯?米泽斯去了英国伦敦,埃米尔?J?冈贝尔逃到了法国,埃米纳脱(Emmy Noether)在美国国宾夕法尼亚的布林莫尔学院(Bryn Mawr College)求得一个临时工作。但是,并非每个人都逃得脱。不能出示证明受聘到美国去工作的那些人,美国移民局对他们总是大门紧闭;而拉丁美洲那些国家的国门则由于那些小官僚的反复无常而时开时关。纳粹军队占领了波兰首都华沙后,大肆搜捕能找到的华沙大学所有的教授和学者,逮捕他们并惨绝人寰地将他们杀害,然后一起埋在一个巨大的坟墓里。在纳粹的种族主义世界里,波兰人和其他斯拉夫人只配做他们这些亚利安(Aryan)主人的奴隶,没有受教育的权利。欧洲那些历史悠久的大学里许多有培养前途的青年学生就这样被毁掉了。在苏联,大部分数学家都躲进了纯数学中去寻求庇护,而不敢在应用领域中做任何尝试。因为,那些从事应用研究的科学家,正受到斯大林令人不寒而栗的无端猜疑。
不过,在这些黑暗没有完全成为现实之前,欧洲的数学家们就已经解决了中心极限定理的证明问题。芬兰的亚尔?瓦尔德马?林德伯格和法国的保罗?利维分别发现了能够使中心极限定理这个猜想成立所必需的一组重叠的条件。这证明了至少存在三种解这个问题的方法,而且证明了中心极限定理不是只有一个单个的定理,而是有一组定理,其中每个中心极限定理都能从略有区别的一组条件中推导出来。到了1934年,中心极限定理(组)终于不再是猜想了,一个科学家必须要做的只是要证明林德伯格?利维条件(LindebergLévy Conditions)成立,那么中心极限定理就成立,于是,他就可以随意地把正态分布设为一个合适的模型。
林德伯格?利维条件与U统计量
然而,就一个特定情况而言,要证明林德伯格?利维条件成立很难。但在理解林德伯格?利维条件上倒有几分安慰,因为他们描述的条件看上去是合理的,而且在大多数情况下都是成立的。不过要证明其成立却是一个棘手的问题,这也正是战后远在北卡罗莱纳大学辛苦工作的瓦西里?霍夫丁(Wassily Hoeffding)在这个故事中竟会有如此重要地位的原因。1948年,霍夫丁在《数理统计年报》(Annals of Mathematical Statistics)上发表了一篇论文,题目是“渐近正态分布的一组统计量”。
回想费歇尔曾把统计量(statistic)定义为:从观察到的测量值得出的、可用来估计其分布参数的一个数值。费歇尔还建立了有用的统计量应该具备的一些准则,在这个过程中,他还指出了利用皮尔逊的许多方法导出的统计量不符合这些准则。有很多种计算统计量的不同方法,其中的很多统计量都能满足费歇尔提出的准则。一旦计算出统计量,为了要用它,我们必须知道它的分布。如果它服从正态分布,用起来就容易多了。霍夫丁提出了一种他所谓的“U统计量(Ustatistics),并指出一个统计量如果属于这种U统计量,则满足林德伯格?利维条件。正因为如此,我们只须指出一个新的统计量是否与霍夫丁的定义相一致,而不必去解那些很困难的数学来证明林德伯格?利维条件成立。霍夫丁所做的一切就是用一组数学必要条件取代另外一组。然而,霍夫丁的条件事实上很容易检查。因此,霍夫丁的论文发表之后,几乎所有的论文在证明一个新统计量服从正态分布的时候,都是通过证明该统计量是一个U统计量来完成的。
霍夫丁在柏林
第二次世界大战期间,霍夫丁处在一个不确定的微妙境况中。他1914年出生在芬兰,父亲是丹麦人,母亲是芬兰人。第一次世界大战之后,芬兰沦入俄罗斯帝国的统治,就在这个时候,霍夫丁随家人迁往丹麦,随后又迁往柏林,因此他拥有斯堪的纳维亚地区两个国家的双重国籍。1933年他高中毕业,随后开始在柏林攻读数学。就在那个时候纳粹开始在德国掌权。预料到以后可能发生的事,霍夫丁就读的那所大学的数学系的系主任R?冯?米泽斯早早地离开了德国,不久之后,为霍夫丁授课的其他许多教授,有的逃走了,有的被解除了职务。在动乱中,年轻的霍夫丁所选的课都是由一些低水平的教师来讲授的。即便如此,这些教师中的很多人也没能维持到把他们承担的课程教完,因为纳粹在持续不断地“净化”大学教师队伍,把大学教师中所有的犹太人和犹太人的同情者全都清除出去。
随同数学系里的其他学生一道,霍夫丁被迫去听路德维希?比贝尔巴赫(Ludwig Bieberbach)讲授的一堂课。比贝尔巴赫一直都是教师中的小角色,只是因为对纳粹党的狂热拥护,才合他成为数学系新的系主任。比贝尔巴赫这堂课讲的是“亚利安”数学与“非亚利安”数学的区别,他声称颓废的“非亚利安”(解读为犹太)数学家仰仗着复杂难解的代数符号做研究,相反,“亚利安”数学家则在更高贵、更纯粹的几何直觉领域里从事研究。结束了讲课的时候,他让学生提问题。坐在后排的一个学生问他,为什么偏偏是这个里夏德?库朗(Richard Courant,20世纪初德国伟大的犹太裔数学家之一)运用几何洞察力创建了他的实分析理论(theories of real analysis)。此后,比贝尔巴赫再也没有就这个题目上过公开课。但是他创办了�