女士品茶-第34章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
遥颐潜匦胙Щ崃榛罨苁视ψ酚诟髦植煌嘈偷墓ぷ鳌;蛐砦颐堑冒镏桓錾镅Ъ医行陆湍妇氖笛椋蝗グ镏桓雠┮底彝瓿闪硪幌钍笛椤私庖砸恢痔厥馑橇衔寡募倚蟮姆啾惚浠榭觯挥氩《狙Ъ姨致畚ㄋ苟∟ewcastle)病毒研制的新抗体;去协助一个医疗官员评估麦芽储藏中的灰尘对人体健康的影响;去给一个正在进行传送带实验的工程师提些建议;试着将统计的排除论(queuing theory)应用到职工餐厅的管理上;或者去协助一个社会学家验证他的群体行为理论。
以下是一份为产业界工作的统计学家的典型协作类型清单。根据我本人的工作经验,我们要与之打交道的人包括化学家、药理学家、毒理学家、经济学家、临床医生、经营管理者(我们为他们开发运筹模型用于决策)。可以说,数理统计方法的应用无处不在,作为数学模型专家,统计学家可以与任何领域的人合作,为他们提供服务。这也许就是统计学家的工作之所以迷人的原因之一。
非预期的变异
在坎利夫的演讲中,她指出,最大的变异还是来自现代人类本身。
在吉斯尼期间,我很高兴负责组织对啤酒的品尝实验,对于吉尼斯啤酒这一美好饮品的发展来说,这无疑是一项非常有意义的工作。通过这些实验,我开始认识到,人在不可能没有偏好,没有偏见,没有最感兴趣的事,但这也正是让人着迷的地方。我们都有喜好的某些数字、字母、颜色,实际上,我们都是特别迷信的。我们都有非理性的行为。在我的记忆中,曾开展过一次大型的有关啤酒温度的实验。让一些人在不同室温的环境中品尝不同温度的啤酒,以判断人们对不同温度啤酒的喜好程度。当时,一些身着白色制服的人跑上跑下地送酒,啤酒则放在不同温度的水桶中,每个桶里都配有温度计。实验场所一片喧嚣,啤酒用不同颜色的瓶盖来辨认。最后实验惟一明确的结果是,受试都只在意瓶盖的颜色,他们不喜欢黄颜色瓶盖的啤酒,至于啤酒的温度,几乎没人注意!
坎利夫还讲述了一个检验小号啤酒桶容量的事。这些桶是手工制造的。需要检验它们的容量以确定其尺寸是否符合规格。进行检验的女工首先称一下空桶的重量,然后再将桶中灌满水,称一下装满水的桶的重量。如果桶的重量比标准的少3品脱以上,或多7品脱以上,则都作为不合格品退回去返工。作为进行质量管理程序中的一部分,统计人员负责检查合格品与不合格品的报表情况。在检查满桶重量的记录图时,坎利夫发现,刚刚在合格线以里的桶数目过高,而刚刚在合格线外的桶数目过低。为此她到现场了解工作条件,发现女工必须将挑出来的不合格品堆放到旁边的一大堆桶上,而合格品只需放在传送带上即可。于是她建议把女工的座位加高,工作时只需将挑出来的不合格品直接踢到脚下的箱子里即可。结果发现,报表上反映的合格率,很快趋于正常水平。
坎利夫后来成为吉斯尼统计部的主管。1970年,她被调到英国内务部(the British Home Office)调查局,这个单位负责警察、法院和监狱的监督工作。
在我刚来的时候,这个单位主要从事与犯罪有关的工作。说老实话,我在吉斯尼公司所从事的是十分精确、精心设计、透彻分析的统计工作,而这里要做的都是些社会学家,有时是心理学家的工作,在我看来是一个空泛的世界。我丝毫没有贬低内务部调查局研究人员能力的意思。但是无论如何,使我震惊的是不同的工作原则:设立一个零假设,制定细致详尽的实验设计方案,抽取足够的样本数量,进行小心谨慎的统计分析,做出详细的评估结果,所有这些都是我长期做过的,到了社会学这个领域,却都变得微不足道。
在刑事犯罪学这一领域的主要研究工作,就是积累长期的数据资料,进行分析,以发现公共政策对其可能的影响。如有一项分析是针对男性囚犯进行的,即研究不同刑期的男性囚犯出狱后两年内重新犯罪的概率有多大。分析结果清楚地表明,刑期越短,重新犯罪的概率越高。从而作为一个证明:长刑期可以把惯犯从街头清除。
坎利夫并不满足于重犯率与刑期间简单对比的数表。她要进一步分析数表背后所隐藏的东西。这种明显强关联关系主要是刑期在三个月之内的犯人重犯率高,经过仔细检查,这些人“几乎都是些年老的、处境悲惨的、精神不正常的人,他们被精神病医院拒之门外,所以才一次又一次地反复犯罪后再进监狱。”而统计表所反映的数字,实际都是这同一拨人,被当作不同人重复统计,才将短期犯罪的重犯率夸大了。统计表中的另一个极端表现是,刑期在10年以上的犯人出狱后只有15%的人又重新犯罪。坎利夫认为,“这里有一个很大的年龄因素,一个很大的环境因素和一个很大的犯罪程度因素。刑期长的都是些犯大案的人,他们出狱后重新犯同样大案的可能性也不大了。”因此,在她用两个极端的情况将数表调整这后,重犯率和刑期间明显的关系消失了。
坎利夫说道:
我认为,即使所谓单调的内务部统计仍然是很迷人的,……对于我来说,统计学家的工作就是阅读数据,并质疑它们为什么会是这样的?……我今天晚上来此的想法很简单,就是想告诉人们,数字是很有趣的,如果听众当中有人感到枯燥,那是我们没有表述好,或者因为数字本身的问题。不过,根据我在内务部的统计工作,我要说,数字一点也不枯燥。
坎利夫谴责政府官员中的一种不良倾向,他们在决策时没有仔细研究阅读手头的数据资料。
这不是社会学家、社会工作者和计划制定者们的过错,但却是统计工作者不可推卸的责任。我们还没有学会去为这些在我们看来不那么科学的学科服务,因此我们还没有作为能帮助他们增进知识的人而被接受,……根据我的经验,统计学家在应用领域的力量……在于他(或她)说服他人的能力:去形容所需回答问题;去考虑实验员可用的工具是否足以回答这些问题;去帮助他建立合适的零假设;去实施严格的实验设计原则。
据我本人的经验,将问题尽可能地以数学模型的方式表述出来,这会迫使科学家去充分了解将会产生什么样的问题。仔细地检查可利用资源,经常会得出这样的结论:用这些资源是不可能回答出该问题的。我想,作为统计学家,我的主要贡献之一,就是阻止别人去尝试因缺乏适当资源而注定要失败的实验。例如,一项临床实验,其中的医学问题需要有数十万名病人的配合。这就有必要考虑这个问题是否值得回答。
抽象的数学还是实用的统计学
坎利夫特别看中那些对统计分析有用的预期工作,她轻视为数学而数学的推敲,她诋毁下面的那种数学模型:
全是空想,缺乏实际,很多线索,有趣的片断,充满趣味性,精彩的概念,但同时也缺乏稳健性。这种高雅的乐事往往是以牺牲实践性为代价的,恕我直言,在我看来它似乎更合乎男性的口味。我们统计学家所受的教育就是进行计算,同时要考虑数学的精确度。我们并不善于说服那些毫无经验的人,让他们知道我们的发现值得注意。如果我们一本正经地对一个不懂统计的男人或女人说“P值小于0。001”意味着什么,我们就不会成功,所以,我们必须用他们的语言来解释我们的发现,以增强说服工作的效力。
不戴帽子,不肯向酿酒师这样的“大人物”低头,坎利夫进入了统计的世界,她尽情地满足了自己强烈的好奇心,她批评那些来听自己演讲的数理统计学教授。当我写这本书时,她可能仍在皇家统计学会用她那辛辣的机智,表现她的数学主张。
第26章 鞅的发展
充血性心脏衰竭是世界上致人死亡的重要原因之一。虽然这种病在壮年人当中也时有发生,但此病主要还是一种老年性疾病。以美国为例,在65岁以上的老年人当中,有半数是死于充血性心脏衰竭或它的并发症。从公共健康的角度来看,充血性心脏衰竭不仅是致人死亡人重要原因,也是引发生活中诸多其它疾病的一个重要因素。此外,患者为稳定病情而反复住院,以及治疗过程的复杂程序,是导致国家的公共医疗服务成本居高不下的一个重要因素。为此,许多人都殷切希望能找出更好的辩论治疗方法,以减少患者住院治疗的需求,同时改善这些病人的生活质量。
不幸的是,充血性心脏衰竭不是一种普通的疾病。其病因不是一种简单的传染源,也不能通过阻断某种生化酶的通路而缓解。人体中荷尔蒙精巧地控制着心脏,调节其跳动的速度和收缩能力,以适应身体变化着的需求,但充血性心脏衰竭患者的心脏对这种调节的反应能力越来越差,患者的主要症状表现为心肌逐渐衰弱,心脏的肌肉变得越来越肥大、松弛。患者会因此而出现肺部和脚踝的水肿,轻微的运动都会导致他们呼吸困难。患者还会因进餐时胃部供血而造成的脑部供血不足而感到困倦和意识混乱。
为保持体内平衡,病从的身体会自动调节以适应心脏能量输出的减少。对许多患者,调节心肌和其它肌肉变化的荷尔蒙会在某种稳定状态达到平衡。虽然就一般人来说,这样的荷尔蒙水平是不正常的。如果医生在治疗过程中使用了β肾上腺素收缩剂或钙离子隔断剂,结果可能使患者的情况变得更为复杂。肺部水肿是充血性心脏衰竭病人死亡人一个重要原因。现代医学依靠利尿剂这种药物可以使水肿得到缓解。然而,患者在使用了利尿剂后,为调节肾功能和心脏功能所导致的荷尔蒙的变化,又会因相互影响而造成新的难题。
长期以来,医学界一直致力于研究更加有效的治疗充血性心脏衰竭的方法,希望延长患者的生命,减少他们的住院次数,提高他们的生存质量。由于一些治疗可能会对某些病人产生不良影响,因此,治疗的任何可能会对某些病人产生不良影响,因此,治疗的任何临床研究都需要考虑到特殊病人的情况。在这种情况下,这种研究的最终数据分析可以指认对哪些病人有效,哪些病人有不良反应。所以,对充血性以及衰竭研究的统计分析将变得难度极大。
当设计一项研究时,首先遇到的问题是要测量什么。例如,测量某一种治疗患者的平均住院治疗时间,这是一种粗略的总体测量,没有考虑到重要的方面,如他们的年龄,他们最初的健康状况,他们发病的次数,以及住院治疗的时间。最好要考虑到每个患者发病的整个时间过程,估量可能的住院治疗情况,如住院时间长度,与上一次住院治疗的间隔,出院期间患者的生活质量,并根据患者的年龄以及其它可能发生的疾病,对所有这些结果进行调整。从医学的观点来看,这可能是一个理想的方案,但它提出了一个困难的统计学问题。这里没有一个数据与单个患者相联,相反,患者的记录是事件的时间过程,有些记录是重复的,有些通过多重测量得到。因为在这个试验中的测量是多层次的,因此,其分布函数——这些函数的参数必须是可估计的,其构成也必须是多维的。
早期的理论性工作
解答这个问题,是从法国的数学家保罗?利维开始的。保罗?利维出身于数学世家,他的父亲、祖父都是数学家。保罗?利维1886年出生,在他还很小的时候,就显示出与众不同的学习天赋。按当时漫无边际的惯例,他很快升入专门培养天才学生的学校,并且在学习期间获得过许多学术性奖励。还是十几岁少年的他,就获得了希腊文和数学的法国中学中学优等生会考奖;获得法国国立圣路易学校(Lycée Saint Louis)颁发的数学、物理学和化学的成绩优异奖;获得了高等师范学院及综合工科大学入学竞赛第一的成绩。1912年,26岁的保罗?利维获得科学博士学位,他后来写的一本有关抽象函数的重要著作,就是以他的博士论文为基础的。保罗?利维获得科学博士学位,他后来写的一本有关抽象函数的重要著作,就是以他的博士论文为基础的。保罗?利维在33岁时就成为综合工科大学的全职终身教授,法国科学院院士。他在抽象分析理论方面的工作使他闻名于世。1919年,他所在学校安排他就概率论问题开展一个系列讨论,为此,他首次着手就这一问题展开深入的研究。
利维不满于当时作为复杂计算方法之集合的概率理论(那里安德烈?柯尔莫哥洛夫的理论尚未出现)。利维寻找一些基础性的抽象数学概念,以便把这些方法统一起来。在这一过程中,棣莫弗正态分