從真實(shí)走向虛擬
——平均數(shù)、中位數(shù)、眾數(shù)三個(gè)集中量的歷史演變
陳金飛
統(tǒng)計(jì)是一門數(shù)據(jù)科學(xué)。它的任務(wù)是從數(shù)據(jù)中提取信息,探索數(shù)據(jù)內(nèi)在的規(guī)律性,以達(dá)到推斷所測(cè)對(duì)象的本質(zhì),甚至預(yù)測(cè)對(duì)象的未來(lái)的目的。為了定量地把握總體的規(guī)律,通過(guò)歸納、列表、制圖等初步整理工作,用樣本的數(shù)據(jù)對(duì)總體的數(shù)據(jù)特征進(jìn)行研究,包括集中量、差異量、相關(guān)量等。常見(jiàn)的集中量有算術(shù)平均數(shù)、中位數(shù)、眾數(shù)等。在對(duì)學(xué)生的調(diào)查中發(fā)現(xiàn),當(dāng)需要表示一組數(shù)據(jù)的總體水平時(shí),學(xué)生不知道選用哪個(gè)統(tǒng)計(jì)量比較合適。學(xué)生往往把平均數(shù)理解為平均分,甚至有學(xué)生把平均數(shù)作為整數(shù)、分?jǐn)?shù)、小數(shù)外的第四種數(shù)。怎樣幫助學(xué)生建構(gòu)平均數(shù)、中位數(shù)、眾數(shù)的概念,理解三個(gè)集中量的統(tǒng)計(jì)意義?從概念的歷史產(chǎn)生過(guò)程中,或許能獲得解決問(wèn)題的方案。
一、算術(shù)平均數(shù)從真實(shí)數(shù)據(jù)走向虛擬數(shù)據(jù)。
算術(shù)平均數(shù)是統(tǒng)計(jì)學(xué)中的重要概念。陳希孺指出,如果我們從理論的角度走一點(diǎn)極端,則可以說(shuō),一部數(shù)理統(tǒng)計(jì)學(xué)的歷史,就是從縱橫兩個(gè)方向?qū)λ阈g(shù)平均數(shù)進(jìn)行不斷深入研究的歷史??v的方向指平均數(shù)本身的發(fā)展,如伯努利及其大數(shù)律、狄莫弗—拉普拉斯中心極限定理、高斯的正態(tài)誤差理論,這些研究成果,如今成了支撐數(shù)理統(tǒng)計(jì)學(xué)這座大廈的支柱。橫的方向,指平均數(shù)思想的發(fā)展。從利用平均數(shù)估計(jì)大數(shù),到重復(fù)測(cè)量取平均數(shù)減少誤差,發(fā)展為平均數(shù)作為總體的代表值,實(shí)現(xiàn)了代數(shù)概念到統(tǒng)計(jì)概念的飛躍。
1.利用平均數(shù)估計(jì)總數(shù)
在歷史上,平均數(shù)最早是用來(lái)估計(jì)總數(shù)的。公元4世紀(jì),在古印度有一個(gè)故事:古印度王圖潘納(Rtuparna)發(fā)現(xiàn)一棵枝葉茂盛的大樹(shù)長(zhǎng)有幾個(gè)大的樹(shù)枝,他想估計(jì)這幾個(gè)樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目。他首先估計(jì)了根部的一條粗細(xì)中等的樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目,然后數(shù)出這棵樹(shù)上樹(shù)枝的數(shù)目,用一個(gè)樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目乘樹(shù)枝的數(shù)目,推斷出這棵樹(shù)上樹(shù)葉和果實(shí)的總數(shù)目。在這個(gè)例子中,圖潘納選用粗細(xì)中等的樹(shù)枝作為整棵樹(shù)枝上樹(shù)葉和果實(shí)數(shù)目的代表值,這可能是算術(shù)平均數(shù)的直覺(jué)使用,因?yàn)樗x的樹(shù)枝代表了其余所有樹(shù)枝,其數(shù)量處于“中間”位置。
后來(lái)人們估計(jì)大數(shù)時(shí),引入“中點(diǎn)值”,即取兩個(gè)極端值的算術(shù)平均數(shù)。如取人數(shù)最多和最少的兩條船上人數(shù)的平均數(shù),再乘以船只的數(shù)量,就估計(jì)出全部船只上的人數(shù)??梢?jiàn),中點(diǎn)值計(jì)算是求平均數(shù)的原始方法。用現(xiàn)代的觀點(diǎn)來(lái)看,中點(diǎn)值不是一個(gè)很有用的平均數(shù),因?yàn)樗鼘?duì)極端值太敏感。
2.利用平均數(shù)減少誤差
到了公元16世紀(jì),人類對(duì)平均數(shù)的認(rèn)識(shí)有了新的發(fā)展。人們發(fā)現(xiàn)“中點(diǎn)值”作為代表值,誤差較大。如果把所有數(shù)據(jù)求和再均分,獲得的結(jié)果比中點(diǎn)值更可靠,可以減少誤差。在1582年至1588年期間,丹麥大天文學(xué)家第谷對(duì)某一天文量進(jìn)行重復(fù)觀測(cè),他得到一組觀察值。由于觀測(cè)時(shí)間、氣候的不同,得到的觀測(cè)數(shù)據(jù)各不相同,究竟哪一個(gè)最精確呢?第谷取所有數(shù)據(jù)的平均值作為假想的真實(shí)值,從而用算術(shù)平均數(shù)來(lái)消除誤差。在天文學(xué)界,第谷的這一做法一開(kāi)始并沒(méi)有為多數(shù)人所接受,他們認(rèn)為,當(dāng)有多個(gè)觀測(cè)值時(shí),應(yīng)選擇其中那個(gè)“謹(jǐn)慎地觀測(cè)”所得的值,認(rèn)為這比平均值可靠。因?yàn)椴煌煳膶W(xué)的設(shè)備、觀測(cè)條件及人員素質(zhì)難免有差異,所以得到的觀測(cè)結(jié)果的可靠性也有差異,取平均數(shù)將會(huì)使結(jié)果受到“壞”的觀測(cè)值的干擾,而不如其中的優(yōu)秀者。不過(guò)人們又不得不承認(rèn):要想在一組數(shù)據(jù)中“擇優(yōu)”,在現(xiàn)實(shí)狀態(tài)下并非總是可能的。面對(duì)眾多的觀測(cè)值,往往并無(wú)足夠的根據(jù)去鑒定其優(yōu)劣,只好一視同仁地對(duì)待??梢?jiàn),撇開(kāi)未知的真實(shí)值,取算術(shù)平均值反而比某個(gè)真實(shí)值更可靠。
辛普森為了消除當(dāng)時(shí)天文學(xué)家對(duì)取平均數(shù)代表真實(shí)值的疑慮,印證第谷用平均數(shù)以減少誤差的想法是正確的,專門撰寫了《在應(yīng)用天文學(xué)中取若干個(gè)觀察值的平均的好處》一書,他用數(shù)學(xué)的視角來(lái)證明,取平均數(shù)這個(gè)做法具有更大的可靠性。同樣,高斯在其數(shù)學(xué)和天體力學(xué)的名著《天體運(yùn)動(dòng)理論》中也指出:如果在相同的條件下并具有同樣的認(rèn)真程度,任何一個(gè)對(duì)象通過(guò)幾次直接的觀測(cè)而確定,那么觀測(cè)值的算術(shù)平均數(shù)提供了最可能的取值,即使不是太嚴(yán)格,但至少十分接近,使得它總是一個(gè)最安全的取值?,F(xiàn)在,人們已經(jīng)習(xí)慣于把高斯的這個(gè)觀點(diǎn)當(dāng)作一個(gè)公理。在學(xué)生理解平均數(shù)的過(guò)程中,重復(fù)測(cè)量可能是一個(gè)有用的活動(dòng)。
從用平均值來(lái)估計(jì)總數(shù),到取平均數(shù)作為測(cè)量的真實(shí)值,是統(tǒng)計(jì)史上人類認(rèn)識(shí)的一次飛躍。歷史啟示我們,在科學(xué)發(fā)展史上,人類觀念上的革新和突破是如何的不容易,直到第谷點(diǎn)破,我們才感到用求和均分后獲得的平均值作為觀察值,相對(duì)于“擇優(yōu)法”更可靠,但在沒(méi)有發(fā)現(xiàn)之前,許多學(xué)者努力了幾十年也無(wú)功而返。
3.平均數(shù)作為總體代表值
到了19世紀(jì),人們對(duì)平均數(shù)的認(rèn)識(shí)實(shí)現(xiàn)了新的飛躍,把算術(shù)平均數(shù)作為一種數(shù)據(jù)處理方法,即作為一組數(shù)據(jù)的總體代表值,從真實(shí)數(shù)據(jù)走向虛擬數(shù)據(jù)。這首先得益于比利時(shí)數(shù)理統(tǒng)計(jì)學(xué)家阿道夫·奎特萊特提出的“平均人”的思想。這是奎特萊特運(yùn)用概率論,在探索人類自身規(guī)律的過(guò)程中所提出的獨(dú)特概念。他把社會(huì)上的人,抽象出來(lái)作為生理意義上的人來(lái)研究。從1831年開(kāi)始,奎特萊特搜集了大量關(guān)于人體生理測(cè)量數(shù)據(jù),如體重、身高與胸圍等,經(jīng)分析研究后,認(rèn)為這些生理特征都圍繞著一個(gè)平均值而上下波動(dòng)、呈現(xiàn)出很正規(guī)的分布。由于奎特萊特具備包括統(tǒng)計(jì)學(xué)在內(nèi)的廣泛知識(shí),以及擅長(zhǎng)與國(guó)際統(tǒng)計(jì)界的交流,所以,他能融會(huì)貫通各家各派的統(tǒng)計(jì)思想,從而在博采群言的基礎(chǔ)上,迅速把統(tǒng)計(jì)學(xué)推向新的高度。從統(tǒng)計(jì)學(xué)原理的角度來(lái)說(shuō),奎特萊特把平均數(shù)理解為現(xiàn)實(shí)生活中的“總體”特征的反映,他第一個(gè)把算術(shù)平均數(shù)當(dāng)做總體某方面的代表值。從真實(shí)值到統(tǒng)計(jì)意義上的代表值的轉(zhuǎn)變是觀念上很重要的變化。馬克思曾給奎特萊特以很高的評(píng)價(jià):“他過(guò)去有很大的功績(jī)。他指出:即使是社會(huì)生活的表面上的偶然性,由于它們周期性的反復(fù)和周期性的平均數(shù),仍然具有內(nèi)在的必然性?!?
把平均數(shù)從真實(shí)值推向虛擬值,成為一個(gè)抽象的統(tǒng)計(jì)量,主要的標(biāo)志是“2.5人”的出現(xiàn)。過(guò)去,人們只是從一組數(shù)據(jù)中尋找一個(gè)可靠的值作為代表值,這個(gè)值具有現(xiàn)實(shí)意義。而“2.5人”的出現(xiàn),徹底改變了人們對(duì)平均數(shù)的認(rèn)識(shí)。當(dāng)平均數(shù)作為統(tǒng)計(jì)意義下的一個(gè)代表值時(shí),它可能沒(méi)有實(shí)際意義,比如說(shuō)平均每個(gè)家庭有2.5人,這里的“平均”是一種測(cè)量手段,“平均”有“代表性、典型性”的含義。至此,人們對(duì)平均數(shù)的認(rèn)識(shí)達(dá)到了新的高度。當(dāng)平均數(shù)作為統(tǒng)計(jì)意義下的代表值時(shí),不管是通過(guò)移多補(bǔ)少還是求和均分,獲得的平均值總是一個(gè)虛擬的數(shù)據(jù)。
當(dāng)平均數(shù)作為一組數(shù)據(jù)的代表值時(shí),成為人們對(duì)公平公正的利益訴求。羅馬法律規(guī)定:當(dāng)遭遇暴風(fēng)雨時(shí),人們?yōu)榱吮茈U(xiǎn),往往選擇一些較重的物品拋入大海,以避免船翻或保全其余的貨物。這種背景下產(chǎn)生的損失理當(dāng)由全體商人和船主共同平等地分擔(dān)。同時(shí),統(tǒng)計(jì)概念下的平均數(shù),往往太受極端數(shù)據(jù)的影響,又不能體現(xiàn)人們的利益訴求。例如公司招聘中的“平均工資”,成為騙人的小把戲。10個(gè)工人,平均每人每月3000元,聽(tīng)起來(lái)工資水平蠻高,但事實(shí)是,其中一個(gè)工人每月拿12000元,其余工人是每人每月2000元 ,顯然用平均數(shù)作為這組數(shù)據(jù)的代表值有失平均數(shù)的公平公正性。那么該選擇哪個(gè)統(tǒng)計(jì)量體現(xiàn)平均工資水平,使之不受超高工資的影響?實(shí)際上,描述一組數(shù)據(jù)的平均水平,除了應(yīng)用較為廣泛的平均數(shù)外,還有中位數(shù)和眾數(shù)。中位數(shù)顧名思義是處于一組數(shù)據(jù)最中間的數(shù),位置固定,不受極端數(shù)據(jù)的影響,正好代表平均工資水平。
二、中位數(shù)凸顯數(shù)據(jù)代表值的穩(wěn)健性
在歷史上中位數(shù)幾乎是作為平均數(shù)的代替品而出現(xiàn)的。大約在1755年,博斯科維奇(Boscovich)在有關(guān)測(cè)量的誤差工作中用到了中位數(shù)。從歷史現(xiàn)象學(xué)的角度看,中位數(shù)的出現(xiàn)可能是為了取代平均數(shù)。在19世紀(jì),科學(xué)家們有不同的理由用中位數(shù)代替平均數(shù)。1874年,費(fèi)歇爾試圖用天文學(xué)中行之有效的方法描述心理學(xué)和社會(huì)現(xiàn)象,他使用了中位數(shù),其重要原因是它在計(jì)算上的簡(jiǎn)化和直覺(jué)上的清晰性。埃其渥斯同樣傾向于中位數(shù),因?yàn)槠骄鶖?shù)對(duì)極端數(shù)據(jù)太敏感,而中位數(shù)往往比平均數(shù)更“穩(wěn)健”(即對(duì)極端數(shù)據(jù)不敏感)。1882年,高爾頓第一次提出使用“中位數(shù)”這個(gè)術(shù)語(yǔ)。與數(shù)學(xué)歷史經(jīng)常發(fā)生的情況一樣,高爾頓在使用這個(gè)術(shù)語(yǔ)之前就已經(jīng)知道這個(gè)概念,但他起初使用其他術(shù)語(yǔ),如“最中間的值”,“中等的”等。1847年,他在一次演講中給出了下列描述:“一個(gè)占據(jù)中間位置的物體具有這樣的性質(zhì),比它多的物體的數(shù)目等于比它少的物體的數(shù)目?!?span>
在實(shí)際應(yīng)用中,學(xué)生對(duì)中位數(shù)的理解比平均數(shù)更困難。在數(shù)據(jù)呈現(xiàn)偏態(tài)分布的情形下,即出現(xiàn)極端數(shù)據(jù)的情況下,適合選擇中位數(shù)作為一組數(shù)據(jù)的代表值。
三、眾數(shù)表示重復(fù)計(jì)數(shù)中的準(zhǔn)確值。
相對(duì)來(lái)說(shuō),眾數(shù)容易理解,它的歷史也比較簡(jiǎn)單。第一個(gè)使用眾數(shù)的例子,可能出現(xiàn)在雅典和斯巴達(dá)戰(zhàn)斗中。在公元前428年冬天,普拉鐵阿人和一些雅典人被伯羅奔尼撒人和皮奧夏人包圍。不久,普拉鐵阿人開(kāi)始出現(xiàn)糧食短缺,處于絕望之中,由于從雅典人那里獲得援助已經(jīng)沒(méi)有希望了,也看不到其他安全突圍的方法,普拉鐵阿人便和雅典人商議棄城而去,并打算做梯子翻過(guò)敵人的城墻。由于梯子的高度要與敵人城墻的高度一樣,為此,只有通過(guò)數(shù)敵人城墻上磚塊的層數(shù)來(lái)計(jì)算城墻的高度。在同一時(shí)間,發(fā)動(dòng)許多士兵一起數(shù)城墻上磚塊的層數(shù),有些可能數(shù)錯(cuò)了,但離城墻不太遠(yuǎn)的士兵,可能得到一個(gè)真實(shí)值,因此把出現(xiàn)次數(shù)最多的層數(shù)作為代表值。
了解這三個(gè)概念的歷史起源,無(wú)疑為我們的教學(xué)開(kāi)啟了一扇新的窗口。對(duì)于統(tǒng)計(jì)概念的學(xué)習(xí)而言,重要的不是統(tǒng)計(jì)量的計(jì)算,而是對(duì)意義的理解。統(tǒng)計(jì)關(guān)注的是一組數(shù)據(jù)能告訴我們什么信息,我們又能從數(shù)據(jù)中提取怎樣的信息。通過(guò)畫圖表、計(jì)算了解數(shù)據(jù)的特征,用樣本的頻率分布估計(jì)總體的分布,都是為了定量地把握總體的規(guī)律。因而在教學(xué)中,教師要避免把統(tǒng)計(jì)教成制作圖表,計(jì)算,不然就偏離了統(tǒng)計(jì)的實(shí)質(zhì)。
參考文獻(xiàn):
[1]陳希孺.數(shù)理統(tǒng)計(jì)學(xué)簡(jiǎn)史[M].長(zhǎng)沙:湖南教育出版社,2002.
[2] 吳俊,黃青云.基于數(shù)學(xué)史的平均數(shù)、中位數(shù)和眾數(shù)的理解[J].數(shù)學(xué)通報(bào),2013,52(11):16-21.
﹡本文系江蘇省教育科學(xué)“十二五”規(guī)劃重點(diǎn)資助課題“數(shù)學(xué)史視野下的小學(xué)數(shù)學(xué)教學(xué)的案例研究”(批準(zhǔn)號(hào):B-a/2013/02/002)的研究成果之一。
【原文出處】《小學(xué)教學(xué)》(數(shù)學(xué)版),2015.9.47~49
作者簡(jiǎn)介:陳金飛,1974年生,男,江蘇啟東人,江蘇省啟東實(shí)驗(yàn)小學(xué)副校長(zhǎng),中學(xué)高級(jí)教師,主要從事小學(xué)數(shù)學(xué)教學(xué)研究。
【作者單位】江蘇省啟東實(shí)驗(yàn)小學(xué),聯(lián)系地址:江蘇省啟東市人民中路720號(hào)(226200),聯(lián)系電話:15962731800,E-mail:cjxxcjf@163.com。
——平均數(shù)、中位數(shù)、眾數(shù)三個(gè)集中量的歷史演變
陳金飛
統(tǒng)計(jì)是一門數(shù)據(jù)科學(xué)。它的任務(wù)是從數(shù)據(jù)中提取信息,探索數(shù)據(jù)內(nèi)在的規(guī)律性,以達(dá)到推斷所測(cè)對(duì)象的本質(zhì),甚至預(yù)測(cè)對(duì)象的未來(lái)的目的。為了定量地把握總體的規(guī)律,通過(guò)歸納、列表、制圖等初步整理工作,用樣本的數(shù)據(jù)對(duì)總體的數(shù)據(jù)特征進(jìn)行研究,包括集中量、差異量、相關(guān)量等。常見(jiàn)的集中量有算術(shù)平均數(shù)、中位數(shù)、眾數(shù)等。在對(duì)學(xué)生的調(diào)查中發(fā)現(xiàn),當(dāng)需要表示一組數(shù)據(jù)的總體水平時(shí),學(xué)生不知道選用哪個(gè)統(tǒng)計(jì)量比較合適。學(xué)生往往把平均數(shù)理解為平均分,甚至有學(xué)生把平均數(shù)作為整數(shù)、分?jǐn)?shù)、小數(shù)外的第四種數(shù)。怎樣幫助學(xué)生建構(gòu)平均數(shù)、中位數(shù)、眾數(shù)的概念,理解三個(gè)集中量的統(tǒng)計(jì)意義?從概念的歷史產(chǎn)生過(guò)程中,或許能獲得解決問(wèn)題的方案。
一、算術(shù)平均數(shù)從真實(shí)數(shù)據(jù)走向虛擬數(shù)據(jù)。
算術(shù)平均數(shù)是統(tǒng)計(jì)學(xué)中的重要概念。陳希孺指出,如果我們從理論的角度走一點(diǎn)極端,則可以說(shuō),一部數(shù)理統(tǒng)計(jì)學(xué)的歷史,就是從縱橫兩個(gè)方向?qū)λ阈g(shù)平均數(shù)進(jìn)行不斷深入研究的歷史??v的方向指平均數(shù)本身的發(fā)展,如伯努利及其大數(shù)律、狄莫弗—拉普拉斯中心極限定理、高斯的正態(tài)誤差理論,這些研究成果,如今成了支撐數(shù)理統(tǒng)計(jì)學(xué)這座大廈的支柱。橫的方向,指平均數(shù)思想的發(fā)展。從利用平均數(shù)估計(jì)大數(shù),到重復(fù)測(cè)量取平均數(shù)減少誤差,發(fā)展為平均數(shù)作為總體的代表值,實(shí)現(xiàn)了代數(shù)概念到統(tǒng)計(jì)概念的飛躍。
1.利用平均數(shù)估計(jì)總數(shù)
在歷史上,平均數(shù)最早是用來(lái)估計(jì)總數(shù)的。公元4世紀(jì),在古印度有一個(gè)故事:古印度王圖潘納(Rtuparna)發(fā)現(xiàn)一棵枝葉茂盛的大樹(shù)長(zhǎng)有幾個(gè)大的樹(shù)枝,他想估計(jì)這幾個(gè)樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目。他首先估計(jì)了根部的一條粗細(xì)中等的樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目,然后數(shù)出這棵樹(shù)上樹(shù)枝的數(shù)目,用一個(gè)樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目乘樹(shù)枝的數(shù)目,推斷出這棵樹(shù)上樹(shù)葉和果實(shí)的總數(shù)目。在這個(gè)例子中,圖潘納選用粗細(xì)中等的樹(shù)枝作為整棵樹(shù)枝上樹(shù)葉和果實(shí)數(shù)目的代表值,這可能是算術(shù)平均數(shù)的直覺(jué)使用,因?yàn)樗x的樹(shù)枝代表了其余所有樹(shù)枝,其數(shù)量處于“中間”位置。
后來(lái)人們估計(jì)大數(shù)時(shí),引入“中點(diǎn)值”,即取兩個(gè)極端值的算術(shù)平均數(shù)。如取人數(shù)最多和最少的兩條船上人數(shù)的平均數(shù),再乘以船只的數(shù)量,就估計(jì)出全部船只上的人數(shù)??梢?jiàn),中點(diǎn)值計(jì)算是求平均數(shù)的原始方法。用現(xiàn)代的觀點(diǎn)來(lái)看,中點(diǎn)值不是一個(gè)很有用的平均數(shù),因?yàn)樗鼘?duì)極端值太敏感。
2.利用平均數(shù)減少誤差
到了公元16世紀(jì),人類對(duì)平均數(shù)的認(rèn)識(shí)有了新的發(fā)展。人們發(fā)現(xiàn)“中點(diǎn)值”作為代表值,誤差較大。如果把所有數(shù)據(jù)求和再均分,獲得的結(jié)果比中點(diǎn)值更可靠,可以減少誤差。在1582年至1588年期間,丹麥大天文學(xué)家第谷對(duì)某一天文量進(jìn)行重復(fù)觀測(cè),他得到一組觀察值。由于觀測(cè)時(shí)間、氣候的不同,得到的觀測(cè)數(shù)據(jù)各不相同,究竟哪一個(gè)最精確呢?第谷取所有數(shù)據(jù)的平均值作為假想的真實(shí)值,從而用算術(shù)平均數(shù)來(lái)消除誤差。在天文學(xué)界,第谷的這一做法一開(kāi)始并沒(méi)有為多數(shù)人所接受,他們認(rèn)為,當(dāng)有多個(gè)觀測(cè)值時(shí),應(yīng)選擇其中那個(gè)“謹(jǐn)慎地觀測(cè)”所得的值,認(rèn)為這比平均值可靠。因?yàn)椴煌煳膶W(xué)的設(shè)備、觀測(cè)條件及人員素質(zhì)難免有差異,所以得到的觀測(cè)結(jié)果的可靠性也有差異,取平均數(shù)將會(huì)使結(jié)果受到“壞”的觀測(cè)值的干擾,而不如其中的優(yōu)秀者。不過(guò)人們又不得不承認(rèn):要想在一組數(shù)據(jù)中“擇優(yōu)”,在現(xiàn)實(shí)狀態(tài)下并非總是可能的。面對(duì)眾多的觀測(cè)值,往往并無(wú)足夠的根據(jù)去鑒定其優(yōu)劣,只好一視同仁地對(duì)待。可見(jiàn),撇開(kāi)未知的真實(shí)值,取算術(shù)平均值反而比某個(gè)真實(shí)值更可靠。
辛普森為了消除當(dāng)時(shí)天文學(xué)家對(duì)取平均數(shù)代表真實(shí)值的疑慮,印證第谷用平均數(shù)以減少誤差的想法是正確的,專門撰寫了《在應(yīng)用天文學(xué)中取若干個(gè)觀察值的平均的好處》一書,他用數(shù)學(xué)的視角來(lái)證明,取平均數(shù)這個(gè)做法具有更大的可靠性。同樣,高斯在其數(shù)學(xué)和天體力學(xué)的名著《天體運(yùn)動(dòng)理論》中也指出:如果在相同的條件下并具有同樣的認(rèn)真程度,任何一個(gè)對(duì)象通過(guò)幾次直接的觀測(cè)而確定,那么觀測(cè)值的算術(shù)平均數(shù)提供了最可能的取值,即使不是太嚴(yán)格,但至少十分接近,使得它總是一個(gè)最安全的取值?,F(xiàn)在,人們已經(jīng)習(xí)慣于把高斯的這個(gè)觀點(diǎn)當(dāng)作一個(gè)公理。在學(xué)生理解平均數(shù)的過(guò)程中,重復(fù)測(cè)量可能是一個(gè)有用的活動(dòng)。
從用平均值來(lái)估計(jì)總數(shù),到取平均數(shù)作為測(cè)量的真實(shí)值,是統(tǒng)計(jì)史上人類認(rèn)識(shí)的一次飛躍。歷史啟示我們,在科學(xué)發(fā)展史上,人類觀念上的革新和突破是如何的不容易,直到第谷點(diǎn)破,我們才感到用求和均分后獲得的平均值作為觀察值,相對(duì)于“擇優(yōu)法”更可靠,但在沒(méi)有發(fā)現(xiàn)之前,許多學(xué)者努力了幾十年也無(wú)功而返。
3.平均數(shù)作為總體代表值
到了19世紀(jì),人們對(duì)平均數(shù)的認(rèn)識(shí)實(shí)現(xiàn)了新的飛躍,把算術(shù)平均數(shù)作為一種數(shù)據(jù)處理方法,即作為一組數(shù)據(jù)的總體代表值,從真實(shí)數(shù)據(jù)走向虛擬數(shù)據(jù)。這首先得益于比利時(shí)數(shù)理統(tǒng)計(jì)學(xué)家阿道夫·奎特萊特提出的“平均人”的思想。這是奎特萊特運(yùn)用概率論,在探索人類自身規(guī)律的過(guò)程中所提出的獨(dú)特概念。他把社會(huì)上的人,抽象出來(lái)作為生理意義上的人來(lái)研究。從1831年開(kāi)始,奎特萊特搜集了大量關(guān)于人體生理測(cè)量數(shù)據(jù),如體重、身高與胸圍等,經(jīng)分析研究后,認(rèn)為這些生理特征都圍繞著一個(gè)平均值而上下波動(dòng)、呈現(xiàn)出很正規(guī)的分布。由于奎特萊特具備包括統(tǒng)計(jì)學(xué)在內(nèi)的廣泛知識(shí),以及擅長(zhǎng)與國(guó)際統(tǒng)計(jì)界的交流,所以,他能融會(huì)貫通各家各派的統(tǒng)計(jì)思想,從而在博采群言的基礎(chǔ)上,迅速把統(tǒng)計(jì)學(xué)推向新的高度。從統(tǒng)計(jì)學(xué)原理的角度來(lái)說(shuō),奎特萊特把平均數(shù)理解為現(xiàn)實(shí)生活中的“總體”特征的反映,他第一個(gè)把算術(shù)平均數(shù)當(dāng)做總體某方面的代表值。從真實(shí)值到統(tǒng)計(jì)意義上的代表值的轉(zhuǎn)變是觀念上很重要的變化。馬克思曾給奎特萊特以很高的評(píng)價(jià):“他過(guò)去有很大的功績(jī)。他指出:即使是社會(huì)生活的表面上的偶然性,由于它們周期性的反復(fù)和周期性的平均數(shù),仍然具有內(nèi)在的必然性。”
把平均數(shù)從真實(shí)值推向虛擬值,成為一個(gè)抽象的統(tǒng)計(jì)量,主要的標(biāo)志是“2.5人”的出現(xiàn)。過(guò)去,人們只是從一組數(shù)據(jù)中尋找一個(gè)可靠的值作為代表值,這個(gè)值具有現(xiàn)實(shí)意義。而“2.5人”的出現(xiàn),徹底改變了人們對(duì)平均數(shù)的認(rèn)識(shí)。當(dāng)平均數(shù)作為統(tǒng)計(jì)意義下的一個(gè)代表值時(shí),它可能沒(méi)有實(shí)際意義,比如說(shuō)平均每個(gè)家庭有2.5人,這里的“平均”是一種測(cè)量手段,“平均”有“代表性、典型性”的含義。至此,人們對(duì)平均數(shù)的認(rèn)識(shí)達(dá)到了新的高度。當(dāng)平均數(shù)作為統(tǒng)計(jì)意義下的代表值時(shí),不管是通過(guò)移多補(bǔ)少還是求和均分,獲得的平均值總是一個(gè)虛擬的數(shù)據(jù)。
當(dāng)平均數(shù)作為一組數(shù)據(jù)的代表值時(shí),成為人們對(duì)公平公正的利益訴求。羅馬法律規(guī)定:當(dāng)遭遇暴風(fēng)雨時(shí),人們?yōu)榱吮茈U(xiǎn),往往選擇一些較重的物品拋入大海,以避免船翻或保全其余的貨物。這種背景下產(chǎn)生的損失理當(dāng)由全體商人和船主共同平等地分擔(dān)。同時(shí),統(tǒng)計(jì)概念下的平均數(shù),往往太受極端數(shù)據(jù)的影響,又不能體現(xiàn)人們的利益訴求。例如公司招聘中的“平均工資”,成為騙人的小把戲。10個(gè)工人,平均每人每月3000元,聽(tīng)起來(lái)工資水平蠻高,但事實(shí)是,其中一個(gè)工人每月拿12000元,其余工人是每人每月2000元 ,顯然用平均數(shù)作為這組數(shù)據(jù)的代表值有失平均數(shù)的公平公正性。那么該選擇哪個(gè)統(tǒng)計(jì)量體現(xiàn)平均工資水平,使之不受超高工資的影響?實(shí)際上,描述一組數(shù)據(jù)的平均水平,除了應(yīng)用較為廣泛的平均數(shù)外,還有中位數(shù)和眾數(shù)。中位數(shù)顧名思義是處于一組數(shù)據(jù)最中間的數(shù),位置固定,不受極端數(shù)據(jù)的影響,正好代表平均工資水平。
二、中位數(shù)凸顯數(shù)據(jù)代表值的穩(wěn)健性
在歷史上中位數(shù)幾乎是作為平均數(shù)的代替品而出現(xiàn)的。大約在1755年,博斯科維奇(Boscovich)在有關(guān)測(cè)量的誤差工作中用到了中位數(shù)。從歷史現(xiàn)象學(xué)的角度看,中位數(shù)的出現(xiàn)可能是為了取代平均數(shù)。在19世紀(jì),科學(xué)家們有不同的理由用中位數(shù)代替平均數(shù)。1874年,費(fèi)歇爾試圖用天文學(xué)中行之有效的方法描述心理學(xué)和社會(huì)現(xiàn)象,他使用了中位數(shù),其重要原因是它在計(jì)算上的簡(jiǎn)化和直覺(jué)上的清晰性。埃其渥斯同樣傾向于中位數(shù),因?yàn)槠骄鶖?shù)對(duì)極端數(shù)據(jù)太敏感,而中位數(shù)往往比平均數(shù)更“穩(wěn)健”(即對(duì)極端數(shù)據(jù)不敏感)。1882年,高爾頓第一次提出使用“中位數(shù)”這個(gè)術(shù)語(yǔ)。與數(shù)學(xué)歷史經(jīng)常發(fā)生的情況一樣,高爾頓在使用這個(gè)術(shù)語(yǔ)之前就已經(jīng)知道這個(gè)概念,但他起初使用其他術(shù)語(yǔ),如“最中間的值”,“中等的”等。1847年,他在一次演講中給出了下列描述:“一個(gè)占據(jù)中間位置的物體具有這樣的性質(zhì),比它多的物體的數(shù)目等于比它少的物體的數(shù)目?!?span>
在實(shí)際應(yīng)用中,學(xué)生對(duì)中位數(shù)的理解比平均數(shù)更困難。在數(shù)據(jù)呈現(xiàn)偏態(tài)分布的情形下,即出現(xiàn)極端數(shù)據(jù)的情況下,適合選擇中位數(shù)作為一組數(shù)據(jù)的代表值。
三、眾數(shù)表示重復(fù)計(jì)數(shù)中的準(zhǔn)確值。
相對(duì)來(lái)說(shuō),眾數(shù)容易理解,它的歷史也比較簡(jiǎn)單。第一個(gè)使用眾數(shù)的例子,可能出現(xiàn)在雅典和斯巴達(dá)戰(zhàn)斗中。在公元前428年冬天,普拉鐵阿人和一些雅典人被伯羅奔尼撒人和皮奧夏人包圍。不久,普拉鐵阿人開(kāi)始出現(xiàn)糧食短缺,處于絕望之中,由于從雅典人那里獲得援助已經(jīng)沒(méi)有希望了,也看不到其他安全突圍的方法,普拉鐵阿人便和雅典人商議棄城而去,并打算做梯子翻過(guò)敵人的城墻。由于梯子的高度要與敵人城墻的高度一樣,為此,只有通過(guò)數(shù)敵人城墻上磚塊的層數(shù)來(lái)計(jì)算城墻的高度。在同一時(shí)間,發(fā)動(dòng)許多士兵一起數(shù)城墻上磚塊的層數(shù),有些可能數(shù)錯(cuò)了,但離城墻不太遠(yuǎn)的士兵,可能得到一個(gè)真實(shí)值,因此把出現(xiàn)次數(shù)最多的層數(shù)作為代表值。
了解這三個(gè)概念的歷史起源,無(wú)疑為我們的教學(xué)開(kāi)啟了一扇新的窗口。對(duì)于統(tǒng)計(jì)概念的學(xué)習(xí)而言,重要的不是統(tǒng)計(jì)量的計(jì)算,而是對(duì)意義的理解。統(tǒng)計(jì)關(guān)注的是一組數(shù)據(jù)能告訴我們什么信息,我們又能從數(shù)據(jù)中提取怎樣的信息。通過(guò)畫圖表、計(jì)算了解數(shù)據(jù)的特征,用樣本的頻率分布估計(jì)總體的分布,都是為了定量地把握總體的規(guī)律。因而在教學(xué)中,教師要避免把統(tǒng)計(jì)教成制作圖表,計(jì)算,不然就偏離了統(tǒng)計(jì)的實(shí)質(zhì)。
參考文獻(xiàn):
[1]陳希孺.數(shù)理統(tǒng)計(jì)學(xué)簡(jiǎn)史[M].長(zhǎng)沙:湖南教育出版社,2002.
[2] 吳俊,黃青云.基于數(shù)學(xué)史的平均數(shù)、中位數(shù)和眾數(shù)的理解[J].數(shù)學(xué)通報(bào),2013,52(11):16-21.
﹡本文系江蘇省教育科學(xué)“十二五”規(guī)劃重點(diǎn)資助課題“數(shù)學(xué)史視野下的小學(xué)數(shù)學(xué)教學(xué)的案例研究”(批準(zhǔn)號(hào):B-a/2013/02/002)的研究成果之一。
【原文出處】《小學(xué)教學(xué)》(數(shù)學(xué)版),2015.9.47~49
作者簡(jiǎn)介:陳金飛,1974年生,男,江蘇啟東人,江蘇省啟東實(shí)驗(yàn)小學(xué)副校長(zhǎng),中學(xué)高級(jí)教師,主要從事小學(xué)數(shù)學(xué)教學(xué)研究。
【作者單位】江蘇省啟東實(shí)驗(yàn)小學(xué),聯(lián)系地址:江蘇省啟東市人民中路720號(hào)(226200),聯(lián)系電話:15962731800,E-mail:cjxxcjf@163.com。
從真實(shí)走向虛擬
——平均數(shù)、中位數(shù)、眾數(shù)三個(gè)集中量的歷史演變
陳金飛
統(tǒng)計(jì)是一門數(shù)據(jù)科學(xué)。它的任務(wù)是從數(shù)據(jù)中提取信息,探索數(shù)據(jù)內(nèi)在的規(guī)律性,以達(dá)到推斷所測(cè)對(duì)象的本質(zhì),甚至預(yù)測(cè)對(duì)象的未來(lái)的目的。為了定量地把握總體的規(guī)律,通過(guò)歸納、列表、制圖等初步整理工作,用樣本的數(shù)據(jù)對(duì)總體的數(shù)據(jù)特征進(jìn)行研究,包括集中量、差異量、相關(guān)量等。常見(jiàn)的集中量有算術(shù)平均數(shù)、中位數(shù)、眾數(shù)等。在對(duì)學(xué)生的調(diào)查中發(fā)現(xiàn),當(dāng)需要表示一組數(shù)據(jù)的總體水平時(shí),學(xué)生不知道選用哪個(gè)統(tǒng)計(jì)量比較合適。學(xué)生往往把平均數(shù)理解為平均分,甚至有學(xué)生把平均數(shù)作為整數(shù)、分?jǐn)?shù)、小數(shù)外的第四種數(shù)。怎樣幫助學(xué)生建構(gòu)平均數(shù)、中位數(shù)、眾數(shù)的概念,理解三個(gè)集中量的統(tǒng)計(jì)意義?從概念的歷史產(chǎn)生過(guò)程中,或許能獲得解決問(wèn)題的方案。
一、算術(shù)平均數(shù)從真實(shí)數(shù)據(jù)走向虛擬數(shù)據(jù)。
算術(shù)平均數(shù)是統(tǒng)計(jì)學(xué)中的重要概念。陳希孺指出,如果我們從理論的角度走一點(diǎn)極端,則可以說(shuō),一部數(shù)理統(tǒng)計(jì)學(xué)的歷史,就是從縱橫兩個(gè)方向?qū)λ阈g(shù)平均數(shù)進(jìn)行不斷深入研究的歷史??v的方向指平均數(shù)本身的發(fā)展,如伯努利及其大數(shù)律、狄莫弗—拉普拉斯中心極限定理、高斯的正態(tài)誤差理論,這些研究成果,如今成了支撐數(shù)理統(tǒng)計(jì)學(xué)這座大廈的支柱。橫的方向,指平均數(shù)思想的發(fā)展。從利用平均數(shù)估計(jì)大數(shù),到重復(fù)測(cè)量取平均數(shù)減少誤差,發(fā)展為平均數(shù)作為總體的代表值,實(shí)現(xiàn)了代數(shù)概念到統(tǒng)計(jì)概念的飛躍。
1.利用平均數(shù)估計(jì)總數(shù)
在歷史上,平均數(shù)最早是用來(lái)估計(jì)總數(shù)的。公元4世紀(jì),在古印度有一個(gè)故事:古印度王圖潘納(Rtuparna)發(fā)現(xiàn)一棵枝葉茂盛的大樹(shù)長(zhǎng)有幾個(gè)大的樹(shù)枝,他想估計(jì)這幾個(gè)樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目。他首先估計(jì)了根部的一條粗細(xì)中等的樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目,然后數(shù)出這棵樹(shù)上樹(shù)枝的數(shù)目,用一個(gè)樹(shù)枝上樹(shù)葉和果實(shí)的數(shù)目乘樹(shù)枝的數(shù)目,推斷出這棵樹(shù)上樹(shù)葉和果實(shí)的總數(shù)目。在這個(gè)例子中,圖潘納選用粗細(xì)中等的樹(shù)枝作為整棵樹(shù)枝上樹(shù)葉和果實(shí)數(shù)目的代表值,這可能是算術(shù)平均數(shù)的直覺(jué)使用,因?yàn)樗x的樹(shù)枝代表了其余所有樹(shù)枝,其數(shù)量處于“中間”位置。
后來(lái)人們估計(jì)大數(shù)時(shí),引入“中點(diǎn)值”,即取兩個(gè)極端值的算術(shù)平均數(shù)。如取人數(shù)最多和最少的兩條船上人數(shù)的平均數(shù),再乘以船只的數(shù)量,就估計(jì)出全部船只上的人數(shù)??梢?jiàn),中點(diǎn)值計(jì)算是求平均數(shù)的原始方法。用現(xiàn)代的觀點(diǎn)來(lái)看,中點(diǎn)值不是一個(gè)很有用的平均數(shù),因?yàn)樗鼘?duì)極端值太敏感。
2.利用平均數(shù)減少誤差
到了公元16世紀(jì),人類對(duì)平均數(shù)的認(rèn)識(shí)有了新的發(fā)展。人們發(fā)現(xiàn)“中點(diǎn)值”作為代表值,誤差較大。如果把所有數(shù)據(jù)求和再均分,獲得的結(jié)果比中點(diǎn)值更可靠,可以減少誤差。在1582年至1588年期間,丹麥大天文學(xué)家第谷對(duì)某一天文量進(jìn)行重復(fù)觀測(cè),他得到一組觀察值。由于觀測(cè)時(shí)間、氣候的不同,得到的觀測(cè)數(shù)據(jù)各不相同,究竟哪一個(gè)最精確呢?第谷取所有數(shù)據(jù)的平均值作為假想的真實(shí)值,從而用算術(shù)平均數(shù)來(lái)消除誤差。在天文學(xué)界,第谷的這一做法一開(kāi)始并沒(méi)有為多數(shù)人所接受,他們認(rèn)為,當(dāng)有多個(gè)觀測(cè)值時(shí),應(yīng)選擇其中那個(gè)“謹(jǐn)慎地觀測(cè)”所得的值,認(rèn)為這比平均值可靠。因?yàn)椴煌煳膶W(xué)的設(shè)備、觀測(cè)條件及人員素質(zhì)難免有差異,所以得到的觀測(cè)結(jié)果的可靠性也有差異,取平均數(shù)將會(huì)使結(jié)果受到“壞”的觀測(cè)值的干擾,而不如其中的優(yōu)秀者。不過(guò)人們又不得不承認(rèn):要想在一組數(shù)據(jù)中“擇優(yōu)”,在現(xiàn)實(shí)狀態(tài)下并非總是可能的。面對(duì)眾多的觀測(cè)值,往往并無(wú)足夠的根據(jù)去鑒定其優(yōu)劣,只好一視同仁地對(duì)待??梢?jiàn),撇開(kāi)未知的真實(shí)值,取算術(shù)平均值反而比某個(gè)真實(shí)值更可靠。
辛普森為了消除當(dāng)時(shí)天文學(xué)家對(duì)取平均數(shù)代表真實(shí)值的疑慮,印證第谷用平均數(shù)以減少誤差的想法是正確的,專門撰寫了《在應(yīng)用天文學(xué)中取若干個(gè)觀察值的平均的好處》一書,他用數(shù)學(xué)的視角來(lái)證明,取平均數(shù)這個(gè)做法具有更大的可靠性。同樣,高斯在其數(shù)學(xué)和天體力學(xué)的名著《天體運(yùn)動(dòng)理論》中也指出:如果在相同的條件下并具有同樣的認(rèn)真程度,任何一個(gè)對(duì)象通過(guò)幾次直接的觀測(cè)而確定,那么觀測(cè)值的算術(shù)平均數(shù)提供了最可能的取值,即使不是太嚴(yán)格,但至少十分接近,使得它總是一個(gè)最安全的取值。現(xiàn)在,人們已經(jīng)習(xí)慣于把高斯的這個(gè)觀點(diǎn)當(dāng)作一個(gè)公理。在學(xué)生理解平均數(shù)的過(guò)程中,重復(fù)測(cè)量可能是一個(gè)有用的活動(dòng)。
從用平均值來(lái)估計(jì)總數(shù),到取平均數(shù)作為測(cè)量的真實(shí)值,是統(tǒng)計(jì)史上人類認(rèn)識(shí)的一次飛躍。歷史啟示我們,在科學(xué)發(fā)展史上,人類觀念上的革新和突破是如何的不容易,直到第谷點(diǎn)破,我們才感到用求和均分后獲得的平均值作為觀察值,相對(duì)于“擇優(yōu)法”更可靠,但在沒(méi)有發(fā)現(xiàn)之前,許多學(xué)者努力了幾十年也無(wú)功而返。
3.平均數(shù)作為總體代表值
到了19世紀(jì),人們對(duì)平均數(shù)的認(rèn)識(shí)實(shí)現(xiàn)了新的飛躍,把算術(shù)平均數(shù)作為一種數(shù)據(jù)處理方法,即作為一組數(shù)據(jù)的總體代表值,從真實(shí)數(shù)據(jù)走向虛擬數(shù)據(jù)。這首先得益于比利時(shí)數(shù)理統(tǒng)計(jì)學(xué)家阿道夫·奎特萊特提出的“平均人”的思想。這是奎特萊特運(yùn)用概率論,在探索人類自身規(guī)律的過(guò)程中所提出的獨(dú)特概念。他把社會(huì)上的人,抽象出來(lái)作為生理意義上的人來(lái)研究。從1831年開(kāi)始,奎特萊特搜集了大量關(guān)于人體生理測(cè)量數(shù)據(jù),如體重、身高與胸圍等,經(jīng)分析研究后,認(rèn)為這些生理特征都圍繞著一個(gè)平均值而上下波動(dòng)、呈現(xiàn)出很正規(guī)的分布。由于奎特萊特具備包括統(tǒng)計(jì)學(xué)在內(nèi)的廣泛知識(shí),以及擅長(zhǎng)與國(guó)際統(tǒng)計(jì)界的交流,所以,他能融會(huì)貫通各家各派的統(tǒng)計(jì)思想,從而在博采群言的基礎(chǔ)上,迅速把統(tǒng)計(jì)學(xué)推向新的高度。從統(tǒng)計(jì)學(xué)原理的角度來(lái)說(shuō),奎特萊特把平均數(shù)理解為現(xiàn)實(shí)生活中的“總體”特征的反映,他第一個(gè)把算術(shù)平均數(shù)當(dāng)做總體某方面的代表值。從真實(shí)值到統(tǒng)計(jì)意義上的代表值的轉(zhuǎn)變是觀念上很重要的變化。馬克思曾給奎特萊特以很高的評(píng)價(jià):“他過(guò)去有很大的功績(jī)。他指出:即使是社會(huì)生活的表面上的偶然性,由于它們周期性的反復(fù)和周期性的平均數(shù),仍然具有內(nèi)在的必然性?!?
把平均數(shù)從真實(shí)值推向虛擬值,成為一個(gè)抽象的統(tǒng)計(jì)量,主要的標(biāo)志是“2.5人”的出現(xiàn)。過(guò)去,人們只是從一組數(shù)據(jù)中尋找一個(gè)可靠的值作為代表值,這個(gè)值具有現(xiàn)實(shí)意義。而“2.5人”的出現(xiàn),徹底改變了人們對(duì)平均數(shù)的認(rèn)識(shí)。當(dāng)平均數(shù)作為統(tǒng)計(jì)意義下的一個(gè)代表值時(shí),它可能沒(méi)有實(shí)際意義,比如說(shuō)平均每個(gè)家庭有2.5人,這里的“平均”是一種測(cè)量手段,“平均”有“代表性、典型性”的含義。至此,人們對(duì)平均數(shù)的認(rèn)識(shí)達(dá)到了新的高度。當(dāng)平均數(shù)作為統(tǒng)計(jì)意義下的代表值時(shí),不管是通過(guò)移多補(bǔ)少還是求和均分,獲得的平均值總是一個(gè)虛擬的數(shù)據(jù)。
當(dāng)平均數(shù)作為一組數(shù)據(jù)的代表值時(shí),成為人們對(duì)公平公正的利益訴求。羅馬法律規(guī)定:當(dāng)遭遇暴風(fēng)雨時(shí),人們?yōu)榱吮茈U(xiǎn),往往選擇一些較重的物品拋入大海,以避免船翻或保全其余的貨物。這種背景下產(chǎn)生的損失理當(dāng)由全體商人和船主共同平等地分擔(dān)。同時(shí),統(tǒng)計(jì)概念下的平均數(shù),往往太受極端數(shù)據(jù)的影響,又不能體現(xiàn)人們的利益訴求。例如公司招聘中的“平均工資”,成為騙人的小把戲。10個(gè)工人,平均每人每月3000元,聽(tīng)起來(lái)工資水平蠻高,但事實(shí)是,其中一個(gè)工人每月拿12000元,其余工人是每人每月2000元 ,顯然用平均數(shù)作為這組數(shù)據(jù)的代表值有失平均數(shù)的公平公正性。那么該選擇哪個(gè)統(tǒng)計(jì)量體現(xiàn)平均工資水平,使之不受超高工資的影響?實(shí)際上,描述一組數(shù)據(jù)的平均水平,除了應(yīng)用較為廣泛的平均數(shù)外,還有中位數(shù)和眾數(shù)。中位數(shù)顧名思義是處于一組數(shù)據(jù)最中間的數(shù),位置固定,不受極端數(shù)據(jù)的影響,正好代表平均工資水平。
二、中位數(shù)凸顯數(shù)據(jù)代表值的穩(wěn)健性
在歷史上中位數(shù)幾乎是作為平均數(shù)的代替品而出現(xiàn)的。大約在1755年,博斯科維奇(Boscovich)在有關(guān)測(cè)量的誤差工作中用到了中位數(shù)。從歷史現(xiàn)象學(xué)的角度看,中位數(shù)的出現(xiàn)可能是為了取代平均數(shù)。在19世紀(jì),科學(xué)家們有不同的理由用中位數(shù)代替平均數(shù)。1874年,費(fèi)歇爾試圖用天文學(xué)中行之有效的方法描述心理學(xué)和社會(huì)現(xiàn)象,他使用了中位數(shù),其重要原因是它在計(jì)算上的簡(jiǎn)化和直覺(jué)上的清晰性。埃其渥斯同樣傾向于中位數(shù),因?yàn)槠骄鶖?shù)對(duì)極端數(shù)據(jù)太敏感,而中位數(shù)往往比平均數(shù)更“穩(wěn)健”(即對(duì)極端數(shù)據(jù)不敏感)。1882年,高爾頓第一次提出使用“中位數(shù)”這個(gè)術(shù)語(yǔ)。與數(shù)學(xué)歷史經(jīng)常發(fā)生的情況一樣,高爾頓在使用這個(gè)術(shù)語(yǔ)之前就已經(jīng)知道這個(gè)概念,但他起初使用其他術(shù)語(yǔ),如“最中間的值”,“中等的”等。1847年,他在一次演講中給出了下列描述:“一個(gè)占據(jù)中間位置的物體具有這樣的性質(zhì),比它多的物體的數(shù)目等于比它少的物體的數(shù)目。”
在實(shí)際應(yīng)用中,學(xué)生對(duì)中位數(shù)的理解比平均數(shù)更困難。在數(shù)據(jù)呈現(xiàn)偏態(tài)分布的情形下,即出現(xiàn)極端數(shù)據(jù)的情況下,適合選擇中位數(shù)作為一組數(shù)據(jù)的代表值。
三、眾數(shù)表示重復(fù)計(jì)數(shù)中的準(zhǔn)確值。
相對(duì)來(lái)說(shuō),眾數(shù)容易理解,它的歷史也比較簡(jiǎn)單。第一個(gè)使用眾數(shù)的例子,可能出現(xiàn)在雅典和斯巴達(dá)戰(zhàn)斗中。在公元前428年冬天,普拉鐵阿人和一些雅典人被伯羅奔尼撒人和皮奧夏人包圍。不久,普拉鐵阿人開(kāi)始出現(xiàn)糧食短缺,處于絕望之中,由于從雅典人那里獲得援助已經(jīng)沒(méi)有希望了,也看不到其他安全突圍的方法,普拉鐵阿人便和雅典人商議棄城而去,并打算做梯子翻過(guò)敵人的城墻。由于梯子的高度要與敵人城墻的高度一樣,為此,只有通過(guò)數(shù)敵人城墻上磚塊的層數(shù)來(lái)計(jì)算城墻的高度。在同一時(shí)間,發(fā)動(dòng)許多士兵一起數(shù)城墻上磚塊的層數(shù),有些可能數(shù)錯(cuò)了,但離城墻不太遠(yuǎn)的士兵,可能得到一個(gè)真實(shí)值,因此把出現(xiàn)次數(shù)最多的層數(shù)作為代表值。
了解這三個(gè)概念的歷史起源,無(wú)疑為我們的教學(xué)開(kāi)啟了一扇新的窗口。對(duì)于統(tǒng)計(jì)概念的學(xué)習(xí)而言,重要的不是統(tǒng)計(jì)量的計(jì)算,而是對(duì)意義的理解。統(tǒng)計(jì)關(guān)注的是一組數(shù)據(jù)能告訴我們什么信息,我們又能從數(shù)據(jù)中提取怎樣的信息。通過(guò)畫圖表、計(jì)算了解數(shù)據(jù)的特征,用樣本的頻率分布估計(jì)總體的分布,都是為了定量地把握總體的規(guī)律。因而在教學(xué)中,教師要避免把統(tǒng)計(jì)教成制作圖表,計(jì)算,不然就偏離了統(tǒng)計(jì)的實(shí)質(zhì)。
參考文獻(xiàn):
[1]陳希孺.數(shù)理統(tǒng)計(jì)學(xué)簡(jiǎn)史[M].長(zhǎng)沙:湖南教育出版社,2002.
[2] 吳俊,黃青云.基于數(shù)學(xué)史的平均數(shù)、中位數(shù)和眾數(shù)的理解[J].數(shù)學(xué)通報(bào),2013,52(11):16-21.
﹡本文系江蘇省教育科學(xué)“十二五”規(guī)劃重點(diǎn)資助課題“數(shù)學(xué)史視野下的小學(xué)數(shù)學(xué)教學(xué)的案例研究”(批準(zhǔn)號(hào):B-a/2013/02/002)的研究成果之一。
【原文出處】《小學(xué)教學(xué)》(數(shù)學(xué)版),2015.9.47~49
作者簡(jiǎn)介:陳金飛,1974年生,男,江蘇啟東人,江蘇省啟東實(shí)驗(yàn)小學(xué)副校長(zhǎng),中學(xué)高級(jí)教師,主要從事小學(xué)數(shù)學(xué)教學(xué)研究。
【作者單位】江蘇省啟東實(shí)驗(yàn)小學(xué),聯(lián)系地址:江蘇省啟東市人民中路720號(hào)(226200),聯(lián)系電話:15962731800,E-mail:cjxxcjf@163.com。