前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的統(tǒng)計(jì)學(xué)的參數(shù)主題范文,僅供參考,歡迎閱讀并收藏。
在數(shù)學(xué)教學(xué)中滲透游戲教學(xué),可以使學(xué)生在身心愉快的狀態(tài)下學(xué)習(xí)數(shù)學(xué),有益于智力殘疾兒童智力的開發(fā),充分挖掘智力殘疾兒童的潛能,補(bǔ)償智力殘疾兒童的身心缺陷。
一 巧設(shè)游戲,誘發(fā)興趣
學(xué)習(xí)興趣是學(xué)習(xí)動機(jī)的重要心理成分,它是學(xué)生主動探究知識的助力器。讓學(xué)生在學(xué)習(xí)過程中帶著愉快的情感色彩去學(xué)習(xí),其學(xué)習(xí)的效果最佳。托爾斯泰曾指出:“成功的教學(xué)所需要的不是強(qiáng)制,而是激發(fā)學(xué)生的興趣。”教學(xué)實(shí)踐證明:濃厚的學(xué)習(xí)興趣可以讓智力殘疾問題的大腦處于最活躍的狀態(tài),能最有效地激發(fā)學(xué)生的學(xué)習(xí)動機(jī),調(diào)動其學(xué)習(xí)的積極性,促使其自主地投入到學(xué)習(xí)活動中,從而有效地獲取知識,而游戲則是智力殘疾兒童最喜歡的一種活動。又由于智力殘疾兒童的注意力極其不穩(wěn)定,易被其他事物所吸引,他們集中注意力的時(shí)間大約只有10分鐘左右,教師在教學(xué)中要善于變換教學(xué)方式,采用新的教學(xué)方法來吸引兒童的注意,并積極地、有意識地培養(yǎng)他們注意自己不感興趣的東西,發(fā)展他們的有意注意,以提高數(shù)學(xué)教學(xué)的課堂效率。
1.課前游戲,吸引注意,激發(fā)興趣
剛上課時(shí)由于學(xué)生課間活動剛剛結(jié)束,他們心理還處于活動的興奮狀態(tài),無法馬上集中進(jìn)入學(xué)習(xí)狀態(tài),所以在新課前安排一個(gè)小游戲,便能夠及時(shí)地吸引學(xué)生的注意力,激發(fā)智力殘疾兒童的學(xué)習(xí)興趣。
2.新課游戲,降低難度,培養(yǎng)興趣
在講授新課時(shí),由于單純的算理講解顯得枯燥無味,智力殘疾兒童也較難理解,而他們的注意力又具有極其不穩(wěn)定的特點(diǎn),所以容易走神,不愛學(xué)習(xí)。教學(xué)中筆者常把這些新知識編成游戲的形式來進(jìn)行教學(xué),在游戲中滲透新知識,使學(xué)生在輕松、愉快的情境中掌握新知識,降低了學(xué)習(xí)的難度,培養(yǎng)了智力殘疾兒童學(xué)習(xí)數(shù)學(xué)的興趣,提高了智力殘疾兒童學(xué)習(xí)數(shù)學(xué)的積極性。如在教學(xué)“兩步混合運(yùn)算式題”時(shí),講解其算理時(shí),筆者就安排了“排隊(duì)上車”的游戲,在上車的人群中有年邁的老奶奶、兩個(gè)抱孩子的阿姨和幾個(gè)小學(xué)生。讓他們先根據(jù)平時(shí)乘車的經(jīng)驗(yàn)排隊(duì)上車,其余同學(xué)看看他們上車時(shí)是不是個(gè)文明的乘客,再進(jìn)行討論和評價(jià),學(xué)生討論得出上車的順序應(yīng)該是:先讓老奶奶上車,再讓兩個(gè)抱小孩的阿姨先后上車,最后是幾個(gè)小學(xué)生按順序先后上車,那他們就得按到的先后順序排隊(duì)上車。這時(shí)教師進(jìn)而把式題中的小括號比成“老奶奶”;把乘法和除法比成“抱孩子的阿姨”;把加法和減法比成“小學(xué)生”。這樣兩步混合運(yùn)算式題的運(yùn)算順序,學(xué)生就能較輕松地掌握了,增強(qiáng)了學(xué)習(xí)的自信心,培養(yǎng)了學(xué)習(xí)數(shù)學(xué)的興趣。
3.課后游戲,鞏固新知,提高興趣
在鞏固練習(xí)時(shí)適當(dāng)安排游戲,可以放松一下學(xué)生的大腦,活躍課堂氣氛,讓學(xué)生在游戲中鞏固所學(xué)的新知識,提高學(xué)生的學(xué)習(xí)興趣。如教學(xué)“時(shí)、分、秒”時(shí),在鞏固練習(xí)時(shí)筆者就安排了一個(gè)“找朋友”的小游戲,筆者在硬紙板上分別畫了幾個(gè)鐘面,再用幾張卡片分別寫出鐘面上所表示的時(shí)間,分別發(fā)給兩組學(xué)生,其中一組學(xué)生拿“鐘面”,另一組學(xué)生拿著表示相應(yīng)鐘面時(shí)間的卡片,接下來讓全班同學(xué)一起唱《找朋友》的歌,這兩組同學(xué)就迅速地找到與自己對應(yīng)的同學(xué),與其手拉手,再分別說出自己所持有“鐘面”的時(shí)間是……找對朋友的同學(xué),教師給予表揚(yáng)、獎勵,找不到朋友的,大家?guī)兔φ摇?/p>
在數(shù)學(xué)教學(xué)中穿插游戲活動,能充分引起學(xué)生的有意注意,提高學(xué)生學(xué)習(xí)數(shù)學(xué)的興趣,激發(fā)學(xué)生的好奇心、求知欲。使學(xué)生在寬松、愉快的環(huán)境下學(xué)習(xí)知識、鞏固知識。
二 利用游戲教學(xué)實(shí)施情感缺陷補(bǔ)償
情感在一個(gè)人認(rèn)識世界和改造世界的活動中起著很重要的作用,它是人生的一種調(diào)味劑,智力殘疾兒童也不例外,但由于他們的情感存在著缺陷,他們的身心發(fā)展將受到嚴(yán)重的阻礙,所以在教學(xué)過程中補(bǔ)償智力殘疾兒童的情感缺陷具有很重要的意義。而游戲教學(xué)是補(bǔ)償智力殘疾兒童情感缺陷的重要途徑。在教學(xué)新知識時(shí),通過游戲的形式進(jìn)行教學(xué),減少學(xué)生掌握抽象知識的困難,學(xué)生也能在較輕松的氛圍中了解和掌握新知識,獲得成功的體驗(yàn),增強(qiáng)學(xué)習(xí)的自信心,使學(xué)生獲得良好的情感體驗(yàn),從而達(dá)到情感缺陷的補(bǔ)償作用。
三 利用游戲教學(xué)創(chuàng)造性地使用教材
隨著新課程的改革與實(shí)施,我們的全日制培智教材有的內(nèi)容已無法適應(yīng)教育教學(xué)發(fā)展的需要,與智力殘疾兒童的生活實(shí)際脫軌,如“珠算加法”“角和分的認(rèn)識”等,由于智力殘疾兒童缺少生活的經(jīng)驗(yàn),學(xué)習(xí)這些內(nèi)容就有一定的困難。如教學(xué)“角、分的認(rèn)識”時(shí)由于目前市面上已不用“分”的錢幣單位了,所以在教學(xué)時(shí)筆者把這方面內(nèi)容改為“元、角的認(rèn)識”,并安排了“購物”的游戲讓學(xué)生在游戲中進(jìn)一步認(rèn)識了以“元”和“角”為單位的人民幣。
根據(jù)智力殘疾兒童的發(fā)展特點(diǎn),結(jié)合他們的生活實(shí)際,在數(shù)學(xué)教學(xué)滲透游戲教學(xué),創(chuàng)造性地使用教材,貼近孩子的生活實(shí)際,為學(xué)生更好地適應(yīng)社會生活打下了堅(jiān)實(shí)的基礎(chǔ)。
四 利用游戲教學(xué)增強(qiáng)社會適應(yīng)能力,回歸主流
關(guān)鍵詞:通用技術(shù);參與性;有效教學(xué)
隨著科學(xué)技術(shù)的飛速發(fā)展,技術(shù)已經(jīng)成為人類生活中無處不用的客觀事物,并且也成為影響社會進(jìn)步的重要因素。因此,技術(shù)教育就成為青少年培養(yǎng)基本素養(yǎng)的教育,通用技術(shù)課程就成為開發(fā)青少年潛能、促進(jìn)青少年思維發(fā)展的基礎(chǔ)課程。但是,作為一門新的學(xué)科,通用技術(shù)的教學(xué)無論在教學(xué)資源的開發(fā),還是在教學(xué)方法、手段上都存在著一定的問題。本文中筆者提出了一些在通用技術(shù)課堂中提高學(xué)生參與性、提高教學(xué)效果的教學(xué)策略。
一、將教師引導(dǎo)與學(xué)生探究學(xué)習(xí)相結(jié)合,創(chuàng)設(shè)良好的學(xué)習(xí)環(huán)境
在教學(xué)中,學(xué)生是學(xué)習(xí)的主體,為了激發(fā)其開發(fā)自身思維的能力,教師不應(yīng)該單純地進(jìn)行知識的灌輸,而應(yīng)該在教師教導(dǎo)的基礎(chǔ)上給予學(xué)生更多的思考和操作的空間。
首先,教師應(yīng)該創(chuàng)設(shè)輕松、活潑的課堂環(huán)境,給予學(xué)生更多的肯定與鼓勵,激發(fā)學(xué)生的學(xué)習(xí)熱情。其次,教師要能根據(jù)教學(xué)內(nèi)容有效地設(shè)置問題,讓學(xué)生直接參與和經(jīng)歷,調(diào)動學(xué)生積極地思考和解決問題。如在學(xué)習(xí)《設(shè)計(jì)中的人機(jī)關(guān)系》這一節(jié)時(shí)教師就可以提出:“觀察一下教室,說出哪些物品構(gòu)成了人機(jī)關(guān)系”的問題,學(xué)生通過對親身經(jīng)驗(yàn)的討論和回答,就能準(zhǔn)確地掌握“機(jī)”和“人機(jī)關(guān)系”的含義。再次,教師要在事先精心地做好教學(xué)設(shè)計(jì)的基礎(chǔ)上,給予學(xué)生足夠的時(shí)間來分析和探索,如在學(xué)習(xí)《設(shè)計(jì)中的人機(jī)關(guān)系》中,教師完全可以利用已有的教學(xué)設(shè)施,通過層層遞進(jìn)的提問方式,讓學(xué)生相互討論、自我探究,掌握學(xué)習(xí)要點(diǎn)。教師可以提問一些“人體哪些部位與椅子構(gòu)成人機(jī)關(guān)系”“大概多高的椅子坐起來最舒適”“學(xué)校里面有哪些設(shè)計(jì)不合理”等問題,讓學(xué)生對整個(gè)知識點(diǎn)進(jìn)行系統(tǒng)的討論和理解。因?yàn)檎n堂中問題的設(shè)置,使得學(xué)生參與課堂的興趣加大,自主探究的能力也得到了開發(fā),同時(shí)師生之間和生生之間的互動更為有效,從而達(dá)到最好的學(xué)習(xí)
效果。
二、將教材知識與生活實(shí)際相結(jié)合,激發(fā)學(xué)生的學(xué)習(xí)興趣
在通用技術(shù)這種立足實(shí)踐、高度綜合、注重創(chuàng)造、科學(xué)與人文融合的課程教學(xué)中,假若教師純粹地宣讀課本、陳列知識點(diǎn),則不易引起學(xué)生的學(xué)習(xí)興趣。所以,教師應(yīng)該有意識地將學(xué)生的學(xué)習(xí)陣地從書本中轉(zhuǎn)移到生活中,加強(qiáng)教材知識和生活實(shí)際的結(jié)合。例如,直接將一些生活中常見的、生動有趣的事件引入課堂,然后再根據(jù)教學(xué)內(nèi)容進(jìn)行適當(dāng)?shù)纳钊牒屯卣?,這樣教學(xué)內(nèi)容由淺入
深、教學(xué)內(nèi)容形象生動,就會使學(xué)生學(xué)起來感覺輕松,學(xué)習(xí)興趣自然得到提升,也能自主地、積極地參與到課堂之中,在實(shí)踐操作之中理解課本知識、學(xué)習(xí)技術(shù)。
在學(xué)習(xí)《發(fā)現(xiàn)與明確問題》這一章時(shí),為了明確在日常生活中發(fā)現(xiàn)“問題”在技術(shù)探究中的重要性,教師可以從大家熟知的牛頓和蘋果的故事引入,并且趁熱打鐵拿出自己事先做好的取碗器,來展示如何在較深且口徑小的容器中取出盛有食物的碗。因?yàn)閷W(xué)生在生活中也可能遇到在用高壓鍋等燉菜時(shí),因?yàn)樘珷C又怕打翻食物,而無法取出碗的狀況。所以,這一設(shè)計(jì)無疑會引起學(xué)生對生活中“發(fā)現(xiàn)問題”的興趣。
這種寓生活知識講授課本內(nèi)容的教學(xué),能使學(xué)生感受到通用技術(shù)課程并不是枯燥無味的,其所學(xué)的內(nèi)容能夠解決實(shí)際問題。這種貼近生活的教學(xué)直觀、生動,能夠有效地提高學(xué)生的課堂參與性。
三、將通用技術(shù)與信息技術(shù)相結(jié)合,實(shí)行多樣化的教學(xué)模式
信息技術(shù)和通用技術(shù)的教學(xué)整合對學(xué)生的學(xué)習(xí)以及教師的授課都有極大的幫助,信息技術(shù)是通用技術(shù)教學(xué)的重要工具,利用多媒體教學(xué)技術(shù)、計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)等能將通用技術(shù)的課堂變得更加多樣化,增加其吸引力和趣味性。信息技術(shù)能將文字、影像、圖片資料等集于一體,這使得通用技術(shù)課程的教學(xué)內(nèi)容能從抽象變得具體,降低技能學(xué)習(xí)的難度。同時(shí),聲情并茂、形式多樣的教學(xué)方法也能有效地激發(fā)學(xué)生的學(xué)習(xí)興趣,促其積極地進(jìn)行探索學(xué)習(xí)。
通用技術(shù)課程是立足于學(xué)生的“做中學(xué)”和“學(xué)中做”的課程,同時(shí)也是一門強(qiáng)調(diào)各學(xué)科、各方面知識的聯(lián)系和綜合運(yùn)用的課程。所以,在課堂中提高學(xué)生的參與性,能促進(jìn)通用技術(shù)的有
1.醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫建立的必要性
近年來選修醫(yī)學(xué)統(tǒng)計(jì)學(xué)的學(xué)生逐漸增多,考試的客觀性、公正性顯得尤為重要。當(dāng)前,不同的學(xué)校采取的考試方式不盡相同:有的學(xué)校建立了“整卷庫”,以整套試卷為單位進(jìn)行存儲,考試時(shí)隨機(jī)抽取一套試卷對考生施測,這種方式固化了試卷結(jié)構(gòu),不能根據(jù)實(shí)際需求靈活調(diào)整;有的學(xué)校簡單地將試題按章節(jié)存放在一起,試題未經(jīng)測試與合理的分析,未按能力層次及學(xué)科要求進(jìn)行劃分,考試時(shí)按章節(jié)選出一部分試題組卷,費(fèi)時(shí)又費(fèi)力;還有的學(xué)校指定每位代課老師出一定數(shù)量的題目,最后把所有老師提交的題目匯總、組合成卷,由于代課老師往往根據(jù)課堂上強(qiáng)調(diào)的授課重點(diǎn)出題,因此不能全面考察學(xué)生的真實(shí)水平??梢姡t(yī)學(xué)統(tǒng)計(jì)學(xué)考試制度存在諸多問題,要想通過考試客觀、準(zhǔn)確地評價(jià)每個(gè)考生的真實(shí)能力,充分發(fā)揮考試對教學(xué)的反饋?zhàn)饔?,?shí)現(xiàn)科學(xué)化、標(biāo)準(zhǔn)化、規(guī)范化、公正化的考試,建立高質(zhì)量的醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫〔1〕勢在必行。所謂試題庫〔2〕(itembank),并不是試題的簡單堆集,而是以一定的教育測量理論為基礎(chǔ),通過相應(yīng)的數(shù)學(xué)模型對試題進(jìn)行多項(xiàng)性能指標(biāo)分析后,選出符合要求的優(yōu)秀題目,按次序集中儲存的一種形式,并能按要求調(diào)出所需試題,最終按規(guī)定的條件組合成卷〔3-5〕。醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫以合格、優(yōu)秀的試題為基本單位,能克服現(xiàn)有考試制度的弊端。因此,建議建立醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫。
2.理論依據(jù)———項(xiàng)目反應(yīng)理論(itemresponsetheory,IRT)
建設(shè)醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫的中心環(huán)節(jié)就是命題、選題。選題時(shí)必須根據(jù)一定的評價(jià)指標(biāo)對試題進(jìn)行評估,優(yōu)秀的、符合要求的試題方可進(jìn)入試題庫。教育測量是以一定的理論為基礎(chǔ),目前用于試題評價(jià)的理論主要有經(jīng)典測量理論(classicaltesttheory,CTT)和項(xiàng)目反應(yīng)理論(itemresponsetheory,IRT)〔6,7〕。CTT存在很多無法克服的技術(shù)問題,如具有試題依賴性和樣本依賴性、被試的能力分?jǐn)?shù)與試題難度未建立在同一量尺上、忽略了每位被試的反應(yīng)組型等等〔8-11〕。于是,近代在CTT基礎(chǔ)上發(fā)展起來了一種新的測量理論,即IRT,又稱潛在特質(zhì)理論(latenttraittheory)或項(xiàng)目特征曲線理論〔12〕(itemcharacteristiccurvetheory)。IRT以幾項(xiàng)基本假設(shè)(如單維性假設(shè)、局部獨(dú)立性假設(shè)〔13,14〕等)為前提,試圖通過建立恰當(dāng)?shù)臄?shù)理統(tǒng)計(jì)模型來反映被試特質(zhì)水平、試題參數(shù)與該被試在試題上的反應(yīng)表現(xiàn)之間的關(guān)系。相對于CTT,IRT的優(yōu)勢主要有:(1)具有試題獨(dú)立性和樣本獨(dú)立性,即扣除測量誤差的影響后,被試能力參數(shù)的估計(jì)值不會隨試題的不同而不同,試題參數(shù)的估計(jì)值也不會隨被試的不同而不同。(2)每位被試具有相應(yīng)的測量誤差。(3)考慮了每位被試的反應(yīng)組型。(4)引入了信息函數(shù)的概念,其可代替CTT中信度的概念〔15〕。IRT克服了CTT的不足,已逐漸成為試題評價(jià)的主流理論。許多大型的考試如美國的研究生入學(xué)考試GRE及著名考試TOFEL等試題評價(jià)均采用了IRT〔16〕。本文也將應(yīng)用IRT,闡述醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫建設(shè)的基本思路。
資料與方法
1.資料
從中山大學(xué)公共衛(wèi)生學(xué)院資料庫中搜集2008年至2011年期間的醫(yī)學(xué)統(tǒng)計(jì)學(xué)考試試卷,共5116份。試題題型主要是單項(xiàng)選擇題、簡答題和計(jì)算分析題。這些試題面向7個(gè)不同專業(yè)的考生,包括臨床專業(yè)、預(yù)防專業(yè)、藥學(xué)專業(yè)、法醫(yī)專業(yè)、口腔專業(yè)、康復(fù)專業(yè)以及護(hù)理專業(yè)。此外,這些考生來自于不同層次,包括本科生、碩士生。
2.方法
IRT強(qiáng)調(diào)的核心是數(shù)學(xué)模型的建立和對模型中各個(gè)參數(shù)的估計(jì)〔13〕,通過對模型中各個(gè)參數(shù)適當(dāng)估計(jì)和選取,解決在現(xiàn)實(shí)中CTT遇到的大部分問題。IRT假定學(xué)生對測試項(xiàng)目的反應(yīng)不僅受到特定“能力”的影響,還受到許多隨機(jī)因素的影響,其將被試的能力看作是一個(gè)潛在的不可觀測的變量,同時(shí)將難度、區(qū)分度、猜測度等參數(shù)看作是項(xiàng)目的固有屬性,獨(dú)立于被試樣本,并將被試在某項(xiàng)目上的反映情況與該被試的特質(zhì)水平聯(lián)結(jié)起來,與表示試題特性的參數(shù)一起,共同建立起數(shù)理統(tǒng)計(jì)學(xué)概率模型〔17,18〕。不同形式的數(shù)據(jù)應(yīng)采用不同的模型進(jìn)行擬合。本研究擬應(yīng)用IRT,從以下幾個(gè)方面進(jìn)行分析。
(1)考生反應(yīng)組型的整理
采用EpiData3.1軟件包,根據(jù)搜集到的試題輸入每位受試者的反應(yīng)組型(responsepattern),即:考生在一組測驗(yàn)試題上的作答情形。數(shù)據(jù)處理如下:對于單項(xiàng)選擇題,假定某考生對試題i的反應(yīng)為ui,其中答對用ui=1來表示,答錯(cuò)用ui=0來表示(屬于二元化計(jì)分);對于簡答題,每一道簡答題滿分為h=6分,我們將其分為以下四個(gè)等級:h=0分、0<h≤2分、2<h≤4分、4<h≤6分,分別用0,1,2,3來表示(屬多元計(jì)分);對于計(jì)算分析題,每一道計(jì)算分析題滿分為k=12分,我們將其分為以下四個(gè)等級:k=0分、0<k≤4分、4<k≤8分、8<k≤12分,分別用0,1,2,3來表示(屬多元計(jì)分)。
(2)模型選擇
①單維三參數(shù)logistic模型(3parameterlogisticmodel,3PLM)對于單項(xiàng)選擇題,其反應(yīng)數(shù)據(jù)為二元化計(jì)分形式,項(xiàng)目反應(yīng)理論中可采用的數(shù)學(xué)模型有l(wèi)ogistic模型和正態(tài)卵形模型,其中應(yīng)用最廣的是前者〔9〕。logistic模型根據(jù)參數(shù)數(shù)目的不同,可分為單參數(shù)模型、雙參數(shù)模型和三參數(shù)模型〔19〕。在理論和實(shí)踐中,三參數(shù)模型得到了充分的驗(yàn)證,相對成熟、可靠,并且可以提供更多的試題信息,能更好地對參數(shù)進(jìn)行估計(jì)〔20〕。因此,本文對單項(xiàng)選擇題的數(shù)據(jù)采用單維三參數(shù)logistic模型〔21-22〕進(jìn)行處理,其表達(dá)式如下:Pi(θ)=ci+(1-ci)eDai(θ-bi)1+eDai(θ-bi)(1)其中θ表示考生能力估計(jì)值;ai表示第i題的區(qū)分度系數(shù);bi表示第i題的難度系數(shù);ci表示第i題的猜測度系數(shù);D表示標(biāo)化因子,一般取D=1.702〔19〕;Pi(θ)表示能力為θ的人答對此題目的概率。②等級反應(yīng)模型對于簡答題和計(jì)算分析題,將原始分?jǐn)?shù)進(jìn)行轉(zhuǎn)化后,反應(yīng)數(shù)據(jù)變換為多元計(jì)分形式,此時(shí),可采用項(xiàng)目反應(yīng)理論中的等級反應(yīng)模型〔23-25〕(gradedresponsemodel,GRM)。GRM假設(shè)每一個(gè)反應(yīng)類別各自對應(yīng)一條特征曲線,如果對某試題i而言,被試的反應(yīng)可以劃分為g+1類,其得分可以表示如下:Xi=0,1,……,g,那么被試在該試題上恰好得某一等級g分的概率可表示如下:Pi,k(θ)=P*i,k(θ)-P*i,k+1(θ)(2)公式(2)中,Pi,k(θ)表示對于試題i而言,能力值為θ的被試恰好得k分的概率;P*i,k(θ)表示對于試題i而言,能力值為θ的被試得k分以及k分以上的概率,P*i,k+1(θ)表示對于試題i而言,能力值為θ的被試得k+1分以及k+1分以上的概率。其中P*i,k(θ)按雙參數(shù)logistic模型可以寫為:P*i,k=11+e-Dai(θ-bi,k)(3)公式(3)中,θ、ai、D的含義與公式(1)相同,bi,k表示第i題第k個(gè)等級的難度系數(shù)。
(3)試題參數(shù)估計(jì)
應(yīng)用MULTILOG軟件,采用最大邊緣似然估計(jì)〔26,27〕(marginalmaximumlikelihoodestimate,MMLE)法來估計(jì)IRT模型中的參數(shù)。以L(ui|θ)表示能力為θ的某考生對題目i的反應(yīng)ui(答對:ui=1;答錯(cuò):ui=0)的概率,用對數(shù)似然函數(shù)表示為:L(u1,u1,…,un|θ)=∏ni=1PuiiQ1-uii(4)其中n為題目數(shù),Puii表示考生答對第i題的概率,Q1-uii表示考生答錯(cuò)第i題的概率。當(dāng)各參數(shù)的偏導(dǎo)數(shù)為0時(shí)函數(shù)取得最大值,分別求得每一個(gè)試題相應(yīng)參數(shù)值,即:試題區(qū)分度系數(shù)ai,難度系數(shù)bi,猜測度系數(shù)ci。
(4)試題篩選入庫
在篩選試題以決定哪些試題可以入庫時(shí),不能僅以試題參數(shù)作為能否進(jìn)入試題庫的唯一標(biāo)準(zhǔn),需同時(shí)考慮估計(jì)出的各試題參數(shù)以及任課教師的專業(yè)意見,篩選符合一定標(biāo)準(zhǔn)的試題進(jìn)入試題庫。試題難度過大或過小,會使分?jǐn)?shù)呈偏態(tài)分布,從而使考試的信度系數(shù)值降低,因此,選取難度系數(shù)位于[-4.0,4.0]范圍內(nèi)的試題進(jìn)入試題庫。區(qū)分度越大的題目,表明對學(xué)業(yè)水平不同的考生的鑒別力或區(qū)分能力越強(qiáng)。通常,教學(xué)過程完畢后進(jìn)行的考試,是以考察考生對知識掌握情況為目的的,因此,區(qū)分度不應(yīng)過大。我們選取區(qū)分度位于[0,3]范圍內(nèi)的試題進(jìn)入試題庫。此外,試題的猜測度也不應(yīng)太大,猜測度系數(shù)過大的試題對于考察學(xué)生對知識的掌握意義不大〔28〕,我們將猜測度小于0.25的試題選入試題庫。根據(jù)試題參數(shù)篩選出試題后,再由5~7位任課教師,獨(dú)立地逐一對初步篩選的試題進(jìn)行審核,以判斷試題文字表述是否恰當(dāng)、是否會引起歧義、是否符合醫(yī)學(xué)統(tǒng)計(jì)學(xué)邏輯、是否具有考試價(jià)值、是否具有內(nèi)容典型性、是否具有編寫格式統(tǒng)一性,是否重復(fù)等,經(jīng)全部任課教師認(rèn)可的試題方能最終進(jìn)入試題庫。除了將試題及試題參數(shù)錄入數(shù)據(jù)庫外,各個(gè)試題庫還應(yīng)包括試題編號、試題類型、所考知識點(diǎn)、認(rèn)知層次、參考答案、選中標(biāo)識等。醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫建立的流程圖見圖1。結(jié)果該研究的預(yù)期結(jié)果是成功建立醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫,該試題庫以單個(gè)試題為基本單位,每道試題都有編號、題型、難度、區(qū)分度、猜測度、知識點(diǎn)、認(rèn)知層次、參考答案以及選中標(biāo)識這9個(gè)屬性,且試題庫中的試題參數(shù)都建立在同一量尺上。試題庫中的所有試題均符合大綱要求,且試題知識覆蓋面廣,每一章節(jié)均有一定數(shù)目的試題。該試題庫可用于期末考試,也可用于階段性小測驗(yàn),可供臨床、口腔、康復(fù)、護(hù)理、預(yù)防醫(yī)學(xué)等專業(yè)使用,可根據(jù)不同專業(yè)的不同要求(如預(yù)防專業(yè)的學(xué)生應(yīng)該掌握醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識,考試時(shí)理應(yīng)選取難度較大的試題進(jìn)行測驗(yàn);而康復(fù)專業(yè)的學(xué)生理解醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識即可,那么考試時(shí)應(yīng)選取中等難度或低難度的試題進(jìn)行測驗(yàn))選取試題,進(jìn)而實(shí)現(xiàn)自動化組卷或者計(jì)算機(jī)自適應(yīng)考試,從而使各種考試得以方便、快速、順利地進(jìn)行。結(jié)論與討論采用項(xiàng)目反應(yīng)理論建立的醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫可以滿足各種目的的考試要求。不僅大大節(jié)省了時(shí)間、節(jié)約了人力,還使考試更加客觀、公正,具有重大的實(shí)際意義。
在建設(shè)醫(yī)學(xué)統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn)化試題庫的過程中,以下幾個(gè)問題值得引起我們的注意:
1.必須明確醫(yī)學(xué)統(tǒng)計(jì)學(xué)的教學(xué)大綱,并結(jié)合本校的實(shí)際情況列出考核知識點(diǎn),然后將搜集到的試題歸類于相應(yīng)的知識點(diǎn)。以知識點(diǎn)而非章節(jié)作為試題的屬性,更便于我們有針對性的命題、將試題進(jìn)行分類以及對試題進(jìn)行搜索。
2.在考生人數(shù)和試題庫試題題量方面,當(dāng)然是考生人數(shù)越多,試題參數(shù)估計(jì)的穩(wěn)健性越好;選入試題庫的題量越大、試題知識覆蓋面越廣越好。但是在實(shí)際中,由于考生人數(shù)以及符合大綱要求的試題題量有限,可以先根據(jù)現(xiàn)有的資源創(chuàng)建試題庫,然后不斷地修正試題參數(shù),不斷地為試題庫注入新的“血液”,使試題庫不斷的發(fā)展完善。為了增加試題庫題量,我們還可以借鑒兄弟院校的試題,或者組織經(jīng)驗(yàn)豐富的專家或教師命制新的試題。
3.每一道試題須包括以下9個(gè)屬性:編號、題型、難度、區(qū)分度、猜測度、知識點(diǎn)、認(rèn)知層次、參考答案以及選中標(biāo)識,以便于對試題進(jìn)行分類、存儲、檢索、維護(hù)與管理。
4.醫(yī)學(xué)統(tǒng)計(jì)學(xué)試題往往帶有各種數(shù)學(xué)符號、表格甚至圖形,這就提醒我們在錄入試題前,應(yīng)選擇合適的軟件平臺,以保證所有的試題均能完整無誤地輸入或輸出試題庫,以確保各種工作的順利進(jìn)行。
自從Paelinck提出“空間經(jīng)濟(jì)計(jì)量學(xué)”這個(gè)術(shù)語,Cliff和Ord(1973,1981)對空間自回歸模型的開拓性工作,發(fā)展出廣泛的模型、參數(shù)估計(jì)和檢驗(yàn)技術(shù),使得經(jīng)濟(jì)計(jì)量學(xué)建模中綜合空間因素變得更加有效。
Anselin(1988)對空間經(jīng)濟(jì)計(jì)量學(xué)進(jìn)行了系統(tǒng)的研究,它以及Cliff和Ord(1973,1981)這三本著作至今仍被廣泛引用。Anselin對空間經(jīng)濟(jì)計(jì)量學(xué)的定義是:“在區(qū)域科學(xué)模型的統(tǒng)計(jì)分析中,研究由空間引起的各種特性的一系列方法。”Anselin所提到的區(qū)域科學(xué)模型,指明確將區(qū)域、位置及空間交互影響綜合在模型中,并且它們的估計(jì)及確定也是基于參照地理的(即:截面的或時(shí)-空的)數(shù)據(jù),數(shù)據(jù)可能來自于空間上的點(diǎn),也可能是來自于某個(gè)區(qū)域,前者對應(yīng)于經(jīng)緯坐標(biāo),后者對應(yīng)于區(qū)域之間的相對位置。
國外近幾年空間經(jīng)濟(jì)計(jì)量學(xué)得以迅速發(fā)展,如Anselin和Florax(1995)指出的,主要得益于以下幾點(diǎn):
(1)人們對于空間及空間交互影響的作用的重新認(rèn)識。對空間的重新關(guān)注并不局限于經(jīng)濟(jì)學(xué),在其它社會科學(xué)中也得以反映。
(2)與地理對應(yīng)的社會經(jīng)濟(jì)大型數(shù)據(jù)庫的逐步實(shí)用性。在美國以及歐洲,官方統(tǒng)計(jì)部門提供的以區(qū)域和地區(qū)為統(tǒng)計(jì)單元的大型數(shù)據(jù)庫很容易得到,并且價(jià)格低廉。這些數(shù)據(jù)可以進(jìn)行空前數(shù)量的截面或時(shí)空觀測分析,這時(shí),空間(或時(shí)空)自相關(guān)可能成為標(biāo)準(zhǔn)而非一種特殊情況。
(3)地理信息系統(tǒng)(GIS)和空間數(shù)據(jù)分析軟件,以高效和低成本的計(jì)算技術(shù)處理空間觀測的發(fā)展。GIS的使用,允許地理數(shù)據(jù)的有效存儲、快速恢復(fù)及交互可視化,為空間分析技術(shù)的藝術(shù)化提供了巨大的機(jī)會。至少目前線性模型中,缺少針對空間數(shù)據(jù)和空間經(jīng)濟(jì)計(jì)量學(xué)的軟件的情況已經(jīng)大為改觀。目前已有一些專門的空間統(tǒng)計(jì)分析軟件,并且SAS、S-PLUS等著名統(tǒng)計(jì)軟件中,都已經(jīng)包括用于空間統(tǒng)計(jì)分析的模塊。
(二)空間經(jīng)濟(jì)計(jì)量學(xué)與相關(guān)學(xué)科的關(guān)系
空間統(tǒng)計(jì)學(xué)是研究空間問題的另一門學(xué)科,它是應(yīng)用數(shù)學(xué)的一個(gè)快速發(fā)展的分支。它起源于20世紀(jì)50年代早期,用以幫助采礦業(yè)進(jìn)行礦藏量的計(jì)算。最早的工作是采礦工程師D.G.Krige和統(tǒng)計(jì)學(xué)家H.S.Sichel在南非進(jìn)行的。70年代隨著計(jì)算機(jī)的普及以及運(yùn)算速度的大幅提高,空間統(tǒng)計(jì)分析技術(shù)逐漸擴(kuò)展到地球科學(xué)的其它領(lǐng)域。目前已經(jīng)普遍存在于需要處理時(shí)間上或空間上相關(guān)的數(shù)據(jù)的科技領(lǐng)域中。
空間經(jīng)濟(jì)計(jì)量學(xué)與空間統(tǒng)計(jì)學(xué)的區(qū)分不太容易。Haining和Anselin的觀點(diǎn)認(rèn)為空間統(tǒng)計(jì)學(xué)的研究大多由數(shù)據(jù)驅(qū)動,而空間經(jīng)濟(jì)計(jì)量學(xué)由模型驅(qū)動,即從特定的理論或模型出發(fā),重點(diǎn)放在問題的估計(jì)、解釋和檢驗(yàn)上??臻g統(tǒng)計(jì)學(xué)的主流是研究生態(tài)學(xué)和地質(zhì)學(xué)中的物質(zhì)現(xiàn)象,空間經(jīng)濟(jì)計(jì)量學(xué)主要研究與區(qū)域及城市經(jīng)濟(jì)有關(guān)的模型。有一種觀點(diǎn)認(rèn)為二者的區(qū)分應(yīng)基于作者將其工作對應(yīng)于空間經(jīng)濟(jì)計(jì)量學(xué)還是空間統(tǒng)計(jì)學(xué),這種區(qū)分辦法可能較為簡單。
地質(zhì)統(tǒng)計(jì)學(xué)(Geostatistics)發(fā)展于20世紀(jì)60年代,主要用于研究地質(zhì)學(xué)現(xiàn)象的空間結(jié)構(gòu)和進(jìn)行空間估值。例如,在探礦過程中,通常是在空間上布點(diǎn)進(jìn)行鉆探,然后對采樣得到的樣品進(jìn)行分析,估計(jì)礦藏的分布和儲量。由于礦藏不開采的話,在時(shí)間上結(jié)構(gòu)幾乎是不變的,因此地質(zhì)統(tǒng)計(jì)學(xué)研究的問題主要是空間相關(guān)。空間經(jīng)濟(jì)計(jì)量學(xué)所研究的問題不僅存在空間相關(guān),往往所研究的問題在時(shí)間上也存在相關(guān)。
在區(qū)域經(jīng)濟(jì)學(xué)的理論中,人們建立了各種理論以及關(guān)系式來描述人類在空間上的行為,如研究城鎮(zhèn)問題的“引力模型”等。但在利用模型進(jìn)行定量研究問題的時(shí)候,需要將理論或關(guān)系式用數(shù)學(xué)模型來進(jìn)行刻劃,利用統(tǒng)計(jì)方法對模型進(jìn)行估計(jì)、檢驗(yàn),并進(jìn)行評價(jià),這些正好是屬于經(jīng)濟(jì)計(jì)量學(xué)研究的范疇。應(yīng)該說,空間經(jīng)濟(jì)計(jì)量學(xué)主要研究區(qū)域經(jīng)濟(jì)問題,依據(jù)的是區(qū)域經(jīng)濟(jì)學(xué)理論,但它還需要綜合數(shù)學(xué),以及空間統(tǒng)計(jì)學(xué)等學(xué)科,因此它不等同于區(qū)域經(jīng)濟(jì)學(xué),而是一門交叉學(xué)科。
二、研究的問題
空間經(jīng)濟(jì)計(jì)量學(xué)主要研究存在空間效應(yīng)的問題??臻g效應(yīng)主要包括空間相關(guān)和空間差異性。在研究中涉及空間相鄰、空間相鄰矩陣等概念。
(一)空間相關(guān)
空間相關(guān)指在樣本觀測中,位于位置i的觀測與其它j≠i的觀測有關(guān),即
附圖
存在空間相關(guān)的原因有兩方面:相鄰空間單元存在測量誤差,空間交互影響的存在。測量誤差是由于調(diào)查過程中,數(shù)據(jù)的采集與空間中的單位有關(guān),如數(shù)據(jù)是按省、市、縣等統(tǒng)計(jì)的,但設(shè)定的空間單位與研究問題不一致,存在測量誤差。
空間相關(guān)不僅意味著空間上的觀測缺乏獨(dú)立性,并且意味著潛在于這種空間相關(guān)中的空間結(jié)構(gòu),也就是說空間相關(guān)的強(qiáng)度及模式由絕對位置和相對位置(布局,距離)決定。
對于空間相關(guān),空間自回歸通常是其核心內(nèi)容,空間自回歸模型的一般形式為:
附圖
在這個(gè)模型中,β解釋變量X(n×k矩陣)的參數(shù)向量(k×1),ρ是空間滯后相關(guān)變量的參數(shù),λ是殘差空間自回歸(空間AR)結(jié)構(gòu)中的參數(shù)。
W[,1]和W[,2]為n×n矩陣,是標(biāo)準(zhǔn)化或未標(biāo)準(zhǔn)化的空間加權(quán)矩陣,分別對應(yīng)于因變量以及擾動項(xiàng)中的空間自回歸過程,這兩個(gè)矩陣可以不同,這意味著兩個(gè)過程由不同的空間結(jié)構(gòu)生成。
這個(gè)模型可以退化成為普通的線性回歸模型、(純)空間自回歸模型、混合回歸與空間自回歸模型、殘差空間自回歸模型等形式。
對這個(gè)模型,普通最小二乘估計(jì)不僅是有偏的,而且是不一致的,參數(shù)的估計(jì)通常采用極大似然估計(jì),近幾年,有學(xué)者嘗試采用貝葉斯估計(jì)對參數(shù)進(jìn)行估計(jì)。
(二)空間差異性
空間差異性指空間上的區(qū)域缺乏均一性,如存在中心區(qū)和郊區(qū)、先進(jìn)和后進(jìn)地區(qū)等。例如,我國沿海地區(qū)和中西部地區(qū)經(jīng)濟(jì)存在較大差別。
對于空間差異性,只要將空間單元的特性考慮進(jìn)去,大多可以用經(jīng)典經(jīng)濟(jì)計(jì)量學(xué)方法解決。但當(dāng)空間差異性與空間相關(guān)共同存在時(shí),經(jīng)典經(jīng)濟(jì)計(jì)量學(xué)方法不再適用,而且這時(shí)問題可能變得非常復(fù)雜,因?yàn)檫@時(shí)要區(qū)分空間差異性與空間相關(guān)可能非常困難。
研究空間差異性的模型主要有:
E.Casetti提出的空間擴(kuò)展模型(1972)和回歸參數(shù)漂移分析方法(簡稱DARP)模型(1982)。這時(shí),空間差異性表現(xiàn)為模型參數(shù)隨空間位置變化,并以空間單元的位置信息作為輔助變量(稱為擴(kuò)展參數(shù))。
y=Xβ+ε
附圖
模型(3)為以經(jīng)緯坐標(biāo)(Z[,x],Z[,y])作為擴(kuò)展參數(shù)的空間擴(kuò)展模型。同樣可以以到中心區(qū)域的距離作為擴(kuò)展參數(shù)設(shè)計(jì)模型。
將模型(3)的第二個(gè)式子右邊加入隨機(jī)擾動項(xiàng),則為DARP模型。E.Casetti(1992)進(jìn)一步提出了貝葉斯空間擴(kuò)展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加權(quán)回歸模型(簡稱GWR模型)。
附圖
(三)時(shí)空數(shù)據(jù)空間模型
在模型中考慮時(shí)間維增加了描述的復(fù)雜性,但綜合時(shí)間空間的模型在實(shí)際工作中非常有用。在經(jīng)典的經(jīng)濟(jì)計(jì)量學(xué)模型中,這是綜合截面和時(shí)間序列數(shù)據(jù)的情形。如果數(shù)據(jù)不存在空間相關(guān),則可以采用PanelData模型。Anselin(1988)將似不相關(guān)(SUR)模型擴(kuò)展到空間的情形,提出空間SUR模型。
三、應(yīng)用前景及需要進(jìn)一步研究的問題
(一)在中國的應(yīng)用前景
在我國,地質(zhì)統(tǒng)計(jì)學(xué)是較早應(yīng)用空間統(tǒng)計(jì)學(xué)的領(lǐng)域,在20世紀(jì)80年代中國科學(xué)院就有人研究并應(yīng)用Krige模型。空間統(tǒng)計(jì)學(xué)除了在地質(zhì)學(xué)的研究中發(fā)揮作用,近十年來,周國法、徐汝梅等學(xué)者研究生態(tài)學(xué)中的空間相互作用,并于1998年出版了《生物地理統(tǒng)計(jì)學(xué)》。20世紀(jì)80年代以來,我國利用衛(wèi)星遙感技術(shù),對土地、森林、農(nóng)業(yè)、礦產(chǎn)、能源、作物估產(chǎn)、災(zāi)患檢測等進(jìn)行應(yīng)用,開始了我國空間統(tǒng)計(jì)學(xué)在經(jīng)濟(jì)領(lǐng)域應(yīng)用中統(tǒng)計(jì)調(diào)查的工作,為了將空間遙感調(diào)查技術(shù)逐步納入到我國統(tǒng)計(jì)的常規(guī)性工作中,1998年10月,國家統(tǒng)計(jì)局成立了空間統(tǒng)計(jì)研究室,并與中國科學(xué)院地理所合作,組成了“空間信息多重采樣設(shè)計(jì)的空間統(tǒng)計(jì)學(xué)應(yīng)用研究”課題組,運(yùn)用遙感技術(shù)和空間分析對我國農(nóng)業(yè)耕地、森林、草地等資源以及城鎮(zhèn)動態(tài)變化進(jìn)行調(diào)查,該項(xiàng)目獲得國家統(tǒng)計(jì)局2000年課題研究一等獎。
在我國地質(zhì)統(tǒng)計(jì)學(xué)、生物地理統(tǒng)計(jì)學(xué)及利用遙感技術(shù)進(jìn)行的各種調(diào)查,都屬于空間統(tǒng)計(jì)學(xué)的范疇。地質(zhì)統(tǒng)計(jì)學(xué)、生物地理統(tǒng)計(jì)學(xué)主要研究空間相關(guān)及空間估值,在生物地理統(tǒng)計(jì)學(xué)的研究中還包括物種的空間擴(kuò)散過程。所用的方法主要是各種Krige模型、方差圖模型,以及空間自回歸模型。空間動態(tài)采樣的研究,與地質(zhì)礦產(chǎn)調(diào)查類似,主要涉及樣本在空間上的布局、有效樣本量的確定、采樣誤差的計(jì)算等問題的研究,根據(jù)其研究的問題和方法,也可以將其歸入統(tǒng)計(jì)學(xué)的抽樣調(diào)查分支之中。
隨著我國按地區(qū)進(jìn)行統(tǒng)計(jì)的統(tǒng)計(jì)基礎(chǔ)資料不斷積累,尤其是遙感技術(shù)應(yīng)用到統(tǒng)計(jì)調(diào)查中來,都將使得按時(shí)間和空間排列的數(shù)據(jù)資料極為豐富,對數(shù)據(jù)進(jìn)行空間甚至?xí)r空分析成為可能,人們將逐漸從時(shí)間的角度轉(zhuǎn)向普遍從時(shí)空的角度來考慮問題。
從經(jīng)濟(jì)分析的角度看,空間經(jīng)濟(jì)計(jì)量學(xué)在我國以下幾個(gè)方面將有很大的應(yīng)用前景。
由于區(qū)域之間存在相關(guān)性,或者存在差異性,因此一項(xiàng)政策對每個(gè)區(qū)域的影響是不同的,通過運(yùn)用空間經(jīng)濟(jì)計(jì)量學(xué)方法對各區(qū)域進(jìn)行研究之后,找到政策在各區(qū)域上作用的關(guān)系,對于政府決策、正確制訂政策具有很大的參考價(jià)值。
由于區(qū)域之間存在先進(jìn)地區(qū)和后進(jìn)地區(qū),通過空間經(jīng)濟(jì)計(jì)量學(xué)方法可以對先進(jìn)地區(qū)與后進(jìn)地區(qū)之間的相互關(guān)系進(jìn)行研究。
按區(qū)域編制投入產(chǎn)出表時(shí),空間的概念將發(fā)揮作用。
對房地產(chǎn)的價(jià)值進(jìn)行評估時(shí),在考慮外界影響因素的基礎(chǔ)上,充分考慮地區(qū)之間的相互關(guān)系,將對正確評估房地產(chǎn)的價(jià)值有很大幫助。
對環(huán)境污染進(jìn)行研究時(shí),運(yùn)用空間經(jīng)濟(jì)計(jì)量學(xué)方法對污染的傳播方式進(jìn)行研究,有助于人們對環(huán)境污染進(jìn)行控制。
在交通領(lǐng)域的研究,可以利用空間經(jīng)濟(jì)計(jì)量學(xué)方法對人員、貨物在空間上的流動方式進(jìn)行研究,同時(shí)對通道上的不同區(qū)段進(jìn)行研究。
在對某種疾?。ㄈ缌鞲校┰诳臻g上的傳播過程進(jìn)行研究之后,對于疾病的預(yù)防控制將有很大的幫助。
建立了空間的概念之后,人們對于在空間上的抽樣將綜合考慮空間單元之間的相關(guān)性。而空間抽樣在空間上的布點(diǎn)方式也可以用作商業(yè)網(wǎng)點(diǎn)的布局研究。
總之,只要問題涉及到空間的概念,空間經(jīng)濟(jì)計(jì)量學(xué)就將發(fā)揮其作用。對空間經(jīng)濟(jì)計(jì)量學(xué)的深入研究及應(yīng)用,將促使人們面對問題的時(shí)候,從空間或時(shí)空的角度思考問題。
(二)需要進(jìn)一步研究的問題
目前的研究中,系統(tǒng)內(nèi)的空間單元受到系統(tǒng)內(nèi)其它位置單元的影響,但邊界處的單元還受到系統(tǒng)外與之相鄰的單元的影響,如何將這個(gè)影響考慮在模型中值得研究。
在具體問題中,距離的概念需要加以認(rèn)真對待,單用地理上的距離有時(shí)并不合適,例如國與國之間的經(jīng)濟(jì)聯(lián)系在今天并不是距離遠(yuǎn)近決定的,電子化交易使得資金的流動非常迅速方便,因此,在研究這類問題時(shí),如何將貿(mào)易、人員、資金的流動充分考慮到空間加權(quán)矩陣中去,尚值得研究。
貝葉斯方法在統(tǒng)計(jì)學(xué)各個(gè)分支的應(yīng)用越來越廣,空間貝葉斯模型也是目前空間經(jīng)濟(jì)計(jì)量學(xué)研究的熱點(diǎn)之一。
可變單元的問題。當(dāng)數(shù)據(jù)匯總的級別變化,可能整個(gè)模型的描述都發(fā)生變化,對于不同的問題,可能影響模型變化的匯總的級別也不同,能否有一個(gè)統(tǒng)一的模式對系統(tǒng)進(jìn)行描述尚待進(jìn)一步研究。
時(shí)空數(shù)據(jù)的綜合分析,參數(shù)估計(jì)的漸近性質(zhì),模型的各種檢驗(yàn)方法等,還有待進(jìn)一步的研究。
關(guān)鍵詞:統(tǒng)計(jì)學(xué);地質(zhì)工程;應(yīng)用分析
地質(zhì)統(tǒng)計(jì)學(xué)是20世紀(jì)六七十年展起來的一門新興的數(shù)學(xué)地質(zhì)學(xué)科的分支,是隨著采礦業(yè)的發(fā)展而興起的一門交叉學(xué)科。地質(zhì)統(tǒng)計(jì)學(xué)是以區(qū)域化變量理論為基礎(chǔ),以變異函數(shù)為主要工具,研究那些在空間分布上既有隨機(jī)性又有結(jié)構(gòu)性,或空間相關(guān)和依賴性的自然現(xiàn)象的科學(xué)。國內(nèi)外地質(zhì)統(tǒng)計(jì)學(xué)的理論、方法及應(yīng)用均達(dá)到了成熟的階段,并形成了具有較好應(yīng)用價(jià)值的軟件。具有代表性的有:法國巴黎高等礦院地質(zhì)統(tǒng)計(jì)學(xué)研究中心研制的ISATIS;美國斯坦福大學(xué)應(yīng)用地球科學(xué)系C.v.Deutsch和A.G.Journel共同編寫的GSIJB程序包,等等;北京科技大學(xué)地質(zhì)系也編寫出地質(zhì)統(tǒng)計(jì)學(xué)方法研究程序集。
近年來,克里金技術(shù)在石油勘探開發(fā)中的應(yīng)用日益廣泛深入,效果也越來越明顯。主要應(yīng)用包括:儲層預(yù)測,即估計(jì)地層的埋深、層厚、孔隙度、滲透率和含油飽和度等地質(zhì)和地球物理參數(shù)的空間分布,這些變量在空間既存在一定的空間分布規(guī)律(結(jié)構(gòu)性),又存在局部的變異性(隨機(jī)性),這些變量都屬于區(qū)域化變量,因此可以用地質(zhì)統(tǒng)計(jì)學(xué)方法對這些變量進(jìn)行研究繪制各種地質(zhì)圖件;利用地質(zhì)統(tǒng)計(jì)學(xué)的變差函數(shù)研究儲層的非均質(zhì)性及各向異性;數(shù)據(jù)整合,即整合地震、測井、鉆井和露頭等各種信息并進(jìn)行建模。除此以外,隨機(jī)模擬方法和油藏?cái)?shù)值模擬相結(jié)合,可以預(yù)測油藏的動態(tài)特征,為制定和調(diào)整開發(fā)方案并提高采收率提供依據(jù)。
一、地質(zhì)統(tǒng)計(jì)學(xué)研究方法的基本理論
(一)基本原理
當(dāng)一個(gè)變量呈現(xiàn)為空間分布時(shí),就稱之為區(qū)域化變量。這種變量常常反映某種空間現(xiàn)象的特征,用區(qū)域化變量來描述的現(xiàn)象稱之為區(qū)域化現(xiàn)象。區(qū)域化變量,亦稱區(qū)域化隨機(jī)變量,G.Matheron(1963)將它定義為以空間點(diǎn)x的三個(gè)直角坐標(biāo)為自變量的隨機(jī)場。區(qū)域化變量具有兩個(gè)最顯著,而且也是最重要的特征,即隨機(jī)性和結(jié)構(gòu)性。區(qū)域化隨機(jī)變量之間的差異,可以用空間協(xié)方差來表示(見圖1)。
(二)變差函數(shù)
一維變差函數(shù)的定義:假設(shè)空間點(diǎn)x只在一維x軸上變化,把區(qū)域化變量Z(x)在x,x+h兩點(diǎn)處的數(shù)值之差的方差之半定義為區(qū)域化變量Z(x)在x方向上的變差函數(shù),記為:
r表示變差函數(shù);E表示數(shù)學(xué)期望;Var表示方差。也就是說變差函數(shù)依賴于x和h兩個(gè)自變量。在本征假設(shè)條件下,變差函數(shù)僅依賴于分割它們的距離h和方向a。而與所考慮的點(diǎn)x在待估域內(nèi)的位置無關(guān),因此變差函數(shù)更明確定義為:變差函數(shù)是在任一方向a,相距h的兩個(gè)區(qū)域化變量Z(x)和Z(x+h)的增量的方差之半。
變差函數(shù)是一個(gè)距離的函數(shù),描述不同位置變量的相似性,r值越大,相關(guān)越差。通常情況下,r值隨著距離矢量h的增大而增大,直到h到達(dá)一定值時(shí),r達(dá)到極大值,而后保持這個(gè)常數(shù)值不變。
(三)克里金方法
當(dāng)隨機(jī)變量X的數(shù)學(xué)期望對整個(gè)區(qū)域都為已知時(shí),采用的克里金方法就是簡單克里金方法。在進(jìn)行簡單克里金估計(jì)時(shí),我們假設(shè)整個(gè)區(qū)域的均值是已知的。然而儲層物性的均值是隨著局部區(qū)域的不同而變化的,上述假設(shè)在絕大部分的情況下是不成立的,普通克里金解決了這一問題。當(dāng)隨機(jī)變量X(u)的數(shù)學(xué)期望是一個(gè)和u無關(guān)的常數(shù),但這個(gè)常數(shù)未知時(shí),導(dǎo)出的克里金方法就是普通克里金方法。
(四)協(xié)克里金
1.協(xié)克里金方法的原理及其公式。協(xié)克里金方法要求主變量與二級變量之間具有良好的相關(guān)性。以整合兩個(gè)變量為例,協(xié)克里金估計(jì)的主變量和二級變量的線性組合形式如下:
公式中,是位置的估計(jì)值,是在位置上的主變量采樣值;是對應(yīng)于該采樣點(diǎn)的加權(quán)系數(shù)。
協(xié)克里金有其不足之處,需要建立兩個(gè)變差函數(shù)(主變量、二級變量的變差函數(shù))和一個(gè)互變差函數(shù)(主變量與二級變量之間的互變差函數(shù))。不僅運(yùn)算的數(shù)據(jù)量顯著增大了,而且擬合這些變差函數(shù)比較困難。在協(xié)克里金的計(jì)算過程中,相關(guān)性較好的數(shù)據(jù)對相關(guān)性較差的數(shù)據(jù)存在屏蔽效應(yīng)。由于這些原因,這種完全協(xié)克里金在實(shí)際應(yīng)用方面受到限制。于是,人們發(fā)展了配置協(xié)克里金,這種方法保留了協(xié)克里金的優(yōu)點(diǎn),又不用同時(shí)建立三個(gè)變差函數(shù)。
2.協(xié)克里金算法中幾個(gè)關(guān)鍵的步驟。在使用協(xié)克里金方法時(shí),要求兩組數(shù)據(jù)之間具有良好的相關(guān)性。圖1是工區(qū)井點(diǎn)處單位厚度旅行時(shí)差與孔隙度的交匯圖,計(jì)算單位厚度旅行時(shí)差與孔隙度的相關(guān)系數(shù)為0.880655,具有良好的相關(guān)系數(shù)。
相關(guān)函數(shù)的計(jì)算與擬合。由于實(shí)際數(shù)據(jù)測量點(diǎn)個(gè)數(shù)的不足,我們需要對相關(guān)函數(shù)進(jìn)行計(jì)算并擬合,繪制出完整的相關(guān)函數(shù)圖形,通過變差函數(shù)計(jì)算方法和線性規(guī)劃擬合方法,計(jì)算擬合相關(guān)函數(shù)。
選擇合適的搜索半徑。協(xié)克里金方法至少使用兩種數(shù)據(jù),一般叫做硬數(shù)據(jù)和軟數(shù)據(jù),通過實(shí)際資料處理,認(rèn)為這兩種數(shù)據(jù)不宜用相同的搜索半徑。對于硬數(shù)據(jù),應(yīng)采用與硬數(shù)據(jù)的變程相當(dāng)?shù)乃阉靼霃?,原則是盡可能地應(yīng)用精確的硬數(shù)據(jù);對于軟數(shù)據(jù),搜索半徑不宜過大,因?yàn)檐洈?shù)據(jù)本身不夠精確,會把自身的偏差帶到估計(jì)值中。
處理加權(quán)系數(shù)。最后一步是處理加權(quán)系數(shù),由于負(fù)的加權(quán)系數(shù)會導(dǎo)致奇異的估計(jì)值,因此需要采用線性規(guī)劃方法處理加權(quán)系數(shù)。
二、地質(zhì)統(tǒng)計(jì)學(xué)方法的應(yīng)用
(一)儲層預(yù)測
對儲層參數(shù)進(jìn)行科學(xué)有效的預(yù)測,一直是石油地質(zhì)學(xué)的熱點(diǎn)和難點(diǎn)。最初采用傳統(tǒng)的數(shù)理統(tǒng)計(jì)方法,但這種純數(shù)學(xué)的方法不考慮儲層參數(shù)之間的空間連續(xù)性和相關(guān)性,不帶任何地質(zhì)意義,對儲層參數(shù)預(yù)測具有很大的局限性。而地質(zhì)統(tǒng)計(jì)學(xué)方法以區(qū)域化變量理論為基礎(chǔ),充分考慮了地質(zhì)參數(shù)空間變化的趨勢、方向性及2樣點(diǎn)參數(shù)的相互依賴性,利用克里金方法的插值和外推功能,求出比較符合地質(zhì)規(guī)律的地質(zhì)統(tǒng)計(jì)模型和方法,來表征各種儲層參數(shù)的變化規(guī)律,然后用這種規(guī)律,對參數(shù)(如孔隙度和滲透率等)的空間展布進(jìn)行比較合理而有效的預(yù)測。
(二)儲層的非均質(zhì)性及各向異性研究
儲層非均質(zhì)性研究是油藏描述的重要內(nèi)容,其參數(shù)的空間分布不僅具有隨機(jī)性,而且具有結(jié)構(gòu)性。從地質(zhì)統(tǒng)計(jì)學(xué)關(guān)于變差函數(shù)的基本理論出發(fā),在綜合分析的基礎(chǔ)上,構(gòu)造了一種定量表征儲層平面非均質(zhì)性的數(shù)學(xué)模型,計(jì)算結(jié)果所反映的各類儲層的平面非均質(zhì)特征符合沉積的基本規(guī)律,說明這一表征模型用于儲層平面非均質(zhì)性定量評價(jià)中是可行的。
(三)不確定性描述
靜態(tài)、動態(tài)的確定性模型,很難反映油藏的復(fù)雜變化,只有通過不確定性描述,從地質(zhì)統(tǒng)計(jì)觀點(diǎn)概括和綜合地質(zhì)模型,才能真實(shí)地反映復(fù)雜的油藏模型。近幾年來,地質(zhì)統(tǒng)計(jì)學(xué)越來越廣泛地用于儲層表征,諸如估計(jì)孔隙度的空間分布,模擬滲透率的數(shù)值連續(xù)性,定量估計(jì)油藏模型的不確定性,取樣設(shè)計(jì),流動模擬過程中的敏感性分析和風(fēng)險(xiǎn)分析,等等。它的最大優(yōu)點(diǎn)就在于能夠方便地綜合應(yīng)用各種資料,如地質(zhì)、地震、測井、生產(chǎn)等各方面的信息,這對巖心取樣十分稀疏的油藏的準(zhǔn)確描述是關(guān)鍵的。而且不確定性描述能為油藏工程師提供多個(gè)可選擇的開發(fā)方案,有利于綜合分析,獲得合理的開發(fā)決策。
參考文獻(xiàn):
[1]何琰,殷軍.儲層非均質(zhì)性描述的地質(zhì)統(tǒng)計(jì)學(xué)方法[J].西南石油學(xué)院學(xué)報(bào),2001,23(3).
[2]李黎,王永剛.地質(zhì)統(tǒng)計(jì)學(xué)應(yīng)用綜述[J].勘探地球物理進(jìn)展,2006,(6).
[3]王自高,何偉,高才坤,盧杰.工程勘察新技術(shù)應(yīng)用與發(fā)展思路[J].水力發(fā)電,2006,(11).
[4]GUNTER,HOLDER.StatisticsinPreclinicalPharmaceuticalResearchandDevelopment[J].JournaloftheAmericanStatisticalAssociation,2000,95(449).
[關(guān)鍵詞]巖土參數(shù) 變異性 評價(jià)分析
[中圖分類號] P58 [文獻(xiàn)碼] B [文章編號] 1000-405X(2015)-7-437-1
隨著建筑、交通等建設(shè)規(guī)模的擴(kuò)大,建筑物對地基的承載能力、沉降幅度的要求越來越高了。要滿足這種高精度的巖土工程設(shè)計(jì)要求,取得建筑區(qū)域的巖土參數(shù),并通過研究巖土參數(shù),更加科學(xué)反映建設(shè)區(qū)域的巖土特質(zhì),在施工前對建筑工程帶來必要的數(shù)據(jù)參考,從而保證工程建設(shè)的安全性和可靠性。
在工程建設(shè)中, 人們認(rèn)識到同一點(diǎn)不同深度及同一地區(qū)的不同點(diǎn)處的巖土參數(shù)具有一定的差異, 對巖土參數(shù)的空間變異性有一定的認(rèn)識。但是為了便于原始數(shù)據(jù)的統(tǒng)計(jì)分析而將巖土介質(zhì)視為均質(zhì)各向同性地層。卻忽略了巖土參數(shù)的空間變異性, 而將這種“差異”僅僅作為試驗(yàn)過程中的純隨機(jī)誤差。在巖土工程領(lǐng)域的可靠性設(shè)計(jì)中, 若將參數(shù)樣本統(tǒng)計(jì)值直接作為巖土參數(shù)的空間統(tǒng)計(jì)值, 將對可靠度計(jì)算精度產(chǎn)生直接影響。
因此, 巖土參數(shù)的空間變異性分析和相關(guān)距離的計(jì)算一直受到重視。巖土最重要的特征是具有復(fù)雜的變異性也即地域特征,導(dǎo)致其參數(shù)值有顯著不確定性。巖土參數(shù)是巖土工程設(shè)計(jì)時(shí)需要考慮的基本要素,同時(shí)巖土參數(shù)的空間變異性已經(jīng)被人們所認(rèn)識,并逐步引入巖土工程的實(shí)際分析之中。
本文通過巖土空間參數(shù)的變異性來源及其評價(jià)分析的闡述,說明巖土參數(shù)在巖土工程中的作用。
1巖土參數(shù)空間變異性的來源與特征
巖土參數(shù)所具有的不確定性除了來自巖土勘察導(dǎo)致的誤差外,巖土參數(shù)本身也有了隨機(jī)變量的特性。我們知道,長期地質(zhì)變遷形成的巖土,其性質(zhì)極為復(fù)雜。巖土因?yàn)槠浞蔷|(zhì)和各向異性的特點(diǎn),使得它具備有空間的變異性,這種空間變異性與建筑勘察時(shí)對巖土取樣過程中的失真和量測誤差,是導(dǎo)致巖土參數(shù)變異性的主要因素。
巖土變異性的來源總結(jié)起來可以歸入以下幾類:首先是巖土其本身的變異或者是模型變異,也來自于為試驗(yàn)誤差或者是統(tǒng)計(jì)誤差。而在大樣本條件下,并舍棄明顯不合理試驗(yàn)值后,可以忽略模型和統(tǒng)計(jì)部分引起的變異。根據(jù)區(qū)域化變量理論,可將展布于一定空間范圍內(nèi),相互之間具有一定相關(guān)性的隨機(jī)變量視為區(qū)域化變量。這恰好反映出巖土參數(shù)的空間相關(guān)性和隨機(jī)性。
因此,巖土工程的設(shè)計(jì)計(jì)算中涉及的抗剪強(qiáng)度指標(biāo)、壓縮模量(系數(shù))、孔隙比、容重和滲透系數(shù)等都可以看作區(qū)域化變量進(jìn)行統(tǒng)計(jì)分析。
2巖土參數(shù)變異性的評價(jià)分析
巖土參數(shù)空間變異性分析,是根據(jù)取樣并測定的數(shù)據(jù)資料,分析巖土參數(shù)的空間變化特征、參數(shù)自身及各參數(shù)之間的空間相互關(guān)系,以及將分析得到的結(jié)果應(yīng)用于實(shí)際的工程中,并對未測點(diǎn)參數(shù)進(jìn)行最優(yōu)化估值,還可分析預(yù)測狀態(tài)變量的空間分布。
在實(shí)際工程設(shè)計(jì)中,許多巖土參數(shù)可以看作是區(qū)域化變量。比如土的孔隙度相對密度塑性指數(shù)、滲透系數(shù)、壓縮模量、抗剪( 壓) 強(qiáng)度以及某一特定持力土層的厚度等。它們的依隨空間位置點(diǎn)而變化, 并且具有兩個(gè)基本屬性,即結(jié)構(gòu)性與隨機(jī)性。由于區(qū)域化變量具有上述特殊性質(zhì),如果用經(jīng)典概率統(tǒng)計(jì)方法來研究、描述這類性質(zhì)的變化是非常不容易的,因?yàn)樗鼰o法道道巖土參數(shù)的空間結(jié)構(gòu)方面的信息。
而通過區(qū)域化變量理論中的一個(gè)簡單工具一一變異函數(shù), 就可以很好的描述區(qū)域化變量的上述特性,并對區(qū)域化的變異性也能反映。
目前多數(shù)巖土工程可靠性分析計(jì)算中,巖土參數(shù)的變異性是按概率統(tǒng)計(jì)中的隨機(jī)變量變異性來評估的,它采用樣本的均方差與樣本均值的比值(一般叫做變異系數(shù))來表示,這很容易忽略巖土參數(shù)變異性中很重要的特點(diǎn),即結(jié)構(gòu)性。而我們采用的區(qū)域化變量理論中的變異函數(shù)來描述巖土參數(shù)空間變異性就彌補(bǔ)這一缺點(diǎn)。從而將這類變量的變異性分析的任務(wù)得以實(shí)現(xiàn)。同時(shí),利用地質(zhì)統(tǒng)計(jì)學(xué)方法可以得到的巖土參數(shù)空間結(jié)構(gòu)信息,定量的描述巖土參數(shù)的空間變異性,更全面的分析巖土參數(shù)的空間變化,以及通過巖土工程勘探網(wǎng)的合理布局,從而得到定量的有關(guān)巖土參數(shù)空間的最優(yōu)化值。而經(jīng)典的統(tǒng)計(jì)方法使用的標(biāo)準(zhǔn)差,變異系數(shù)特征值的離散隨機(jī)變量等參數(shù),這些值的特征通常能用來總結(jié)某個(gè)范圍內(nèi)的巖土參數(shù)值給定的離散的規(guī)模以及總體集中度,卻不可能反映巖土參數(shù)的空間局部作用域和特征值的一個(gè)特定的方向。所以,地質(zhì)統(tǒng)計(jì)學(xué)方法可以彌補(bǔ)傳統(tǒng)統(tǒng)計(jì)方法忽視巖土參數(shù)變異性的缺點(diǎn),從而對巖土參數(shù)的空間變異性進(jìn)行更現(xiàn)實(shí)的分析和評價(jià)。
3結(jié)論
巖土參數(shù)的不確定性根源是巖土參數(shù)的空間變異性和量測系統(tǒng)變異性所導(dǎo)致的。巖土參數(shù)的變異性特征確定了巖土參數(shù)的空間分布的結(jié)構(gòu)性和隨機(jī)性的雙重特征,因此我們就用巖土參數(shù)的區(qū)域化變量理論對巖土參數(shù)的空間變異性做出客觀的評估。變異函數(shù)及其參數(shù)的使用,使得我們能夠?qū)r石結(jié)構(gòu)特征進(jìn)行定量描述,從定量的角度揭示巖土屬性空間變異規(guī)律,在區(qū)域化變量空間結(jié)構(gòu)分析基礎(chǔ)上構(gòu)建出的有別于傳統(tǒng)統(tǒng)計(jì)方法的方向綜合變異指標(biāo),然后充分利用經(jīng)典統(tǒng)計(jì)學(xué)所丟失的信息,就可以對巖土參數(shù)的空間變異性得出可靠的定量評價(jià)。地質(zhì)統(tǒng)計(jì)學(xué)是巖土工程研究巖土的空間變異性及數(shù)學(xué)地質(zhì)領(lǐng)域有效的工具,有很廣闊的應(yīng)用前景,這體現(xiàn)其在儲量計(jì)算、勘探等領(lǐng)域探索,以及采礦設(shè)計(jì)和采礦地質(zhì)等方面都顯示了強(qiáng)大的生命力,已經(jīng)成為描述和考察各種自然資源工程學(xué)科。地質(zhì)統(tǒng)計(jì)學(xué)研究巖土參數(shù)幾個(gè)空間變異性,可以更全面的揭示巖土參數(shù)的空間分布特征,從而更為準(zhǔn)確評估建筑工地的巖土特征,為工程施工前的做可靠的參照依據(jù)。
參考文獻(xiàn)
[1]朱小林:巖上工程參數(shù)的評價(jià)(巖上工程系列講座第五講) [J].工程勘察,1989年5 期.
[2]戴維著,孫惠文,劉承柞譯.礦產(chǎn)儲量的地質(zhì)統(tǒng)計(jì)學(xué)評價(jià)( 數(shù)學(xué)地質(zhì)進(jìn)展2)[J].地質(zhì)出版社,北京,1989年.
[3]王俊庸.地質(zhì)統(tǒng)計(jì)學(xué)及共在煤炭資源開發(fā)中的應(yīng)用[J].煤炭工業(yè)出版社, 1990
統(tǒng)計(jì)學(xué)研究的對象是數(shù)據(jù),數(shù)據(jù)科學(xué)顧名思義也是以數(shù)據(jù)為研究對象,這產(chǎn)生一種直觀的錯(cuò)覺,似乎數(shù)據(jù)科學(xué)與統(tǒng)計(jì)學(xué)之間存在某種與生俱來的淵源關(guān)系。Wu(1998)直言不諱,數(shù)據(jù)科學(xué)就是統(tǒng)計(jì)學(xué)的重命名,相應(yīng)地,數(shù)據(jù)科學(xué)家替代了統(tǒng)計(jì)學(xué)家這個(gè)稱謂。若此,那是什么促成了這種名義上的替代?顯然僅僅因?yàn)閿?shù)據(jù)量大本身并不足以促成“統(tǒng)計(jì)學(xué)”向“數(shù)據(jù)科學(xué)”的轉(zhuǎn)變,數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)這些概念似乎就已經(jīng)足夠了。問題的關(guān)鍵在于,二者所指的“數(shù)據(jù)”并非同一概念,數(shù)據(jù)②本身是一個(gè)很寬泛的概念,只要是對客觀事物記錄下來的、可以鑒別的符號都可以稱之為數(shù)據(jù),包括數(shù)字、文字、音頻、視頻等等。統(tǒng)計(jì)學(xué)研究的數(shù)據(jù)雖然類型豐富,如類別數(shù)據(jù)、有序數(shù)據(jù)等定性數(shù)據(jù),定距數(shù)據(jù)、定比數(shù)據(jù)等定量數(shù)據(jù),但這些都是結(jié)構(gòu)化數(shù)據(jù);數(shù)據(jù)科學(xué)所謂的數(shù)據(jù)則更為寬泛,不僅包括這些傳統(tǒng)的結(jié)構(gòu)型數(shù)據(jù),而且還包括文本、圖像、視頻、音頻、網(wǎng)絡(luò)日志等非結(jié)構(gòu)型和半結(jié)構(gòu)型數(shù)據(jù),即,大數(shù)據(jù)。大數(shù)據(jù)(以半/非結(jié)構(gòu)型數(shù)據(jù)為主)使基于關(guān)系型數(shù)據(jù)庫的傳統(tǒng)分析工具很難發(fā)揮作用,或者說傳統(tǒng)的數(shù)據(jù)庫和統(tǒng)計(jì)分析方法很難在可容忍的時(shí)間范圍內(nèi)完成存儲、管理和分析等一系列數(shù)據(jù)處理過程,為了有效地處理這類數(shù)據(jù),需要一種新的范式———數(shù)據(jù)科學(xué)。真正意義上的現(xiàn)代統(tǒng)計(jì)學(xué)是從處理小數(shù)據(jù)、不完美的實(shí)驗(yàn)等這類現(xiàn)實(shí)問題發(fā)展起來的,而數(shù)據(jù)科學(xué)是因?yàn)樘幚泶髷?shù)據(jù)這類現(xiàn)實(shí)問題而興起的。因此數(shù)據(jù)科學(xué)的研究對象是大數(shù)據(jù),而統(tǒng)計(jì)學(xué)以結(jié)構(gòu)型數(shù)據(jù)為研究對象。退一步,單從數(shù)量級來講,也已發(fā)生了質(zhì)變。對于結(jié)構(gòu)化的大規(guī)模數(shù)據(jù),傳統(tǒng)的方法只是理論上的(可行性)或不經(jīng)濟(jì)的(有效性),實(shí)踐中還需要借助數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、并行處理技術(shù)等現(xiàn)代計(jì)算技術(shù)才能實(shí)現(xiàn)。
二、數(shù)據(jù)科學(xué)的統(tǒng)計(jì)學(xué)內(nèi)涵
(一)理論基礎(chǔ)
數(shù)據(jù)科學(xué)中的數(shù)據(jù)處理和分析方法是在不同學(xué)科領(lǐng)域中分別發(fā)展起來的,譬如,統(tǒng)計(jì)學(xué)、統(tǒng)計(jì)學(xué)習(xí)或稱統(tǒng)計(jì)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、應(yīng)用數(shù)學(xué)、數(shù)據(jù)密集型計(jì)算、密集計(jì)算方法等。在量化分析的浪潮下甚至出現(xiàn)了“metric+模式”,如計(jì)量經(jīng)濟(jì)學(xué)、文獻(xiàn)計(jì)量學(xué)、網(wǎng)絡(luò)計(jì)量學(xué)、生物統(tǒng)計(jì)學(xué)等。因此,有學(xué)者將數(shù)據(jù)科學(xué)定義為計(jì)算機(jī)科學(xué)技術(shù)、數(shù)學(xué)與統(tǒng)計(jì)學(xué)知識、專業(yè)應(yīng)用知識三者的交集,這意味著數(shù)據(jù)科學(xué)是一門新興的交叉學(xué)科。但是這種沒有側(cè)重的疊加似乎只是羅列了數(shù)據(jù)科學(xué)所涉及到的學(xué)科知識,并沒有進(jìn)行實(shí)質(zhì)性的分析,就好似任何現(xiàn)實(shí)活動都可以拆解為不同的細(xì)分學(xué)科,這是必然的。根據(jù)Naur(1960,1974)的觀點(diǎn),數(shù)據(jù)科學(xué)或稱數(shù)據(jù)學(xué)是計(jì)算機(jī)科學(xué)的一個(gè)替代性稱謂。但是這種字面上的轉(zhuǎn)換,并沒有作為一個(gè)獨(dú)立的學(xué)科而形成。Cleveland(2001)首次將數(shù)據(jù)科學(xué)作為一個(gè)獨(dú)立的學(xué)科提出時(shí),將數(shù)據(jù)科學(xué)表述為統(tǒng)計(jì)學(xué)加上它在計(jì)算技術(shù)方面的擴(kuò)展。這種觀點(diǎn)表明,數(shù)據(jù)科學(xué)的理論基礎(chǔ)是統(tǒng)計(jì)學(xué),數(shù)據(jù)科學(xué)可以看作是統(tǒng)計(jì)學(xué)在研究范圍(對象)和分析方法上不斷擴(kuò)展的結(jié)果。一如統(tǒng)計(jì)學(xué)最初只是作為征兵、征稅等行政管理的附屬活動,而現(xiàn)在包括了范圍更廣泛的理論和方法。從研究范圍的擴(kuò)展來看,是從最初的結(jié)構(gòu)型大規(guī)模數(shù)據(jù)(登記數(shù)據(jù)),到結(jié)構(gòu)型的小規(guī)模數(shù)據(jù)(抽樣數(shù)據(jù))、結(jié)構(gòu)型的大規(guī)模數(shù)據(jù)(微觀數(shù)據(jù)),再擴(kuò)展到現(xiàn)在的非(半)結(jié)構(gòu)型的大規(guī)模數(shù)據(jù)(大數(shù)據(jù))和關(guān)系數(shù)據(jù)等類型更為豐富的數(shù)據(jù)。從分析方法的擴(kuò)展來看,是從參數(shù)方法到非參數(shù)方法,從基于模型到基于算法,一方面?zhèn)鹘y(tǒng)的統(tǒng)計(jì)模型需要向更一般的數(shù)據(jù)概念延伸;另一方面,算法(計(jì)算機(jī)實(shí)現(xiàn))成為必要的“可行性分析”,而且在很多方面算法模型的優(yōu)勢越來越突出。注意到,數(shù)據(jù)分析有驗(yàn)證性的數(shù)據(jù)分析和探索性的數(shù)據(jù)分析兩個(gè)基本取向,但不論是哪一種取向,都有一個(gè)基本的前提假設(shè),就是觀測數(shù)據(jù)是由背后的一個(gè)(隨機(jī))模型生成,因此數(shù)據(jù)分析的基本問題就是找出這個(gè)(隨機(jī))模型。Tukey(1980,2000)明確提到,EDA和CDA并不是替代關(guān)系,兩者皆必不可少,強(qiáng)調(diào)EDA是因?yàn)樗坏凸懒?。?shù)據(jù)導(dǎo)向是計(jì)算機(jī)時(shí)代統(tǒng)計(jì)學(xué)發(fā)展的方向,這一觀點(diǎn)已被越來越多的統(tǒng)計(jì)學(xué)家所認(rèn)同。但是數(shù)據(jù)導(dǎo)向仍然有基于模型與基于算法兩種聲音,其中,前文提到的EDA和CDA都屬于基于模型的方法,它們都假定數(shù)據(jù)背后存在某種生成機(jī)制;而算法模型則認(rèn)為復(fù)雜的現(xiàn)實(shí)世界無法用數(shù)學(xué)公式來刻畫,即,不設(shè)置具體的數(shù)學(xué)模型,同時(shí)對數(shù)據(jù)也不做相應(yīng)的限制性假定。算法模型自20世紀(jì)80年代中期以來隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展而得到快速成長,然而很大程度上是在統(tǒng)計(jì)學(xué)這個(gè)領(lǐng)域之外“悄然”進(jìn)行的,比如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹、隨機(jī)森林等機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法。若響應(yīng)變量記為y,預(yù)測變量記為x,擾動項(xiàng)和參數(shù)分別記為ε和β,則基于模型的基本形式是:y=f(x,β,ε),其目的是要研究清楚y與x之間的關(guān)系并對y做出預(yù)測,其中,f是一個(gè)有顯式表達(dá)的函數(shù)形式(若f先驗(yàn)假定,則對應(yīng)CDA;若f是探索得到的,則對應(yīng)EDA),比如線性回歸、Logistic回歸、Cox回歸等??梢姡瑐鹘y(tǒng)建模的基本觀點(diǎn)是,不僅要得到正確的模型———可解釋性強(qiáng),而且要得到準(zhǔn)確的模型———外推預(yù)測能力強(qiáng)。而對于現(xiàn)實(shí)中復(fù)雜的、高維的、非線性的數(shù)據(jù)集,更切合實(shí)際的做法是直接去尋找一個(gè)恰當(dāng)?shù)念A(yù)測規(guī)則(算法模型),不過代價(jià)是可解釋性較弱,但是算法模型的計(jì)算效率和可擴(kuò)展性更強(qiáng)?;谒惴ǖ幕拘问筋愃朴诜菂?shù)方法y=f(x,ε),但是比非參數(shù)方法的要求更低yx,因?yàn)榉菂?shù)方法很多時(shí)候要求f或其一階導(dǎo)數(shù)是平滑的,而這里直接跳過了函數(shù)機(jī)制的探討,尋找的只是一個(gè)預(yù)測規(guī)則(后續(xù)的檢驗(yàn)也是基于預(yù)測構(gòu)造的)。在很多應(yīng)用場合,算法模型得到的是針對具體問題的解(譬如某些參數(shù)是被當(dāng)作一個(gè)確定的值通過優(yōu)化算法得到的),并不是統(tǒng)計(jì)意義上的推斷解。
(二)技術(shù)維度
數(shù)據(jù)科學(xué)是基于數(shù)據(jù)的決策,數(shù)據(jù)分析的本質(zhì)既不是數(shù)學(xué),也不是軟件程序,而是對數(shù)據(jù)的“閱讀”和“理解”。技術(shù)只是輔助數(shù)據(jù)理解的工具,一個(gè)毫無統(tǒng)計(jì)學(xué)知識的人應(yīng)用統(tǒng)計(jì)軟件也可以得到統(tǒng)計(jì)結(jié)果,但無論其過程還是結(jié)果都是可疑的,對統(tǒng)計(jì)結(jié)果的解釋也無法令人信服?!皬挠?jì)算機(jī)科學(xué)自身來看,這些應(yīng)用領(lǐng)域提供的主要研究對象就是數(shù)據(jù)。雖然計(jì)算機(jī)科學(xué)一貫重視數(shù)據(jù)的研究,但數(shù)據(jù)在其中的地位將會得到更進(jìn)一步的加強(qiáng)”。不可否認(rèn),統(tǒng)計(jì)分析逐漸向計(jì)算機(jī)科學(xué)技術(shù)靠近的趨勢是明顯的。這一方面是因?yàn)?,?shù)據(jù)量快速膨脹,數(shù)據(jù)來源、類型和結(jié)構(gòu)越來越復(fù)雜,迫切需要開發(fā)更高效率的存儲和分析工具,可以很好地適應(yīng)數(shù)據(jù)量的快速膨脹;另一方面,計(jì)算機(jī)科學(xué)技術(shù)的迅猛發(fā)展為新方法的實(shí)現(xiàn)提供了重要的支撐。對于大數(shù)據(jù)而言,大數(shù)據(jù)分析丟不掉計(jì)算機(jī)科學(xué)這個(gè)屬性的一個(gè)重要原因還不單純是因?yàn)樾枰y(tǒng)計(jì)軟件來協(xié)助基本的統(tǒng)計(jì)分析和計(jì)算,而是大數(shù)據(jù)并不能像早先在關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)那樣可以直接用于統(tǒng)計(jì)分析。事實(shí)上,面對越來越龐雜的數(shù)據(jù),核心的統(tǒng)計(jì)方法并沒有實(shí)質(zhì)性的改變,改變的只是實(shí)現(xiàn)它的算法。因此,從某種程度上來講,大數(shù)據(jù)考驗(yàn)的并不是統(tǒng)計(jì)學(xué)的方法論,而是計(jì)算機(jī)科學(xué)技術(shù)和算法的適應(yīng)性。譬如大數(shù)據(jù)的存儲、管理以及分析架構(gòu),這些都是技術(shù)上的應(yīng)對,是如何實(shí)現(xiàn)統(tǒng)計(jì)分析的輔助工具,核心的數(shù)據(jù)分析邏輯并沒有實(shí)質(zhì)性的改變。因此,就目前而言,大數(shù)據(jù)分析的關(guān)鍵是計(jì)算機(jī)技術(shù)如何更新升級來適應(yīng)這種變革,以便可以像從前一樣滿足統(tǒng)計(jì)分析的需要。
(三)應(yīng)用維度
在商業(yè)應(yīng)用領(lǐng)域,數(shù)據(jù)科學(xué)被定義為,將數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的商業(yè)信息①的完整過程。數(shù)據(jù)科學(xué)家要同時(shí)具備數(shù)據(jù)分析技術(shù)和商業(yè)敏感性等綜合技能。換句話說,數(shù)據(jù)科學(xué)家不僅要了解數(shù)據(jù)的來源、類型和存儲調(diào)用方式,而且還要知曉如何選擇相應(yīng)的分析方法,同時(shí)對分析結(jié)果也能做出切合實(shí)際的解釋②。這實(shí)際上提出了兩個(gè)層面的要求:①長期目標(biāo)是數(shù)據(jù)科學(xué)家從一開始就應(yīng)該熟悉整個(gè)數(shù)據(jù)分析流程,而不是數(shù)據(jù)庫、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、經(jīng)濟(jì)學(xué)、商業(yè)分析等片段化碎片化的知識。②短期目標(biāo)實(shí)際上是一個(gè)“二級定義”,即,鼓勵已經(jīng)在專業(yè)領(lǐng)域內(nèi)有所成就的統(tǒng)計(jì)學(xué)家、程序員、商業(yè)分析師相互學(xué)習(xí)。在提及數(shù)據(jù)科學(xué)的相關(guān)文獻(xiàn)中,對應(yīng)用領(lǐng)域有更多的傾向;數(shù)據(jù)科學(xué)與統(tǒng)計(jì)學(xué)、數(shù)學(xué)等其他學(xué)科的區(qū)別恰在于其更傾向于實(shí)際應(yīng)用。甚至有觀點(diǎn)認(rèn)為,數(shù)據(jù)科學(xué)是為應(yīng)對大數(shù)據(jù)現(xiàn)象而專門設(shè)定的一個(gè)“職業(yè)”。其中,商業(yè)敏感性是數(shù)據(jù)科學(xué)家區(qū)別于一般統(tǒng)計(jì)人員的基本素質(zhì)。對數(shù)據(jù)的簡單收集和報(bào)告不是數(shù)據(jù)科學(xué)的要義,數(shù)據(jù)科學(xué)強(qiáng)調(diào)對數(shù)據(jù)多角度的理解,以及如何就大數(shù)據(jù)提出相關(guān)的問題(很多重要的問題,我們非但不知道答案而且不知道問題何在以及如何發(fā)問)。同時(shí)數(shù)據(jù)科學(xué)家要有良好的表達(dá)能力,能將數(shù)據(jù)中所發(fā)現(xiàn)的事實(shí)清楚地表達(dá)給相關(guān)部門以便實(shí)現(xiàn)有效協(xié)作。從商業(yè)應(yīng)用和服務(wù)社會的角度來看,強(qiáng)調(diào)應(yīng)用這個(gè)維度無可厚非,因?yàn)榇颂幨菙?shù)據(jù)產(chǎn)生的土壤,符合數(shù)據(jù)科學(xué)數(shù)據(jù)導(dǎo)向的理念,數(shù)據(jù)分析的目的很大程度上也是為了增進(jìn)商業(yè)理解,而且包括數(shù)據(jù)科學(xué)家、首席信息官這些提法也都肇始于實(shí)務(wù)部門。不過,早在20世紀(jì)90年代中期,已故圖靈獎得主格雷(JimGray)就已經(jīng)意識到,數(shù)據(jù)庫技術(shù)的下一個(gè)“大數(shù)據(jù)”挑戰(zhàn)將會來自科學(xué)領(lǐng)域而非商業(yè)領(lǐng)域(科學(xué)研究領(lǐng)域成為產(chǎn)生大數(shù)據(jù)的重要土壤)。2008年9月4日刊出的《自然》以“bigdata”作為專題(封面)探討了環(huán)境科學(xué)、生物醫(yī)藥、互聯(lián)網(wǎng)技術(shù)等領(lǐng)域所面臨的大數(shù)據(jù)挑戰(zhàn)。2011年2月11日,《科學(xué)》攜其子刊《科學(xué)-信號傳導(dǎo)》、《科學(xué)-轉(zhuǎn)譯醫(yī)學(xué)》、《科學(xué)-職業(yè)》專門就日益增長的科學(xué)研究數(shù)據(jù)進(jìn)行了廣泛的討論。格雷還進(jìn)一步提出科學(xué)研究的“第四范式”是數(shù)據(jù)(數(shù)據(jù)密集型科學(xué)),不同于實(shí)驗(yàn)、理論、和計(jì)算這三種范式,在該范式下,需要“將計(jì)算用于數(shù)據(jù),而非將數(shù)據(jù)用于計(jì)算”。這種觀點(diǎn)實(shí)際上是將數(shù)據(jù)從計(jì)算科學(xué)中單獨(dú)區(qū)別開來了。
三、數(shù)據(jù)科學(xué)范式對統(tǒng)計(jì)分析過程的直接影響
以前所謂的大規(guī)模數(shù)據(jù)都是封閉于一個(gè)機(jī)構(gòu)內(nèi)的(數(shù)據(jù)孤島),而大數(shù)據(jù)注重的是數(shù)據(jù)集間的關(guān)聯(lián)關(guān)系,也可以說大數(shù)據(jù)讓孤立的數(shù)據(jù)形成了新的聯(lián)系,是一種整體的、系統(tǒng)的觀念。從這個(gè)層面來說,將大數(shù)據(jù)稱為“大融合數(shù)據(jù)”或許更為恰當(dāng)。事實(shí)上,孤立的大數(shù)據(jù),其價(jià)值十分有限,大數(shù)據(jù)的革新恰在于它與傳統(tǒng)數(shù)據(jù)的結(jié)合、線上和線下數(shù)據(jù)的結(jié)合,當(dāng)放到更大的環(huán)境中所產(chǎn)生的“1+1>2”的價(jià)值。譬如消費(fèi)行為記錄與企業(yè)生產(chǎn)數(shù)據(jù)結(jié)合,移動通訊基站定位數(shù)據(jù)用于優(yōu)化城市交通設(shè)計(jì),微博和社交網(wǎng)絡(luò)數(shù)據(jù)用于購物推薦,搜索數(shù)據(jù)用于流感預(yù)測、利用社交媒體數(shù)據(jù)監(jiān)測食品價(jià)等等。特別是數(shù)據(jù)集之間建立的均衡關(guān)系,一方面無形中增強(qiáng)了對數(shù)據(jù)質(zhì)量的監(jiān)督和約束;另一方面,為過去難以統(tǒng)計(jì)的指標(biāo)和變量提供了另辟蹊徑的思路。從統(tǒng)計(jì)學(xué)的角度來看,數(shù)據(jù)科學(xué)(大數(shù)據(jù))對統(tǒng)計(jì)分析過程的各個(gè)環(huán)節(jié)(數(shù)據(jù)收集、整理、分析、評價(jià)、等)都提出了挑戰(zhàn),其中,集中表現(xiàn)在數(shù)據(jù)收集和數(shù)據(jù)分析這兩個(gè)方面。
(一)數(shù)據(jù)收集方面
在統(tǒng)計(jì)學(xué)被作為一個(gè)獨(dú)立的學(xué)科分離出來之前(1900年前),統(tǒng)計(jì)學(xué)家們就已經(jīng)開始處理大規(guī)模數(shù)據(jù)了,但是這個(gè)時(shí)期主要是全國范圍的普查登記造冊,至多是一些簡單的匯總和比較。之后(1920-1960年)的焦點(diǎn)逐漸縮聚在小規(guī)模數(shù)據(jù)(樣本),大部分經(jīng)典的統(tǒng)計(jì)方法(統(tǒng)計(jì)推斷)以及現(xiàn)代意義上的統(tǒng)計(jì)調(diào)查(抽樣調(diào)查)正是在這個(gè)時(shí)期產(chǎn)生。隨后的45年里,統(tǒng)計(jì)方法因廣泛的應(yīng)用而得到快速發(fā)展。變革再次來自于統(tǒng)計(jì)分析的初始環(huán)節(jié)———數(shù)據(jù)收集方式的轉(zhuǎn)變:傳統(tǒng)的統(tǒng)計(jì)調(diào)查方法通常是經(jīng)過設(shè)計(jì)的、系統(tǒng)收集的,而大數(shù)據(jù)是零散實(shí)錄的、有機(jī)的,這些數(shù)據(jù)通常是用戶使用電子數(shù)碼產(chǎn)品的副產(chǎn)品或用戶自行產(chǎn)生的內(nèi)容,比如社交媒體數(shù)據(jù)、搜索記錄、網(wǎng)絡(luò)日志等數(shù)據(jù)流等,而且數(shù)據(jù)隨時(shí)都在增加(數(shù)據(jù)集是動態(tài)的)。與以往大規(guī)模數(shù)據(jù)不同的是,數(shù)據(jù)來源和類型更加豐富,數(shù)據(jù)庫間的關(guān)聯(lián)性也得到了前所未有的重視(大數(shù)據(jù)的組織形式是數(shù)據(jù)網(wǎng)絡(luò)),問題也變得更加復(fù)雜。隨著移動電話和網(wǎng)絡(luò)的逐漸滲透,固定電話不再是識別住戶的有效工具變量,相應(yīng)的無回答率也在增加(移動電話的拒訪率一般高于固定電話),同時(shí)統(tǒng)計(jì)調(diào)查的成本在增加,人口的流動性在增加,隱私意識以及法律對隱私的保護(hù)日益趨緊,涉及個(gè)人信息的數(shù)據(jù)從常規(guī)調(diào)查中越來越難以取得(從各國的經(jīng)驗(yàn)來看,拒訪率或無回答率的趨勢是增加的),對時(shí)效性的要求也越來越高。因此,官方統(tǒng)計(jì)的數(shù)據(jù)來源已經(jīng)無法局限于傳統(tǒng)的統(tǒng)計(jì)調(diào)查,迫切需要整合部門行政記錄數(shù)據(jù)、商業(yè)記錄數(shù)據(jù)、個(gè)人行為記錄數(shù)據(jù)等多渠道數(shù)據(jù)源,與部門和搜索引擎服務(wù)商展開更廣泛的合作。
(二)數(shù)據(jù)分析方面
現(xiàn)代統(tǒng)計(jì)分析方法的核心是抽樣推斷(參數(shù)估計(jì)和假設(shè)檢驗(yàn)),然而數(shù)據(jù)收集方式的改變直接淡化了樣本的意義。比如基于瀏覽和偏好數(shù)據(jù)構(gòu)建的推薦算法,誠然改進(jìn)算法可以改善推薦效果,但是增加數(shù)據(jù)同樣可以達(dá)到相同的目的,甚至效果更好。即所謂的“大量的數(shù)據(jù)勝于好的算法”這與統(tǒng)計(jì)學(xué)的關(guān)鍵定律(大數(shù)定律和中心極限定理)是一致的。同樣,在大數(shù)據(jù)分析中,可以用數(shù)量來產(chǎn)生質(zhì)量,而不再需要用樣本來推斷總體。事實(shí)上,在某些場合(比如社會網(wǎng)絡(luò)數(shù)據(jù)),抽樣本身是困難的。數(shù)據(jù)導(dǎo)向的、基于算法的數(shù)據(jù)分析方法成為計(jì)算機(jī)時(shí)代統(tǒng)計(jì)學(xué)發(fā)展無法回避的一個(gè)重要趨勢。算法模型不僅對數(shù)據(jù)分布結(jié)構(gòu)有更少的限制性假定,而且在計(jì)算效率上有很大的優(yōu)勢。特別是一些積極的開源軟件的支撐,以及天生與計(jì)算機(jī)的相容性,使算法模型越來越受到學(xué)界的廣泛重視。大數(shù)據(jù)分析首先涉及到存儲、傳輸?shù)却髷?shù)據(jù)管理方面的問題。僅從數(shù)量上來看,信息爆炸、數(shù)據(jù)過剩、數(shù)據(jù)泛濫、數(shù)據(jù)墳?zāi)?、豐富的數(shù)據(jù)貧乏的知識……這些詞組表達(dá)的主要是我們匱乏的、捉襟見肘的存儲能力,同時(shí),存儲數(shù)據(jù)中有利用價(jià)值的部分卻少之又少或塵封窖藏難以被發(fā)現(xiàn)。這除了對開采工具的渴求,當(dāng)時(shí)的情緒主要還是遷怨于盲目的記錄,把過多精力放在捕捉和存儲外在信息。在這種情況下,開采有用的知識等價(jià)于拋棄無用的數(shù)據(jù)。然而,大數(shù)據(jù)時(shí)代的思路改變了,開始變本加厲巨細(xì)靡遺地記錄一切可以記錄的數(shù)據(jù)。因?yàn)?數(shù)據(jù)再怎么拋棄還是會越來越多。我們不能通過刪減數(shù)據(jù)來適應(yīng)自己的無能,為自己不愿做出改變找借口,而是應(yīng)該面對現(xiàn)實(shí),提高處理海量數(shù)據(jù)的能力。退一步,該刪除哪些數(shù)據(jù)呢?當(dāng)前無用的數(shù)據(jù)將來也無用嗎?顯然刪除數(shù)據(jù)的成本要大于存儲的成本。大數(shù)據(jù)存儲目前廣泛應(yīng)用的是GFS、HDFS等基于計(jì)算機(jī)群組的文件系統(tǒng),它可以通過簡單增加計(jì)算機(jī)來無限地?cái)U(kuò)充存儲能力。值得注意的是,分布式文件系統(tǒng)存儲的數(shù)據(jù)僅僅是整個(gè)架構(gòu)中最基礎(chǔ)的描述,是為其他部件服務(wù)的(比如MapReduce),并不能直接用于統(tǒng)計(jì)分析。而NoSQL這類分布式存儲系統(tǒng)可以實(shí)現(xiàn)高級查詢語言,事實(shí)上,有些RDBMS開始借鑒MapReduce的一些思路,而基于MapReduce的高級查詢語言也使MapReduce更接近傳統(tǒng)的數(shù)據(jù)庫編程,二者的差異將變得越來越模糊。大數(shù)據(jù)分析的可行性問題指的是,數(shù)據(jù)量可能大到已經(jīng)超過了目前的存儲能力,或者盡管沒有大到無法存儲,但是如果算法對內(nèi)存和處理器要求很高,那么數(shù)據(jù)相對也就“大”了。換句話說,可行性問題主要是,數(shù)據(jù)量太大了,或者算法的復(fù)雜度太高。大數(shù)據(jù)分析的有效性問題指的是,盡管目前的硬件條件允許,但是耗時(shí)太久,無法在可容忍的或者說可以接受的時(shí)間范圍內(nèi)完成。目前對有效性的解決辦法是采用并行處理。注意到,高性能計(jì)算和網(wǎng)格計(jì)算也是并行處理,但是對于大數(shù)據(jù)而言,由于很多節(jié)點(diǎn)需要訪問大量數(shù)據(jù),因此很多計(jì)算節(jié)點(diǎn)會因?yàn)榫W(wǎng)絡(luò)帶寬的限制而不得不空閑等待。而MapReduce會盡量在計(jì)算節(jié)點(diǎn)上存儲數(shù)據(jù),以實(shí)現(xiàn)數(shù)據(jù)的本地快速訪問。因此,數(shù)據(jù)本地化是MapReduce的核心特征。
四、結(jié)論
(一)數(shù)據(jù)科學(xué)不能簡單地理解為統(tǒng)計(jì)學(xué)的重命名,二者所指“數(shù)據(jù)”并非同一概念,前者更為寬泛,不僅包括結(jié)構(gòu)型數(shù)據(jù),而且還包括文本、圖像、視頻、音頻、網(wǎng)絡(luò)日志等非結(jié)構(gòu)型和半結(jié)構(gòu)型數(shù)據(jù);同時(shí),數(shù)量級也是后者難以企及的(PB以上)。但是數(shù)據(jù)科學(xué)的理論基礎(chǔ)是統(tǒng)計(jì)學(xué),數(shù)據(jù)科學(xué)可以看作是統(tǒng)計(jì)學(xué)在研究范圍(對象)和分析方法上不斷擴(kuò)展的結(jié)果,特別是數(shù)據(jù)導(dǎo)向的、基于算法的數(shù)據(jù)分析方法越來越受到學(xué)界的廣泛重視。
(二)從某種程度上來講,大數(shù)據(jù)考驗(yàn)的并不是統(tǒng)計(jì)學(xué)的方法論,而是計(jì)算機(jī)科學(xué)技術(shù)和算法的適應(yīng)性。譬如大數(shù)據(jù)的存儲、管理以及分析架構(gòu),這些都是技術(shù)上的應(yīng)對,核心的數(shù)據(jù)分析邏輯并沒有實(shí)質(zhì)性的改變。因此,大數(shù)據(jù)分析的關(guān)鍵是計(jì)算機(jī)技術(shù)如何更新升級以適應(yīng)這種變革,以便可以像從前一樣滿足統(tǒng)計(jì)分析的需要。
(三)大數(shù)據(jù)問題很大程度上來自于商業(yè)領(lǐng)域,受商業(yè)利益驅(qū)動,因此數(shù)據(jù)科學(xué)還被普遍定義為,將數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的商業(yè)信息的完整過程。這種強(qiáng)調(diào)應(yīng)用維度的觀點(diǎn)無可厚非,因?yàn)榇颂幨菙?shù)據(jù)產(chǎn)生的土壤,符合數(shù)據(jù)科學(xué)數(shù)據(jù)導(dǎo)向的理念。不過,早在20世紀(jì)90年代中期,已故圖靈獎得主格雷就已經(jīng)意識到,數(shù)據(jù)庫技術(shù)的下一個(gè)“大數(shù)據(jù)”挑戰(zhàn)將會來自科學(xué)領(lǐng)域而非商業(yè)領(lǐng)域(科學(xué)研究領(lǐng)域成為產(chǎn)生大數(shù)據(jù)的重要土壤)。他提出科學(xué)研究的“第四范式”是數(shù)據(jù),不同于實(shí)驗(yàn)、理論、和計(jì)算這三種范式,在該范式下,需要“將計(jì)算用于數(shù)據(jù),而非將數(shù)據(jù)用于計(jì)算”。這種觀點(diǎn)實(shí)際上將數(shù)據(jù)從計(jì)算科學(xué)中單獨(dú)區(qū)別開了。
(四)數(shù)據(jù)科學(xué)范式對統(tǒng)計(jì)分析過程的各個(gè)環(huán)節(jié)都提出了挑戰(zhàn),集中表現(xiàn)在數(shù)據(jù)收集和數(shù)據(jù)分析這兩個(gè)方面。數(shù)據(jù)收集不再是刻意的、經(jīng)過設(shè)計(jì)的,而更多的是用戶使用電子數(shù)碼產(chǎn)品的副產(chǎn)品或用戶自行產(chǎn)生的內(nèi)容,這種改變的直接影響是淡化了樣本的意義,同時(shí)增進(jìn)了數(shù)據(jù)的客觀性。事實(shí)上,在某些場合(比如社會網(wǎng)絡(luò)數(shù)據(jù)),抽樣本身是困難的。數(shù)據(jù)的存儲和分析也不再一味地依賴于高性能計(jì)算機(jī),而是轉(zhuǎn)向由中低端設(shè)備構(gòu)成的大規(guī)模群組并行處理,采用橫向擴(kuò)展的方式。
【關(guān)鍵詞】經(jīng)濟(jì)類非統(tǒng)計(jì)專業(yè) 統(tǒng)計(jì)學(xué)教學(xué)
統(tǒng)計(jì)學(xué)是一門研究統(tǒng)計(jì)活動規(guī)律和方法的方法論科學(xué)。統(tǒng)計(jì)學(xué)是經(jīng)濟(jì)類各專業(yè)的主要課程或主干學(xué)科,幾乎所有的專業(yè)都把統(tǒng)計(jì)學(xué)作為一門專業(yè)基礎(chǔ)課來開設(shè),以便為學(xué)生進(jìn)行專業(yè)研究時(shí)提供一種可行的定量分析工具。而面對不同層次的教學(xué)對象,不同專業(yè)的教學(xué)需求,統(tǒng)計(jì)學(xué)課程教學(xué)過程面臨諸多挑戰(zhàn)。
一、教學(xué)中存在的一些困難與問題
統(tǒng)計(jì)學(xué)實(shí)際教學(xué)效果并不理想,不少學(xué)生認(rèn)為統(tǒng)計(jì)學(xué)概念多,公式多,十分枯燥,比較難學(xué),并且在實(shí)際中沒什么用處。本文主要從一個(gè)教師的角度對目前經(jīng)濟(jì)類非統(tǒng)計(jì)專業(yè)的統(tǒng)計(jì)學(xué)教學(xué)存在的問題進(jìn)行探討。
(1)對于非統(tǒng)計(jì)專業(yè)的學(xué)生來說,他們本身的專業(yè)課學(xué)習(xí)負(fù)擔(dān)已經(jīng)不輕, 加上對統(tǒng)計(jì)知識的認(rèn)識不夠, 讓他們騰出更多的時(shí)間來學(xué)習(xí)統(tǒng)計(jì)知識是很難做到的。 而且,由于其本專業(yè)的課程體系要求,學(xué)生本身的數(shù)學(xué)基礎(chǔ)特別是概率論知識學(xué)得又不是很好,這就使得他們感到統(tǒng)計(jì)學(xué)知識難以理解,出現(xiàn)了統(tǒng)計(jì)難學(xué)的看法,最終導(dǎo)致一些學(xué)生徹底放棄。 這樣,學(xué)生在認(rèn)識不到統(tǒng)計(jì)知識用處的情況下, 所學(xué)又和實(shí)際結(jié)合不緊密。 容易產(chǎn)生學(xué)統(tǒng)計(jì)無用的想法,學(xué)習(xí)興趣不高,以至于被迫學(xué)習(xí),教學(xué)效果不佳。
(2)在實(shí)際教學(xué)中,由于各種條件所限,教學(xué)方式還局限在傳統(tǒng)的教學(xué)手段上。隨著計(jì)算機(jī)的普及, 有關(guān)數(shù)據(jù)處理的軟件也越來越多,統(tǒng)計(jì)學(xué)的教學(xué)手段也應(yīng)該日新月異。 多媒體教學(xué)使得教學(xué)信息量有所增加, 但是并沒有改變傳統(tǒng)的教師講、學(xué)生聽的教學(xué)方式,往往是一節(jié)課下來,教師講的嗓子冒煙,學(xué)生聽得直打瞌睡,究其原因還在于過于單一的教學(xué)手段, 使得學(xué)生不能直接參與到教學(xué)中去。
(3)教學(xué)定位不清楚。統(tǒng)計(jì)學(xué)教學(xué)分為統(tǒng)計(jì)學(xué)專業(yè)的統(tǒng)計(jì)學(xué)教學(xué)和非統(tǒng)計(jì)專業(yè)的統(tǒng)計(jì)學(xué)教學(xué)。對統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生而言要求他們掌握一整套系統(tǒng)的統(tǒng)計(jì)學(xué)分析方法,以便將來專門進(jìn)行有關(guān)數(shù)據(jù)的研究;而對絕大多數(shù)非統(tǒng)計(jì)專業(yè)的學(xué)生來說,學(xué)習(xí)統(tǒng)計(jì)學(xué)主要是為他們提供一種統(tǒng)計(jì)學(xué)的思想, 在信息社會,如何辨別信息的真?zhèn)?,做出判斷和決策,這都需要他們具備一些統(tǒng)計(jì)學(xué)的思想;其次是給他們提供一些實(shí)用的數(shù)據(jù)處理方法。 可是不少學(xué)校的非統(tǒng)計(jì)教學(xué)由于定位不清楚, 導(dǎo)致教學(xué)過程中還是充斥著大量的公式推導(dǎo)和概念闡述,如不少統(tǒng)計(jì)學(xué)教材上大篇幅介紹統(tǒng)計(jì)圖表, 并對其進(jìn)行比較, 可是對于如何利用計(jì)算機(jī)軟件畫出這些圖表卻沒有闡述。 其結(jié)果是學(xué)生學(xué)完了統(tǒng)計(jì)學(xué)后只記得一些概念,而具體如何收集、整理、分析數(shù)據(jù),并做出圖表卻一無所知, 結(jié)果是不少學(xué)生得出《統(tǒng)計(jì)學(xué)》難學(xué)也沒什么用的結(jié)論。
二、教學(xué)方法與教學(xué)手段的更新
(1)合理地安排教學(xué)內(nèi)容
經(jīng)濟(jì)類非統(tǒng)計(jì)專業(yè)統(tǒng)計(jì)學(xué)教學(xué)的主要目的是通過學(xué)習(xí)統(tǒng)計(jì)學(xué)使學(xué)生具備在隨機(jī)性事物中尋找規(guī)律的能力,以及懂得如何在生活、學(xué)習(xí)、工作中運(yùn)用統(tǒng)計(jì)學(xué)知識。 因此在教學(xué)內(nèi)容的選擇上也應(yīng)該有所取舍。整個(gè)統(tǒng)計(jì)學(xué)的教學(xué)應(yīng)該按照收集數(shù)據(jù)、整理數(shù)據(jù)和分析數(shù)據(jù)的步驟進(jìn)行。其主要內(nèi)容還是包括描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)兩部分,而重點(diǎn)應(yīng)加以調(diào)整,應(yīng)以推斷統(tǒng)計(jì)為主,描述統(tǒng)計(jì)為輔。 在描述統(tǒng)計(jì)部分,著重介紹搜集、整理、分析數(shù)據(jù)的方法。 在推斷統(tǒng)計(jì)部分,不僅要介紹抽樣推斷、參數(shù)估計(jì)、假設(shè)檢驗(yàn)、方差分析和回歸分析,還應(yīng)該介紹關(guān)于統(tǒng)計(jì)決策、多元統(tǒng)計(jì)分析和非參數(shù)統(tǒng)計(jì)等現(xiàn)代統(tǒng)計(jì)方法。 計(jì)算機(jī)的飛速發(fā)展給統(tǒng)計(jì)學(xué)的發(fā)展帶來了前所未有的突破。 統(tǒng)計(jì)學(xué)常用的軟件是 Excel 和 SPSS, 為了讓學(xué)生更多了解統(tǒng)計(jì)學(xué)方法在實(shí)際中的應(yīng)用,因此實(shí)踐課程的加入是必須的。實(shí)踐課程中介紹這些軟件的使用方法, 使得統(tǒng)計(jì)學(xué)不在是高高在上的陽春白雪,成為可以隨時(shí)接觸的、使用的工具。
(2)采用多樣化的教學(xué)手段
統(tǒng)計(jì)學(xué)能否引起學(xué)生的興趣 ,教學(xué)手段多樣化也是一個(gè)關(guān)鍵的因素。 因此,當(dāng)務(wù)之急是改變當(dāng)前單一的教學(xué)手段,使用多樣化的教學(xué)手段。 首先,在教學(xué)過程中,將傳統(tǒng)的“灌輸式”教學(xué)轉(zhuǎn)變?yōu)椤皢l(fā)式”教學(xué)。 充分調(diào)動學(xué)生的積極性,在課堂中應(yīng)將講授式教學(xué)法、啟發(fā)式教學(xué)法和討論式教學(xué)法相結(jié)合,相互取長補(bǔ)短,以達(dá)到更好的效果。其次,由于統(tǒng)計(jì)學(xué)內(nèi)容的繁多與復(fù)雜,適當(dāng)加入學(xué)生的環(huán)節(jié)可以增強(qiáng)學(xué)習(xí)的主動性。例如讓學(xué)生用軟件設(shè)計(jì)問卷, 對自己收集的數(shù)據(jù)進(jìn)行簡單的分析,寫出分析報(bào)告。 最后,統(tǒng)計(jì)學(xué)是一門實(shí)踐性、應(yīng)用性很強(qiáng)的學(xué)科,應(yīng)該加強(qiáng)教師和學(xué)生之間的互動和交流, 因此在教學(xué)中利用計(jì)算機(jī)輔助教學(xué),加大實(shí)踐教學(xué)的比重。 這樣,既便于進(jìn)行案例教學(xué)、小組討論,也便于調(diào)動學(xué)生學(xué)習(xí)的積極性,使每個(gè)學(xué)生都能參與到教學(xué)中去,真正做到“教學(xué)相長”。
(3)部分內(nèi)容采用實(shí)踐教學(xué)和靈活的考核方式
單純的筆試往往使學(xué)生認(rèn)為考試為大, 別的都是次要的,重點(diǎn)在于考試前死記硬背,而對于是否掌握知識沒有興趣。實(shí)踐教學(xué)一定比例的加入必然要求考核方式的多樣化。 因此,單純進(jìn)行筆試考試改革勢在必行。并且統(tǒng)計(jì)學(xué)中的一些內(nèi)容,例如推斷分析、方差分析和回歸分析等不借助計(jì)算機(jī)很難在筆試中實(shí)現(xiàn)甚至沒辦法實(shí)現(xiàn),導(dǎo)致的結(jié)果是重要內(nèi)容沒辦法考,能考的內(nèi)容有可能反而不重要。 因此,必須采用靈活多樣的考核方式,尤其是以實(shí)踐教學(xué)為主的考核方式勢在必行。
三、結(jié)語
總之,在對經(jīng)濟(jì)類非統(tǒng)計(jì)專業(yè)的統(tǒng)計(jì)學(xué)教學(xué)中,教師應(yīng)充分調(diào)動學(xué)生學(xué)習(xí)的積極性。 不僅需要教師在選擇教學(xué)內(nèi)容的時(shí)候要緊密聯(lián)系實(shí)際, 還要求教師要全方位的展示統(tǒng)計(jì)學(xué)的魅力,增加實(shí)踐課時(shí),讓學(xué)生充分理解統(tǒng)計(jì)無處不在、無處不用。 其次, 教學(xué)手段與方式的選擇也起到事半功倍的作用。 統(tǒng)計(jì)軟件的應(yīng)用、統(tǒng)計(jì)案例的講解,完全可以使統(tǒng)計(jì)學(xué)成為人人喜歡學(xué)習(xí)的一門數(shù)據(jù)處理的工具。
參考文獻(xiàn):
[1]王來栓.財(cái)經(jīng)院校非統(tǒng)計(jì)專業(yè)統(tǒng)計(jì)學(xué)教學(xué)法探討,內(nèi)蒙古統(tǒng)計(jì)[J].2013(06).
[2]董瑞.]經(jīng)管類專業(yè)統(tǒng)計(jì)學(xué)教學(xué)改革的背景與設(shè)想.河南科技學(xué)院學(xué)報(bào)[J].20 l1(06).
關(guān)鍵詞:經(jīng)濟(jì)管理類專業(yè) 統(tǒng)計(jì)學(xué)教材 統(tǒng)計(jì)軟件
一、引言
統(tǒng)計(jì)學(xué)作為一門搜集數(shù)據(jù)、整理數(shù)據(jù)、展示數(shù)據(jù)、分析數(shù)據(jù)的方法論學(xué)科,在當(dāng)今社會的各個(gè)領(lǐng)域得到了越來越廣泛的應(yīng)用,在我國各高等院校也日益受到重視,幾乎所有的經(jīng)濟(jì)、管理類專業(yè)都把統(tǒng)計(jì)學(xué)作為學(xué)科基礎(chǔ)課來開設(shè),使之成為本專業(yè)定量分析的工具??墒菗?jù)我十多年的統(tǒng)計(jì)學(xué)教學(xué)實(shí)踐和調(diào)查結(jié)果來看,目前統(tǒng)計(jì)學(xué)在高校的開課效果并不理想,多數(shù)學(xué)生反映統(tǒng)計(jì)學(xué)公式多、計(jì)算量大、內(nèi)容枯燥,還有不少同學(xué)對統(tǒng)計(jì)學(xué)存在畏懼心理,統(tǒng)計(jì)學(xué)也成為目前高校不及格率最高的科目之一。造成目前這種狀況的原因很多,但目前國內(nèi)的統(tǒng)計(jì)學(xué)教材的“可讀性”差,讀起來“味同嚼蠟”應(yīng)該是一個(gè)主要的原因。本文對當(dāng)前經(jīng)濟(jì)、管理類專業(yè)的統(tǒng)計(jì)學(xué)教材存在的一些問題進(jìn)行探討。
二、目前統(tǒng)計(jì)學(xué)教材存在的主要問題
目前市面上國內(nèi)編著的經(jīng)濟(jì)、管理類的統(tǒng)計(jì)學(xué)教材數(shù)量繁多,其名字也五花八門,如:《統(tǒng)計(jì)學(xué)原理》《統(tǒng)計(jì)學(xué)基礎(chǔ)》《統(tǒng)計(jì)學(xué)》《經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》《管理統(tǒng)計(jì)學(xué)》等。據(jù)我調(diào)查,目前武漢市書店在售的這類圖書不下三十種。雖然數(shù)目眾多,但翻開一看,就會發(fā)現(xiàn)這些書的內(nèi)容大同小異,和國外的統(tǒng)計(jì)學(xué)教材相比,對學(xué)生的吸引力不強(qiáng)。經(jīng)過綜合,我認(rèn)為國內(nèi)的統(tǒng)計(jì)學(xué)教材主要存在以下問題。
(一)內(nèi)容陳舊。
如今的經(jīng)濟(jì)、管理類統(tǒng)計(jì)學(xué)教材由以前的只介紹描述統(tǒng)計(jì)變成既有描述又有推斷統(tǒng)計(jì)的大統(tǒng)計(jì)學(xué)??墒欠_現(xiàn)有的統(tǒng)計(jì)學(xué)教材,就會發(fā)現(xiàn)不少已經(jīng)過時(shí)的描述統(tǒng)計(jì)學(xué)的概念比比皆是,學(xué)生平時(shí)在生活、學(xué)習(xí)中幾乎用不上。如不少教材里的第一章緒論部分重點(diǎn)介紹“標(biāo)志”和“指標(biāo)”這對概念,花很大篇幅來介紹兩者的聯(lián)系和區(qū)別,但這對概念在后續(xù)的數(shù)據(jù)分析中幾乎用不到;在“后續(xù)統(tǒng)計(jì)調(diào)查”這章中,對統(tǒng)計(jì)報(bào)表、重點(diǎn)調(diào)查和典型調(diào)查這些方法也是花了不少篇幅來介紹,而這些在計(jì)劃經(jīng)濟(jì)條件下使用的調(diào)查方法現(xiàn)在很少采用;另外,目前不少教材保留了“指數(shù)”一章,詳細(xì)介紹了編制指數(shù)的兩種方法,而這些內(nèi)容由于內(nèi)容繁雜,應(yīng)用面窄,除了專門的統(tǒng)計(jì)調(diào)查人員,一般人根本沒有必要掌握,只需要了解其基本含義。由此可見,目前國內(nèi)統(tǒng)計(jì)學(xué)教材內(nèi)容陳舊,教材中對廣大讀者用處不大的資源占用了大量的篇幅,而一些實(shí)用性很強(qiáng)的內(nèi)容,如參數(shù)估計(jì)、假設(shè)檢驗(yàn)及多元回歸則放在教材后面簡單介紹,由于學(xué)時(shí)有限,很多老師在課堂上只是簡單地提一下,其結(jié)果是學(xué)生用這樣的教材根本學(xué)不到有用的知識。
(二)概念、公式多,案例少。
目前很多學(xué)生并不需要學(xué)量系統(tǒng)的統(tǒng)計(jì)學(xué)知識,而只需要能用簡單、實(shí)用的統(tǒng)計(jì)學(xué)方法來辨別、處理出現(xiàn)的定量分析問題,并且能夠利用統(tǒng)計(jì)學(xué)軟件自己解決一部分,當(dāng)自己不能解決時(shí)知道到哪里尋求幫助就行了。因此統(tǒng)計(jì)學(xué)教材的主要任務(wù)是教會他們統(tǒng)計(jì)學(xué)的主要思想,學(xué)會用統(tǒng)計(jì)分析方法解決實(shí)際問題。基于這種目的,統(tǒng)計(jì)學(xué)教材應(yīng)偏重實(shí)際應(yīng)用,多引入生活中常見的實(shí)例或案例,不知不覺地把讀者引入統(tǒng)計(jì)學(xué)專業(yè)知識的殿堂。但是目前的統(tǒng)計(jì)學(xué)教材一般都是先介紹理論、概念,再給出公式及其推導(dǎo)過程,最后才結(jié)合實(shí)踐進(jìn)行舉例,而且大量繁瑣的數(shù)學(xué)推導(dǎo)占了很大的篇幅,而經(jīng)濟(jì)、管理類專業(yè)的學(xué)生大多數(shù)是文科生,數(shù)學(xué)底子差,大量的公式推導(dǎo)往往讓他們望而卻步。而與大量公式相對應(yīng),國內(nèi)現(xiàn)有的經(jīng)濟(jì)、管理類的統(tǒng)計(jì)學(xué)教材有關(guān)經(jīng)濟(jì)、管理的統(tǒng)計(jì)案例很少,大部分是過于簡單的設(shè)例,或是“編寫”的案例,甚至是若干年以前在自然科學(xué)領(lǐng)域內(nèi)應(yīng)用的陳舊的案例,與現(xiàn)實(shí)的經(jīng)濟(jì)、管理工作嚴(yán)重脫節(jié)。國內(nèi)統(tǒng)計(jì)學(xué)教材這種重理論學(xué)習(xí)和公式推導(dǎo),輕結(jié)合實(shí)際案例的特點(diǎn),使得本該妙趣橫生的統(tǒng)計(jì)學(xué)在學(xué)生眼里課程變得晦澀難懂、枯燥乏味。
(三)實(shí)用性不強(qiáng)。
統(tǒng)計(jì)學(xué)作為一門實(shí)用性很強(qiáng)的方法論學(xué)科,是和計(jì)算機(jī)以及統(tǒng)計(jì)軟件緊緊地聯(lián)系在一起,任何統(tǒng)計(jì)學(xué)方法都可以在統(tǒng)計(jì)學(xué)軟件上操作完成,目前常用的統(tǒng)計(jì)學(xué)軟件有SAS、STATISTIC、MINITAB、SPSS和EXCEL,對于經(jīng)濟(jì)管理專業(yè)的學(xué)生來說,SPSS和EXCEL都是操作起來相當(dāng)簡單方便的統(tǒng)計(jì)學(xué)軟件。目前國內(nèi)的統(tǒng)計(jì)學(xué)教材只是介紹統(tǒng)計(jì)學(xué)原理和方法,而如何應(yīng)用統(tǒng)計(jì)軟件來解決具體問題則沒有系統(tǒng)的介紹,如Excel制作圖、表的功能很強(qiáng)大,展示數(shù)據(jù)常用的直方圖、條形圖、餅圖、環(huán)形圖利用Excel都可以做得很漂亮,可是不少教材只是介紹什么是直方圖和條形圖,兩者有何區(qū)別,而具體如何利用軟件作圖則只字未提;時(shí)間數(shù)列分析、多元回歸分析等內(nèi)容涉及的數(shù)據(jù)都很多,不借助統(tǒng)計(jì)軟件根本沒法完成,因此很多教材也只是介紹概念和方法,老師在課上也只簡單介紹方法,不給學(xué)生講授如何應(yīng)用統(tǒng)計(jì)軟件來解決具體問題,這使得學(xué)生學(xué)完這門課后實(shí)際分析問題的能力沒有得到鍛煉,學(xué)生在學(xué)習(xí)后續(xù)課程或撰寫畢業(yè)論文時(shí),抱怨統(tǒng)計(jì)學(xué)只是學(xué)了很多不會用,也不知怎么用的概念和公式。
三、對策分析
統(tǒng)計(jì)學(xué)教材的質(zhì)量普遍不高,反映了當(dāng)前我國定量分析問題的能力還有待提高。要解決這一問題,我覺得重點(diǎn)應(yīng)從以下幾方面著手。
(一)加大對從事統(tǒng)計(jì)學(xué)教學(xué)的教師的培訓(xùn)力度。
統(tǒng)計(jì)學(xué)教材是統(tǒng)計(jì)學(xué)教師教學(xué)實(shí)踐的結(jié)晶。目前國內(nèi)統(tǒng)計(jì)學(xué)教材質(zhì)量不高的根本原因在于從事統(tǒng)計(jì)學(xué)教學(xué)教師的統(tǒng)計(jì)學(xué)能力有所欠缺。從事經(jīng)濟(jì)、管理類統(tǒng)計(jì)學(xué)教學(xué)的教師不僅要熟練地掌握統(tǒng)計(jì)學(xué)方法和統(tǒng)計(jì)軟件的使用技巧,還要對經(jīng)濟(jì)、管理有一定的了解,并了解統(tǒng)計(jì)學(xué)在經(jīng)濟(jì)、管理中的使用??墒菗?jù)我對武漢市高校的調(diào)查統(tǒng)計(jì),不少學(xué)校從事經(jīng)濟(jì)、管理統(tǒng)計(jì)學(xué)教學(xué)的教師都是學(xué)習(xí)經(jīng)濟(jì)、管理的,他們對統(tǒng)計(jì)學(xué)方法和統(tǒng)計(jì)軟件的使用并不熟悉,因此編出來的教材其質(zhì)量也是可想而知。雖然一部分老師是統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)的,但絕大多數(shù)是學(xué)經(jīng)濟(jì)統(tǒng)計(jì)的,對推斷統(tǒng)計(jì)和統(tǒng)計(jì)軟件的使用并不精通。另外還有一小部分老師是學(xué)數(shù)理統(tǒng)計(jì)專業(yè)的,他們對統(tǒng)計(jì)學(xué)方法進(jìn)行過系統(tǒng)的學(xué)習(xí),可是由于對于經(jīng)濟(jì)、管理了解甚少,因此沒法和經(jīng)濟(jì)、管理的實(shí)際案例相結(jié)合,而只是像講數(shù)學(xué)一樣,著重公式的推導(dǎo)。因此要改變這種狀況,各校首先要加大對統(tǒng)計(jì)學(xué)重要性的認(rèn)識,其次要拿出切實(shí)可行的方案來對從事統(tǒng)計(jì)學(xué)教學(xué)的教師進(jìn)行全方位的培訓(xùn),使得他們具備從事統(tǒng)計(jì)學(xué)教學(xué)的專業(yè)水平,這樣才有可能從根本上改變統(tǒng)計(jì)學(xué)教材吸引不了學(xué)生的現(xiàn)狀。
(二)借鑒國外優(yōu)秀統(tǒng)計(jì)學(xué)教材的經(jīng)驗(yàn)。
和國內(nèi)經(jīng)濟(jì)、管理類統(tǒng)計(jì)學(xué)教材內(nèi)容陳舊、案例匱乏、實(shí)用性不強(qiáng)和趣味性差的現(xiàn)狀相比,國外的統(tǒng)計(jì)學(xué)教材則讓人眼前一亮。國外教材非常注重實(shí)際應(yīng)用,每一部分都引入大量的生活中常見的實(shí)例或案例,不知不覺地把讀者引入統(tǒng)計(jì)專業(yè)知識的殿堂。這些教材幾乎都摒棄了繁瑣的數(shù)學(xué)推導(dǎo),大部分只介紹基本公式,少數(shù)則采用純文字描述的形式來介紹統(tǒng)計(jì)學(xué),讓沒有統(tǒng)計(jì)學(xué)基礎(chǔ)的學(xué)生也能輕松地學(xué)習(xí)統(tǒng)計(jì)學(xué)而且它們都非常詳細(xì)地介紹了如何利用統(tǒng)計(jì)軟件來進(jìn)行操作,并貫穿在各章,課后也有大量配套的習(xí)題讓讀者自己去練習(xí),以加深對統(tǒng)計(jì)學(xué)方法的理解。因此要提高目前國內(nèi)統(tǒng)計(jì)學(xué)教材的質(zhì)量,多多向國外同行學(xué)習(xí)是非常必要的,不少學(xué)校的老師直接以國外的教材作為學(xué)生的學(xué)習(xí)教材。但是完全采用國外的教材也有不少問題,如直接采用國外原版教材,對多數(shù)學(xué)生來說英文水平有待提高,而如果采用翻譯過來的教材,由于目前不少教材翻譯質(zhì)量不高,學(xué)生讀起來感覺很生澀;另外國外的教材結(jié)合的都是本國的例子,和我國的具體國情不符,學(xué)生聽起來覺得陌生。因此最好的方法是借鑒國外統(tǒng)計(jì)學(xué)教材好的體系和編排方法,同時(shí)結(jié)合本國的具體實(shí)踐,編制適合我國國慶的教材,這就需要付出更多的努力。
(三)合理安排統(tǒng)計(jì)學(xué)教材的章節(jié)設(shè)置。
如今,國內(nèi)經(jīng)管類專業(yè)“統(tǒng)計(jì)學(xué)”教材通常包括緒論、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)整理、數(shù)據(jù)的概括性描述、時(shí)間數(shù)列、抽樣分布與參數(shù)估計(jì)、相關(guān)分析與回歸分析、統(tǒng)計(jì)指數(shù)等八個(gè)部分。前面談到過有些章節(jié)的內(nèi)容陳舊,因此有必要對各章節(jié)設(shè)置進(jìn)行調(diào)整。借鑒國外統(tǒng)計(jì)學(xué)教材的經(jīng)驗(yàn),應(yīng)刪除描述統(tǒng)計(jì)的大部分內(nèi)容部分,重點(diǎn)介紹推斷統(tǒng)計(jì),即在有限的篇幅內(nèi)重點(diǎn)介紹統(tǒng)計(jì)學(xué)的精華部分。具體來說,經(jīng)濟(jì)、管理類統(tǒng)計(jì)學(xué)教材應(yīng)包括以下幾部分:數(shù)據(jù)收集、數(shù)據(jù)的圖表展示、數(shù)據(jù)的概括性度量、時(shí)間數(shù)列、參數(shù)估計(jì)和假設(shè)檢驗(yàn)、方差分析和相關(guān)與回歸。另外對章節(jié)的內(nèi)容也要進(jìn)行調(diào)整,多介紹實(shí)用性、強(qiáng)的內(nèi)容,最后應(yīng)加強(qiáng)統(tǒng)計(jì)軟件的介紹,著重可以Excel或SPSS為工具來進(jìn)行實(shí)例分析。