公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘下學(xué)習(xí)分析在教學(xué)中的應(yīng)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘下學(xué)習(xí)分析在教學(xué)中的應(yīng)用范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘下學(xué)習(xí)分析在教學(xué)中的應(yīng)用

摘要:在大數(shù)據(jù)的大背景下,學(xué)習(xí)分析成為學(xué)界研究的熱點。對于學(xué)習(xí)分析的研究,美國已經(jīng)提出預(yù)測學(xué)習(xí)者學(xué)習(xí)偏好的模型,并且根據(jù)預(yù)測結(jié)果對學(xué)習(xí)者進行自適應(yīng)引導(dǎo);國內(nèi)對于學(xué)習(xí)分析實現(xiàn)了學(xué)習(xí)者評估,并且在評估后對學(xué)習(xí)者給予干預(yù)與預(yù)警。學(xué)習(xí)分析是使用數(shù)據(jù)和模型預(yù)測學(xué)習(xí)者收獲和行為,具備處理這些信息的能力。其模型自底向上分別為數(shù)據(jù)層、機制層、結(jié)果層。學(xué)習(xí)分析首先要獲取學(xué)習(xí)者的在線學(xué)習(xí)數(shù)據(jù),而后選擇適合研究對象的算法(如決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機、K-Means聚類等)。擬提出將學(xué)習(xí)分析應(yīng)用在高校計算機教學(xué)中實證研究模型,將試驗對象分為A、B2個對照組,根據(jù)前7周學(xué)習(xí)行為進行分析與預(yù)測,并于8-11周進行學(xué)習(xí)干預(yù),最后檢驗預(yù)測結(jié)果及干預(yù)效果?;?a href="http://m.saumg.com/lunwen/sjwj/109252.html" target="_blank">數(shù)據(jù)挖掘的學(xué)習(xí)分析能夠精準支持課程教學(xué),在優(yōu)化學(xué)習(xí)任務(wù)和教學(xué)決策方面有一定的創(chuàng)新性。

關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;學(xué)習(xí)分析;計算機課程

對于學(xué)習(xí)分析的研究,致力于通過研究分析學(xué)習(xí)者本身的數(shù)據(jù)以及在學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù),激發(fā)學(xué)習(xí)者的學(xué)習(xí)興趣,優(yōu)化學(xué)習(xí)者的學(xué)習(xí)效率,改善學(xué)習(xí)者的學(xué)習(xí)環(huán)境。目前美國在這一領(lǐng)域處于領(lǐng)先地位,早在2004年,有研究者利用聚類算法對在線課程中的用戶行為進行研究,找出學(xué)習(xí)行為相近的學(xué)習(xí)者[1]。美國佐治亞州大學(xué)的研究人員對高中學(xué)習(xí)者的GPA和SAT數(shù)學(xué)成績通過判別式分析對他們的在線通識教育課程的完成情況進行預(yù)測??藏悹栐谄斩纱髮W(xué)發(fā)表的論文中,對課程管理系統(tǒng)中的數(shù)據(jù)和學(xué)習(xí)者人口統(tǒng)計信息數(shù)據(jù)利用因子分析和邏輯回歸分析方法研究出一個能預(yù)測學(xué)習(xí)者學(xué)習(xí)結(jié)果的預(yù)測模型[2]。羅梅羅等人利用數(shù)據(jù)挖掘技術(shù)在Moodle平臺上進行研究。近年來BravoAgapito等人利用C4.5決策樹規(guī)則來對在線學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)不佳表現(xiàn)進行判別分析。2007年普渡大學(xué)提出了通過對學(xué)習(xí)者的素質(zhì)評價和在線學(xué)習(xí)行為數(shù)據(jù)對學(xué)習(xí)者的成績進行預(yù)測的預(yù)測模型,并在2010年基于普度大學(xué)的Blackboard上實現(xiàn)了預(yù)測模型的開發(fā)部署,在實際使用中取得了非常好的結(jié)果。在對學(xué)習(xí)者平臺數(shù)據(jù)進行分析的同時能對學(xué)習(xí)者進行自適應(yīng)的引導(dǎo)[3]。平臺收集學(xué)習(xí)者的登陸情況,活動情況數(shù)據(jù),利用兩步聚類算法將學(xué)習(xí)者分類,再根據(jù)不同的類別進行深入探究。他們的研究結(jié)果不僅可以為每個不同的學(xué)習(xí)者提供學(xué)習(xí)的幫助,而且可以對不同的學(xué)習(xí)者群體進行深入了解。國內(nèi)對于在線學(xué)習(xí)評價及預(yù)測的主要研究為在線學(xué)習(xí)的數(shù)據(jù)監(jiān)控、采集及分析。其中復(fù)旦大學(xué)的胡運安等人提出了基于SCORM規(guī)范的網(wǎng)絡(luò)教學(xué)管理平臺上的學(xué)習(xí)者模型機器學(xué)習(xí)行為采集、分析、質(zhì)量評估方案[4];上海交通大學(xué)的申瑞民等人基于E-Learning平臺[5],搭建了一個學(xué)習(xí)行為分析和監(jiān)控系統(tǒng),通過頻繁序列挖掘到關(guān)聯(lián)規(guī)則,并通過這些規(guī)則得到學(xué)習(xí)者頻繁訪問的知識點的關(guān)聯(lián)規(guī)則,實現(xiàn)了對學(xué)習(xí)者的個性化推薦知識功能;并且通過聚類算法,從學(xué)習(xí)者的資源請求發(fā)現(xiàn)學(xué)習(xí)者的興趣愛好,將興趣愛好相同的學(xué)習(xí)者組為學(xué)習(xí)小組,構(gòu)建了個性化的學(xué)習(xí)小組;最后利用支持向量機算法,實現(xiàn)了學(xué)習(xí)評估。華東師范大學(xué)的顧小清等人總結(jié)了學(xué)習(xí)分析的技術(shù),并對其未來的應(yīng)用進行了展望[6]。東北師范大學(xué)的趙蔚、趙慧瓊等人在學(xué)習(xí)過程中進行干預(yù),能夠識別出學(xué)習(xí)者潛在的學(xué)習(xí)危機,并發(fā)出提供個性化解決方案,提高—990—學(xué)習(xí)質(zhì)量[7]。

1學(xué)習(xí)分析的概念和模型

1.1學(xué)習(xí)分析的概念

美國高等教育信息化協(xié)會將學(xué)習(xí)分析定義為:使用數(shù)據(jù)和模型預(yù)測學(xué)習(xí)者收獲和行為具備處理這些信息的能力。于2011年召開的,首屆學(xué)習(xí)分析與知識國際會議定義學(xué)習(xí)分析為:測量、收集、分析和報告關(guān)于學(xué)習(xí)者及其學(xué)習(xí)情景的數(shù)據(jù),以期了解和優(yōu)化學(xué)習(xí)和學(xué)習(xí)發(fā)生的情境[8]。新媒體聯(lián)盟也有相似的定義:利用松散耦合的數(shù)據(jù)收集工具和分析技術(shù),研究分析學(xué)習(xí)者學(xué)習(xí)參與、學(xué)習(xí)表現(xiàn)和學(xué)習(xí)過程的相關(guān)數(shù)據(jù),進而對課程教學(xué)和評價進行實時修正??梢岳斫鉃椋谠S多方面,學(xué)習(xí)分析指的是應(yīng)用于教育領(lǐng)域的“大數(shù)據(jù)”分析[9]。

1.2學(xué)習(xí)行為分析的模型

學(xué)習(xí)分析模型自底向上分別為數(shù)據(jù)層、機制層、結(jié)果層。數(shù)據(jù)層的主要作用是收集學(xué)習(xí)者產(chǎn)生或的數(shù)據(jù),進而形成行為特征庫[10];機制層負責(zé)分析行為特征庫中各因素之間的關(guān)聯(lián)與內(nèi)涵,提供預(yù)測和及時反饋;結(jié)果層最終將分析結(jié)果可視化并呈現(xiàn)給學(xué)習(xí)者、教師、家長、教學(xué)管理者,三層級持續(xù)循環(huán)迭代[11]。最終將學(xué)習(xí)分析分為社交維度、情感維度、過程維度、生理維度,從四個維度進行分析研究。

2學(xué)習(xí)分析的主要分析方法和工具

學(xué)習(xí)分析首先要獲取學(xué)習(xí)者的在線學(xué)習(xí)數(shù)據(jù)。數(shù)據(jù)的獲取主要通過網(wǎng)絡(luò)教學(xué)平臺能夠記錄的學(xué)習(xí)者學(xué)習(xí)行為數(shù)據(jù)[12],例如:學(xué)習(xí)者登錄次數(shù),在線時長,操作次數(shù),作業(yè)提交時間,互動內(nèi)容等等。利用對各大在線教育平臺的數(shù)據(jù)分析比較,來總結(jié)一般的學(xué)習(xí)平臺分析處理學(xué)習(xí)者數(shù)據(jù)的方式,通過對這些數(shù)據(jù)進行優(yōu)化,來確定研究需要的數(shù)據(jù)。后續(xù)將數(shù)據(jù)進行處理,將獲取的數(shù)據(jù)通過處理后得到更規(guī)范的、更加結(jié)構(gòu)化的,更加適合開展研究需要的數(shù)據(jù)。采用何種方法處理和分析這些數(shù)據(jù),才能讓在線學(xué)習(xí)分析工作更加科學(xué)合理,是后續(xù)研究的前提。在學(xué)習(xí)分析工具的選擇上,首先應(yīng)進行對數(shù)據(jù)處理中常用的算法和分析方法的調(diào)研,選出適合進行在線學(xué)習(xí)分析的相關(guān)算法和分析方法,了解其原理以及使用的方式,進一步理解基于大數(shù)據(jù)的學(xué)習(xí)分析過程[13],使得后續(xù)的研究能夠更加深入。在學(xué)習(xí)分析中常見的算法有:

2.1決策樹算法

決策樹算法是一種分類與回歸方法。它利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策對新數(shù)據(jù)進行分析。本質(zhì)上決策樹是通過一系列規(guī)則對數(shù)據(jù)進行分類的過程。決策樹算法構(gòu)造決策樹來發(fā)現(xiàn)數(shù)據(jù)中蘊涵的分類規(guī)則。決策樹算法在分類、預(yù)測、規(guī)則提取等領(lǐng)域都有這廣泛的應(yīng)用。在學(xué)習(xí)分析中經(jīng)常用于學(xué)習(xí)者的模式識別與預(yù)測。

2.2神經(jīng)網(wǎng)絡(luò)算法

神經(jīng)網(wǎng)絡(luò)算法是以對大腦的生理研究成果為基礎(chǔ),其目的在于模擬大腦的某些機理與機制,實現(xiàn)一些特定的功能[14]。它由眾多神經(jīng)元可調(diào)的連接權(quán)值連接而成,同時兼具十分可觀的非線性映射能力。此外,可以根據(jù)具體情況設(shè)置中間層的參數(shù)、各層的處理單元的數(shù)量和網(wǎng)絡(luò)的學(xué)習(xí)系數(shù)。在學(xué)習(xí)分析中可以應(yīng)用于模式識別,以及為后期的學(xué)習(xí)干預(yù)與預(yù)警進行決策支持。

2.3支持向量機算法

支持向量機算法是基于統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小化原則。它尋求在模型的復(fù)雜性(特定訓(xùn)練樣本的學(xué)習(xí)精度)和有限樣本信息的學(xué)習(xí)能力(識別無誤差的任意樣本的能力)之間的最優(yōu)折衷。在解決小樣本、非線性和高維模式識別方面表現(xiàn)出許多獨特的優(yōu)勢。在學(xué)習(xí)分析中用于識別模型、分類和回歸分析。

2.4K-Means聚類算法

K-Means聚類算法是一種典型的基于距離的分層聚類算法,它是數(shù)據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整規(guī)則。在最小化誤差函數(shù)的基礎(chǔ)上將數(shù)據(jù)劃分為預(yù)定的類數(shù)K,采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。在學(xué)習(xí)分析中可以應(yīng)用于數(shù)據(jù)的聚類分析。

3學(xué)習(xí)分析應(yīng)用于計算機教學(xué)的實證研究模型

綜合對比學(xué)習(xí)分析的方法與工具以后,根據(jù)目的選擇適當?shù)姆治龉ぞ?。擬針對某大學(xué)計算機基礎(chǔ)課程學(xué)習(xí)者的在線學(xué)習(xí)行為進行分析與預(yù)測。大學(xué)計算機基礎(chǔ)課程是全校學(xué)習(xí)者的必修公共課程,授課形式為理論教學(xué)搭配實驗教學(xué),其中實驗教學(xué)比例大于理論教學(xué)比例。在實驗教學(xué)環(huán)節(jié),教師與學(xué)習(xí)者經(jīng)常利用網(wǎng)絡(luò)教學(xué)平臺開展各類教學(xué)與學(xué)習(xí)。大學(xué)計算機基礎(chǔ)課程是第一批開展線上教學(xué)的課程,多年來積累了大量的數(shù)據(jù),符合本研究的基本條件。因此要根據(jù)網(wǎng)絡(luò)教育平臺上大學(xué)計算機基礎(chǔ)課程的實際情況清洗數(shù)據(jù),根據(jù)該課程的特定情況的具體問題進行分析和預(yù)測,將理論與實際相結(jié)合,對學(xué)學(xué)計算機基礎(chǔ)課程學(xué)習(xí)者的在線學(xué)習(xí)數(shù)據(jù)進行研究,得出數(shù)據(jù)與學(xué)習(xí)者學(xué)習(xí)績效之間的關(guān)系[15],是研究非常重要的環(huán)節(jié)。通過對大學(xué)計算機基礎(chǔ)課程在線學(xué)習(xí)數(shù)據(jù)的分析得出結(jié)論,了解學(xué)習(xí)者學(xué)習(xí)情況并及時發(fā)現(xiàn)學(xué)習(xí)中存在的問題,從而預(yù)測學(xué)習(xí)者在學(xué)習(xí)過程中將會遇到的困難[16]。擬以選修大學(xué)計算機基礎(chǔ)課程兩個班的學(xué)生為實證研究對象,形成對照組,進行實證研究。根據(jù)學(xué)生前7周的在線學(xué)習(xí)行為分析結(jié)果分別預(yù)測兩個班級的學(xué)生將面臨的學(xué)習(xí)危機。擬將學(xué)習(xí)危機等級分為三個級別:危險、中等、安全。將所取得的預(yù)測結(jié)果通知對照組A班的學(xué)習(xí)者、教師以及教學(xué)管理者。并在第8—11周的教學(xué)活動中對對照組A班進行干預(yù)。對照組B班學(xué)習(xí)情況只進行預(yù)測,并不實施預(yù)警及干預(yù)。教師以及教學(xué)管理者接受到預(yù)測結(jié)果后根據(jù)學(xué)生遇到的具體問題,對對照組A班進行個性化的指導(dǎo),從而督促、引導(dǎo)學(xué)習(xí)者掌握知識,順利完成學(xué)業(yè)。通過最后的成績、問卷調(diào)查以及訪談的結(jié)果,來判斷預(yù)測的學(xué)習(xí)危機是否準確,并且判斷基于學(xué)習(xí)分析的預(yù)測與干預(yù)是否能夠激發(fā)學(xué)習(xí)興趣、提高學(xué)習(xí)效率、提高及格率、促進學(xué)業(yè)成功。

4結(jié)語

利用數(shù)據(jù)挖掘的方法進行學(xué)習(xí)分析研究,能夠挖掘?qū)W習(xí)數(shù)據(jù)的潛在內(nèi)涵,并使得無意義的數(shù)據(jù)升華為有價值的教學(xué)信息,從而優(yōu)化學(xué)習(xí)過程、提高教學(xué)效果。通過學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)預(yù)測出學(xué)習(xí)者在學(xué)習(xí)中產(chǎn)生的危機,及時向其發(fā)出預(yù)警信號并提供個性化干預(yù)對策,有利于增強學(xué)習(xí)動機,培養(yǎng)學(xué)習(xí)毅力,提高學(xué)習(xí)質(zhì)量?;跀?shù)據(jù)挖掘的學(xué)習(xí)分析,利用大數(shù)據(jù)的數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)分析的方法,探索數(shù)據(jù)分析下學(xué)習(xí)者的學(xué)習(xí)偏好,學(xué)習(xí)態(tài)度以及預(yù)測學(xué)習(xí)中所會遇到的問題。在這些數(shù)據(jù)的驅(qū)動下,對課程的精準教學(xué)支持,優(yōu)化學(xué)習(xí)任務(wù)和教學(xué)決策方面有一定的創(chuàng)新性,基于數(shù)據(jù)挖掘的學(xué)習(xí)分析研究值得更加深入的探討。

參考文獻:

[1]吳永和,陳丹,馬曉玲,等.學(xué)習(xí)分析:教育信息化的新浪潮[J].遠程教育志,2013,31(4):11-19.

[2]吳永和,曹盼,邢萬里,等.學(xué)習(xí)分析技術(shù)的發(fā)展和挑戰(zhàn)——第四屆學(xué)習(xí)分析與知識國際會議評析[J].開放教育研究,2014

[3]胡運安,呂智慧,吳杰,等.基于SCORM的學(xué)習(xí)行為采集模型的設(shè)計與實現(xiàn)[J].計算機工程與應(yīng)用,2004,40(33):106-108.

[4]高毅,申瑞民,楊帆,等.基于開放E-Learning平臺的學(xué)生行為分析中心[J].計算機工程,2004,30(15):86

作者:隋永博 曹旭 單位:長春中醫(yī)藥大學(xué)