公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)的應(yīng)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)的應(yīng)用范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)的應(yīng)用

摘要:隨著辦學(xué)規(guī)模的擴(kuò)大,傳統(tǒng)的學(xué)生檔案管理模式逐漸無法滿足對檔案信息的時(shí)效性、系統(tǒng)性等要求。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在學(xué)生檔案管理中的應(yīng)用,可以大幅提高學(xué)生檔案信息整體管理水平,提高檔案管理效率,其現(xiàn)實(shí)意義重大。在概述數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)挖掘技術(shù)形式的基礎(chǔ)上,研究數(shù)據(jù)挖掘技術(shù)在學(xué)生檔案管理中應(yīng)用的意義,并探索數(shù)據(jù)挖掘技術(shù)在檔案信息管理系統(tǒng)中的具體應(yīng)用。

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);學(xué)生;檔案管理系統(tǒng);應(yīng)用

一、計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)概述

隨著時(shí)展,科技進(jìn)步,傳統(tǒng)檔案管理方式逐漸無法滿足現(xiàn)實(shí)發(fā)展的要求,信息技術(shù)與網(wǎng)絡(luò)技術(shù)在檔案管理中的應(yīng)用,極大提高了學(xué)生檔案管理水平。數(shù)據(jù)挖掘技術(shù)的發(fā)展與應(yīng)用,提高了數(shù)據(jù)收集速度與數(shù)據(jù)收集質(zhì)量。數(shù)據(jù)挖掘技術(shù)指的是從相對模糊、不完全、數(shù)量眾多、存在噪音的實(shí)際數(shù)據(jù)之中,找出數(shù)據(jù)之中隱藏的、人們忽視的、不了解的但卻具有實(shí)際應(yīng)用價(jià)值的信息與知識的一個(gè)過程。數(shù)據(jù)挖掘所獲得的信息其特征主要表現(xiàn)為未知性、有效性、實(shí)用性。管理層應(yīng)分析挖掘數(shù)據(jù)信息,對未來發(fā)展趨勢進(jìn)行預(yù)測。數(shù)據(jù)挖掘技術(shù)最初主要應(yīng)用于數(shù)學(xué)研究,該技術(shù)在應(yīng)用過程中,可以對相關(guān)數(shù)據(jù)信息進(jìn)行挖掘、收集與分析并獲得相關(guān)研究結(jié)果,這些研究結(jié)果多可以應(yīng)用于優(yōu)化查詢、信息管理、過程控制、輔助決策與數(shù)據(jù)維護(hù)等方面。因數(shù)據(jù)挖掘技術(shù)特性,其應(yīng)用領(lǐng)域逐漸擴(kuò)展到機(jī)器學(xué)習(xí)、可視化、數(shù)據(jù)庫、數(shù)據(jù)統(tǒng)計(jì)、人工智能等領(lǐng)域。

二、計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)形式及其方法

描述型、預(yù)測型屬于計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的主要形式,其中描述型數(shù)據(jù)挖掘技術(shù),指的是描述數(shù)據(jù)信息中所存在的規(guī)則,依據(jù)數(shù)據(jù)微觀性特點(diǎn),研究數(shù)據(jù)中普通性較強(qiáng)、概念層次較高、較為宏觀的信息,通過總結(jié)概況與抽象方式對數(shù)據(jù)信息的相同屬性進(jìn)行描述。預(yù)測型數(shù)據(jù)挖掘技術(shù)指的通過對現(xiàn)有的數(shù)據(jù)信息進(jìn)行分析與處理,從而找出某類事物之中隱藏的屬性內(nèi)容,或預(yù)測事物未來形成的規(guī)律。在描述型與預(yù)測型挖掘技術(shù)在應(yīng)用中,多采取分類法、關(guān)聯(lián)法、粗糙集法。1.分類法。分類法屬于計(jì)算機(jī)挖掘技術(shù)中重要部分,分類操作直接決定著數(shù)據(jù)收集質(zhì)量,影響著所收集數(shù)據(jù)信息屬性分析,其所發(fā)揮的作用極為重要。分類指的是對數(shù)據(jù)庫屬性作一定分析,并將元組分為若干不同種類的過程,在劃分操作時(shí),依據(jù)收集數(shù)據(jù)所構(gòu)成的訓(xùn)練集,集中對部分?jǐn)?shù)據(jù)進(jìn)行處理并劃分,針對未處理的數(shù)據(jù)進(jìn)行相關(guān)測試,如數(shù)據(jù)測試后滿足相關(guān)要求,則按照一定規(guī)則進(jìn)行分類處理。通常,數(shù)據(jù)挖掘技術(shù)分類過程中,其過程為:依據(jù)收集數(shù)據(jù),確定分類范圍,尋找數(shù)據(jù)目標(biāo)屬性,并構(gòu)成數(shù)據(jù)訓(xùn)練集,對數(shù)據(jù)屬性進(jìn)行研究,選擇算法并分類計(jì)算,獲得計(jì)算結(jié)果,選擇出測試集,通過驗(yàn)證分類規(guī)則,最終輸出數(shù)據(jù)分類規(guī)則。2.關(guān)聯(lián)法。關(guān)聯(lián)分析規(guī)則屬于數(shù)據(jù)挖掘技術(shù)中較為簡單的一種相關(guān)規(guī)則,能夠準(zhǔn)確對相關(guān)數(shù)據(jù)信息進(jìn)行描述,支持對數(shù)據(jù)的深入分析。在應(yīng)用相關(guān)規(guī)則的過程中,重點(diǎn)是描述具體事務(wù),結(jié)合相同屬性,并對其進(jìn)行概況總結(jié),從而確定共同模式與共同屬性。關(guān)聯(lián)分析規(guī)則可以直接應(yīng)用于數(shù)據(jù)庫之中,對數(shù)據(jù)進(jìn)行統(tǒng)一記錄,該方法數(shù)據(jù)記錄準(zhǔn)確性較高,降低了數(shù)據(jù)搜索空間,可以有效改善運(yùn)行系統(tǒng)質(zhì)量。3.粗糙集法。粗糙集法在數(shù)據(jù)挖掘技術(shù)處理中作為一種數(shù)據(jù)工具,主要對不精確及不確定性數(shù)據(jù)信息進(jìn)行研究,在整個(gè)運(yùn)行系統(tǒng)應(yīng)用中發(fā)揮著重要作用,其優(yōu)勢較大。表現(xiàn)在以下幾個(gè)方面:粗糙集法的應(yīng)用,可以不需要了解相應(yīng)信息,在運(yùn)算處理中,其算法較為簡單且容易受到控制;粗糙集在運(yùn)行中能夠從數(shù)據(jù)中發(fā)現(xiàn)異常問題,排除獲取知識過程中存在的噪聲干擾,快速發(fā)展數(shù)據(jù)規(guī)律,通過表格形式,將數(shù)據(jù)規(guī)律進(jìn)行歸納總結(jié),并形成決策表,為實(shí)際應(yīng)用查詢提供支持;在數(shù)據(jù)庫運(yùn)行中多存在著數(shù)量較多的不確定信息,通過粗糙集法的應(yīng)用,可以對全不確定信息進(jìn)行處理,從而提高數(shù)據(jù)挖掘效率與質(zhì)量。

三、數(shù)據(jù)挖掘技術(shù)在學(xué)生檔案管理系統(tǒng)中應(yīng)用的現(xiàn)實(shí)意義

隨著學(xué)校規(guī)模擴(kuò)大,學(xué)生數(shù)量增加,為提高學(xué)生信息管理,就要改變傳統(tǒng)的學(xué)生檔案管理模式。在計(jì)算機(jī)技術(shù)與通信技術(shù)發(fā)展的推動(dòng)下,構(gòu)建學(xué)生檔案管理系統(tǒng)成為可能。在學(xué)生檔案管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以有效提高學(xué)生檔案管理水平,提高檔案管理效率,其應(yīng)用現(xiàn)實(shí)意義重大。1.數(shù)據(jù)挖掘技術(shù)應(yīng)用可以提高學(xué)生檔案信息管理安全性。學(xué)生檔案記錄著學(xué)生的基本信息及其在校表現(xiàn)等各種信息,如學(xué)生姓名、學(xué)號、考勤、成績、懲罰狀況、獲獎(jiǎng)狀況、實(shí)踐能力、外語水平等各種信息,檔案信息完整性與真實(shí)性,直接影響著學(xué)生綜合評價(jià),影響學(xué)生就業(yè)問題,其現(xiàn)實(shí)意義重大。學(xué)校應(yīng)做好學(xué)生檔案信息管理工作,然而隨著學(xué)生數(shù)量增加,采取傳統(tǒng)檔案管理其工作量較大,保管工作困難,且隨著翻查頻率增加,引起檔案信息破損嚴(yán)重。檔案信息管理應(yīng)重視保密性,一旦學(xué)生檔案信息被泄露,會(huì)對學(xué)生的隱私造成嚴(yán)重侵犯,甚至?xí)W(xué)生后期發(fā)展帶來較大的消極影響。而在學(xué)生檔案管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),則可以有效提高檔案管理實(shí)體及內(nèi)容的安全性,切實(shí)做好學(xué)生檔案管理工作。2.提高學(xué)生檔案管理效率,降低學(xué)生檔案管理成本。在開展學(xué)校學(xué)生檔案管理工作時(shí),通過應(yīng)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),可以改變傳統(tǒng)的檔案管理方式,通過信息化技術(shù),推動(dòng)學(xué)生檔案管理水平的提高,并提高學(xué)校學(xué)生檔案管理的工作效率。在學(xué)生檔案管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),其處理檔案信息的速度大幅提高,從而節(jié)約了管理人員在檔案管理中所花費(fèi)的時(shí)間,降低了工作強(qiáng)度。通過數(shù)據(jù)挖掘技術(shù)應(yīng)用,推動(dòng)落實(shí)學(xué)生檔案評定工作,節(jié)約學(xué)生檔案管理成本。此外,在學(xué)生檔案管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以為學(xué)校管理制度改進(jìn)提供決策支持。

四、數(shù)據(jù)挖掘技術(shù)在學(xué)生檔案管理系統(tǒng)中的應(yīng)用研究

應(yīng)用數(shù)據(jù)挖掘技術(shù)構(gòu)建學(xué)校學(xué)生檔案管理系統(tǒng),應(yīng)結(jié)合學(xué)校實(shí)際情況,從實(shí)際出發(fā),以滿足學(xué)校應(yīng)用需求為中心,做到技術(shù)為實(shí)際需求服務(wù),確保學(xué)生檔案管理系統(tǒng)可以滿足學(xué)?,F(xiàn)實(shí)需求。當(dāng)前,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)快速發(fā)展并普及,信息化時(shí)代要求學(xué)校改進(jìn)學(xué)生檔案管理工作,提高學(xué)生檔案信息管理系統(tǒng)的時(shí)效性、完整性。傳統(tǒng)檔案管理方式中,學(xué)生檔案部分?jǐn)?shù)據(jù)信息無法獲得有效應(yīng)用,為實(shí)現(xiàn)學(xué)生檔案數(shù)據(jù)的有效應(yīng)用,充分發(fā)揮學(xué)生檔案價(jià)值,通過應(yīng)用數(shù)據(jù)挖掘技術(shù),尋找出學(xué)生檔案數(shù)據(jù)中隱含的信息,并對其進(jìn)行總結(jié)與應(yīng)用,實(shí)現(xiàn)其綜合效益。數(shù)據(jù)挖掘技術(shù)在學(xué)生檔案管理系統(tǒng)中的應(yīng)用主要表現(xiàn)在以下方面:1.檔案分類法在學(xué)生檔案管理系統(tǒng)中的應(yīng)用。檔案分類法,是按照一定標(biāo)準(zhǔn),將不同類型檔案進(jìn)行整理的方法,找出檔案中屬性類似的置于同一個(gè)類別之中,將不同屬性檔案分別放置于相應(yīng)類別中。在檔案分類處理中,數(shù)據(jù)挖掘技術(shù)能夠?qū)n案類別進(jìn)行詳細(xì)劃分,協(xié)助管理人員完成檔案歸類,如依據(jù)學(xué)生入學(xué)時(shí)間、專業(yè)差異、主修課程差異等劃分檔案,從而提高檔案檢索效率。2.檔案收集法在學(xué)生檔案管理系統(tǒng)中的應(yīng)用。檔案收集法,指的是通過分析學(xué)生檔案數(shù)據(jù)庫中的具體數(shù)據(jù),在描述數(shù)據(jù)的基礎(chǔ)上,構(gòu)建數(shù)學(xué)模型,通過模型與所有測試樣本進(jìn)行對比分析,通過這種方式,實(shí)現(xiàn)對管理對象的劃分。如在學(xué)校學(xué)生檔案管理中,其對象應(yīng)主要包括學(xué)生、教師、學(xué)校領(lǐng)導(dǎo)與家長。3.數(shù)據(jù)挖掘技術(shù)決策樹在學(xué)生檔案管理系統(tǒng)中的應(yīng)用。決策樹法是在信息增益的基礎(chǔ)上,尋找數(shù)據(jù)庫中所存在的最大信息量字段并構(gòu)建決策樹節(jié)點(diǎn),依據(jù)字段不同取值構(gòu)建決策樹分支。在學(xué)生檔案管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)決策樹法,可以對學(xué)生檔案數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)決策屬性對學(xué)生信息的影響,為學(xué)校領(lǐng)導(dǎo)決策提供依據(jù),可以加強(qiáng)學(xué)生管理,為獎(jiǎng)懲提供一定依據(jù)。如在學(xué)生檔案管理中,對學(xué)生專業(yè)成績屬性進(jìn)行分析,考慮到學(xué)生學(xué)科側(cè)重點(diǎn)不同問題,引入績點(diǎn)概念,將相應(yīng)專業(yè)成績屬性作平均績點(diǎn)計(jì)算,并分為優(yōu)、良、中、差四個(gè)層次,同理,在學(xué)生檔案考勤屬性管理時(shí),將出勤百分比作為依據(jù),分為優(yōu)、良、中、差四個(gè)層次,通過決策樹法,直接顯示出學(xué)生檔案信息,為檔案管理、學(xué)生獎(jiǎng)懲提供便利。在學(xué)生檔案管理中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以提高數(shù)據(jù)分類,提高檔案檢索效率,實(shí)現(xiàn)對檔案數(shù)據(jù)信息的挖掘,從而找出檔案管理與檔案對象之間的關(guān)系。依據(jù)學(xué)生檔案數(shù)據(jù)統(tǒng)計(jì)結(jié)果,針對不同學(xué)生,開展差異化指導(dǎo),有助于提高學(xué)校教育質(zhì)量,推動(dòng)學(xué)生全面發(fā)展,現(xiàn)實(shí)意義重大。

五、結(jié)語

當(dāng)前,學(xué)校辦學(xué)規(guī)模擴(kuò)大,學(xué)生人數(shù)增加,這就對學(xué)生檔案管理工作提出了新的要求。在概述數(shù)據(jù)挖掘技術(shù)形式基礎(chǔ)上,綜合分析數(shù)據(jù)挖掘技術(shù)在學(xué)生檔案管理中的意義及具體應(yīng)用,實(shí)踐證明,在學(xué)生檔案管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以有效提高學(xué)校學(xué)生檔案管理安全性、管理水平、管理效率,降低學(xué)生檔案管理成本,有利于挖掘?qū)W生檔案中隱藏信息,為提高檔案信息的應(yīng)用價(jià)值,輔助學(xué)校決策,開展針對性指導(dǎo)提供便利,現(xiàn)實(shí)意義重大。

參考文獻(xiàn):

[1]高燕飛,陳俊杰.試析計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案信息管理系統(tǒng)中的運(yùn)用[J].內(nèi)蒙古師范大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2012,41(4):44-46.

[2]黃世喆,吳震.論數(shù)據(jù)挖掘技術(shù)在電子文件管理中應(yīng)用的必要性與可行性[J].檔案與建設(shè),2011,(11):8-10.

[3]宇然.檔案計(jì)算機(jī)管理系統(tǒng)中關(guān)聯(lián)規(guī)則的應(yīng)用與實(shí)現(xiàn)[J].蘭臺世界,2011,(21):16-17.

作者:李玉娟 單位:長治醫(yī)學(xué)院