前言:想要寫出一篇引人入勝的文章?我們特意為您整理了基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)異常檢測技術(shù)范文,希望能給你帶來靈感和參考,敬請閱讀。
1網(wǎng)絡(luò)異常檢測技術(shù)概述
如今,我們已經(jīng)處于網(wǎng)絡(luò)時(shí)代,生活的方方面面都離不開網(wǎng)絡(luò),而且網(wǎng)絡(luò)的穩(wěn)定與否直接影響著人們生活質(zhì)量的高低。在日常生活中,由于受到外界因素的影響以及網(wǎng)絡(luò)本身的問題,常常會(huì)出現(xiàn)網(wǎng)絡(luò)異常的情況,為了解決這一問題,保證用戶上網(wǎng)的流暢性,需要針對發(fā)生異常的網(wǎng)絡(luò)進(jìn)行檢測,這種技術(shù)就是網(wǎng)絡(luò)異常檢測技術(shù)。網(wǎng)絡(luò)異常這種情況在生活中較為常見,但是產(chǎn)生的原因卻十分復(fù)雜,一旦找不到問題的原因,就會(huì)造成網(wǎng)絡(luò)大范圍的崩潰,進(jìn)而影響人們的工作和生活。
2基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)異常檢測技術(shù)
數(shù)據(jù)挖掘就是人們常說的知識發(fā)現(xiàn),通過對海量的、雜亂無章的、不清晰的并且隨機(jī)性很大的數(shù)據(jù)進(jìn)行挖掘,找到其中蘊(yùn)含的有規(guī)律并且有價(jià)值和能夠理解應(yīng)用的知識,這一過程就是數(shù)據(jù)挖掘。它主要是借助分析工具找到數(shù)據(jù)和模型之間的關(guān)心,之后進(jìn)行預(yù)測,并將數(shù)據(jù)回歸到真實(shí)變量。在網(wǎng)絡(luò)異常檢測技術(shù)中應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠從海量數(shù)據(jù)中找到需要的信息,并且根據(jù)數(shù)據(jù)信息建立模型,從而對入侵行為和正常操作進(jìn)行分類了,數(shù)據(jù)挖掘的方法有兩種:一種是分類分析,一種是聚分析。分類分析需要找到數(shù)據(jù)之間的依賴關(guān)系,并且進(jìn)行預(yù)判斷,這一過程需要興趣度的介入,也就是對規(guī)則的可行性和適用性進(jìn)行衡量,確保滿足最小閾值,之后建立一個(gè)數(shù)據(jù)映射分類模型,從而輸出離散類別。分類的效果與數(shù)據(jù)的特點(diǎn)息息相關(guān),有的數(shù)據(jù)噪聲較大,有的數(shù)據(jù)缺失不全,有的數(shù)據(jù)密集分布,有的數(shù)據(jù)字段離散,所以還需要具體情況具體分析。聚類分析是通過反復(fù)的分區(qū)從而找到解決辦法,它的輸出是各個(gè)不同類型的數(shù)據(jù),也就是先對數(shù)據(jù)進(jìn)行初始?xì)w類,之后去粗取精進(jìn)行合并,最后使得對象之間能夠彼此聯(lián)系,歸于一類。值得一提的是,通過對數(shù)據(jù)和對象之間的距離進(jìn)行聚類,能夠消除數(shù)據(jù)的噪聲,完成不同形狀的聚類,也可以對數(shù)據(jù)的空間分布進(jìn)行劃分,形成網(wǎng)格單元,對數(shù)據(jù)分布情況進(jìn)行更直觀的判斷。
3基于機(jī)器學(xué)習(xí)方法的網(wǎng)絡(luò)異常檢測技術(shù)
機(jī)器學(xué)習(xí)指的是根據(jù)人類學(xué)習(xí)的情況,對機(jī)器進(jìn)行研究,使得機(jī)器掌握學(xué)習(xí)的能力,從而獲取新的知識,并通過一系列的模擬學(xué)習(xí),讓機(jī)器能夠自主解決問題。機(jī)器學(xué)習(xí)是人工智能的最新成果,由環(huán)境、執(zhí)行和數(shù)據(jù)庫構(gòu)成,首先環(huán)境為機(jī)器學(xué)習(xí)系統(tǒng)提供信息,之后機(jī)器學(xué)習(xí)系統(tǒng)對這些信息進(jìn)行識別,和數(shù)據(jù)庫進(jìn)行對比,最后加以執(zhí)行,網(wǎng)絡(luò)異常檢測技術(shù)應(yīng)用機(jī)器學(xué)習(xí)方法主要有兩種情況:監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)指的是通過之前的異常情況和數(shù)據(jù)分析進(jìn)行練習(xí)和研究,找到一個(gè)固定的模板,從而對輸入信息進(jìn)行檢測,根據(jù)檢測結(jié)果進(jìn)行判斷,對異常情況進(jìn)行分類。這種方法需要研究人員熟悉網(wǎng)絡(luò)異常的特征,并且能夠準(zhǔn)確區(qū)分?jǐn)?shù)據(jù),從而使得機(jī)器學(xué)習(xí)系統(tǒng)能夠檢測出不同類型的異常,同時(shí),如果是新型的異常,系統(tǒng)也能夠檢測出來。下面介紹一些檢測的方法:第一種,KNN算法,這種算法是比較簡單的機(jī)器學(xué)習(xí)方法,并且能夠?qū)Ξ惓P袨橹苯舆M(jìn)行計(jì)算,并根據(jù)最近的K個(gè)樣本找到相似的類型,尤其是在動(dòng)態(tài)網(wǎng)絡(luò)中,應(yīng)用比較成熟。但是樣本需要均勻分布,如果測量不準(zhǔn)確就可能出現(xiàn)一定的誤差,所以也可以結(jié)合其他算法同時(shí)使用。第二種,決策樹法,這種方法和流程圖比較像,每個(gè)節(jié)點(diǎn)代表者檢測的屬性,每個(gè)分支則是檢測結(jié)果,每片葉子就是異常的類型。在檢測過程中通過對沒有標(biāo)記的數(shù)據(jù)進(jìn)行分類,由上到下測試,之后選擇合理的分支和節(jié)點(diǎn),最后在葉片上判斷類型。但是隨著網(wǎng)絡(luò)數(shù)據(jù)的不斷增多,需要對內(nèi)存資源進(jìn)行優(yōu)化,從而提高系統(tǒng)檢測的精準(zhǔn)性。無監(jiān)督學(xué)習(xí)不需要對異常情況做標(biāo)記,只需要根據(jù)目前的網(wǎng)絡(luò)進(jìn)行建模,這樣極大地減少了工作量,同時(shí)能夠?qū)?shù)據(jù)聚集情況進(jìn)行分類,之后由研究者進(jìn)行判斷,雖然準(zhǔn)確度不如監(jiān)督學(xué)習(xí)的高,但是操作便捷,簡單易行,它的檢測方法如下:第一種,Apriori方法,這種算法能夠第一時(shí)間檢測到網(wǎng)絡(luò)的異常,并且直接鎖定攻擊來源,主要是找到滿足設(shè)定的頻集,之后根據(jù)頻集的相關(guān)規(guī)則,對數(shù)據(jù)進(jìn)行保留處理,之后生成動(dòng)態(tài)的檢測規(guī)則,提高系統(tǒng)的穩(wěn)定性。第二種,EM方法,在對網(wǎng)絡(luò)異常進(jìn)行檢測時(shí),數(shù)據(jù)可能會(huì)有缺失或者是處于隱性狀態(tài),所以需要根據(jù)檢測對象的屬性對其權(quán)重進(jìn)行分配,找到屬性期望,之后根據(jù)似然估計(jì)進(jìn)行計(jì)算,從而實(shí)現(xiàn)交替循環(huán)。
4結(jié)論
綜上所述,網(wǎng)絡(luò)異常直接影響著用戶的信息安全,所以需要認(rèn)真做好網(wǎng)絡(luò)異常的檢測工作,通過創(chuàng)新和應(yīng)用相關(guān)的檢測技術(shù),在最快的時(shí)間內(nèi)找到產(chǎn)生的問題的原因,從而加以解決,滿足人們使用網(wǎng)絡(luò)的需求。
參考文獻(xiàn)
[1]黃煜坤.網(wǎng)絡(luò)安全異常檢測技術(shù)探究[J].電子測試,2015(05):40-42+45.
[2]廖國輝,劉嘉勇.基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的惡意代碼檢測方法[J].信息安全研究,2016,2(01):74-79.
作者:秦振凱 單位桂林電子科技大學(xué)海洋信息工程學(xué)院