公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術(shù)下的網(wǎng)絡(luò)信息安全對(duì)策

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)下的網(wǎng)絡(luò)信息安全對(duì)策范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

數(shù)據(jù)挖掘技術(shù)下的網(wǎng)絡(luò)信息安全對(duì)策

摘要:隨著計(jì)算機(jī)信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)時(shí)代已經(jīng)到來,在互聯(lián)網(wǎng)技術(shù)的影響下,各行各業(yè)的進(jìn)步與革新越來越離不開互聯(lián)網(wǎng)技術(shù)的推動(dòng)作用。數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)時(shí)代的產(chǎn)物,是數(shù)據(jù)處理的先進(jìn)技術(shù),為我國經(jīng)濟(jì)社會(huì)的發(fā)展提供了有力的支持。結(jié)合行業(yè)內(nèi)的學(xué)術(shù)研究現(xiàn)狀,分析了當(dāng)前大數(shù)據(jù)背景下數(shù)據(jù)挖掘技術(shù)的特點(diǎn)以及相關(guān)內(nèi)涵,并結(jié)合當(dāng)前互聯(lián)網(wǎng)發(fā)展的現(xiàn)狀對(duì)數(shù)據(jù)挖掘技術(shù)支持下的網(wǎng)絡(luò)信息安全對(duì)策進(jìn)行了研究與分析。

關(guān)鍵詞:數(shù)據(jù)挖掘;網(wǎng)絡(luò)信息安全;技術(shù);對(duì)策

1概述

進(jìn)入21世紀(jì)以來,互聯(lián)網(wǎng)信息技術(shù)快速發(fā)展,各行各業(yè)與互聯(lián)網(wǎng)信息技術(shù)的結(jié)合越來越緊密,在這樣的發(fā)展趨勢(shì)下,互聯(lián)網(wǎng)上的各類數(shù)據(jù)信息呈現(xiàn)出爆發(fā)式的增長,數(shù)據(jù)的處理、存儲(chǔ)、訪問方式均與之前發(fā)生了巨大的變化。面對(duì)著數(shù)量眾多的信息技術(shù),數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,但是在數(shù)據(jù)挖掘技術(shù)的應(yīng)用過程中,如何從海量的數(shù)據(jù)中挖掘到對(duì)人類社會(huì)以及經(jīng)濟(jì)發(fā)展有價(jià)值的數(shù)據(jù)信息就顯得尤為重要,尤其是要實(shí)現(xiàn)快速挖掘數(shù)據(jù)的同時(shí)保證網(wǎng)絡(luò)信息的安全,因此,研究數(shù)據(jù)挖掘技術(shù)支持下網(wǎng)絡(luò)信息安全對(duì)策對(duì)于我國經(jīng)濟(jì)社會(huì)的發(fā)展十分具有理論意義與實(shí)踐意義。

2數(shù)據(jù)挖掘技術(shù)的相關(guān)理論

2.1數(shù)據(jù)挖掘技術(shù)的概念

數(shù)據(jù)挖掘,顧名思義,就是從浩瀚的數(shù)據(jù)海洋中迅速地找到人們所需要的、有價(jià)值的數(shù)據(jù)信息,通過先進(jìn)的計(jì)算機(jī)技術(shù)以及云計(jì)算等方法快速地提煉出所需信息。數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)來源必須是真實(shí)且有效的,最終所查找出來的信息也必須是對(duì)人們的生活工作有價(jià)值的。從理論上來分析,當(dāng)數(shù)據(jù)挖掘技術(shù)所面臨的數(shù)據(jù)庫越大、數(shù)據(jù)越隨機(jī),那么最終挖掘的結(jié)果也將會(huì)更加具有說服力和代表性,所以,數(shù)據(jù)挖掘技術(shù)的關(guān)鍵內(nèi)容在于數(shù)據(jù)的處理效率,尤其對(duì)于計(jì)算機(jī)的算法有著較高的要求。從目前學(xué)術(shù)界的研究情況來看,數(shù)據(jù)挖掘技術(shù)是一門多學(xué)科交叉的技術(shù),其中包含著經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)據(jù)庫、計(jì)算機(jī)技術(shù)的內(nèi)容,將數(shù)據(jù)庫中離散分布的、無序的數(shù)據(jù)信息通過技術(shù)手段將其提升到有序、有價(jià)值的知識(shí),從而為數(shù)據(jù)的使用者提供良好的決策信息。通俗地來說,數(shù)據(jù)挖掘技術(shù)就是通過先進(jìn)的計(jì)算機(jī)技術(shù)將海量數(shù)據(jù)信息處理,找出數(shù)據(jù)與之間的規(guī)律與聯(lián)系,數(shù)據(jù)挖掘技術(shù)一般需要包含3個(gè)方面的內(nèi)容,分別是數(shù)據(jù)準(zhǔn)備階段、數(shù)據(jù)信息挖掘階段、數(shù)據(jù)信息結(jié)果表達(dá)階段,這3個(gè)階段構(gòu)成了數(shù)據(jù)挖掘技術(shù)的主要內(nèi)容。

2.2數(shù)據(jù)挖掘技術(shù)的主要工作任務(wù)

在目前的研究?jī)?nèi)容中,數(shù)據(jù)挖掘技術(shù)主要包含著監(jiān)督學(xué)習(xí)、關(guān)聯(lián)分析、聚類分析、異常數(shù)據(jù)檢測(cè)等任務(wù)。其中在監(jiān)督學(xué)習(xí)過程中,主要是對(duì)數(shù)據(jù)的總體情況進(jìn)行識(shí)別與分析,通過對(duì)數(shù)據(jù)庫中已知的數(shù)據(jù)樣本的大小和類型來預(yù)測(cè)出所需要新的樣本的相關(guān)信息。關(guān)聯(lián)分析主要是通過檢索工作將數(shù)據(jù)之間的相似情況快速地找出來,進(jìn)而分析出數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)性。聚類分析指的是對(duì)于一些具有相似性的數(shù)據(jù)找到它們內(nèi)部的一些共性規(guī)律及特征,并且按照特征進(jìn)行劃分,將這些數(shù)據(jù)源劃分為若干個(gè)數(shù)據(jù)群。而異常檢測(cè)也是數(shù)據(jù)挖掘技術(shù)中一項(xiàng)關(guān)鍵的任務(wù),在數(shù)據(jù)挖掘的過程中往往會(huì)建立一個(gè)數(shù)據(jù)樣本,將挖掘得到的數(shù)據(jù)與該樣本中的正確數(shù)據(jù)進(jìn)行比對(duì),從而找出挖掘數(shù)據(jù)中存在的異常數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性。

3當(dāng)前時(shí)代背景下網(wǎng)絡(luò)安全的新技術(shù)

3.1爬蟲技術(shù)

爬蟲技術(shù)是當(dāng)前網(wǎng)絡(luò)信息安全背景的一種新技術(shù),它是一個(gè)能夠自動(dòng)下載網(wǎng)頁的程序。在互聯(lián)網(wǎng)中存在著數(shù)以億計(jì)的網(wǎng)頁,而這些網(wǎng)頁通常分布在全球各地的不同服務(wù)器上,用戶在瀏覽網(wǎng)頁的時(shí)候可以同時(shí)打開不同的服務(wù)器進(jìn)行切換和瀏覽,而爬蟲技術(shù)則是對(duì)這一行為的模仿,將多個(gè)服務(wù)器上的數(shù)據(jù)進(jìn)行批量下載和瀏覽,然后將搜集到的數(shù)據(jù)集中傳輸在數(shù)據(jù)庫中,以供下一步的處理。

3.2規(guī)則引擎技術(shù)

數(shù)據(jù)的獲取是數(shù)據(jù)挖掘技術(shù)中的基礎(chǔ)性工作,當(dāng)數(shù)據(jù)獲取完畢之后就需要對(duì)這些海量數(shù)據(jù)進(jìn)行處理和分析,在目前的應(yīng)用過程中基于Python的規(guī)則引擎大致有以下幾種。PyKE是一個(gè)專業(yè)的知識(shí)專家系統(tǒng),主要是利用Prolog語言規(guī)范進(jìn)行工作的。Pychinko是一項(xiàng)可以定義和處理語義網(wǎng)的規(guī)則引擎,通過使用RDF來進(jìn)行定義。從整體上來說,規(guī)則引擎技術(shù)主要是在數(shù)據(jù)挖掘過程中創(chuàng)建一個(gè)存儲(chǔ)、管理數(shù)據(jù)的外部規(guī)則,然后計(jì)算機(jī)技術(shù)按照這個(gè)規(guī)則來執(zhí)行與推測(cè)其他事實(shí)的應(yīng)用程序。這里所說的規(guī)則通常包含著企業(yè)和商務(wù)上的業(yè)務(wù)邏輯、法律規(guī)定的相關(guān)內(nèi)容等。規(guī)則引擎技術(shù)在當(dāng)前的數(shù)據(jù)挖掘中已經(jīng)有了多年的發(fā)展,其中對(duì)成熟的就是Prolog和Rete算法兩大類,在目前的應(yīng)用過程中,大多數(shù)規(guī)則的引擎技術(shù)都是以該兩種算法為基礎(chǔ)而展開的,但是在某些領(lǐng)域中,也會(huì)使用Clips體系和Prolog體系相互結(jié)合。

4數(shù)據(jù)挖掘技術(shù)支持下網(wǎng)絡(luò)信息安全對(duì)策

4.1構(gòu)建安全的網(wǎng)絡(luò)環(huán)境

安全的網(wǎng)絡(luò)環(huán)境是保證網(wǎng)絡(luò)信息安全的最重要條件,根據(jù)目前行業(yè)內(nèi)的發(fā)展情況來看,需要首先更新隔離和訪問控制技術(shù),不但要實(shí)現(xiàn)物理方面的隔離,更要進(jìn)一步完善邏輯方面的隔離,只有經(jīng)過授權(quán)的用戶才能訪問網(wǎng)絡(luò)資金。其次,要廣泛應(yīng)用反病毒技術(shù),網(wǎng)絡(luò)上各種各樣的病毒是危害網(wǎng)絡(luò)信息安全的重要?dú)⑹种唬瑸榱耸沟镁W(wǎng)絡(luò)信息更加安全,必須構(gòu)建出一個(gè)完善的病毒預(yù)警與防護(hù)機(jī)制,當(dāng)有外部病毒入侵的時(shí)候,病毒檢測(cè)技術(shù)能夠在短時(shí)間內(nèi)識(shí)別出來,并且還能夠?qū)崿F(xiàn)定期地對(duì)網(wǎng)絡(luò)信息進(jìn)行安全性分析,及時(shí)安裝補(bǔ)丁。除此之外,網(wǎng)絡(luò)系統(tǒng)中還應(yīng)當(dāng)具有一定的數(shù)據(jù)統(tǒng)計(jì)功能,能夠詳細(xì)地記錄用戶訪問時(shí)間以及訪問次數(shù),同時(shí)還能夠?qū)W(wǎng)絡(luò)環(huán)境的使用狀態(tài)進(jìn)行記錄與反饋,確認(rèn)是否網(wǎng)絡(luò)具有被攻擊的危險(xiǎn)。當(dāng)然,為了使得數(shù)據(jù)信息在應(yīng)急情況下不被破壞,網(wǎng)絡(luò)環(huán)境中還應(yīng)當(dāng)具有網(wǎng)絡(luò)備份和災(zāi)難恢復(fù)系統(tǒng),可以保證在網(wǎng)絡(luò)受到外界攻擊后能夠在最短的時(shí)間內(nèi)將系統(tǒng)恢復(fù)至可用狀態(tài)。

4.2保證數(shù)據(jù)挖掘信息的安全

在數(shù)據(jù)挖掘的過程中,要保證所挖掘數(shù)據(jù)信息的安全,其中包含著數(shù)據(jù)的存儲(chǔ)安全、數(shù)據(jù)的傳輸安全以及數(shù)據(jù)的使用安全3大過程。在具體的操作過程中,首先需要保證數(shù)據(jù)信息具有物理方面的邏輯完整性,而保密性和邏輯完整性則是構(gòu)成數(shù)據(jù)存儲(chǔ)安全的重要內(nèi)容。保證數(shù)據(jù)傳輸過程中的安全對(duì)于整個(gè)挖掘過程來說十分重要,在當(dāng)前的應(yīng)用環(huán)境中,通常是使用傳輸加密技術(shù)、數(shù)據(jù)完整性技術(shù)、防抵賴性技術(shù)來保證傳輸過程中的安全性,同時(shí),工作人員在操作的過程中也應(yīng)當(dāng)保證數(shù)據(jù)信息使用和傳遞的安全性,避免發(fā)生數(shù)據(jù)泄露現(xiàn)象。而使用安全則主要是指數(shù)據(jù)在被使用的過程中一定要對(duì)使用主體進(jìn)行核驗(yàn)和校準(zhǔn),嚴(yán)禁非授權(quán)主體擅自地使用數(shù)據(jù)資源,從而保證數(shù)據(jù)信息的安全。

4.3建立完善的模型

為了保證數(shù)據(jù)挖掘技術(shù)支持下網(wǎng)絡(luò)信息安全需要建立完善的挖掘模型,首先,應(yīng)當(dāng)根據(jù)關(guān)聯(lián)性的分析情況來構(gòu)建關(guān)聯(lián)分析模型,在目前的技術(shù)領(lǐng)域中,關(guān)聯(lián)數(shù)據(jù)模型主要是通過對(duì)外部攻擊要素的歸納和整合,結(jié)合當(dāng)前所使用的數(shù)據(jù)挖掘技術(shù),體現(xiàn)出網(wǎng)絡(luò)上頻次最高、效果最強(qiáng)的攻擊行為態(tài)勢(shì)。在常見的攻擊行為中,攻擊類型、源地址、目的地址是最主要的3個(gè)要素,更是體現(xiàn)著攻擊行為的本質(zhì)特征,因此,為了保證網(wǎng)絡(luò)信息安全,必須對(duì)高頻次的攻擊行為進(jìn)行分析與統(tǒng)計(jì),從而做出相關(guān)的模型,進(jìn)而建立起完善的解決體系。其次,要形成效果良好的事件預(yù)測(cè)機(jī)制。所謂事件的預(yù)測(cè)機(jī)制主要內(nèi)容是通過對(duì)發(fā)生的某一事件的未來走勢(shì)進(jìn)行跟蹤性的調(diào)查,利用數(shù)據(jù)挖掘技術(shù)中的聚類算法,通過一定的演算過程來推斷出該事件是否能成為大規(guī)模的網(wǎng)絡(luò)攻擊事件,對(duì)于目前發(fā)生的大規(guī)模網(wǎng)絡(luò)安全事件來說,發(fā)生的次數(shù)并不是重點(diǎn)關(guān)注的對(duì)象,而發(fā)生的擴(kuò)散程度、牽涉面積、蔓延速度則是需要重點(diǎn)關(guān)注的。舉個(gè)例子來說,如果在數(shù)據(jù)監(jiān)測(cè)的過程中發(fā)現(xiàn)了同一種木馬病毒的IP地址數(shù)量在急劇地上升,那么就必須引起警覺,因?yàn)檫@種現(xiàn)象的事件很可能就是一次嚴(yán)重的網(wǎng)絡(luò)攻擊事件。同時(shí),還需要建立可控?cái)?shù)量的預(yù)測(cè)模型??煽?cái)?shù)量的預(yù)測(cè)模型主要是對(duì)觀察事件中的受控主機(jī)狀態(tài)的增長趨勢(shì)進(jìn)行監(jiān)控,可以對(duì)事件的感染能夠做出準(zhǔn)確的判斷。受控主機(jī)狀態(tài)增長主要說的是沒有發(fā)覺異常之前的主機(jī)狀態(tài),如果通過的相關(guān)監(jiān)測(cè)手段,發(fā)現(xiàn)主機(jī)已經(jīng)被攻擊而且隨后數(shù)量也發(fā)生大規(guī)模的增長,那么這就叫做受控主機(jī)狀態(tài)的增長趨勢(shì)。舉個(gè)例子來說,我們?cè)谌粘1O(jiān)測(cè)的過程中發(fā)現(xiàn)了某種病毒,而且經(jīng)過監(jiān)測(cè)發(fā)現(xiàn)該主機(jī)之前并未受到過這種感染,但是在監(jiān)測(cè)的周期內(nèi)發(fā)現(xiàn)了主機(jī)被感染,那么對(duì)于這一種類型的病毒來說,該主機(jī)就是受控主機(jī)狀態(tài)的增長狀態(tài)。最后,還需要建立分析與處理的模型。該模型的建立主要是對(duì)于一些數(shù)據(jù)與事件進(jìn)行反饋,從而得出被控主機(jī)的處理能力,該模型在分析的過程中是對(duì)未處理主機(jī)、已經(jīng)處理主機(jī)、處理效率等方面進(jìn)行綜合性地評(píng)定,從而得出其處理能力的強(qiáng)弱。

5結(jié)語

隨著信息技術(shù)的發(fā)展,計(jì)算機(jī)技術(shù)已經(jīng)深入到我們生活生產(chǎn)的方方面面,深刻地改變著社會(huì)經(jīng)濟(jì)發(fā)展的格局。但是隨著計(jì)算機(jī)網(wǎng)絡(luò)的普及,越來越多的不法分子也開始入侵到網(wǎng)絡(luò)中,做一些違法亂紀(jì)的事情,近些年來,黑客攻擊網(wǎng)絡(luò)的手段層出不窮,傳統(tǒng)的網(wǎng)絡(luò)信息安全技術(shù)也難以應(yīng)對(duì),而將數(shù)據(jù)挖掘技術(shù)應(yīng)用到網(wǎng)絡(luò)信息安全策略中有著非常強(qiáng)的實(shí)踐價(jià)值,從這一角度出發(fā),對(duì)數(shù)據(jù)挖掘技術(shù)中的相關(guān)內(nèi)容進(jìn)行了重點(diǎn)的研究,希望能夠?yàn)樵摷夹g(shù)的發(fā)展提供有價(jià)值的參考。

參考文獻(xiàn)

[1]曹子璽,陸琦,薛質(zhì).基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)信息安全策略研究[J].信息安全與技術(shù),2018,5(01):26-28.

[2]季民.整合Web數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)信息安全防范技術(shù)的相關(guān)分析[J].信息化建設(shè),2019,(03):375.

[3]闕宏宇,梁波.入侵檢測(cè)技術(shù)網(wǎng)絡(luò)安全中的具體運(yùn)用[J].電子技術(shù)與軟件工程,2017,(11):205.

[4]李勇,李建,曾銀.數(shù)據(jù)挖掘技術(shù)在入侵檢測(cè)系統(tǒng)中的應(yīng)用[J].山西電子技術(shù),2016,(06):36-38.

[5]王江,樊向東,施偉.大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)信息安全與隱私保護(hù)研究[J].信息與電腦(理論版),2018,(24):213-214+217.

作者:郭秀峰 單位:河南牧業(yè)經(jīng)濟(jì)學(xué)院信息工程學(xué)院