前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)挖掘技術(shù)應(yīng)用主題范文,僅供參考,歡迎閱讀并收藏。
【關(guān)鍵詞】信息時(shí)代;數(shù)據(jù);利用;挖掘;應(yīng)用
1.數(shù)據(jù)挖掘的起源
隨著科學(xué)技術(shù)的日新月異,信息正在處于爆炸的時(shí)代,但是在數(shù)據(jù)龐大的背后,人們對(duì)其利用和提取的價(jià)值是有限的,有時(shí)候是不能滿足現(xiàn)實(shí)的需要。當(dāng)前大部分只是對(duì)所有的數(shù)據(jù)進(jìn)行儲(chǔ)存、統(tǒng)計(jì)、查詢,很難找出數(shù)據(jù)背后存在的某種關(guān)系和規(guī)律,更不能對(duì)數(shù)據(jù)的未來(lái)發(fā)展進(jìn)行準(zhǔn)確的預(yù)測(cè)。這也就導(dǎo)致了雖然信息數(shù)據(jù)非常多但是價(jià)值卻占到很少的一部分。正是因?yàn)橛羞@種情況的產(chǎn)生,信息挖掘技術(shù)才會(huì)得到發(fā)展和應(yīng)用。
2.數(shù)據(jù)挖掘的定義
所謂的信息挖掘通過(guò)對(duì)一些已有的數(shù)據(jù)存在不確定性、信息量大、不完整的數(shù)據(jù)進(jìn)行分析提取,提取出數(shù)據(jù)背后存在的一些價(jià)值和有用的信息。通過(guò)對(duì)這些數(shù)據(jù)的分析提取為一些技術(shù)部門和相關(guān)的人員的戰(zhàn)略決策提供很大的支持。
3.數(shù)據(jù)挖掘的過(guò)程
數(shù)據(jù)的挖掘是通過(guò)數(shù)據(jù)挖掘算法提取出數(shù)據(jù)模型,還有就是針對(duì)數(shù)據(jù)挖掘所采取的一些方法和步驟,一般都是經(jīng)歷幾次甚至多次的處理過(guò)程。最后才會(huì)在數(shù)據(jù)上提取到其存在的潛在價(jià)值,整個(gè)過(guò)程主要包括一下幾個(gè)階段。
(1)目標(biāo)定義階段
做任何事情之前通過(guò)對(duì)將要做的事情進(jìn)行計(jì)劃分析,然后制定對(duì)所做這件事情需要達(dá)到的目標(biāo),這樣事情就會(huì)很容易成功。數(shù)據(jù)挖掘也不例外,在對(duì)數(shù)據(jù)進(jìn)行挖掘的時(shí)候,需要相關(guān)的人員了解和明確對(duì)所挖掘的數(shù)據(jù)要達(dá)到的目的,這也很大程度上會(huì)決定數(shù)據(jù)挖掘的成功與否。因此相關(guān)人員要在指定明確的目標(biāo),然后選擇一定的技術(shù)手段和方式對(duì)數(shù)據(jù)進(jìn)行挖掘。
(2)數(shù)據(jù)準(zhǔn)備階段
根據(jù)已有的數(shù)據(jù)挖掘目標(biāo),就應(yīng)該對(duì)所有的數(shù)據(jù)進(jìn)行分析處理,大略的挑出能達(dá)到目標(biāo)的一些數(shù)據(jù),剔除一些沒有意義的數(shù)據(jù)。還有就是對(duì)數(shù)據(jù)進(jìn)行一些變化,主要就是為了能夠在一些有特征的數(shù)據(jù)找出符合要求的數(shù)據(jù),減少在數(shù)據(jù)挖掘過(guò)程中需要考慮的其他因素。
(3)數(shù)據(jù)挖掘階段
這個(gè)階段是整個(gè)數(shù)據(jù)挖掘階段最重要、最核心的階段。相關(guān)的工作人員應(yīng)該在已有的數(shù)據(jù)挖掘目標(biāo)的基礎(chǔ)上選擇合理、科學(xué)的數(shù)據(jù)挖掘方法對(duì)數(shù)據(jù)進(jìn)行挖掘,提取出數(shù)據(jù)背后隱藏的價(jià)值。
(4)數(shù)據(jù)挖掘結(jié)果解釋和評(píng)估階段
首先應(yīng)該對(duì)數(shù)據(jù)挖掘出來(lái)的信息進(jìn)行研究,把最終滿足要求的數(shù)據(jù)提取出來(lái)。因?yàn)閿?shù)據(jù)的挖掘的最終目的就是為客戶服務(wù),所以還應(yīng)該針對(duì)客戶的一些特殊要求對(duì)挖掘出來(lái)的數(shù)據(jù)進(jìn)行提煉,經(jīng)過(guò)客戶對(duì)所挖掘的數(shù)據(jù)結(jié)果的評(píng)估后,將一些不滿足要求的數(shù)據(jù)剔除。還有就是把挖掘的數(shù)據(jù)應(yīng)該進(jìn)行合理的優(yōu)化使其更加人性化,給客戶優(yōu)質(zhì)的服務(wù)。
4.數(shù)據(jù)挖掘的研究方向
(1)對(duì)于數(shù)據(jù)挖掘系統(tǒng)來(lái)說(shuō),其不可能對(duì)各類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,因此應(yīng)該針對(duì)不同類型的數(shù)據(jù)研究出不同的數(shù)據(jù)挖掘系統(tǒng),這樣就可以在數(shù)據(jù)挖掘時(shí)能夠快速、高效的對(duì)數(shù)據(jù)進(jìn)行挖掘。
(2)數(shù)據(jù)挖掘系統(tǒng)應(yīng)該具備能夠?qū)?shù)據(jù)進(jìn)行高效率的挖掘,因?yàn)殡S著信息化時(shí)代的到來(lái),數(shù)據(jù)會(huì)越來(lái)越多,越來(lái)越復(fù)雜。如果其系統(tǒng)不能高效的工作,會(huì)很大程度上影響到數(shù)據(jù)挖掘的整體進(jìn)度。
(3)數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性、通俗性以及有效性也是數(shù)據(jù)挖掘所需要達(dá)到的,只有這幾方面都能滿足要求,才會(huì)能夠很好的服務(wù)客戶。
(4)隨著信息時(shí)代和科學(xué)技術(shù)的快速發(fā)展,人們也越來(lái)越關(guān)注到一些個(gè)人隱私。所以在對(duì)數(shù)據(jù)挖掘的過(guò)程中不應(yīng)該侵犯到他人的隱私。還有就是對(duì)挖掘出來(lái)的數(shù)據(jù)有一定的安全保護(hù)措施,防止數(shù)據(jù)丟失。
(5)挖掘出來(lái)的數(shù)據(jù)也應(yīng)該能夠及時(shí)的和現(xiàn)有的數(shù)據(jù)進(jìn)行結(jié)合和補(bǔ)充,這樣就能使數(shù)據(jù)得到更廣泛的應(yīng)用和利用。
5.數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域
隨著科技的不斷發(fā)展和信息化時(shí)代的到來(lái),數(shù)據(jù)挖掘技術(shù)也取得了一些成就,在許多行業(yè)也得到了一定的應(yīng)用
(1)科學(xué)研究
因?yàn)樵S多科學(xué)研究的數(shù)據(jù)的大量性、復(fù)雜性使得一般的分析工具很大對(duì)數(shù)據(jù)進(jìn)行分析、提取,因此數(shù)據(jù)挖掘技術(shù)在這種情況下深受科學(xué)研究方面的廣大歡迎,其也在這個(gè)行業(yè)得到了快速的發(fā)展和應(yīng)用。通過(guò)數(shù)據(jù)挖掘在科學(xué)研究的應(yīng)用,促進(jìn)了科學(xué)的快速發(fā)展,使其能夠?yàn)樯鐣?huì)提供有價(jià)值的科學(xué)成果,為國(guó)家做出貢獻(xiàn)。
(2)風(fēng)險(xiǎn)分析和欺詐辨別
因?yàn)樵S多行業(yè)的數(shù)據(jù)存在具有龐大性、真假難辨性,所以對(duì)這些數(shù)據(jù)進(jìn)行挖掘分析,分析出有價(jià)值、真的數(shù)據(jù),防止因?yàn)榧俚臄?shù)據(jù)給我們帶來(lái)的不必要的麻煩。還可以經(jīng)過(guò)對(duì)數(shù)據(jù)的挖掘分析提高對(duì)風(fēng)險(xiǎn)的分析能力。還有就是一些行業(yè)的數(shù)據(jù)可能被不法分子利用對(duì)人們進(jìn)行欺詐,通過(guò)數(shù)據(jù)挖掘可以對(duì)這些數(shù)據(jù)進(jìn)行辨別,從而避免了經(jīng)濟(jì)損失。
(3)制造業(yè)的應(yīng)用
數(shù)據(jù)挖掘一般就是對(duì)制造業(yè)的制造部件的缺陷進(jìn)行分析,通過(guò)分析挖掘出能夠優(yōu)化制造部件的數(shù)據(jù),從而避免制造部件的缺陷。
(4)學(xué)校教育的應(yīng)用
學(xué)校的數(shù)據(jù)也是非常龐大、復(fù)雜的,因此數(shù)據(jù)挖掘也在學(xué)校的各個(gè)信息系統(tǒng)得到了一定的應(yīng)用。學(xué)校通過(guò)數(shù)據(jù)挖掘挖掘出對(duì)學(xué)校、老師、學(xué)生有價(jià)值的數(shù)據(jù),從而讓學(xué)??茖W(xué)的管理,老師更加高效的工作和教學(xué),學(xué)生更加高效的學(xué)習(xí)。
參考文獻(xiàn):
[1] Jiawei Han.Data Mining:Concepts and Techniques[M].機(jī)械工業(yè)出版社.2004
[2] 劉同明等.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].北京:國(guó)防工業(yè)出版社.2001.(9)
[3] 康曉東.基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘技術(shù)[J].北京:機(jī)械工業(yè)出版社.2004.(1):131~175
[關(guān)鍵詞] 數(shù)據(jù)挖掘 商業(yè)決策 數(shù)據(jù)分析
一、應(yīng)用數(shù)據(jù)挖掘技術(shù)支撐商業(yè)管理理念的實(shí)施
商業(yè)管理理論及理念的研究一直沒有停歇,那面是“二八原則”,這面又是“藍(lán)平長(zhǎng)二”,無(wú)論是什么,其宗旨都是為使企業(yè)能在激烈的商業(yè)競(jìng)爭(zhēng)中審時(shí)度勢(shì),迅速出擊,知己知彼,百戰(zhàn)不殆。任何好的商業(yè)決策都必須及時(shí)、準(zhǔn)確,有真實(shí)可靠的事實(shí)與數(shù)據(jù)為依據(jù)。商業(yè)組織如果感覺不靈敏,很容易陷入“夜半臨深池”的危險(xiǎn)境地卻不自知,有先進(jìn)的管理理念也無(wú)濟(jì)于事。面對(duì)日益復(fù)雜的競(jìng)爭(zhēng)環(huán)境,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
數(shù)據(jù)挖掘技術(shù)基于人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),可高度自動(dòng)化地從深層次上分析商業(yè)組織在運(yùn)營(yíng)過(guò)程中積累的海量業(yè)務(wù)數(shù)據(jù),抽取重要信息,使商業(yè)組織大大提高認(rèn)知其組織內(nèi)外環(huán)境的能力,靈活應(yīng)對(duì)突發(fā)事件,迅速制定合理決策,使先進(jìn)的商業(yè)管理理念落到實(shí)處。
二、數(shù)據(jù)挖掘功能及其所能解決的典型商業(yè)問(wèn)題
1.關(guān)聯(lián)分析
關(guān)聯(lián)分析是從大量的數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間相關(guān)關(guān)系或因果結(jié)構(gòu)的數(shù)據(jù)分析方法。通過(guò)對(duì)大量銷售數(shù)據(jù)的分析,可以發(fā)現(xiàn)兩種或多種商品之間存在的關(guān)聯(lián)關(guān)系,據(jù)此可改變商品的擺放位置,制定捆綁銷售等策略。亞馬遜及當(dāng)當(dāng)?shù)荣?gòu)物網(wǎng)站在用戶選擇商品后及時(shí)給出的其他商品的推介就是利用關(guān)聯(lián)分析得到的。
2.分類與預(yù)測(cè)
分類與預(yù)測(cè)是通過(guò)對(duì)當(dāng)前數(shù)據(jù)集合的描述以識(shí)別未知數(shù)據(jù)的歸屬或預(yù)測(cè)未來(lái)數(shù)據(jù)的發(fā)展趨勢(shì)。通過(guò)對(duì)大量銷售數(shù)據(jù)的分析,可以確定特定客戶的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷其下一步的消費(fèi)行為,據(jù)此進(jìn)行定向營(yíng)銷和推送服務(wù),必將大大節(jié)省營(yíng)銷成本,獲得良好的營(yíng)銷收益。
3.聚類分析
聚類就是按照事物的某些屬性把事物聚集成類。聚類之前類的數(shù)量及類的特征都是未知的。應(yīng)用聚類技術(shù)能發(fā)現(xiàn)不同客戶群并刻畫出客戶群的特征,據(jù)此制定營(yíng)銷策略和客戶服務(wù)策略,如超市根據(jù)客戶聚集地中心點(diǎn)制定班車路線,制定商品宣傳策略等。
4.孤立點(diǎn)分析
數(shù)據(jù)庫(kù)中包含的與其他數(shù)據(jù)行為或模型不一致的數(shù)據(jù)對(duì)象稱為孤立點(diǎn),在數(shù)據(jù)庫(kù)中查找識(shí)別孤立點(diǎn)的技術(shù)即為孤立點(diǎn)分析。在銀行、電信等行業(yè)的業(yè)務(wù)數(shù)據(jù)中發(fā)現(xiàn)的孤立點(diǎn)可能預(yù)示著欺詐行為,盡早識(shí)別,可以為企業(yè)減少不必要的經(jīng)濟(jì)損失。另外可用于網(wǎng)絡(luò)的入侵檢測(cè),生態(tài)系統(tǒng)的失調(diào)檢測(cè),特殊病種檢測(cè)等。
5.時(shí)序演變分析
時(shí)序演變分析是建立事件或?qū)ο笮袨殡S時(shí)間變化的規(guī)律或趨勢(shì)的模型。據(jù)此方法利用股市交易信息可分析股市的波動(dòng)趨勢(shì),利用商業(yè)交易信息可分析出產(chǎn)品的銷量變化趨勢(shì)、目標(biāo)市場(chǎng)發(fā)展趨勢(shì)等,利用天氣狀況數(shù)據(jù)可分析天氣的變化趨勢(shì)等。
6.文本信息抽取
文本信息抽取是從非結(jié)構(gòu)化的文本中提取重要信息的過(guò)程。利用該技術(shù)可獲取競(jìng)爭(zhēng)情報(bào),可從新聞等文本中動(dòng)態(tài)抽取日期、地點(diǎn)和人物等信息,并借助關(guān)聯(lián)分析方法進(jìn)一步識(shí)別出產(chǎn)品、企業(yè)、人、事件和地點(diǎn)之間的關(guān)系,使企業(yè)對(duì)競(jìng)爭(zhēng)環(huán)境的感知更敏銳。
7.Web挖掘
Web挖掘是指從網(wǎng)絡(luò)環(huán)境中提取有價(jià)值信息的過(guò)程。如搜索引擎的應(yīng)用;如分析網(wǎng)站的參觀者和購(gòu)買者的高頻率瀏覽路徑,以確定用戶對(duì)某產(chǎn)品的需求,發(fā)現(xiàn)用戶的個(gè)人喜好,發(fā)現(xiàn)用戶的去留傾向……據(jù)此可改變網(wǎng)頁(yè)的設(shè)置,為用戶提供個(gè)性化服務(wù),改變受歡迎產(chǎn)品的經(jīng)營(yíng)和宣傳策略等。
三、數(shù)據(jù)挖掘流程及所面對(duì)的問(wèn)題
數(shù)據(jù)挖掘流程可描述為“數(shù)據(jù)選擇數(shù)據(jù)預(yù)處理數(shù)據(jù)挖掘模式評(píng)估知識(shí)表示”。
數(shù)據(jù)挖掘首先根據(jù)分析目標(biāo)從數(shù)據(jù)源中選取與業(yè)務(wù)相關(guān)的數(shù)據(jù)。數(shù)據(jù)源是存儲(chǔ)業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)。選取的數(shù)據(jù)通常會(huì)存在不完整、含噪聲(錯(cuò)誤數(shù)據(jù))、不一致等問(wèn)題,需要預(yù)處理數(shù)據(jù)使數(shù)據(jù)適合于挖掘。在這一過(guò)程中元數(shù)據(jù)起了非常重要的作用。
數(shù)據(jù)挖掘之前必須選定數(shù)據(jù)挖掘模型,即先做出某種假定,關(guān)聯(lián)分析、聚類分析及分類與預(yù)測(cè)為不同的挖掘模型。分析商品銷售數(shù)據(jù)時(shí)假定其中某些商品具有相關(guān)性,則選擇關(guān)聯(lián)分析模型,若挖掘的結(jié)果找到了產(chǎn)品A的購(gòu)買帶來(lái)產(chǎn)品B的購(gòu)買則是具體的模式。最終需要評(píng)測(cè)這種模式是不是真實(shí)有效且對(duì)商業(yè)決策有指導(dǎo)意義(模型評(píng)估,利用興趣度度量加人的識(shí)別),保留有意義的模型,并用一種用戶容易理解的方式表達(dá)出來(lái)(知識(shí)表示)。
數(shù)據(jù)的選擇和預(yù)處理會(huì)直接影響數(shù)據(jù)挖掘的結(jié)果。另外任何一種挖掘模型和挖掘算法都不是萬(wàn)能的,不同的商業(yè)問(wèn)題需要用不同的方法去解決。對(duì)于特定的商業(yè)問(wèn)題和特定數(shù)據(jù)可能有多種算法,需要評(píng)估以選取最佳算法。
四、總結(jié)
數(shù)據(jù)挖掘作為正在興起并得到廣泛應(yīng)用的信息技術(shù)具有巨大的商業(yè)價(jià)值,特別是在銀行、電信、保險(xiǎn)、交通、網(wǎng)上商城、超市等商業(yè)領(lǐng)域都有很好的表現(xiàn)。數(shù)據(jù)挖掘技術(shù)可以組織并深層次分析企業(yè)積累的海量業(yè)務(wù)數(shù)據(jù),預(yù)測(cè)客戶行為,預(yù)測(cè)產(chǎn)品狀況,預(yù)測(cè)市場(chǎng)走勢(shì),幫助決策者正確判斷即將出現(xiàn)的機(jī)會(huì),調(diào)整策略,減少風(fēng)險(xiǎn)。因此利用數(shù)據(jù)挖掘技術(shù)必將大大提高商業(yè)組織利用信息的能力,使得信息更好地為決策服務(wù)。
但數(shù)據(jù)挖掘不是萬(wàn)能的,在實(shí)際應(yīng)用中還要受到許多限制。有足夠的合適的數(shù)據(jù),選擇恰當(dāng)?shù)哪P秃退惴?,有決策者的支持等都是有效應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要條件。
參考文獻(xiàn):
[1]李佩鈺等:藍(lán)平長(zhǎng)二 商業(yè)理論洛陽(yáng)紙貴,biz.省略
[2]欒世武:數(shù)據(jù)挖掘給企業(yè)應(yīng)用帶來(lái)什么,省略ki.省略
【關(guān)鍵詞】數(shù)據(jù)挖掘 知識(shí)獲取 數(shù)據(jù)庫(kù)
數(shù)據(jù)的迅速增加與數(shù)據(jù)分析方法的滯后之間的矛盾越來(lái)越突出,人們希望在對(duì)已有的大量數(shù)據(jù)分析的基礎(chǔ)上進(jìn)行科學(xué)研究、商業(yè)決策或者企業(yè)管理,但是目前所擁有的數(shù)據(jù)分析工具很難對(duì)數(shù)據(jù)進(jìn)行深層次的處理,使得人們只能望“數(shù)”興嘆。數(shù)據(jù)挖掘正是為了解決傳統(tǒng)分析方法的不足,并針對(duì)大規(guī)模數(shù)據(jù)的分析處理而出現(xiàn)的。數(shù)據(jù)挖掘通過(guò)在大量數(shù)據(jù)的基礎(chǔ)上對(duì)各種學(xué)習(xí)算法的訓(xùn)練,得到數(shù)據(jù)對(duì)象間的關(guān)系模式,這些模式反映了數(shù)據(jù)的內(nèi)在特性,是對(duì)數(shù)據(jù)包含信息的更高層次的抽象。
一、數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從數(shù)據(jù)倉(cāng)庫(kù)中提取出可信的、新穎的、有效的并能被人理解的模式的高級(jí)處理過(guò)程。所謂模式,可以看作是我們所說(shuō)的知識(shí),它給出了數(shù)據(jù)的特性或數(shù)據(jù)之間的關(guān)系,是對(duì)數(shù)據(jù)包含的信息更抽象的描述。如:成績(jī)優(yōu)秀的學(xué)生學(xué)習(xí)都非常刻苦;發(fā)燒的人是因?yàn)榛剂烁忻暗?。模式的表示方法很多,可以利用圖形、文字、表達(dá)式等方式表示;所謂處理過(guò)程是指數(shù)據(jù)挖掘是一個(gè)多步驟的對(duì)大量數(shù)據(jù)進(jìn)行分析的過(guò)程,包括數(shù)據(jù)預(yù)處理、模式提取、知識(shí)評(píng)估及過(guò)程優(yōu)化。知識(shí)提取往往需要經(jīng)過(guò)多次的反復(fù),通過(guò)對(duì)相關(guān)數(shù)據(jù)的再處理及知識(shí)學(xué)習(xí)算法的優(yōu)化,不斷提高學(xué)習(xí)效率。
二、數(shù)據(jù)挖掘的技術(shù)算法
在數(shù)據(jù)挖掘的處理過(guò)程中,數(shù)據(jù)挖掘引擎是最為關(guān)鍵的,而決定數(shù)據(jù)挖掘引擎的算法主要有以下幾類:
(一)數(shù)據(jù)挖掘的信息論方法
該類方法是利用信息論原理,計(jì)算數(shù)據(jù)庫(kù)中各字段的信息量,建立決策樹或者決策規(guī)則樹。比較重要的有ID3方法和IBLE方法。
(二)數(shù)據(jù)挖掘的集合論方法
粗集方法:在數(shù)據(jù)庫(kù)中將元素看成行對(duì)象,列元素看成屬性(分為條件屬性和結(jié)論屬性)。等價(jià)關(guān)系定義為不同對(duì)象在某個(gè)屬性上相同,這些等價(jià)關(guān)系的對(duì)象組成的集合稱為該等價(jià)關(guān)系的等價(jià)類。條件屬性上的等價(jià)類E與結(jié)論屬性上的等價(jià)類之間有三種關(guān)系:下近似,Y包含E;上近似,Y和E的交非空;無(wú)關(guān),Y和E的交為空。對(duì)下近似建立確定性規(guī)則,對(duì)上近似建立不確定性規(guī)則(含可信度),對(duì)無(wú)關(guān)情況不存在規(guī)則。
概念樹方法:數(shù)據(jù)庫(kù)中記錄的屬性字段按歸類方式進(jìn)行抽象,建立起來(lái)的層次結(jié)構(gòu)稱為概念樹。
(三)數(shù)據(jù)挖掘的仿生物方法
神經(jīng)網(wǎng)絡(luò)方法:神經(jīng)網(wǎng)絡(luò)通過(guò)學(xué)習(xí)待分析數(shù)據(jù)中的模式來(lái)構(gòu)造模型,一般可對(duì)隱類型進(jìn)行分類,用于非線性的、復(fù)雜的數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)由“神經(jīng)元”的互連或按層組織的結(jié)點(diǎn)構(gòu)成。通常,神經(jīng)模型由三個(gè)層次組成:輸入、中間層和輸出。每一神經(jīng)元求得輸入值,再計(jì)算總輸入值,由過(guò)濾機(jī)制比較總輸入,然后確定其自己的輸出值??赏ㄟ^(guò)連接一組神經(jīng)元來(lái)模型化復(fù)雜行為。當(dāng)修改連接層的“連接度”或參數(shù)時(shí),神經(jīng)網(wǎng)絡(luò)就進(jìn)行了“學(xué)習(xí)”和“訓(xùn)練”。這里,神經(jīng)網(wǎng)絡(luò)用恰當(dāng)?shù)臄?shù)據(jù)倉(cāng)庫(kù)示例來(lái)訓(xùn)練。目前,神經(jīng)網(wǎng)絡(luò)以MP和Hebb學(xué)習(xí)規(guī)則為基礎(chǔ),建立了三大類多種神經(jīng)網(wǎng)絡(luò)模型。
三、數(shù)據(jù)挖掘技術(shù)的應(yīng)用
首先介紹一個(gè)著名的實(shí)例:SKICAT。然后結(jié)合實(shí)際具體探討數(shù)據(jù)挖掘技術(shù)在Bayesian中的應(yīng)用。
(一)天文數(shù)據(jù)分析中的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘在天文學(xué)上有一個(gè)非常著名的應(yīng)用系統(tǒng):SKICAT[外3]。它是美國(guó)加州理工學(xué)院(CIT)與天文科學(xué)家合作開發(fā)的用于幫助天文學(xué)家發(fā)現(xiàn)遙遠(yuǎn)的類星體的一個(gè)工具。SKICAT既是第一個(gè)獲得相當(dāng)成功的數(shù)據(jù)挖掘應(yīng)用,也是人工智能技術(shù)在天文學(xué)和空間科學(xué)上第一批成功應(yīng)用之一。利用SKICAT,天文學(xué)家已發(fā)現(xiàn)了16個(gè)新的極其遙遠(yuǎn)的類星體,該項(xiàng)發(fā)現(xiàn)能幫助天文工作者更好地研究類星體的形成以及早期宇宙的結(jié)構(gòu)。
(二)Bayesian網(wǎng)絡(luò)中的數(shù)據(jù)挖掘
Bayesian網(wǎng)是由變量及其關(guān)聯(lián)組成的有向圖。它主要用于處理實(shí)際應(yīng)用中遇到的不確定信息。圖中還帶有各變量的概率分布,定量的概率信息被表示為條件概率表中在決策前對(duì)實(shí)際問(wèn)題的先驗(yàn)的理解與把握。
然而,針對(duì)實(shí)際問(wèn)題建立一個(gè)應(yīng)用于決策的Bayesian網(wǎng)絡(luò)時(shí)存在兩個(gè)問(wèn)題。首先,我們常常是憑個(gè)人對(duì)問(wèn)題的經(jīng)驗(yàn)與理解來(lái)建立模型的,因此建立的模型很難反映問(wèn)題的客觀實(shí)際。其二,在確定Bayesian網(wǎng)中的條件概率表時(shí),我們需要用定量的數(shù)值以支持計(jì)算,但實(shí)際中,人們很難給出一個(gè)具體概率值,一般的應(yīng)用往往是根據(jù)經(jīng)驗(yàn),這就要求我們有一個(gè)合理的方法,從大量雜亂無(wú)序的數(shù)據(jù)中將它們找到,并填入條件概率表中去。
而數(shù)據(jù)挖掘技術(shù)恰恰為我們提供了一系列有效的方法來(lái)尋找隱藏于大規(guī)模數(shù)據(jù)之中的有用數(shù)據(jù),以解決以上兩個(gè)問(wèn)題。在Bayesian建模中,我們需要找到各變量之間的關(guān)聯(lián),這種關(guān)聯(lián)與關(guān)系數(shù)據(jù)庫(kù)理論中的函數(shù)依賴(Functional Dependence)近似,后者表示了關(guān)系表中各屬性(Attribute)之間的依賴關(guān)系,而前者表示Bayesian網(wǎng)中各變量是關(guān)系表中的屬性時(shí),兩者的表示含義是一致而和諧的。因而,只要在關(guān)系表的元組中發(fā)掘出函數(shù)依賴,便可以認(rèn)清Bayesian網(wǎng)中各變量之間的關(guān)系,從而給建模予以理論依據(jù),并且在數(shù)量上以具體值作為技術(shù)支持。
將數(shù)據(jù)挖掘中函數(shù)依賴的挖掘與Bayesian網(wǎng)技術(shù)結(jié)合起來(lái)[外4],將帶來(lái)以下好處:簡(jiǎn)化Bayesian網(wǎng)的結(jié)構(gòu); 根據(jù)所挖掘出的函數(shù)依賴的置信度,可以使Bayesian網(wǎng)中各結(jié)點(diǎn)關(guān)聯(lián)更加清晰且有理可尋。
隨著信息技術(shù)的發(fā)展,采集的數(shù)據(jù)量的急劇加大,此時(shí)產(chǎn)生了數(shù)據(jù)挖掘,它就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。在對(duì)大量的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理過(guò)程中,從而提取得到對(duì)一些決策數(shù)據(jù)的支撐。
數(shù)據(jù)挖掘是一個(gè)由數(shù)理統(tǒng)計(jì)到人工智能,進(jìn)而到機(jī)器學(xué)習(xí)的逐步演變、變化過(guò)程。它是一門交叉的學(xué)科,是一門涉及廣泛的學(xué)科,是一門在社會(huì)的發(fā)展歷程中不斷前進(jìn)變化的學(xué)科。它所涉及到的內(nèi)容包括數(shù)據(jù)庫(kù)技術(shù)、人機(jī)智能、知識(shí)庫(kù)系統(tǒng)、知識(shí)獲取、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)學(xué)、模式識(shí)別、信息檢索等,并且在跟著發(fā)展的需要、學(xué)科的進(jìn)步變化而不斷發(fā)展、向前。
由于數(shù)據(jù)量之大,傳統(tǒng)的統(tǒng)計(jì)分析方法主要是對(duì)沒有明確假設(shè)的前提下去挖掘信息,只會(huì)使得效率低下,同時(shí),對(duì)于問(wèn)題的解決也在大打折扣,處理的結(jié)果不理想,傳統(tǒng)的這種方法沒有找到數(shù)據(jù)之間的內(nèi)在聯(lián)系,這樣只是看到過(guò)去,不能很好的預(yù)測(cè)未來(lái),對(duì)所要探索的目標(biāo)不能得出想要的結(jié)論;而數(shù)據(jù)挖掘是將所得到的信息是對(duì)前者的補(bǔ)充,得到未知的潛在的東西,是在原有的基礎(chǔ)上發(fā)現(xiàn)那些沒法預(yù)料的、不是靠感官所能察覺的,甚至是一些與生活所違背的,它更是人工智能和統(tǒng)計(jì)分析的結(jié)合,是對(duì)傳統(tǒng)技術(shù)的進(jìn)一步拓展,由于對(duì)數(shù)據(jù)分析要求的進(jìn)一步提高,也正是這一些特征才使得數(shù)據(jù)挖掘的結(jié)果而更加有意義與價(jià)值。
二、數(shù)據(jù)挖掘的相關(guān)技術(shù)與在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用
正是由于對(duì)于數(shù)據(jù)的大量收集、先進(jìn)的計(jì)算機(jī)技術(shù)、數(shù)據(jù)算法的產(chǎn)生、超大規(guī)模數(shù)據(jù)庫(kù)的出現(xiàn)、數(shù)據(jù)訪問(wèn)速度的提升、對(duì)數(shù)據(jù)進(jìn)行精深統(tǒng)計(jì)方法計(jì)算的能力等等一系列東西的出現(xiàn),從而一步步使得數(shù)據(jù)挖掘技術(shù)的作用越來(lái)越廣泛。對(duì)于經(jīng)濟(jì)統(tǒng)計(jì)準(zhǔn)確性與實(shí)用性的需要,數(shù)據(jù)挖掘技術(shù)才開始慢慢滲透到經(jīng)濟(jì)統(tǒng)計(jì)工作中。數(shù)據(jù)挖掘技術(shù)的主要方法有:
統(tǒng)計(jì)分析方法,數(shù)據(jù)庫(kù)字段項(xiàng)之間存在兩種關(guān)系,函數(shù)關(guān)系和相關(guān)關(guān)系,即能用函數(shù)公式表示的確定性關(guān)系與不能用函數(shù)公式表示,但仍是相關(guān)確定性關(guān)系。即利用統(tǒng)計(jì)學(xué)原理對(duì)數(shù)據(jù)庫(kù)中的信息進(jìn)行分析。
神經(jīng)網(wǎng)絡(luò)方法,是一種模擬人腦信息加工過(guò)程的智能化信息技術(shù)。就像人的神經(jīng)網(wǎng)絡(luò)的過(guò)程一樣,經(jīng)過(guò)輸入、分析、輸出的過(guò)程,而在經(jīng)濟(jì)統(tǒng)計(jì)過(guò)程中得到實(shí)際應(yīng)用。它為我們提供了一種完整的、準(zhǔn)確的處理過(guò)程,使得經(jīng)濟(jì)運(yùn)行模式就像人在接受處理信息的過(guò)程一樣而形象化、具體化、實(shí)用化,更好地取得經(jīng)濟(jì)過(guò)程中各個(gè)部分之間的聯(lián)系,從而獲得對(duì)經(jīng)濟(jì)問(wèn)題的分析,獲得處理辦法。
決策樹是一種用于預(yù)測(cè)模型的算法,是基于統(tǒng)計(jì)理論的非參數(shù)識(shí)別技術(shù),通過(guò)對(duì)大量數(shù)據(jù)的有目的分類,找到有價(jià)值、潛在的信息。正是由于分類速度快,描述簡(jiǎn)單,特別適合對(duì)經(jīng)濟(jì)運(yùn)行過(guò)程中出現(xiàn)的大規(guī)模數(shù)據(jù)的處理工作。
粗集理論的方法,是一種研究不精確、不確定知識(shí)的數(shù)學(xué)工具,是通過(guò)對(duì)上下近似集來(lái)出來(lái)不確定問(wèn)題。它算法簡(jiǎn)單,易于操作;不需要給出額外信息;簡(jiǎn)化輸入信息的表達(dá)空間。對(duì)于不確定的經(jīng)濟(jì)因素提供了一種思維方法,正是通過(guò)這種近似原則,使得經(jīng)濟(jì)決策更加的與需求所接近,為最大利益化的獲得給予有力支撐。
遺傳算法,是一種根據(jù)生物自然選擇與遺傳機(jī)理的隨機(jī)搜索算法,其思路是根據(jù)社會(huì)問(wèn)題,在指定對(duì)象的人群中去采集信息,通過(guò)對(duì)隱含信息的整合、分析,進(jìn)而得到結(jié)果。它具有隱含性、易于和其它模型結(jié)合,可以對(duì)隱含數(shù)據(jù)進(jìn)行采集,而后把挖掘出的數(shù)據(jù)加以分析,進(jìn)而得到應(yīng)用。經(jīng)濟(jì)問(wèn)題是一個(gè)發(fā)展變化的問(wèn)題,內(nèi)部有著千絲萬(wàn)縷的聯(lián)系,參照遺傳算法,我們就可以通過(guò)源頭開始,一步步向下延伸,去提取數(shù)據(jù),進(jìn)行整體分析,這樣就把經(jīng)濟(jì)問(wèn)題具體化、直接化、目標(biāo)化,使得問(wèn)題的研究更加直觀,把隱性的表現(xiàn)化,促使經(jīng)濟(jì)統(tǒng)計(jì)工作更加簡(jiǎn)單、直白。
三、數(shù)據(jù)挖掘流程在經(jīng)濟(jì)統(tǒng)計(jì)中的體現(xiàn)
定義問(wèn)題,對(duì)于經(jīng)濟(jì)問(wèn)題,要定義出所要探究的問(wèn)題,確定數(shù)據(jù)挖掘的目的。1.數(shù)據(jù)準(zhǔn)備,選擇數(shù)據(jù),數(shù)據(jù)預(yù)處理。即對(duì)所要探究的經(jīng)濟(jì)問(wèn)題所涉及到的數(shù)據(jù)進(jìn)行采集,做好前期的一些處理工作,使得數(shù)據(jù)得到簡(jiǎn)化,為后續(xù)工作的順利進(jìn)行做準(zhǔn)備。2.數(shù)據(jù)挖掘,根據(jù)數(shù)據(jù)的類型和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法,利用人工智能、統(tǒng)計(jì)等方法,去發(fā)掘出有用的信息。3.結(jié)果分析,對(duì)上述得到的結(jié)果進(jìn)行分析、評(píng)估,進(jìn)而通過(guò)這一步驟去調(diào)整上面的方法,使得結(jié)果更加貼切。4.知識(shí)的運(yùn)用,將得到的結(jié)果應(yīng)用到實(shí)際經(jīng)濟(jì)問(wèn)題中去,進(jìn)而實(shí)現(xiàn)經(jīng)濟(jì)的良好運(yùn)行與發(fā)展。
關(guān)鍵詞:數(shù)據(jù)挖掘 移動(dòng)通信 應(yīng)用
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2012)09-0032-01
自20世紀(jì)50年代中期開始,計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)的蓬勃發(fā)展,將社會(huì)前進(jìn)的步伐帶入了信息時(shí)代。當(dāng)下是一個(gè)信息爆炸的時(shí)代,每一分鐘都有大量的信息涌現(xiàn)。這大量信息的產(chǎn)生一方面給人們帶來(lái)了便利,另一面這種信息爆炸現(xiàn)象的負(fù)面作用也愈發(fā)明顯:信息量巨大,難以一一消化,同時(shí)這其中真?zhèn)坞y辨,給信息安全帶來(lái)威脅;由于信息的載體形式多種多樣,也為有效處理信息造成困難。信息爆炸卻知識(shí)貧乏,如何從海量的信息中提取有用的知識(shí)。不是被信息淹沒,而是有效利用信息。數(shù)據(jù)挖掘技術(shù)因此應(yīng)運(yùn)而生,并成為計(jì)算機(jī)技術(shù)發(fā)展的熱點(diǎn)。
1、數(shù)據(jù)挖掘技術(shù)概述
所謂數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程[1]。數(shù)據(jù)挖掘是一門交叉學(xué)科,涉及到數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、可視化、機(jī)器學(xué)習(xí)、信息科學(xué)等多種學(xué)科。數(shù)據(jù)挖掘技術(shù)除了對(duì)數(shù)據(jù)進(jìn)行基本的查詢,更重要的是從無(wú)序的數(shù)據(jù)中挖掘、整理信息,提取知識(shí),進(jìn)而提供決策支持。
1.1 數(shù)據(jù)挖掘的原理
數(shù)據(jù)挖掘的原理可以簡(jiǎn)單概括為6個(gè)過(guò)程:確定任務(wù)目標(biāo),熟悉研究領(lǐng)域內(nèi)的數(shù)據(jù)及背景情況,明確數(shù)據(jù)挖掘的目標(biāo);建立數(shù)據(jù)倉(cāng)庫(kù),即對(duì)根據(jù)要求對(duì)數(shù)據(jù)進(jìn)行選擇,選擇與任務(wù)目標(biāo)相關(guān)的數(shù)據(jù);進(jìn)行數(shù)據(jù)預(yù)處理,精簡(jiǎn)數(shù)據(jù),除去冗余的數(shù)據(jù)信息,并統(tǒng)一形式,便于處理;數(shù)據(jù)挖掘,根據(jù)目標(biāo)確定算法,并選擇適合參數(shù)、建立模型;評(píng)估、解釋和應(yīng)用模型,必要時(shí)進(jìn)行反復(fù)提?。恢R(shí)評(píng)價(jià),將提取的數(shù)據(jù)知識(shí)提供給用戶試用,并進(jìn)行反饋[2]。
1.2 數(shù)據(jù)挖掘的常用技術(shù)
對(duì)數(shù)據(jù)進(jìn)行分析的常用技術(shù)包括有聚類、分類、回歸分析、關(guān)聯(lián)原則、偏差分析等等[3]。聚類分析是以相似性、差異性對(duì)數(shù)據(jù)進(jìn)行分析,同一組數(shù)據(jù)相似性盡可能大,不同組數(shù)據(jù)差異性要明顯,分類反之?;貧w分析是分析數(shù)據(jù)屬性隨時(shí)間的變化,探索不同數(shù)據(jù)間變化的依賴關(guān)系。關(guān)聯(lián)原則即探尋數(shù)據(jù)間的關(guān)聯(lián)及相互關(guān)系。偏差分析主要是對(duì)數(shù)據(jù)庫(kù)中的異常記錄,反常實(shí)例進(jìn)行分析,尋找有意義的差別。
數(shù)據(jù)挖掘的常用技術(shù)主要來(lái)自以下相關(guān)領(lǐng)域:統(tǒng)計(jì)學(xué)、決策樹、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗集、模糊邏輯、可視化技術(shù)等。數(shù)據(jù)挖掘的應(yīng)用十分廣泛,主要有商業(yè)應(yīng)用,多應(yīng)用于市場(chǎng)營(yíng)銷、金融、銀行、制造和通信領(lǐng)域;在科學(xué)研究方面,對(duì)生物、醫(yī)學(xué)、氣象、水文、地質(zhì)和考古等學(xué)科的科研工作都有積極作用。
2、我國(guó)移動(dòng)通信現(xiàn)狀概述
近年來(lái),移動(dòng)通信領(lǐng)域迅猛發(fā)展,成為人們?nèi)粘I钪胁豢苫蛉钡臏贤ㄊ侄?。移?dòng)通信的服務(wù)從最初提供簡(jiǎn)單通話服務(wù)發(fā)展成綜合服務(wù),包括語(yǔ)音、圖像等多種類的信息傳遞。隨著技術(shù)的不斷發(fā)展和人們需求的多樣化,計(jì)算機(jī)及網(wǎng)絡(luò)等方式綜合應(yīng)用于通信領(lǐng)域已是大勢(shì)所趨。利用數(shù)據(jù)挖掘技術(shù)可以有效利用資源,能夠提高通信領(lǐng)域的工作效率,改善服務(wù)質(zhì)量。1998年我國(guó)的移動(dòng)通信業(yè)開始興起,其后的發(fā)展速度令人咋舌,為世界之最。中國(guó)移動(dòng)通信業(yè)的發(fā)展世人側(cè)目,而且還具有巨大提升潛力和盈利空間。產(chǎn)業(yè)內(nèi)部的競(jìng)爭(zhēng)狀態(tài)取決于五種基本競(jìng)爭(zhēng)作用力[4],即進(jìn)入威脅、替代威脅、買方侃價(jià)能力、供方侃價(jià)能力和現(xiàn)有競(jìng)爭(zhēng)對(duì)手的競(jìng)爭(zhēng)。
3、數(shù)據(jù)挖掘技術(shù)在移動(dòng)通信中的應(yīng)用
移動(dòng)通信業(yè)在信息化過(guò)程中得到了長(zhǎng)足的發(fā)展,各類應(yīng)用系統(tǒng)被廣泛應(yīng)用,如計(jì)費(fèi)系統(tǒng)、綜合業(yè)務(wù)系統(tǒng)等,在較為完整的保存歷史數(shù)據(jù)的同時(shí),也造成的海量數(shù)據(jù)的冗余,無(wú)法有效為使用者提供有用的信息。另一方面,海量數(shù)據(jù)的存在也為計(jì)算機(jī)設(shè)備的有效運(yùn)行帶來(lái)困擾。如何滿足用戶日益提高的需求的同時(shí)降低成本、提高效益,成為移動(dòng)通信發(fā)展的重大課題。
數(shù)據(jù)挖掘技術(shù)成為解決這一問(wèn)題重要手段,由于日益激勵(lì)的競(jìng)爭(zhēng)、數(shù)據(jù)電子化程度較高、用戶關(guān)系管理系統(tǒng)的建立等多方面原因,中國(guó)移動(dòng)通信等電信企業(yè)已經(jīng)將該技術(shù)納入企業(yè)的經(jīng)營(yíng)中。
3.1 數(shù)據(jù)挖掘應(yīng)用的典型技術(shù)
數(shù)據(jù)倉(cāng)庫(kù)的建立,共建一個(gè)可以共享移動(dòng)通信業(yè)務(wù)數(shù)據(jù)的平臺(tái),采用合適的算法對(duì)數(shù)據(jù)信息進(jìn)行挖掘,獲得對(duì)有用信息,對(duì)運(yùn)營(yíng)商的發(fā)展提供科學(xué)技術(shù)支持。
決策樹技術(shù)的應(yīng)用,該技術(shù)可對(duì)具有不同特性的商品的營(yíng)銷生成相應(yīng)的模型,有效區(qū)分用戶群體,對(duì)不同的群體采取不同的應(yīng)對(duì)策略。關(guān)聯(lián)規(guī)則的應(yīng)用于告警相關(guān)性分析,快捷查出故障點(diǎn)及發(fā)生原因。同時(shí)APriori算法可確定告警之間的關(guān)聯(lián),方便維護(hù)及管理,提高工作效率。
3.2 數(shù)據(jù)挖掘技術(shù)應(yīng)用于移動(dòng)通信中的作用
業(yè)務(wù)預(yù)測(cè)通過(guò)分析用戶的歷史信息包括用戶個(gè)人數(shù)據(jù)及使用情況,確定業(yè)務(wù)發(fā)展的關(guān)鍵影響因素。通過(guò)對(duì)相關(guān)因素進(jìn)行合理的預(yù)測(cè),確定未來(lái)業(yè)務(wù)發(fā)展的可能狀況。從而為下一步業(yè)務(wù)的開展、制定戰(zhàn)略等提供決策依據(jù)。同時(shí)可以根據(jù)發(fā)生的實(shí)際情況對(duì)預(yù)測(cè)的算法、模型進(jìn)行改善。主要應(yīng)用的算法有時(shí)間序列模式、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)。
數(shù)據(jù)挖掘還可以對(duì)用戶忠誠(chéng)度的進(jìn)行預(yù)測(cè)和控制,“用戶忠誠(chéng)度”是指用戶更換運(yùn)營(yíng)商的可能性。通過(guò)對(duì)離網(wǎng)標(biāo)識(shí)、用戶信息資料、呼叫數(shù)據(jù)、賬戶和付費(fèi)數(shù)據(jù)及其他數(shù)據(jù)的分析對(duì)用戶忠誠(chéng)度進(jìn)行預(yù)測(cè),采取相關(guān)措施,從而最大限度的保留用戶量。
通過(guò)對(duì)分類和聚類算法對(duì)用戶群體進(jìn)行細(xì)分,為一對(duì)一營(yíng)銷和相關(guān)新產(chǎn)品的開發(fā)提供基礎(chǔ)。用戶呼叫模式是通過(guò)用戶的通話詳單來(lái)進(jìn)行分析,使得運(yùn)營(yíng)商掌握用戶行為特征,以制定不同的營(yíng)銷策略。數(shù)據(jù)挖掘技術(shù)還可應(yīng)用于網(wǎng)絡(luò)資源管理,大客戶特征識(shí)別等,通過(guò)對(duì)相關(guān)數(shù)據(jù)的分析,為運(yùn)營(yíng)商提供決策支持。
數(shù)據(jù)挖掘系統(tǒng)被開發(fā)出來(lái)已廣泛應(yīng)用到社會(huì)生活的各個(gè)方面,雖然效率方面不盡如人意,但是隨著硬件的改善,算法的改進(jìn),數(shù)據(jù)挖掘技術(shù)在移動(dòng)通信中的應(yīng)用乃至各行各業(yè)都會(huì)有迅猛的進(jìn)展。
參考文獻(xiàn)
[1]陳東鵬.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在移動(dòng)通信領(lǐng)域的應(yīng)用.電信科學(xué),2001,(5):34-35.
[2]王扶東,朱云龍,薛勁松,李兵.基于數(shù)據(jù)挖掘的客戶關(guān)系分析評(píng)價(jià)系統(tǒng).東南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版,2002,10(4):99-102.
關(guān)鍵詞:商務(wù)智能數(shù)據(jù)挖掘第三方物流研究
在當(dāng)今競(jìng)爭(zhēng)日益激烈的市場(chǎng)環(huán)境中,第三方物流企業(yè)都希望能夠從浩如煙海的商務(wù)數(shù)據(jù)以及其他相關(guān)的物流業(yè)務(wù)數(shù)據(jù)中發(fā)現(xiàn)帶來(lái)巨額利潤(rùn)的商機(jī)。只有那些利用先進(jìn)的信息技術(shù)成功地收集、分析、理解信息并依據(jù)信息進(jìn)行決策的物流企業(yè)才能獲得競(jìng)爭(zhēng)優(yōu)勢(shì),才是物流市場(chǎng)的贏家。因此,越來(lái)越多的物流管理者開始借助商務(wù)智能技術(shù)來(lái)發(fā)現(xiàn)物流運(yùn)營(yíng)過(guò)程中存在的問(wèn)題,找到有利的物流解決方案。
商務(wù)智能技術(shù)應(yīng)用現(xiàn)狀
我國(guó)加入了WTO,在許多領(lǐng)域,如金融、保險(xiǎn)、物流等領(lǐng)域?qū)⒅鸩綄?duì)外開放,這就意味著許多第三方物流企業(yè)將面臨來(lái)自國(guó)際大型跨國(guó)物流公司的巨大競(jìng)爭(zhēng)壓力。國(guó)外發(fā)達(dá)國(guó)家各種企業(yè)采用商務(wù)智能的水平已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了我國(guó)。美國(guó)PaloAlto管理集團(tuán)公司1999年對(duì)歐洲、北美和日本375家大中型企業(yè)的商務(wù)智能技術(shù)的采用情況進(jìn)行了調(diào)查。結(jié)果顯示,在金融領(lǐng)域,商務(wù)智能技術(shù)的應(yīng)用水平已經(jīng)達(dá)到或接近70%,在營(yíng)銷領(lǐng)域也達(dá)到50%,并且在其他應(yīng)用領(lǐng)域?qū)υ摷夹g(shù)的采納水平都提高約50%。現(xiàn)在,許多第三方物流企業(yè)都把數(shù)據(jù)看成寶貴的財(cái)富,紛紛利用商務(wù)智能發(fā)現(xiàn)其中隱藏的信息,借此獲得巨額的回報(bào)。
據(jù)IDC對(duì)歐洲和北美62家采用了商務(wù)智能技術(shù)的企業(yè)的調(diào)查分析發(fā)現(xiàn),這些企業(yè)的3年平均投資回報(bào)率為401%,其中25%的企業(yè)的投資回報(bào)率超過(guò)600%。調(diào)查結(jié)果還顯示,一個(gè)企業(yè)要想在復(fù)雜的環(huán)境中獲得成功,高層管理者必須能夠控制極其復(fù)雜的商業(yè)結(jié)構(gòu),若沒有詳實(shí)的事實(shí)和數(shù)據(jù)支持,是很難辦到的。因此,隨著數(shù)據(jù)挖掘技術(shù)的不斷改進(jìn)和日益成熟,它必將被更多的第三方物流企業(yè)采用,使更多的物流管理者得到更多的商務(wù)智能。
商務(wù)智能技術(shù)的組成
具體地說(shuō),商務(wù)智能技術(shù)有數(shù)據(jù)倉(cāng)庫(kù)(datawarehousing)、聯(lián)機(jī)分析處理(on-lineanalyticalprocessing,簡(jiǎn)稱OLAP)、數(shù)據(jù)挖掘(datamining),包括這三者在內(nèi)的用于綜合、探察和分析商務(wù)數(shù)據(jù)的先進(jìn)的信息技術(shù)的統(tǒng)稱就是商務(wù)智能技術(shù)。
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、隨時(shí)間變化的主要用于決策支持的數(shù)據(jù)的集合。一般來(lái)說(shuō),大的物流公司或企業(yè)內(nèi)存在著各種各樣的信息系統(tǒng),這些應(yīng)用驅(qū)動(dòng)的操作型信息系統(tǒng)為企業(yè)不同的物流業(yè)務(wù)系統(tǒng)服務(wù),具有不同接口和不同的數(shù)據(jù)表示方法,互相孤立。利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)可以動(dòng)態(tài)地將各個(gè)物流企業(yè)子系統(tǒng)中的數(shù)據(jù)抽取集成到一起,進(jìn)行清洗、轉(zhuǎn)換等處理之后加載到數(shù)據(jù)倉(cāng)庫(kù)中,通過(guò)周期性的刷新,為物流用戶提供一個(gè)統(tǒng)一的干凈的數(shù)據(jù)視圖,為數(shù)據(jù)分析提供一個(gè)高質(zhì)量的數(shù)據(jù)源。
對(duì)于數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),可以使用一些增強(qiáng)的查詢和報(bào)表工具進(jìn)行復(fù)雜的查詢和即時(shí)的報(bào)表制作,可以利用OLAP技術(shù)從多種角度對(duì)物流業(yè)務(wù)數(shù)據(jù)進(jìn)行多方面的匯總、統(tǒng)計(jì)、計(jì)算,還可以利用數(shù)據(jù)挖掘技術(shù)自動(dòng)發(fā)現(xiàn)其中隱含的有用的物流信息。
數(shù)據(jù)挖掘又稱知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,簡(jiǎn)稱KDD),是從大量數(shù)據(jù)中抽取有意義的、隱含的、以前未知的并有潛在使用價(jià)值的知識(shí)的過(guò)程。數(shù)據(jù)挖掘是一個(gè)多學(xué)科交叉性學(xué)科,它涉及統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、模式識(shí)別、可視化以及高性能計(jì)算等多個(gè)學(xué)科。利用數(shù)據(jù)挖掘技術(shù)可以分析各種類型的數(shù)據(jù),例如結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)、靜態(tài)的歷史數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)流數(shù)據(jù)等。
數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用分析
數(shù)據(jù)挖掘是從大量的、不完全的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的數(shù)據(jù)中發(fā)現(xiàn)其潛在規(guī)律的技術(shù),是當(dāng)前計(jì)算機(jī)科學(xué)研究的熱點(diǎn)之一。隨著信息技術(shù)的高速發(fā)展,積累的有關(guān)物流行業(yè)的數(shù)據(jù)量劇增,如何從大量的物流數(shù)據(jù)中提取有用的知識(shí)成為第三方物流企業(yè)當(dāng)務(wù)之急。數(shù)據(jù)挖掘就是為順應(yīng)需要應(yīng)運(yùn)而生發(fā)展起來(lái)的數(shù)據(jù)處理技術(shù)。
數(shù)據(jù)挖掘的對(duì)象
關(guān)系數(shù)據(jù)庫(kù)(relationaldatabase)中通常存儲(chǔ)和管理的是結(jié)構(gòu)化的數(shù)據(jù),它將一個(gè)實(shí)體的各方面信息通過(guò)離散的屬性進(jìn)行描述。而文本數(shù)據(jù)庫(kù)(textdatabase)或文檔數(shù)據(jù)庫(kù)(documentdatabase)則通常存儲(chǔ)和管理的是半結(jié)構(gòu)化的數(shù)據(jù),例如新聞稿件、研究論文、電子郵件、書籍以及WEB頁(yè)面等都屬于半結(jié)構(gòu)化數(shù)據(jù)??臻g數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)中存放的是非結(jié)構(gòu)化數(shù)據(jù),例如地圖、圖片、音頻、視頻等都屬于非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)來(lái)說(shuō),針對(duì)結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)比較成熟,市場(chǎng)上有很多的商品軟件可以使用,用的較多的包括IBMIntelligentMiner、SASEnterpriseMiner、SGIMineSet、ClementineSPSS以及MicrosoftSQLServer2000等。關(guān)于半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)挖掘軟件尚不多,相應(yīng)的算法相對(duì)還較少。從另一個(gè)角度來(lái)說(shuō),數(shù)據(jù)挖掘的分析對(duì)象分為兩種類型:靜態(tài)數(shù)據(jù)和數(shù)據(jù)流(datastream)數(shù)據(jù)?,F(xiàn)在的多數(shù)數(shù)據(jù)挖掘算法是用于分析靜態(tài)數(shù)據(jù)的。
數(shù)據(jù)挖掘的分析
無(wú)論要分析的數(shù)據(jù)對(duì)象的類型如何,常用的數(shù)據(jù)挖掘分析包括關(guān)聯(lián)分析、序列分析、分類、預(yù)測(cè)、聚類分析以及時(shí)間序列分析等。
關(guān)聯(lián)分析關(guān)聯(lián)分析是由RakeshApwal等人首先提出的。兩個(gè)或兩個(gè)以上變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類重要的、可被發(fā)現(xiàn)的知識(shí)。關(guān)聯(lián)分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。一般用支持度和可信度兩個(gè)閥值來(lái)度量關(guān)聯(lián)規(guī)則的相關(guān)性,還不斷引入興趣度、相關(guān)性等參數(shù),使得所挖掘的規(guī)則更符合需求。關(guān)聯(lián)分析主要用于發(fā)現(xiàn)不同事件之間的關(guān)聯(lián)性,即一個(gè)事件發(fā)生的同時(shí),另一個(gè)事件也經(jīng)常發(fā)生。關(guān)聯(lián)分析的重點(diǎn)在于快速發(fā)現(xiàn)那些有實(shí)用價(jià)值的關(guān)聯(lián)發(fā)生的事件。其主要依據(jù)是事件發(fā)生的概率和條件概率應(yīng)該符合一定的統(tǒng)計(jì)意義。對(duì)于結(jié)構(gòu)化的數(shù)據(jù),以物流客戶的采購(gòu)習(xí)慣數(shù)據(jù)為例,利用關(guān)聯(lián)分析,可以發(fā)現(xiàn)物流客戶的關(guān)聯(lián)采購(gòu)需要。例如,對(duì)于第三方物流企業(yè)來(lái)說(shuō),一個(gè)托運(yùn)貨物的貨主很可能同時(shí)有貨物的包裝、流通加工等物流業(yè)務(wù)的需求。利用這種知識(shí)可以采取積極的物流運(yùn)營(yíng)策略,擴(kuò)展物流客戶采購(gòu)物流服務(wù)的范圍,吸引更多的物流客戶。通過(guò)調(diào)整服務(wù)的內(nèi)容便于物流顧客采購(gòu)到各種物流服務(wù),或者通過(guò)降低一種物流業(yè)務(wù)的價(jià)格來(lái)促進(jìn)另一種物流業(yè)務(wù)的銷售等。
分類分析分類分析是通過(guò)分析具有類別的樣本的特點(diǎn),得到?jīng)Q定樣本屬于各種類別的規(guī)則或方法。利用這些規(guī)則和方法對(duì)未知類別的樣本分類時(shí)應(yīng)該具有一定的準(zhǔn)確度。分類分析可以根據(jù)顧客的消費(fèi)水平和基本特征對(duì)物流顧客進(jìn)行分類,找出對(duì)第三方物流企業(yè)有較大利益貢獻(xiàn)的重要的物流客戶的特征,通過(guò)對(duì)其進(jìn)行個(gè)性化物流服務(wù),提高他們的忠誠(chéng)度。
聚類分析聚類分析是根據(jù)物以類聚的原理,將本身沒有類別的樣本聚集成不同的組,并且對(duì)每一個(gè)這樣的組進(jìn)行描述的過(guò)程。其主要依據(jù)是聚到同一個(gè)組中的樣本應(yīng)該彼此相似,而屬于不同組的樣本應(yīng)該足夠不相似。
以第三方物流企業(yè)的客戶關(guān)系管理為例,利用聚類分析,根據(jù)物流客戶的個(gè)人特征以及物流業(yè)務(wù)消費(fèi)數(shù)據(jù),可以將客戶群體進(jìn)行細(xì)分。例如,可以得到這樣的一個(gè)物流業(yè)務(wù)消費(fèi)群體:生產(chǎn)企業(yè)對(duì)物流業(yè)務(wù)中運(yùn)輸需求占41%,對(duì)物流業(yè)務(wù)中倉(cāng)儲(chǔ)業(yè)務(wù)的需求占23%;商業(yè)企業(yè)對(duì)物流業(yè)務(wù)中運(yùn)輸需求占59%,對(duì)物流業(yè)務(wù)中倉(cāng)儲(chǔ)業(yè)務(wù)需求占77%。針對(duì)不同的客戶群,可以實(shí)施不同的物流服務(wù)方式,從而提高客戶的滿意度。
數(shù)據(jù)挖掘流程
定義問(wèn)題:第三方物流企業(yè)首先清晰地定義出各種物流業(yè)務(wù)問(wèn)題,確定數(shù)據(jù)挖掘的目的。
數(shù)據(jù)準(zhǔn)備:首先第三方物流企業(yè)在大型數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)目標(biāo)中提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集進(jìn)行數(shù)據(jù)選擇;其次進(jìn)行數(shù)據(jù)的預(yù)處理,包括檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性、填補(bǔ)丟失的域,刪除無(wú)效數(shù)據(jù)等。
數(shù)據(jù)挖掘:第三方物流企業(yè)根據(jù)數(shù)據(jù)功能的類型和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法,在凈化和轉(zhuǎn)換過(guò)的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。
結(jié)果分析:第三方物流企業(yè)對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評(píng)價(jià),轉(zhuǎn)換成為能夠最終被理解的知識(shí)。
知識(shí)的運(yùn)用:第三方物流企業(yè)將分析所得到的知識(shí)集成到物流業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
評(píng)價(jià)數(shù)據(jù)挖掘軟件需要考慮的問(wèn)題
越來(lái)越多的軟件供應(yīng)商加入了數(shù)據(jù)挖掘這一領(lǐng)域的競(jìng)爭(zhēng)。第三方物流企業(yè)如何正確評(píng)價(jià)一個(gè)商業(yè)軟件,選擇合適的軟件成為數(shù)據(jù)挖掘成功應(yīng)用的關(guān)鍵。評(píng)價(jià)一個(gè)數(shù)據(jù)挖掘軟件主要應(yīng)從以下四個(gè)主要方面:
計(jì)算性能:如該軟件能否在不同的物流業(yè)務(wù)平臺(tái)運(yùn)行;軟件的架構(gòu);能否連接不同的數(shù)據(jù)源;操作大數(shù)據(jù)集時(shí),性能變化是線性的還是指數(shù)的;算的效率;是否基于組件結(jié)構(gòu)易于擴(kuò)展;運(yùn)行的穩(wěn)定性等;
功能性:如軟件是否提供足夠多樣的算法;能否避免挖掘過(guò)程黑箱化;軟件提供的算法能否應(yīng)用于多種類型的數(shù)據(jù);第三方物流企業(yè)能否調(diào)整算法和算法的參數(shù);軟件能否從數(shù)據(jù)集隨機(jī)抽取數(shù)據(jù)建立預(yù)挖掘模型;能否以不同的形式表現(xiàn)挖掘結(jié)果等。
可用性:如用戶界面是否友好;軟件是否易學(xué)易用;軟件面對(duì)的用戶是初學(xué)者、高級(jí)用戶還是專家;錯(cuò)誤報(bào)告對(duì)用戶調(diào)試是否有很大幫助。
【關(guān)鍵詞】就業(yè)指導(dǎo);數(shù)據(jù)挖掘技術(shù);應(yīng)用
近年來(lái)隨著高校畢業(yè)生人數(shù)的逐年增加,大學(xué)生就業(yè)壓力也在逐漸增大,如何做好就業(yè)指導(dǎo),促進(jìn)學(xué)生更快更好的就業(yè),已成為目前各大高校研究的重點(diǎn)課題。隨著信息化技術(shù)的快速發(fā)展和信息搜集能力的日益提高,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校的就業(yè)指導(dǎo)工作中,從大量的數(shù)據(jù)中挖掘發(fā)現(xiàn)隱藏的、有價(jià)值的信息來(lái)指導(dǎo)學(xué)生有效的就業(yè),提高學(xué)生的就業(yè)質(zhì)量,已成為一個(gè)非常值得研究的重要課題。
1數(shù)據(jù)挖掘技術(shù)概念和類型分析
1.1數(shù)據(jù)挖掘技術(shù)概念
信息技術(shù)水平的迅速發(fā)展,使得一些新技術(shù)在教育領(lǐng)域當(dāng)中得到了廣泛的應(yīng)用,有效促進(jìn)了教育教學(xué)的快速發(fā)展。信息技術(shù)的應(yīng)用會(huì)產(chǎn)生大量的數(shù)據(jù),對(duì)這些數(shù)據(jù)的處理顯得非常的重要,利用數(shù)據(jù)挖掘技術(shù)不但能發(fā)揮數(shù)據(jù)信息處理的優(yōu)勢(shì),還能大大提高信息處理的效率。數(shù)據(jù)挖掘(DataMining)又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是指從大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中提取隱含的、未知的、非平凡的、極有潛在應(yīng)用價(jià)值的信息或模式,是數(shù)據(jù)庫(kù)研究中的一個(gè)很有應(yīng)用價(jià)值的新領(lǐng)域,是一個(gè)涉及到高性能計(jì)算、模式識(shí)別以及神經(jīng)網(wǎng)絡(luò)等各方面內(nèi)容的交叉性學(xué)科。數(shù)據(jù)挖掘需要經(jīng)過(guò)數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)分析、結(jié)果表示等一系列過(guò)程,對(duì)數(shù)據(jù)信息進(jìn)行有效的處理。采用的相關(guān)方法有決策樹方法、遺傳算法、粗糙集方法等。
1.2數(shù)據(jù)挖掘技術(shù)類型分析
數(shù)據(jù)挖掘技術(shù)由于涉及到的學(xué)科比較多,故此在數(shù)據(jù)挖掘技術(shù)的類型上也比較多樣,根據(jù)不同的標(biāo)準(zhǔn)就能分成不同的類型。根據(jù)數(shù)據(jù)庫(kù)的類型進(jìn)行分類,數(shù)據(jù)挖掘主要是關(guān)系數(shù)據(jù)庫(kù)中挖掘知識(shí),在數(shù)據(jù)庫(kù)的類型上會(huì)不斷的增加,這樣就出現(xiàn)了不同數(shù)據(jù)庫(kù)數(shù)據(jù)挖掘,在這些數(shù)據(jù)挖掘類型當(dāng)中,歷史數(shù)據(jù)挖掘以及模糊數(shù)據(jù)挖掘等都是比較突出的應(yīng)用技術(shù)類型。在數(shù)據(jù)挖掘技術(shù)的類型當(dāng)中,結(jié)合挖掘方法的不同,以及技術(shù)應(yīng)用的不同進(jìn)行分類,主要方法有統(tǒng)計(jì)方法、探索性分析和數(shù)據(jù)庫(kù)方法。除此之外,按照數(shù)據(jù)挖掘的任務(wù)對(duì)其進(jìn)行分類,也能分成不同的類型,主要有時(shí)序模式、關(guān)聯(lián)分析、分類數(shù)據(jù)挖掘等。對(duì)不同的數(shù)據(jù)挖掘技術(shù)類型進(jìn)行分析與應(yīng)用,對(duì)信息數(shù)據(jù)的處理效率水平的提高可起到積極作用。
2數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中的應(yīng)用步驟和具體應(yīng)用
2.1數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中的應(yīng)用步驟
將數(shù)據(jù)挖掘應(yīng)用到高校學(xué)生就業(yè)指導(dǎo)當(dāng)中,能促進(jìn)就業(yè)指導(dǎo)教學(xué)的整體質(zhì)量水平的提高。而對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,需要遵循相應(yīng)的步驟,這樣才能有利于發(fā)揮其積極的作用。數(shù)據(jù)挖掘技術(shù)的應(yīng)用要注重過(guò)程操作。2.1.1對(duì)問(wèn)題進(jìn)行分析源數(shù)據(jù)庫(kù)需要評(píng)估以及確認(rèn)是否與數(shù)據(jù)挖掘的標(biāo)準(zhǔn)相符合,對(duì)這一情況結(jié)合實(shí)際加以分析。2.1.2提取、清洗和校驗(yàn)數(shù)據(jù)所提取的數(shù)據(jù)放在一個(gè)結(jié)構(gòu)上和數(shù)據(jù)模型兼容的數(shù)據(jù)庫(kù)當(dāng)中,采取統(tǒng)一模式清除不兼容數(shù)據(jù),保障數(shù)據(jù)的完整性。2.1.3選定數(shù)據(jù)挖掘算法結(jié)合其目的,通過(guò)DM過(guò)程當(dāng)中的準(zhǔn)則選擇一個(gè)特定的數(shù)據(jù)挖掘算法,用于搜索數(shù)據(jù)當(dāng)中的模式。2.1.4實(shí)施數(shù)據(jù)挖掘通過(guò)數(shù)據(jù)挖掘方法,產(chǎn)生一個(gè)特定的感興趣模式或特定數(shù)據(jù)集。2.1.5在對(duì)數(shù)據(jù)挖掘之后進(jìn)行解釋對(duì)所發(fā)現(xiàn)的模式進(jìn)行分析,去掉多余的不切題意的模式。2.1.6進(jìn)行知識(shí)評(píng)價(jià)對(duì)知識(shí)作用加以查看或證明,采用預(yù)先可信知識(shí),檢查以及解決知識(shí)當(dāng)中所存在的矛盾。通過(guò)以上一系列的操作,可將數(shù)據(jù)挖掘技術(shù)的作用得到充分發(fā)揮。
2.2數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中具體應(yīng)用
在高校畢業(yè)生的就業(yè)指導(dǎo)工作中,需要對(duì)影響學(xué)生就業(yè)的因素實(shí)施量化分析,為在畢業(yè)生就業(yè)指導(dǎo)方面提供相應(yīng)的數(shù)據(jù)。在數(shù)據(jù)挖掘技術(shù)的應(yīng)用中,主要就是對(duì)學(xué)生生源地信息以及學(xué)生就業(yè)率關(guān)聯(lián)關(guān)系實(shí)施挖掘,對(duì)學(xué)生性別和就業(yè)的關(guān)聯(lián)關(guān)系進(jìn)行挖掘,還有對(duì)學(xué)生的就業(yè)和學(xué)業(yè)的關(guān)聯(lián)關(guān)系進(jìn)行挖掘。結(jié)合實(shí)際情況對(duì)數(shù)據(jù)挖掘技術(shù)系統(tǒng)進(jìn)行設(shè)計(jì),并且在該系統(tǒng)中,要和數(shù)據(jù)挖掘?qū)I(yè)知識(shí)緊密結(jié)合,將其設(shè)計(jì)成幾個(gè)重要的模塊,即:數(shù)據(jù)預(yù)處理,頻繁項(xiàng)挖掘,關(guān)聯(lián)規(guī)則分析。(1)數(shù)據(jù)挖掘技術(shù)的采集以及轉(zhuǎn)換和預(yù)處理操作。在對(duì)數(shù)據(jù)進(jìn)行采集以及轉(zhuǎn)換和預(yù)處理環(huán)節(jié)的操作上,先對(duì)學(xué)生就業(yè)情況加以分析,在決策屬性方面明確,然后分析指標(biāo)數(shù)據(jù),如:對(duì)學(xué)生的實(shí)踐能力水平以及計(jì)算機(jī)等級(jí)等進(jìn)行分析。(2)對(duì)相關(guān)的指標(biāo)數(shù)據(jù)采集充分重視,在數(shù)據(jù)信息的采集方面,要和開發(fā)的成績(jī)管理系統(tǒng)進(jìn)行連接,并能從成績(jī)數(shù)據(jù)庫(kù)當(dāng)中提取學(xué)生綜合性的成績(jī)。通過(guò)Excel表格將學(xué)號(hào)導(dǎo)入,提供輸入數(shù)據(jù)界面,管理人員進(jìn)行手工輸入。對(duì)學(xué)生工作單位量化標(biāo)識(shí),將工作單位分成升學(xué)、事業(yè)單位、企業(yè)、個(gè)體公司,采用字母a、b、c、d進(jìn)行表示。(3)數(shù)據(jù)挖掘技術(shù)的應(yīng)用過(guò)程中,對(duì)決策樹的應(yīng)用也比較重要,這是通過(guò)離散型變量作為屬性類型的學(xué)習(xí)方法。通過(guò)決策樹當(dāng)中C4.5算法思想的應(yīng)用,能夠有效處理描述屬性連續(xù)的相關(guān)問(wèn)題。某連續(xù)屬性將存儲(chǔ)訓(xùn)練實(shí)例中的不同屬性值進(jìn)行排序,然后選擇相鄰值中的點(diǎn),作為離散時(shí)區(qū)分不同屬性值的標(biāo)準(zhǔn)。(4)數(shù)據(jù)挖掘技術(shù)中決策樹和算法的選擇應(yīng)用也是比較重要的,如在對(duì)算法的選擇方面,就要能先建立真正適合挖掘算法的分析模型,選擇合適的數(shù)據(jù)挖掘技術(shù)和算法,然后采用程序設(shè)計(jì)語(yǔ)言實(shí)現(xiàn)算法,這樣就能獲得有效的數(shù)據(jù)算法。在數(shù)據(jù)庫(kù)的處理方法方面,就包含著諸多的內(nèi)容,其中的數(shù)據(jù)讀取以及查詢操作是比較重要的。根據(jù)這些操作應(yīng)用對(duì)學(xué)生的相關(guān)數(shù)據(jù)信息的提取查看就比較方便。
3結(jié)語(yǔ)
綜上所述,高校畢業(yè)生就業(yè)指導(dǎo)過(guò)程當(dāng)中對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,能有效提高就業(yè)指導(dǎo)的效率水平,從而為學(xué)生的未來(lái)就業(yè)發(fā)展提供有力條件,對(duì)教師在為學(xué)生就業(yè)指導(dǎo)方面能指明方向。希望在此次對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究下,有助于實(shí)際的就業(yè)指導(dǎo)教學(xué)發(fā)展。
參考文獻(xiàn)
[1]金延軍.數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中的應(yīng)用[J].黑龍江工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2015(01).
[2]蔡麗艷.淺談數(shù)據(jù)挖掘技術(shù)及其在高校就業(yè)工作中的應(yīng)用[J].電腦知識(shí)與技術(shù),2015(09).
[3]康艷霞.數(shù)據(jù)挖掘在學(xué)生成績(jī)分析中的應(yīng)用[J].信息與電腦(理論版),2014(09).
[4]馮麗霞.數(shù)據(jù)挖掘技術(shù)在學(xué)校教學(xué)中的應(yīng)用研究[J].甘肅科技,2015(20).
[關(guān)鍵詞]CRM;數(shù)據(jù)挖掘;信息技術(shù)
[作者簡(jiǎn)介]馬凱旋,河南農(nóng)業(yè)大學(xué)華豫學(xué)院商學(xué)院講師,碩士,河南商丘476113
[中圖分類號(hào)]F270.7 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1672-2728(2009)03-0136-03
客戶作為一種企業(yè)核心資源,擁有和保持更多的客戶決定著企業(yè)今后發(fā)展的命運(yùn),因此有效地開發(fā)和利用客戶資源,發(fā)展和鞏固企業(yè)同客戶之間的和諧關(guān)系,在最大程度上滿足客戶需求的同時(shí)實(shí)現(xiàn)企業(yè)的經(jīng)濟(jì)社會(huì)效益最大化,已經(jīng)成為企業(yè)界和學(xué)術(shù)界關(guān)注的焦點(diǎn)。信息經(jīng)濟(jì)環(huán)境中企業(yè)客戶關(guān)系管理是利用IT技術(shù)實(shí)現(xiàn)對(duì)客戶的整合營(yíng)銷,是以客戶為核心的企業(yè)營(yíng)銷的技術(shù)實(shí)現(xiàn)和管理實(shí)現(xiàn),并在企業(yè)與客戶之間建立一種實(shí)時(shí)、互動(dòng)的交流管理系統(tǒng),最終目的是通過(guò)為客戶創(chuàng)造價(jià)值,建立個(gè)性化、高質(zhì)量的商品與服務(wù)來(lái)獲得新客戶,增加原有客戶的忠誠(chéng)度和提高客戶的贏利能力,進(jìn)而增強(qiáng)企業(yè)的核心競(jìng)爭(zhēng)力。同時(shí)隨著信息技術(shù)的迅速發(fā)展,特別是數(shù)據(jù)庫(kù)技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的廣泛應(yīng)用,企業(yè)所面對(duì)的客戶數(shù)據(jù)量、企業(yè)內(nèi)外信息量急劇膨脹,企業(yè)如果能夠?qū)@海量的數(shù)據(jù)進(jìn)行有效、快速和深入的分析和處理,發(fā)現(xiàn)有價(jià)值的知識(shí),就能為企業(yè)作出正確的經(jīng)營(yíng)決策、捕捉稍縱即逝的市場(chǎng)機(jī)會(huì)提供極大的幫助。
一、數(shù)據(jù)挖掘技術(shù)分析
(一)數(shù)據(jù)挖掘技術(shù)的發(fā)展過(guò)程。數(shù)據(jù)挖掘是生產(chǎn)發(fā)展的必然結(jié)果,最初的數(shù)據(jù)挖掘僅僅是用一些信息儲(chǔ)存工具儲(chǔ)存一些簡(jiǎn)單的信息,人們并不去對(duì)這些信息進(jìn)行分析來(lái)提取更深層次的、更有價(jià)值的知識(shí),而且使用和獲得信息的速度也很緩慢,隨著生產(chǎn)力水平的極大提高和信息技術(shù)的飛速發(fā)展,目前已經(jīng)實(shí)現(xiàn)了人們能實(shí)時(shí)地獲得經(jīng)過(guò)深入提煉的知識(shí)與信息。數(shù)據(jù)挖掘的每一步發(fā)展,可以說(shuō)都是建立在前一階段的基礎(chǔ)上,總的來(lái)說(shuō),數(shù)據(jù)挖掘分為四個(gè)發(fā)展階段:(1)數(shù)據(jù)收集階段(Data Col-lection):企業(yè)僅僅是簡(jiǎn)單地整理儲(chǔ)存信息,并應(yīng)用一些簡(jiǎn)單的運(yùn)算工具進(jìn)行數(shù)據(jù)加工,如對(duì)信息的總量計(jì)算、平均數(shù)計(jì)算等;(2)數(shù)據(jù)追溯階段(DataAccess)企業(yè)開始應(yīng)用關(guān)聯(lián)模式處理儲(chǔ)存信息,在整個(gè)企業(yè)范圍內(nèi)建立起了數(shù)據(jù)收集和信息管理系統(tǒng),管理層可以獲得企業(yè)的歷史信息;(3)數(shù)據(jù)導(dǎo)航階段(Data Navigation)、企業(yè)內(nèi)出現(xiàn)了數(shù)據(jù)倉(cāng)庫(kù),應(yīng)用多維數(shù)據(jù)基的處理和儲(chǔ)存信息,企業(yè)不僅能應(yīng)用信息管理系統(tǒng)獲得企業(yè)整體和各個(gè)地區(qū)經(jīng)營(yíng)狀況的信息,而且通過(guò)應(yīng)用在線分析系統(tǒng)(OLAP)等手段進(jìn)行數(shù)據(jù)對(duì)比;(4)數(shù)據(jù)挖掘階段(Data Min-ing):也就是通過(guò)使用在線分析工具、先進(jìn)的信息技術(shù)以及統(tǒng)計(jì)數(shù)學(xué)等方法為企業(yè)提供實(shí)時(shí)的信息反饋和與合作伙伴的信息交流。數(shù)據(jù)挖掘使企業(yè)管理者更能獲得存在于信息之中的深層價(jià)值,從而為企業(yè)的經(jīng)營(yíng)戰(zhàn)略決策產(chǎn)生重要幫助作用。
(二)數(shù)據(jù)挖掘技術(shù)的內(nèi)容。數(shù)據(jù)挖掘是進(jìn)行信息處理的系統(tǒng)工具,按照信息處理的流程來(lái)分類,一般有三種類型:信息發(fā)現(xiàn)(Discovery)、預(yù)測(cè)模型(Predictive Model)和異常分析(Forensic Analy-山)。信息發(fā)現(xiàn)是指單純地對(duì)信息進(jìn)行處理、整理和分析,以發(fā)掘出蘊(yùn)涵在信息之間的潛在的有價(jià)值的知識(shí)或者聯(lián)系,但并不進(jìn)行對(duì)信息處理結(jié)果的預(yù)測(cè)。信息發(fā)現(xiàn)包括條件邏輯推理、關(guān)聯(lián)處理和信息規(guī)律趨勢(shì)和變化等;預(yù)測(cè)模型是指通過(guò)上一階段的信息處理,利用有價(jià)值的知識(shí)資源和預(yù)測(cè)模型對(duì)其進(jìn)行發(fā)展趨勢(shì)預(yù)測(cè),這包括結(jié)論預(yù)測(cè)和發(fā)展趨勢(shì)展望等;異常分析是指數(shù)據(jù)挖掘的擴(kuò)展階段,對(duì)發(fā)現(xiàn)的異常情況作出分析,包括偏離偵測(cè)和關(guān)聯(lián)分析等??偟膩?lái)說(shuō),數(shù)據(jù)挖掘技術(shù)通常有六種手段進(jìn)行信息處理:分類、回歸模型、時(shí)間序列、聚類、關(guān)聯(lián)分析和序列發(fā)現(xiàn)。分類和回歸模型一般用于趨勢(shì)預(yù)測(cè),關(guān)聯(lián)和序列發(fā)現(xiàn)用于分析客戶行為,聚類則可用于以上兩種情況。
數(shù)據(jù)挖掘技術(shù)按對(duì)信息的處理方式分為數(shù)據(jù)保存技術(shù)和數(shù)據(jù)提煉技術(shù)兩種方式。數(shù)據(jù)保存技術(shù)主要是能夠方便地為企業(yè)決策提供信息幫助,在企業(yè)決策中應(yīng)用案例分析(CBR)來(lái)保證經(jīng)營(yíng)決策的有效性。但是企業(yè)要想獲得蘊(yùn)涵在信息之中的有價(jià)值的知識(shí),就必須使用數(shù)據(jù)提煉技術(shù),數(shù)據(jù)提煉技術(shù)包括:邏輯方法是運(yùn)用多維或者OLAP技術(shù)對(duì)量化的或者非量化的數(shù)據(jù)進(jìn)行統(tǒng)一模式的處理,包括規(guī)則公式和決策樹;橫向?qū)Ρ戎饕菍?duì)定性數(shù)據(jù)指標(biāo)進(jìn)行類比分析,包括類比中介和可信網(wǎng)絡(luò);程式分析是能夠有效地應(yīng)用多維模型和數(shù)理統(tǒng)計(jì)方法對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行處理,包括數(shù)理統(tǒng)計(jì)方法和神經(jīng)網(wǎng)絡(luò)等。
二、數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
在客戶關(guān)系管理過(guò)程中,客戶生命周期對(duì)企業(yè)來(lái)說(shuō)非常重要,因?yàn)樗苯雨P(guān)系到企業(yè)的客戶收益和客戶利潤(rùn),一方面客戶生命周期提供了客戶信息來(lái)源,另一方面客戶生命周期使得企業(yè)明確了為滿足客戶需求應(yīng)注重的方面??蛻羯芷跒閿?shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用提供了基礎(chǔ),數(shù)據(jù)挖掘是建立在數(shù)據(jù)倉(cāng)庫(kù)之上的,通過(guò)各種先進(jìn)的信息技術(shù)和數(shù)理統(tǒng)計(jì)方法挖掘數(shù)據(jù)倉(cāng)庫(kù)中的潛在的、有價(jià)值的客戶信息,通過(guò)運(yùn)用數(shù)據(jù)挖掘,企業(yè)能把大量的客戶記錄變成系統(tǒng)的客戶信息,提供給決策者,這樣不僅解決了企業(yè)進(jìn)行決策時(shí)遇到的信息匱乏,也充分發(fā)揮了企業(yè)實(shí)施CRM的效用。
(一)客戶分析。CRM系統(tǒng)主要是面向客戶,因此對(duì)客戶數(shù)據(jù)的分析是極為重要的,通過(guò)對(duì)客戶數(shù)據(jù)的分析,發(fā)現(xiàn)客戶需求,調(diào)整企業(yè)戰(zhàn)略并實(shí)施相應(yīng)的措施,客戶分析主要有幾個(gè)方面:(1)購(gòu)買頻率,通過(guò)對(duì)客戶購(gòu)買頻率的分析,企業(yè)實(shí)施相應(yīng)的營(yíng)銷活動(dòng),可以利用諸如促銷、折扣和優(yōu)惠等手段來(lái)刺激消費(fèi)者的消費(fèi)欲望;(2)近期消費(fèi),通過(guò)對(duì)客戶最近消費(fèi)時(shí)間的分析,可以及時(shí)發(fā)現(xiàn)客戶流失的原因,從而采取相應(yīng)的措施;(3)客戶忠誠(chéng)度分析,通過(guò)對(duì)客戶交易資料的記錄和分析,可以采用序列模式來(lái)預(yù)測(cè)消費(fèi)者的忠誠(chéng)度,并據(jù)此來(lái)調(diào)整企業(yè)的生產(chǎn)和提供的服務(wù),提高客戶的忠誠(chéng)度并吸引新客戶;(4)客戶分類,不同的消費(fèi)者對(duì)產(chǎn)品和服務(wù)的要求不同,也為企業(yè)創(chuàng)造不同的收益,企業(yè)根據(jù)數(shù)據(jù)挖掘技術(shù)的信息處理分析,對(duì)客戶采用聚類的方法進(jìn)行分類,挖掘客戶群的需求特征和需求趨勢(shì),并發(fā)現(xiàn)最有價(jià)值和最有盈利潛力的客戶群,對(duì)這些客戶實(shí)施“一對(duì)一”的市場(chǎng)營(yíng)銷,取得最大的收益;(5)客戶購(gòu)買相關(guān)性分析,通過(guò)銷售記錄的信息挖掘,可以發(fā)現(xiàn)客戶購(gòu)買相關(guān)性,這也是發(fā)現(xiàn)客戶消費(fèi)偏好、消費(fèi)特點(diǎn)的重要方法,據(jù)此企業(yè)可以積極采用各種手段,如推薦、傳單以及網(wǎng)絡(luò)推廣等方式幫助消費(fèi)者選擇商品,增加企業(yè)的收益;(6)營(yíng)銷合理化分析,通過(guò)分析營(yíng)銷活動(dòng)的有效
性,有助于改善營(yíng)銷效率,多維分析可以實(shí)現(xiàn)這方面分析的要求,即通過(guò)比較營(yíng)銷改變前后銷售狀況。
(二)異常偏離分析。企業(yè)在對(duì)客戶數(shù)據(jù)進(jìn)行分析時(shí),有可能發(fā)現(xiàn)異常數(shù)據(jù)或者無(wú)法解釋的現(xiàn)象發(fā)生,企業(yè)應(yīng)對(duì)此應(yīng)高度關(guān)注,一般的做法是通過(guò)使用數(shù)據(jù)挖掘的各種先進(jìn)技術(shù),如決策樹、神經(jīng)網(wǎng)絡(luò)、聚類等來(lái)及時(shí)分析這些異常情況,使企業(yè)能作出快速的反應(yīng),并針對(duì)處理的結(jié)果及時(shí)調(diào)整企業(yè)的營(yíng)銷決策。
(三)趨勢(shì)分析和預(yù)測(cè)。數(shù)據(jù)挖掘的工具為客戶需求趨勢(shì)預(yù)測(cè)提供了有效的手段,常用的工具是時(shí)間序列分析、系統(tǒng)力學(xué)和神經(jīng)網(wǎng)絡(luò)。這些工具能為企業(yè)提供科學(xué)、有效的趨勢(shì)分析,并用于企業(yè)的生產(chǎn)和營(yíng)銷決策。具體內(nèi)容包括:評(píng)價(jià)產(chǎn)品銷售狀況,企業(yè)通過(guò)分析客戶數(shù)據(jù)庫(kù)中記錄每一位消費(fèi)者的交易信息,可以針對(duì)不同的產(chǎn)品、不同的區(qū)域采取不同的銷售策略,實(shí)現(xiàn)盈利最大化;預(yù)測(cè)銷售狀況,通過(guò)準(zhǔn)確的預(yù)測(cè),發(fā)現(xiàn)隱藏的信息,是把握市場(chǎng)動(dòng)向,滿足客戶需求,調(diào)整生產(chǎn)結(jié)構(gòu)和營(yíng)銷方法,從而使企業(yè)在激烈的市場(chǎng)競(jìng)爭(zhēng)中立于不敗之地。
(四)客戶服務(wù)支持??蛻舴?wù)是CRM中的重要組成部分,包括客戶信息和服務(wù)信息,這些數(shù)據(jù)既有結(jié)構(gòu)化的也有非結(jié)構(gòu)化的,結(jié)構(gòu)化的數(shù)據(jù)比較容易分析和整理,如銷售狀況、客戶交易信息等,非結(jié)構(gòu)化的數(shù)據(jù)如故障信息、故障處理信息以及客戶反饋信息等。對(duì)結(jié)構(gòu)化數(shù)據(jù)挖掘的主要過(guò)程是:根據(jù)相應(yīng)數(shù)據(jù)的特點(diǎn)來(lái)選擇規(guī)則模板,對(duì)數(shù)據(jù)進(jìn)行選取和轉(zhuǎn)換,并應(yīng)用歸納學(xué)習(xí)法、決策樹、最鄰近法、人工神經(jīng)網(wǎng)絡(luò)技術(shù)等來(lái)進(jìn)行數(shù)據(jù)挖掘,挖掘得到的結(jié)果可以存入數(shù)據(jù)庫(kù),幫助企業(yè)決策,非結(jié)構(gòu)化數(shù)據(jù)由于存在的形式和性質(zhì)難以進(jìn)行標(biāo)準(zhǔn)化分析,但是非結(jié)構(gòu)化所隱藏的價(jià)值可以通過(guò)兩種途徑來(lái)進(jìn)行挖掘:一是建立全新的數(shù)據(jù)挖掘算法,直接對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行挖掘,但是由于非結(jié)構(gòu)化的自身特點(diǎn),使得這樣的全新數(shù)據(jù)挖掘非常復(fù)雜,而且難以評(píng)估數(shù)據(jù)挖掘結(jié)果的可靠性;二是通過(guò)將非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,而后采用結(jié)構(gòu)化的數(shù)據(jù)挖掘技術(shù)對(duì)其進(jìn)行挖掘,這就需要建立非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換技術(shù),而且也是非常復(fù)雜。總的來(lái)說(shuō),結(jié)構(gòu)化數(shù)據(jù)挖掘技術(shù)已經(jīng)成熟,但是非結(jié)構(gòu)化的數(shù)據(jù)挖掘尚待進(jìn)一步發(fā)展。
(五)銷售管理。銷售管理自動(dòng)化是客戶關(guān)系管理成長(zhǎng)最快的部分,銷售人員與潛在客戶的互動(dòng)行為、將潛在的客戶發(fā)展成真正客戶并提高其忠誠(chéng)度是使企業(yè)盈利的核心因素。在此環(huán)節(jié)中,數(shù)據(jù)挖掘可以對(duì)多種市場(chǎng)活動(dòng)的有效性進(jìn)行實(shí)時(shí)跟蹤和分析,數(shù)據(jù)挖掘不僅使銷售人員及時(shí)把握銷售機(jī)遇、提高工作效率,而且企業(yè)管理層也可以隨時(shí)掌握市場(chǎng)動(dòng)態(tài)。
(六)數(shù)據(jù)挖掘和客戶隱私。數(shù)據(jù)挖掘技術(shù)幫助企業(yè)能比以往更好地發(fā)現(xiàn)客戶信息中的隱性知識(shí),但是這也增加了客戶隱私被企業(yè)侵犯的風(fēng)險(xiǎn)。一方面客戶信息挖掘有助于客戶與企業(yè)之間建立起親密的關(guān)系,另一方面客戶信息如果被企業(yè)不正當(dāng)?shù)乩茫瑒t會(huì)給客戶本身帶來(lái)不利影響。比如客戶信用等級(jí)、客戶交易行為等信息如果不當(dāng)利用,會(huì)給消費(fèi)者帶來(lái)推銷騷擾,甚至是某種社會(huì)歧視或者失業(yè)的威脅。客戶隱私按其本質(zhì)來(lái)說(shuō),更是一個(gè)道德問(wèn)題而非一個(gè)技術(shù)問(wèn)題,關(guān)鍵是處理好企業(yè)數(shù)據(jù)挖掘與客戶個(gè)人信息保護(hù)之間的平衡問(wèn)題,現(xiàn)在世界上好多企業(yè)在處理客戶交易信息時(shí),采用匿名方式,將客戶的個(gè)人身份信息隱藏起來(lái),只將交易資料,如客戶偏好、消費(fèi)等級(jí)、需求特點(diǎn)和客戶價(jià)值等資料輸入到數(shù)據(jù)處理模型中。總之,企業(yè)在實(shí)施客戶關(guān)系管理的同時(shí),必須注重客戶隱私的保護(hù),這樣才能給消費(fèi)者以安全的感覺,才會(huì)讓客戶真正地與企業(yè)之間進(jìn)行交流,才能充分發(fā)揮數(shù)據(jù)挖掘在客戶關(guān)系管理的作用。
關(guān)鍵詞:消防滅火救援;數(shù)據(jù)挖掘技術(shù);應(yīng)用
引言
近年來(lái),我國(guó)的城市化建設(shè)的步伐在逐漸加快,城市規(guī)模、各種建筑、車輛、人員都在快速地增長(zhǎng)。在此背景下,火災(zāi)預(yù)防工作呈現(xiàn)復(fù)雜化和多樣化等特點(diǎn)。不僅火災(zāi)隱患的數(shù)量有所增多,滅火救援的難度也在逐漸的增大。如果不能及時(shí)的消除與控制火災(zāi)隱患,一旦發(fā)生火災(zāi),將會(huì)帶來(lái)巨大的損失,威脅著人們的生命財(cái)產(chǎn)安全。消防滅火救援工作的有效開展,離不開消防滅火系統(tǒng)的穩(wěn)定運(yùn)行。消防滅火系統(tǒng)在運(yùn)行的過(guò)程中,往往會(huì)涉及到大量的相關(guān)數(shù)據(jù)。如果應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)其進(jìn)行分析,將有助于提高消防滅火救援的質(zhì)量與效率。因此,研究消防滅火救援中數(shù)據(jù)挖掘技術(shù)的應(yīng)用,具有重要的理論意義和現(xiàn)實(shí)意義。
1 數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)是社會(huì)經(jīng)濟(jì)發(fā)展的成果之一。在數(shù)理統(tǒng)計(jì)分析、數(shù)據(jù)庫(kù)、模糊數(shù)學(xué)、人工智能等技術(shù)不斷發(fā)展的背景下,數(shù)據(jù)挖掘技術(shù)通過(guò)融合了各種相關(guān)知識(shí),逐漸形成為一項(xiàng)綜合性技術(shù)。隨著信息時(shí)代的到來(lái),數(shù)據(jù)挖掘技術(shù)更是得到了廣泛的應(yīng)用與發(fā)展。數(shù)據(jù)挖掘作為一種專門用來(lái)分析數(shù)據(jù)的技術(shù)之一,主要的應(yīng)用原理是:選取恰當(dāng)?shù)姆治黾夹g(shù),在隨機(jī)的、模糊的數(shù)據(jù)中提取有價(jià)值的信息。通過(guò)實(shí)現(xiàn)數(shù)據(jù)與信息之間的有效轉(zhuǎn)換,能夠找到?jīng)]有意識(shí)到的問(wèn)題、將定性的問(wèn)題定量化,甚至還能找出未來(lái)發(fā)展的趨勢(shì),從而為決策提供有效的依據(jù)。完整的數(shù)據(jù)挖掘流程包括多個(gè)環(huán)節(jié),并且在不同的應(yīng)用領(lǐng)域中,其包含的步驟也各不相同。文章將其大致分為以下三個(gè)階段。(1)數(shù)據(jù)的準(zhǔn)備階段。(2)數(shù)據(jù)挖掘階段。(3)對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋。
2 數(shù)據(jù)挖掘技術(shù)在消防滅火救援中的主要作用
數(shù)據(jù)挖掘不僅在商業(yè)領(lǐng)域獲得的廣泛的應(yīng)用,在其它行業(yè)中的作用也不容小視。隨著現(xiàn)代城市的發(fā)展,消防滅火救援工作的難度也隨之增長(zhǎng)。將數(shù)據(jù)挖掘技術(shù)運(yùn)用于消防滅火救援中,同樣能夠發(fā)揮重要的作用,有助于提高效率。數(shù)據(jù)挖掘技術(shù)在消防滅火救援中所能發(fā)揮的作用,具體體現(xiàn)為以下幾個(gè)方面。
首先,運(yùn)用數(shù)據(jù)挖掘技術(shù)能夠?qū)Τ鞘邢澜o水系統(tǒng)中的相關(guān)信息進(jìn)行有效處理。在消防滅火救援過(guò)程中,充足的水源通常發(fā)揮著重要的滅火作用。因此,為了做好城市消防滅火工作,提高消防滅火救援的質(zhì)量,及時(shí)消滅火源,應(yīng)當(dāng)對(duì)消防給水系統(tǒng)進(jìn)行合理化設(shè)置。在優(yōu)化消防給水系統(tǒng)的過(guò)程中,如果運(yùn)用數(shù)據(jù)挖掘技術(shù),有助于設(shè)置合理的消防給水系統(tǒng)的覆蓋點(diǎn),從而進(jìn)一步提升優(yōu)化水平。
其次,運(yùn)用數(shù)據(jù)挖掘技術(shù),能夠在整理與排查火災(zāi)源頭和隱患時(shí)有效的發(fā)揮作用,從而最大限度的避免火災(zāi)事故的發(fā)生,減少人員傷亡。因?yàn)?,?shù)據(jù)挖掘技術(shù),能夠從大量的隨機(jī)數(shù)據(jù)中挖掘出具有潛在利用價(jià)值的信息,其應(yīng)用在整理與排查火災(zāi)隱患時(shí),有助于提高效率。與此同時(shí),利用數(shù)據(jù)挖掘技術(shù)能夠?qū)ξ磥?lái)的發(fā)展行為或趨勢(shì)做出自動(dòng)預(yù)測(cè)。在面對(duì)不同情況的建筑分布時(shí),可以利用數(shù)據(jù)挖掘技術(shù)進(jìn)行細(xì)化分類,預(yù)測(cè)不同程度的火災(zāi)所必需的水量。
最后,運(yùn)用數(shù)據(jù)挖掘技術(shù)能夠加快消防滅火救援決策的速度。當(dāng)發(fā)生火災(zāi)事故時(shí),快速抵達(dá)火災(zāi)事故現(xiàn)場(chǎng),并采取有效措施展開滅火救援工作,能夠挽回更多的生命與財(cái)產(chǎn)損失。一方面,利用數(shù)據(jù)挖掘技術(shù),對(duì)所獲取的路網(wǎng)監(jiān)控?cái)?shù)據(jù)、可用消防栓的分布狀況以及消防通道情況等信息進(jìn)行實(shí)時(shí)分析,有助于在險(xiǎn)情發(fā)生時(shí)提供一條快速抵達(dá)火災(zāi)事故現(xiàn)場(chǎng)的合理路線方案。另一方面,利用數(shù)據(jù)挖掘技術(shù),可以根據(jù)火災(zāi)事故現(xiàn)場(chǎng)的條件、化學(xué)物質(zhì)主要物濃度、風(fēng)速風(fēng)向等氣象條件進(jìn)行數(shù)據(jù)分析,通過(guò)建立數(shù)據(jù)模型,分析可能發(fā)生的次生災(zāi)害,為消防滅火救援決策提供重要的技術(shù)支持。
3 消防滅火救援中數(shù)據(jù)挖掘的應(yīng)用
通過(guò)上文的分析,了解到數(shù)據(jù)挖掘技術(shù)在消防滅火救援中能夠發(fā)揮多方面的作用。所以,為了完善消防滅火系統(tǒng),提高消防滅火救援工作的整體質(zhì)量,數(shù)據(jù)挖掘技術(shù)在滅火救援中的應(yīng)用,需要做好以下幾點(diǎn)。
3.1 建立數(shù)據(jù)模型
在消防滅火救援中,應(yīng)用數(shù)據(jù)挖掘技術(shù),首先應(yīng)當(dāng)建立數(shù)據(jù)模型。需要注意的是,數(shù)據(jù)挖掘技術(shù)包含多種方法,每一種方法都有其各自的適用范圍。因此,在建立數(shù)據(jù)模型的過(guò)程中,為了高效地實(shí)現(xiàn)數(shù)據(jù)挖掘任務(wù),提取有價(jià)值的信息,應(yīng)當(dāng)采用科學(xué)合理的數(shù)據(jù)挖掘方法。盡管方法不同,在建立數(shù)據(jù)庫(kù)時(shí),都應(yīng)當(dāng)包括以下幾個(gè)方面的功能:火災(zāi)風(fēng)險(xiǎn)評(píng)估功能、消防給水功能以及歷史或再分析功能。要想同時(shí)滿足這三個(gè)功能,需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行分類,構(gòu)建三層分類模型。分別是概念模型、邏輯模型和物理模型三類。(1)在概念模型的設(shè)計(jì)過(guò)程中,應(yīng)當(dāng)以信息包圖為基礎(chǔ)進(jìn)行。在此期間,需要注意以下兩個(gè)方面的內(nèi)容。其一,要確定信息包圖的指標(biāo)、維度與類別三大方面。其二,應(yīng)當(dāng)對(duì)實(shí)體對(duì)象進(jìn)行分析,進(jìn)而完成信息包圖。(2)邏輯模型的基礎(chǔ)是星型圖,它的主要方面是指標(biāo)實(shí)體、維度實(shí)體和詳細(xì)類別實(shí)體三種,用來(lái)反映概念模型中實(shí)體間的關(guān)系。(3)在物理模型的設(shè)計(jì)過(guò)程中,主要以數(shù)據(jù)庫(kù)表為基礎(chǔ)。數(shù)據(jù)庫(kù)表是指,將指標(biāo)的實(shí)體轉(zhuǎn)化成的數(shù)據(jù)編成表。
3.2 聯(lián)機(jī)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)的分析
在消防滅火救援中,應(yīng)用數(shù)據(jù)挖掘技術(shù),還需要聯(lián)機(jī)網(wǎng)絡(luò)對(duì)數(shù)據(jù)做進(jìn)一步的分析。運(yùn)用網(wǎng)絡(luò)工具對(duì)于所采集的消防滅火救援相關(guān)數(shù)據(jù)進(jìn)行聯(lián)機(jī)分析,主要分為以下兩個(gè)步驟。首先,定義控制流任務(wù),選用適當(dāng)?shù)亩嗝襟w工具進(jìn)行數(shù)據(jù)的提取與轉(zhuǎn)換。為了提高數(shù)據(jù)挖掘技術(shù)的應(yīng)用效果,應(yīng)當(dāng)確保數(shù)據(jù)的真實(shí)性與時(shí)效性。其次,建立多維數(shù)據(jù),主要是將數(shù)據(jù)倉(cāng)庫(kù)中的表轉(zhuǎn)換為多維化數(shù)據(jù)。
3.3 分析火災(zāi)風(fēng)險(xiǎn)
聚類分析屬于數(shù)據(jù)挖掘技術(shù)中一種重要的數(shù)據(jù)處理方法,有助于增強(qiáng)對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),其主要原理是將指標(biāo)量變?yōu)閿?shù)據(jù)量。聚類分析的主要步驟是:(1)建立指標(biāo)體系。(2)確定指標(biāo)因子的權(quán)重。(3)量化指標(biāo)。(4)實(shí)現(xiàn)聚類分析。通過(guò)聚類方法分析火災(zāi)風(fēng)險(xiǎn),可以對(duì)不同地區(qū)的火災(zāi)等級(jí)進(jìn)行分類,評(píng)估不同地區(qū)的火災(zāi)隱患嚴(yán)重度,從而合理地安排消防給水系統(tǒng),保障該區(qū)域消防滅火工作得以順利的進(jìn)行,實(shí)現(xiàn)對(duì)于火災(zāi)的有效預(yù)防與控制。
4 結(jié)束語(yǔ)
數(shù)據(jù)挖掘技術(shù)作為社會(huì)經(jīng)濟(jì)發(fā)展的成果之一,能夠?qū)?shù)據(jù)進(jìn)行有效的統(tǒng)計(jì)分析,為相關(guān)的決策提供一定的幫助,因此,在各行業(yè)中都發(fā)揮著不同程度的作用。雖然我國(guó)消防工作中涉及到大量的數(shù)據(jù),但是由于對(duì)數(shù)據(jù)處理技術(shù)的掌握還比較生疏,導(dǎo)致數(shù)據(jù)挖掘技術(shù)的利用率比較低。從長(zhǎng)遠(yuǎn)來(lái)看,為了提高消防滅火救援的效率與效果,數(shù)據(jù)挖掘技術(shù)仍然具有廣闊的應(yīng)用空間。文章對(duì)于消防滅火救援中數(shù)據(jù)挖掘技術(shù)的作用進(jìn)行了簡(jiǎn)要的分析,對(duì)數(shù)據(jù)挖掘技術(shù)有了初步了解。隨著我國(guó)社會(huì)經(jīng)濟(jì)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也會(huì)逐步的改進(jìn)與完善,其終將廣泛應(yīng)用于消防領(lǐng)域中,為我國(guó)的消防滅火救援工作貢獻(xiàn)出一份力量。
參考文獻(xiàn)
[1]謝道文.基于數(shù)據(jù)挖掘的火災(zāi)分析模型及應(yīng)用研究[D].中南大學(xué),2014.
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:CSCD期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)