前言:想要寫出一篇引人入勝的文章?我們特意為您整理了隧道工程管理系統(tǒng)設(shè)計(jì)探析范文,希望能給你帶來靈感和參考,敬請閱讀。
1數(shù)據(jù)倉庫多維分析模型的設(shè)計(jì)
數(shù)據(jù)倉庫模型都是以多維數(shù)據(jù)模型為基礎(chǔ)的。多維數(shù)據(jù)模型普遍采用一種非常重要的模式就是星型模式。在實(shí)際應(yīng)用中,隨著事實(shí)表和維表的增加及變化,星型模式會(huì)有五種建模方式:簡單星型模式、星系模式、星座模式、二級維表和雪花模式。星型模型包括事實(shí)表和維表。事實(shí)度量是星型模型結(jié)構(gòu)的核心,由外鍵和用戶需要了解的度量值組成;事實(shí)度量值是最終用戶在數(shù)據(jù)倉庫應(yīng)用中所需要查詢和分析的細(xì)節(jié)或聚集數(shù)據(jù)。維表保存用戶查詢使用的一個(gè)或多個(gè)層次關(guān)系、成員的類別屬性等原數(shù)據(jù)信息,是相對靜態(tài)的數(shù)據(jù),通過它可以分析數(shù)據(jù);每個(gè)維表通過一個(gè)主鍵連接到事實(shí)表中相對應(yīng)的一個(gè)外鍵上。根據(jù)隧道管理系統(tǒng)具體情況:由工程量和工程材料兩個(gè)事實(shí)表組成,且這2個(gè)事實(shí)表連接的維不完全相同,但又共享部分維表。管理系統(tǒng)的多維數(shù)據(jù)模型設(shè)計(jì)采用星系模式。事實(shí)上星系模式數(shù)據(jù)倉庫中包含:
①施工事實(shí)表、上報(bào)事實(shí)表、工程款事實(shí)表3個(gè)有關(guān)工程量的不含冗余數(shù)據(jù)的事實(shí)表;
②工程材料入庫和出庫兩個(gè)不含冗余數(shù)據(jù)的有關(guān)工程材料的事實(shí)表;
③供應(yīng)商維表、地址維表、時(shí)間維表、合同維表、用戶維表、工程類別表等6個(gè)維表。其中,材料入庫和出庫事實(shí)表共享地址維表和時(shí)間維表;材料出庫和施工事實(shí)表共享用戶維表;施工事實(shí)表、工程款事實(shí)表和上報(bào)事實(shí)表共享工程類別維表。材料入庫、出庫事實(shí)表、施工事實(shí)表、工程款事實(shí)表和上報(bào)事實(shí)表共享時(shí)間維表。時(shí)間維表中包含年、季、月、日信息;地址維表包含國家、省、城市、街道、郵編信息;合同維表包含地址、供應(yīng)商名稱、合同名稱、電話信息;供應(yīng)商維表包含地址、用戶名稱、所在單位、電話信息;用戶維表包含地址、用戶名稱、所在單位、電話信息;工程類別維表包含工程名稱、單位、工程部位信息。材料入庫和出庫事實(shí)表存放著與數(shù)量有關(guān)的材料數(shù)量、金額等信息;與工程量有關(guān)的數(shù)量信息存放在施工事實(shí)表、工程款事實(shí)表和上報(bào)事實(shí)表中。
2輸入和輸出
隧道工程管理系統(tǒng)的總體結(jié)構(gòu)從SQLServerOLAP的數(shù)據(jù)立方體中取數(shù)據(jù),立方體中的數(shù)據(jù)來自一個(gè)或多個(gè)關(guān)系表、數(shù)據(jù)倉庫或其他形式的數(shù)據(jù)(如電子表格)。根據(jù)不同的數(shù)據(jù)挖掘任務(wù)和不同的用戶需求,系統(tǒng)可用多種形式表示獲得的知識。數(shù)據(jù)匯總(datasummarization)和特征化、概化規(guī)則、條形圖、餅圖、曲線以及其他的圖形化工具表示。關(guān)聯(lián)用關(guān)聯(lián)規(guī)則表、關(guān)聯(lián)計(jì)劃和關(guān)聯(lián)規(guī)則圖表示。分類用可視化的決策樹和決策表表示。簇用地圖來表示(對于二維表分析而言),每個(gè)簇用不同的顏色,并用不同的顏色標(biāo)識出它們的輪廓。該系統(tǒng)提供了觀察概念層次和數(shù)據(jù)立方體內(nèi)容的工具。概念層次用類似于目錄/子目錄結(jié)構(gòu)的樹來表示。數(shù)據(jù)立方體的內(nèi)容用三維立方體的形式表示,立方體的每個(gè)方體的大小和顏色表示在一個(gè)三維間隔中所選的度量值的匯總數(shù)據(jù)。二維表可被看作二維的盒圖,每個(gè)盒圖表示相應(yīng)間隔的數(shù)據(jù)離差視圖(包含中值、第一個(gè)四分點(diǎn)、第三個(gè)四分點(diǎn)、須狀點(diǎn)和孤立點(diǎn))。系統(tǒng)的一個(gè)重要特征是具有對輸出的知識進(jìn)行鉆取、切塊以及其他轉(zhuǎn)換等操作的靈活性。例如,在對一個(gè)多維和多層次的組合進(jìn)行關(guān)聯(lián)規(guī)則的挖掘后,可以對任一維進(jìn)行鉆取,以便在新的數(shù)據(jù)集中得出關(guān)聯(lián)規(guī)則。
3系統(tǒng)支持的挖掘任務(wù)
3.1系統(tǒng)支持以下的數(shù)據(jù)挖掘任務(wù)
(1)OLAP分析器:這個(gè)功能是通過鉆取、切塊、切片和其他的OLAP操作,從不同的角度的多個(gè)抽象層次展現(xiàn)數(shù)據(jù)立方體中的內(nèi)容。其輸出可以用多種多樣的可視化或圖形的形式表示。此外,借助數(shù)據(jù)離差分析得到最大值、最小值、標(biāo)準(zhǔn)差以及其他分布情況,可以作為OLAP數(shù)據(jù)的注解。OLAP可以對綜合數(shù)據(jù)感興趣的部分進(jìn)行鉆取、切塊以便做進(jìn)一步分析。
(2)關(guān)聯(lián):該功能從多維數(shù)據(jù)庫中挖掘一系列關(guān)聯(lián)規(guī)則。這樣獲得的規(guī)則可用于市場分析、相關(guān)分析等。用戶可以指定元模式以限制對規(guī)則的搜索。
(3)分類:該功能對一組訓(xùn)練數(shù)據(jù)(即一組已經(jīng)確定分類的對象)進(jìn)行分析,根據(jù)數(shù)據(jù)的特性,對每一個(gè)分類構(gòu)造一個(gè)模型,再根據(jù)測試數(shù)據(jù)對模型進(jìn)行調(diào)整。用決策樹或決策表來表示模型,并利用模型對其他數(shù)據(jù)分類,以便更好的理解數(shù)據(jù)庫中的數(shù)據(jù)。
(4)聚類:該功能將一組選定的數(shù)據(jù)對象,分成若干簇,使得簇內(nèi)的數(shù)據(jù)相似度高,而不同簇中的數(shù)據(jù)相似度低。高維聚類也可以在多維數(shù)據(jù)庫中完成。
(5)預(yù)測:該功能將一組選定的數(shù)據(jù)對象的丟失或未知數(shù)據(jù)的值或值的分布進(jìn)行預(yù)測。這涉及到選擇一組與感興趣的屬性相關(guān)的屬性(借助于某些統(tǒng)計(jì)分析),一組與選定對象類似的數(shù)據(jù),然后作出值分布的預(yù)測。例如,一個(gè)雇員的可能的工資可以根據(jù)公司中與他相似雇員的工資分布而作出預(yù)測。
(6)時(shí)間序列分析:這個(gè)模塊包括若干個(gè)分析功能,例如相似分析,周期分析,序列模式分析,趨勢和背離分析。
3.2對任務(wù)和方法選擇的支持
通過一個(gè)基于窗口的圖形用戶界面,用戶使用挖掘向?qū)нx擇各種不同的挖掘任務(wù),或者與挖掘結(jié)果進(jìn)行交互,在其它的維及層次上進(jìn)行挖掘。根據(jù)用戶的輸入,系統(tǒng)產(chǎn)生一個(gè)挖掘查詢供用戶檢查。圖形用戶界面利用Java語言圖形用戶界面的設(shè)計(jì),以及Java語言與SQLSever數(shù)據(jù)庫的連接完成。
3.3對KDD處理過程的支持
由于該系統(tǒng)是與數(shù)據(jù)倉庫一起工作的,若有必要的話,某些知識發(fā)現(xiàn)的先期處理工作可以由底層的數(shù)據(jù)倉庫系統(tǒng)完成。這些工作包括數(shù)據(jù)清洗,數(shù)據(jù)集成,數(shù)據(jù)綜合(按多維和多層次聚集成組)。數(shù)據(jù)的選擇作為系統(tǒng)挖掘查詢的組成部分來完成。在系統(tǒng)中,對挖掘出的知識進(jìn)行后期處理的大部分工作被集成到數(shù)據(jù)挖掘過程。這是因?yàn)閿?shù)據(jù)挖掘查詢不但指定了與任務(wù)相關(guān)的數(shù)據(jù)和挖掘任務(wù),而且也指定了興趣度量值(例如像支持度、置信度、噪聲等挖掘閾值)和期望的規(guī)則模式。數(shù)據(jù)挖掘和模式評價(jià)的集成減少了搜索空間,使用戶將精力集中到挖掘過程。
4系統(tǒng)的運(yùn)行和維護(hù)
系統(tǒng)可用于在關(guān)系數(shù)據(jù)庫和數(shù)據(jù)倉庫中的聯(lián)機(jī)分析和數(shù)據(jù)挖掘。目前已經(jīng)應(yīng)用于從中等規(guī)模到大規(guī)模的關(guān)系數(shù)據(jù)庫,具有快速的響應(yīng)時(shí)間。實(shí)施階段應(yīng)以對所有特性進(jìn)行綜合測試。通過總結(jié),在這個(gè)階段上,有兩個(gè)問題出現(xiàn)的頻率相對較高:
①不一致的數(shù)據(jù);
②不夠高效的查詢性能。系統(tǒng)運(yùn)行需要建立OLAP工具、設(shè)計(jì)報(bào)表類型、開發(fā)報(bào)表模板,同時(shí)還要有一些支持活動(dòng),如軟硬件和網(wǎng)絡(luò)拓展、IT部門和用戶的培訓(xùn)等。隨著配置信息需求的變化、技術(shù)的變化、系統(tǒng)規(guī)模的變化,要使系統(tǒng)正常地運(yùn)行,就要對系統(tǒng)不斷地進(jìn)行更新維護(hù)。
作者:楊書利 單位:滄州市公路工程監(jiān)理中心