前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的信息分類標準主題范文,僅供參考,歡迎閱讀并收藏。
眾所周知,新品牌要在競爭激烈的市場中迅速崛起,快速實現(xiàn)從“0”到“1”的轉變,在原有產(chǎn)品基礎上尋找到合適的新品類是一個非常有效的策略。那么,一個有效的新品類至少應該滿足哪些標準呢?遠卓機構認為,成功開創(chuàng)的新品類至少要滿足五個標準:站得穩(wěn),展得開,收得攏,伸得遠,傳得快。
其一,站得穩(wěn)。新品類不僅要有產(chǎn)品質量做根基,而且要能夠找到其潛在的消費者需求基礎。滿足這兩個條件后,新品類仍然要有渠道基礎,唯有如此,新品類才可能在市場上站得穩(wěn)。例如,我們在服務潮峰鋼構集團時,開創(chuàng)了精品鋼構這一新品類,滿足了大量客戶對于鋼結構建筑質量的高要求,有效推動了該品牌在全國范圍內(nèi)的迅速崛起,品牌知名度和美譽度火線飆升,很快位居行業(yè)前列。
其二,展得開。新品類必須有足夠的支點來支撐,通俗地說就是,圍繞新品類要能展得開,為新品類找到形式新穎、內(nèi)容相異、主題鮮明的支點。例如,山葉電動車根據(jù)社會現(xiàn)狀和發(fā)展趨勢、行業(yè)現(xiàn)狀和發(fā)展趨勢、企業(yè)現(xiàn)狀和發(fā)展趨勢以及消費者需求現(xiàn)狀和發(fā)展趨勢,提出人文電動車這一新品類,然后圍繞人文電動車這一新品類,在處理經(jīng)銷商關系時大膽創(chuàng)新,將經(jīng)銷商全部視為“事業(yè)元素”,獲得了經(jīng)銷商的大力支持,影響了整個電動車行業(yè)。此外,山葉針對大量電動車由于廠家倒閉而維修難的現(xiàn)狀,全力展開“領養(yǎng)電動車孤兒”活動,掀起震驚行業(yè)的電動車“收孤風暴”,感動了無數(shù)電動車用戶。實際上,山葉這些活動都是“人文電動車”這一新品類的有效拓展,直接向社會展示了人文電動車的具體內(nèi)涵。
其三,收得攏。新品類的命名必須具有“高度”和“廣度”,換句話說就是能夠“海納百川”,或者說是“一覽眾山小”,能夠將品牌未來發(fā)展過程中的各種有利資源聚集“麾下”,形成一股合力,有效推動品牌的良性發(fā)展。
【摘要題】信息資源建設與管理
【關鍵詞】網(wǎng)絡信息分類法/網(wǎng)絡信息組織/分類法構建
【正文】
根據(jù)網(wǎng)絡信息和用戶檢索需求的特點,依據(jù)網(wǎng)絡環(huán)境構建科學、實用的網(wǎng)絡信息分類法,是信息資源組織管理研究的重點之一。本文主要以1999年—2005年的中國學術期刊網(wǎng)數(shù)據(jù)為信息源,從構建方法、原則、語言、大綱、信息技術應用等6個方面回顧了近年來網(wǎng)絡信息分類法構建的研究進展。
1構建網(wǎng)絡信息分類法的依據(jù)或方法
目前,網(wǎng)絡信息分類法主要是指網(wǎng)絡搜索引擎分類體系?;凇胺诸惞ぞ咄ǔJ歉鶕?jù)分類對象的特點和用戶需求,結合一定的技術環(huán)境建立的”認識,馬張華在《分類搜索引擎類目體系研究》一文中論述了分類搜索引擎類目結構的編制依據(jù):(1)從分類對象來看,網(wǎng)絡資源的特點是數(shù)量、種類多,動態(tài)性強,新興科學、商業(yè)、娛樂的資源數(shù)量較多,傳統(tǒng)知識門類的資源相對較少,要求有新的、適合處理對象的分類架構。(2)從用戶需求來看,網(wǎng)絡的使用對象涉及所有的終端用戶。(3)從技術環(huán)境來看,網(wǎng)絡信息分類體系應充分利用計算機操作環(huán)境與超文本技術,在體系構建、類目設置等方面發(fā)展不同于傳統(tǒng)分類法的技術特色。[1]
陳樹年提出建構網(wǎng)上知識分類體系的(基本結構)編制方法,即:①有一個涵蓋各知識領域、結構清晰、層次簡明、能滿足網(wǎng)上信息組織需要的分類體系;②采用等級結構展示知識的系統(tǒng)聯(lián)系,構成枝干分明的主題樹或脈絡清晰的知識地圖;③類目的排列和檢索結果的排列方法應采用對用戶最有用的排列次序;④分類體系的標記應適當保留。[2]石曉華等在分析了網(wǎng)絡信息分類法與傳統(tǒng)分類法的優(yōu)劣之后,首次提出了建構《中國網(wǎng)絡信息分類法》的建議,并列舉了具體的編制方法,即:①以傳統(tǒng)分類主題體系為基礎,建構多維的分類體系;②欄目因需而設,突出重點;③控制分級,減少欄目層次;④根據(jù)用戶確定欄目名稱的規(guī)范程度。[3]張琪玉則提出了一整套設計方針,即:①為不同類型的需求提供不同特性的分類體系;②在統(tǒng)一框架下設置分散獨立、各自完整的分類體系;③分類體系的類目設置不以網(wǎng)羅全部網(wǎng)絡信息資源為目標;④分類體系應具有開放性和可變性,并應有反映新穎信息的措施。他也設計了一個供普通用戶使用的分類體系框架。[4]王知津贊同石曉華的第①、②、③建議,認為可以借鑒傳統(tǒng)分類體系,構建《網(wǎng)絡信息分類法》,實現(xiàn)網(wǎng)絡信息分類法與主題詞表的結合,即分類主題一體化。實現(xiàn)分類主題一體化,需要做好三個方面的工作:①建立一個結構簡明的知識分類體系,通過對信息資源的系統(tǒng)分類,實現(xiàn)對網(wǎng)絡信息的宏觀控制;②建立一個智能化的控制詞表,實現(xiàn)作者語言與用戶檢索語言的控制和轉換;③建立分類體系與控制詞表的系統(tǒng)聯(lián)系,即將標引語言納入分類體系,這樣既可以用自然語言直接檢索,也可以在任何類下進行語詞檢索,從而較好實現(xiàn)分類與主題的兼容。[5]董琳提出的思路是設計一個融知識分類、行業(yè)分類、網(wǎng)站信息分類于一體的綜合性中文網(wǎng)站分類體系。[6]該體系把一級大類分為5大模塊:較豐富信息的模塊、高查詢率模塊、學科專業(yè)模塊、查詢?nèi)肟谀K、綜合網(wǎng)站模塊。常設20個一級類目,把主題作為主要聚類標準,學科和專業(yè)作為輔助聚類標準。
另外,陸寶益提出編制的具體步驟,即建立專門機構,配備專業(yè)人員;開展深入調研,制定可行計劃;廣泛征求意見,不斷修改完善。[7]其他學者,如陳代春、趙培云、劉穎、許磊等也從不同角度論述了如何構建統(tǒng)一的網(wǎng)絡信息分類法的問題。
2網(wǎng)絡信息分類法構建的原則
構建新的網(wǎng)絡信息分類體系,需要吸收現(xiàn)有搜索引擎分類體系優(yōu)勢,借鑒傳統(tǒng)分類法的部分長處,并遵循基本的設計指導原則。有的學者[8]認為,強調類表的科學性和專業(yè)性,而忽略了最終用戶——信息需求者的利益,是傳統(tǒng)文獻分類法無法適應網(wǎng)絡信息分類的基本原因之一,所以建立中文網(wǎng)絡信息分類體系應以實用性為主。持相同觀點的學者,如,史學斌提出“實用性、自然性、系統(tǒng)性和技術性、針對性”原則[9]。鄭慶勝指出“實用性、全面性、規(guī)律性、統(tǒng)一性和特殊性”原則[10]等。
持相反觀點的學者認為,首要的原則是科學性原則。吳丹認為,與傳統(tǒng)分類法一樣,網(wǎng)絡信息分類也必須具備科學性原則,分類體系仍必須以科學的知識分類為基礎,即科學性原則、易用性原則、針對性原則、動態(tài)性原則[11]。其他學者,如陸寶益提出“科學性、自然性、實用性、同一性、通用性、兼容性、發(fā)展性”原則[12]、朱蓓玲提出“科學性、實用性、易用性、自然性、針對性、快捷性、系統(tǒng)技術性”原則[13]。敬卿、吳靜提出的“科學性、實用性、易用性、自然性、通用性”原則[14]。鄧香蓮提出的“科學性、簡潔性、直接性、實用性、動態(tài)性、自然性”原則[15]也應歸屬此類。
關于網(wǎng)絡信息分類體系的原則,研究者智者見智,較多學者都提到了應遵循“科學性、實用性、自然性”原則。主要分歧是強調科學性優(yōu)先還是實用性優(yōu)先。筆者認為,網(wǎng)絡信息分類法要適應組織網(wǎng)絡信息動態(tài)變化的需要,滿足用戶復雜的信息查詢需求,對于綜合性、大眾性的中文網(wǎng)絡信息分類體系,必須以實用性原則為主,兼顧科學性的原則。
3網(wǎng)絡信息分類法構建的語言
從實踐來看,傳統(tǒng)的文獻分類法使用的是典型的人工語言,而網(wǎng)絡信息分類法使用的主要是自然語言。因為人工語言嚴格的規(guī)范性使用戶喪失了檢索中的自主性和能動性,背離了以人為本的原則,自然語言是檢索語言發(fā)展的必然。[16]張琪玉教授則指出由于自然語言有其固有的缺陷,網(wǎng)絡信息檢索不可能僅僅使用自然語言,也必須使用人工語言。情報檢索用語發(fā)展的大趨勢,是情報檢索語言的自然語言化和自然語言的情報檢索語言化,是兩者的初級結合到完全融合的過程。[17]所以有的學者認為需要對網(wǎng)絡受控語言進行適合于網(wǎng)民大眾習慣用語的改造,提出了“受控語言網(wǎng)民化”的思想。[18]陳晶也指出:“改進受控語言的易用化是網(wǎng)絡環(huán)境下的大勢所趨,而對自然語言進行必要的控制也是網(wǎng)絡環(huán)境下勢在必行的,兩者的相互滲透、有機結合是情報檢索語言發(fā)展的大趨勢?!盵19]
有的學者認為分類主題一體化語言,實質是受控語言內(nèi)部的一體化,它不能適應網(wǎng)絡檢索的發(fā)展,應當建立更適合于網(wǎng)絡信息檢索的自然語言與受控語言結合的一體化語言。[20]有的學者通過分析受控語言和自然語言各自在網(wǎng)絡中的應用,分析其優(yōu)缺點,指出無論受控語言還是自然語言都有各自獨特的優(yōu)點和缺陷,不能彼此取代,可以相互補充。而“它們在網(wǎng)絡中的應用研究也表明兩者之間呈現(xiàn)出明顯的相互交織兼容的趨勢”。[21]
筆者認為,任何一種語言都有長處和短處,都不能完全滿足網(wǎng)絡用戶多樣化需求,分類語言和主題語言相結合、自然語言和人工語言相結合才是建構網(wǎng)絡信息分類法的發(fā)展趨勢。
4網(wǎng)絡信息分類法的大綱設計
對網(wǎng)絡信息分類法進行深入研究并提出大綱或框架的代表作有文獻[22]、[23]、[24]。陳樹年闡述了構建網(wǎng)上分類體系的原則與技術后,提出了一個適用于一般用戶的綜合性中文搜索引擎的信息分類大綱,該大綱包括22個大類,即哲學與宗教、人文與社會科學、社會文化、文學與藝術、教育與人才、體育與健身、休閑與生活娛樂、旅游與服務業(yè)、醫(yī)學與健康、經(jīng)濟與金融、政治、法律、軍事、歷史與地理、自然科學、農(nóng)業(yè)科學、工程技術、計算機與網(wǎng)絡、新聞與媒體、圖書館與參考資料、國家與地區(qū)、綜合網(wǎng)站。并指出以學術和技術為主的搜索引擎、專業(yè)搜索引擎最好以權威分類法(或其中的某些類)為基礎,經(jīng)過一定的改造后用于網(wǎng)上信息的組織和檢索,因為其科學的體系和嚴密的結構是非專業(yè)人員所不能獨立完成的。[22]吳丹采取學科分類與事物分類兼顧的方式,也設計了一個包含有18個大類和若干二級類目的網(wǎng)絡信息分類體系設計方案。18個大類,即政治法律與軍事、新聞與媒體、商業(yè)與經(jīng)濟、自然科學、農(nóng)業(yè)與工程技術、計算機與網(wǎng)絡、教育、哲學與宗教、人文社會科學、文化藝術、歷史與地理、國家與地區(qū)、旅游與交通、醫(yī)學與健康、生活服務、體育與健身、娛樂休閑、圖書館與參考資料。[23]許培揚提出了中文網(wǎng)絡信息分類法應由簡表、主表、索引和使用指南四部分組成。簡表一般由1-4級類目構成,主表由全部類目構成。索引包括:①本表與其他分類體系的對應,用于不同分類體系的轉換;②英譯名稱索引,從英查漢或從漢查英。使用指南是分類體系的詳細說明。[24]
5現(xiàn)代技術在網(wǎng)絡信息分類法構建中的應用
由于網(wǎng)絡信息分類法必須能適應網(wǎng)絡技術環(huán)境,這就要求在編制過程中適當采用許多現(xiàn)代信息技術,如自動分類技術、人工智能技術、網(wǎng)格技術等等,以適應網(wǎng)絡技術環(huán)境的發(fā)展特點。馬張華專文闡述了超文本技術在網(wǎng)絡信息分類法編制中的應用。[25]他指出:超文本技術可以改進主題之間多維關系的揭示;可以從多個角度組織信息資源;可以進行輪排,亦即多表列類;可以設置鏡像類目,根據(jù)需要對某些重點類目或熱點類目突出反映;可以動態(tài)設置類目和動態(tài)揭示類目之間的關系,根據(jù)需要及時增添類目或刪改類目;可用于聯(lián)結不同的檢索系統(tǒng),增加檢索入口;可以聯(lián)結分類體系與相應的說明文字與規(guī)則系統(tǒng)。
陳旭論述了分面分類在網(wǎng)絡信息分類法編制中的應用。[26]文章首先論述了在編制網(wǎng)絡信息分類法時,可根據(jù)需要利用仿分技術編制各種類型的通用復分表、專用復分表及規(guī)定必要的仿分。其次論述了分面敘詞表的應用。最后論述了分面分類在可視化檢索中的應用。即在檢索界面上設置主題分面、書目形式分面、時間分面和地域分面,然后再按等級列舉的方式分別展開,既便于類表的修訂與維護,又便于用戶檢索更為專指的信息。
周淑云在《分類主題一體化構建網(wǎng)絡信息分類體系》[27]一文中指出,理想的網(wǎng)絡分類法應是分類法和主題法的結合使用,理想的模式是以“分類一主題”的方式對知識進行組織,形成一種兼具分類、主題兩種標引和查找功能的新型檢索語言,從而為不同層次和不同需求的用戶分別提供不同的信息查詢功能。分類主題一體化的網(wǎng)絡分類體系既突破了傳統(tǒng)分類法層層劃分、層層隸屬的等級結構又克服了主題法系統(tǒng)性差,將同類信息分類的特點。對此問題進行論述的還有郭麗芳、梅伯平、蘇瑞竹等。
6構建中微觀層面的具體問題
對網(wǎng)絡信息分類法編制的一些具體問題,許多學者都予以了詳細的探討。
陳樹年在《網(wǎng)絡信息分類法研究》中研究了聚類標準、大類設置、展開層次、類目種類、類目名稱、多分類體系、分類標準與使用次序、類目設置的均衡性和規(guī)律性、重點類目、交叉關系的處理、類目的排列、類目的注釋和說明、用戶界面的設計等,并給出了相應的改進意見。[28]他認為,關于聚類標準,綜合性網(wǎng)絡信息分類法聚類的主要標準應當是“主題和專題”,專業(yè)搜索引擎可以學科或專業(yè)為主要聚類標準,或結合主題聚類運用;關于大類的設置數(shù)量通常以10-20個為宜;關于類目的名稱要做到準確、通用和精練;關于類目種類包括“子類”與“網(wǎng)站”兩種,“在每一類下,把內(nèi)容寬泛,各個下位類不能容納的信息歸納為‘綜合網(wǎng)站’集中收錄是網(wǎng)絡分婁法實用的作法”。
其它方面,人們觀點大致雷同。如,關于分類體系展開層次,陳樹年提出基本應控制在3-6級之間;趙培云認為根據(jù)目前網(wǎng)絡信息的實際情況和用戶瀏覽查詢心理,綜合性網(wǎng)絡信息分類標準,類目應控制在三、四層為宜,專業(yè)搜索引擎和網(wǎng)站可適當延伸。[29]張琪玉提出類目細分應控制在五級左右。[30]
總之,由于網(wǎng)絡信息、網(wǎng)絡信息用戶、網(wǎng)絡信息技術環(huán)境等特點,這就決定了網(wǎng)絡信息分類法的編制原則和技術方法,有別于傳統(tǒng)分類法的編制原則和技術方法,但是傳統(tǒng)文獻分類法和現(xiàn)有網(wǎng)絡信息分類體系的成功經(jīng)驗可以給網(wǎng)絡信息分類法提供有益的借鑒。我們建議,應當由國家信息產(chǎn)業(yè)部牽頭,組織圖書情報界專家、計算機專家、網(wǎng)絡公司等相關專家,廣泛征求意見,盡早編制出一部用戶滿意、質量較高的網(wǎng)絡信息分類法。
【參考文獻】
[1]馬張華.分類搜索引擎類目體系研究.圖書情報工作,2001(2):36-40
[2][22]陳樹年.搜索引擎及網(wǎng)絡信息資源的分類組織.圖書情報工作,2000(4):31-37
[3]石曉華,王春芳。網(wǎng)絡信息分類與傳統(tǒng)分類法的優(yōu)劣分析——兼談構建《中國網(wǎng)絡信息分類法》.圖書館理論與實踐,2001(1):43-45
[4][30]張琪玉.網(wǎng)絡信息檢索工具的分類體系.江蘇圖書館學報,2002(4):7-11
[5]王知津,肖洪.網(wǎng)絡信息組織對傳統(tǒng)信息組織的借鑒.圖書館工作與研究,2003(4):2-7
[6]董琳.網(wǎng)絡信息分類組織的發(fā)展趨勢與標準化.圖書情報知識,2004(2):65-67
[7][12]陸寶益.論創(chuàng)建我國統(tǒng)一的網(wǎng)絡信息分類法.中國圖書館學報,2004(6):44-47
[8]千忠紅.網(wǎng)絡信息環(huán)境下的傳統(tǒng)分類法.圖書情報工作,1999(2):37-39
[9]史學斌.網(wǎng)絡信息分類體系.圖書館,2002(1):33-35,20
[10]鄭慶勝,易曉陽.從新浪等網(wǎng)站看網(wǎng)絡信息分類體系的建立.圖書館建設,2003(1):69-71
[11][23]吳丹.網(wǎng)絡信息分類體系設計.圖書情報知識,2002(5):37-39
[13]朱蓓玲.淺析構建網(wǎng)絡信息分類體系.情報雜志,2004(8):110-111,114
[14]敬卿,吳靜.網(wǎng)絡分類目錄規(guī)范化初探.圖書館,2002(1):49-50
[15]鄧香蓮.文獻信息分類與網(wǎng)絡信息分類之比較研究.情報資料工作,2002(6):43-45
[16]粟慧.以人為本的必然:人工檢索語言向自然語言的轉變.圖書館,2000(2):9-10
[17]張琪玉.網(wǎng)絡信息檢索用語言的發(fā)展趨勢.圖書館雜志,2001(3):5-7
[18]梁樹柏,高夕果.受控語言網(wǎng)民化的思考.情報雜志,2002(8):69-71
[19]陳晶.論網(wǎng)絡環(huán)境下情報檢索語言的發(fā)展.情報雜志,2002(6):54-55
[20]呂娟,袁相琴.論第四種情報檢索語言系統(tǒng).中國圖書館學報,2002(1):87-92
[21]焦玉英,李法運.網(wǎng)絡環(huán)境下信息檢索語言的優(yōu)化研究.情報學報,2003(3):291-296
[24]許培揚,張玢.網(wǎng)絡信息分類標準研究進展.醫(yī)學情報工作,2002(6):324-326
[25]馬張華,李玲.超文本技術在分類法編制中的應用.大學圖書館學報,2001(1):60-62,66
[26]陳旭.分面分類在網(wǎng)絡資源組織中的應用.圖書情報工作,2002(1):59-61
[27]周淑云.分類主題一體化構建網(wǎng)絡信息分類體系.現(xiàn)代情報,2003(4):113-114
關鍵詞:環(huán)境信息 信息分類 多維樹狀信息結構 球形網(wǎng)狀信息結構
中圖分類號:X5 文獻標識碼:A 文章編號:1674-098X(2015)10(b)-0192-02
環(huán)境信息,顧名思義是與環(huán)境有關的信息,但在學術上至今為止還沒有統(tǒng)一的國際一致認可的定義。環(huán)境信息分類是環(huán)境信息標準化的重要基礎,是環(huán)境信息化的關鍵環(huán)節(jié)之一。建立一個科學、規(guī)范、精簡、高效、實用的環(huán)境信息體系,能夠支持信息使用者用最簡單、最短的時間獲取最有價值的環(huán)境信息[1]。我國對環(huán)境信息分類已有一定的研究基礎。當前環(huán)境信息分類方法比較直觀、易于理解,便于內(nèi)容的組織與歸納。然而,隨著“智慧環(huán)?!薄碍h(huán)保物聯(lián)網(wǎng)”“移動互聯(lián)網(wǎng)”的發(fā)展,環(huán)境信息內(nèi)容不斷擴大,此環(huán)境信息分類法忽略了各個類目點的數(shù)據(jù)內(nèi)容交叉性,又切割了各個類目點之間的內(nèi)在客觀聯(lián)系。該文在充分分析環(huán)境信息分類現(xiàn)狀和環(huán)境信息的概念及發(fā)展特征的基礎上,提出新型環(huán)境信息分類方法,為環(huán)境信息的高效利用提供新思路[2]。
1 研究方法
目前,環(huán)境信息分類采用的線分類法和面分類法;線分類法屬于一維分類法,體現(xiàn)的是垂直方向上的概念邏輯關聯(lián);面分類法為二維分類法,體現(xiàn)的是水平方向上的概念邏輯關聯(lián)。然而,環(huán)境是多因素的復雜系統(tǒng),是一個多學科交叉融合的開放體系,環(huán)境系統(tǒng)內(nèi)部體現(xiàn)的是交叉融合的多維邏輯關聯(lián)[3]。
(1)多維樹狀信息結構。
該分類方法需滿足以下條件:所有維度的總和所涵蓋的內(nèi)容能夠構成完整的系統(tǒng)范疇和領域,每一個分類維度內(nèi)涵必須是互相獨立、無重復的。同時,需預留足夠的類目,以保證新事物出現(xiàn)時不至于打亂已建立的分類體系和結構[4]。
系統(tǒng)中的每個子系統(tǒng)映射為信息空間的一個信息維,每一個信息維包括一顆以維度為根級的分類樹,分類樹包括若干子樹,子樹由相互獨立的域構成,域是葉級分類。樹、子樹和域構成了該數(shù)據(jù)維下的二維分類結構[5]。
(2)球形網(wǎng)狀信息結構。
球形網(wǎng)狀信息結構則是結合樹形數(shù)據(jù)結構基礎上演變而來。構建步驟:
一是將信息按照樹形結構分類。
二是調整每一個信息樹及其分類的位置并旋轉一定的角度、形成一個有邊界的多邊形整體效果,將所有的信息單元數(shù)據(jù)對象放在全集空間中考察。
三是對于實踐中所生產(chǎn)的每一個信息單元,先根據(jù)信息的主要功能與價值確定其直接歸屬的欄目,用實線連接該信息單元和其宿主欄目。并考察信息單元與其他欄目的關聯(lián)性,關聯(lián)性強的用虛線連接,關聯(lián)性弱的則不連接。
四是當所有的信息樹分類和信息單元都在這個全集空間中標示出來時,再把該模型放到立體空間去觀察,最后得到一個球形網(wǎng)狀的結構模型。
2 結果與討論
2.1 多維樹狀環(huán)境信息分類
環(huán)境信息除了要體現(xiàn)環(huán)境系統(tǒng)的豐富內(nèi)涵,同時也要表達信息特征和時空特征。因此,環(huán)境信息的三個基本維度可視為:環(huán)境屬性維、信息屬性維和時空定位屬性維。
(1)環(huán)境屬性維。
環(huán)境是多因素的復雜系統(tǒng),信息包括豐富的內(nèi)涵。通過對環(huán)境政治活動和環(huán)境自然因素分析,結合我國用戶對環(huán)境信息的需求,該文將環(huán)境屬性維分為活動行為和環(huán)境要素。
活動行為,是按政府對環(huán)境監(jiān)管進行分類,主要有環(huán)境管理、生態(tài)保護、污染防治、環(huán)境科研、公眾參與和環(huán)境產(chǎn)業(yè)發(fā)展等。
環(huán)境要素,是按人類對環(huán)境的一般認識進行分類,主要有水、大氣、生物、土壤、輻射、聲和社會環(huán)境等。
(2)信息屬性維。
信息屬性說明環(huán)境信息的來源、信息內(nèi)容及信息表現(xiàn)形式,該維度服務于信息的標準化技術操作。
環(huán)境信息來源,通過具體分析環(huán)境信息來源,采用相應的數(shù)據(jù)集成技術,可方便信息的自動化接收和存儲。該文將環(huán)境信息來源分為:環(huán)保系統(tǒng)內(nèi)部信息、跨部門共享信息、公共網(wǎng)絡資源、公共科技資源等。
環(huán)境信息內(nèi)容,根據(jù)對環(huán)境內(nèi)涵的分析,環(huán)境信息內(nèi)容可以分為科普知識、監(jiān)測預警、行政審批、法律政策、新聞公告和科研成果等。
環(huán)境信息表現(xiàn)形式,根據(jù)信息表現(xiàn)的一般分類,該文環(huán)境信息表現(xiàn)形式分為文本、圖表、聲音、視頻、地圖等。
(3)時空定位屬性維。
環(huán)境具有明顯的時空特征,環(huán)境信息也需要反映時空特性,該文將時空定位維分為時間特征、時效特征和空間范圍。
時間特征,按照環(huán)境信息關聯(lián)的自然時間進行定位,該文將時間特征信息分為預測信息、當前信息和歷史信息。
時效特征,按照環(huán)境信息接收到的時間效力進行定位,該文將時效特征分為實時信息、準實時信息、延遲信息等。
空間范圍,按照環(huán)境信息關聯(lián)的空間位置實現(xiàn)空間定位,該文將空間范圍分為世界、全國、區(qū)域、流域、地方等。
2.2 球形網(wǎng)狀環(huán)境信息分類
根據(jù)以上分類,環(huán)境信息樹包括8類:活動行為、環(huán)境要素、信息來源、信息內(nèi)容、表現(xiàn)形式、時間特征、時效特征和空間范圍,將每個信息樹按其分類旋轉一定角度形成空間效果,將實踐中的每一個信息單元與各個環(huán)境信息樹進行關聯(lián),形成一個環(huán)境信息的球形網(wǎng)狀結構。
2.3 結果討論
該文所采用的多維樹狀信息分類法和球形網(wǎng)狀結構的信息分類法,具有以下特點:
(1)多維樹狀信息分類法從環(huán)境屬性維、信息屬性維和時空定位屬性維對環(huán)境信息進行分類,基本涵蓋了環(huán)境及信息的所有內(nèi)涵和特征,克服了現(xiàn)在以線、面混合分類法對于數(shù)據(jù)內(nèi)容交叉性不強的缺陷,為環(huán)境信息分類提出新方向。
(2)球形網(wǎng)狀結構的信息分類法是在多維樹狀信息結構的基礎演變形成,增強了環(huán)境信息類別間的內(nèi)存聯(lián)系,使環(huán)境信息分類體系更富有組織性、有機性。
(3)同時,環(huán)境信息的多維分類及網(wǎng)狀聯(lián)結也為信息的存儲和查詢效率提出了更高的要求,要求更高性能的物理存儲、更合理的數(shù)據(jù)庫結構,以及更加高效的搜索技術。
3 結語
多維樹狀環(huán)境信息分類和球形網(wǎng)狀環(huán)境信息分類是以環(huán)境信息的特征為基礎,以信息高效利用需求為導向,提出的現(xiàn)代化新型環(huán)境信息分類方法,它克服了傳統(tǒng)環(huán)境分類數(shù)據(jù)內(nèi)容交叉性弱、內(nèi)在客觀聯(lián)系不強等缺陷,是科學、規(guī)范、精簡、高效、實用的環(huán)境信息體系構建的基礎理論,為現(xiàn)代環(huán)境信息資源目錄體系和環(huán)境信息資源中心的建設提供了新思路。該研究旨在拋磚引玉,希望更多學者進行探討,為推動環(huán)境信息的綜合有效利用以及環(huán)境信息化發(fā)展做出努力。
參考文獻
[1] 關于在環(huán)境事物中獲取信息、公眾參與決策和司法救濟的公約(奧胡斯公約).歐洲經(jīng)濟委員會環(huán)境政策委員會于1998年在“歐洲環(huán)境”第四次部長級會議[Z].
[2] 尹榮樓,李愛榮.環(huán)境信息分類編碼標準化[J].環(huán)境科學研究,1994,7(2):39-43.
[3] 王健,甘國輝.多維農(nóng)業(yè)信息分類體系[J].農(nóng)業(yè)工程學報,2004,20(4):152-155.
關鍵詞:知識管理 知識化監(jiān)理 知識結構
信息工程監(jiān)理是最近幾年興起的保障信息化建設質量的一種約束機制。它采用“五控兩管一協(xié)調”的控制模式,對業(yè)主、承建單位的項目行為實施監(jiān)督,保障信息化建設的質量,避免“豆腐渣”工程,起著不可或缺的重要作用。
一、信息化建設與知識管理
信息化建設是以知識管理為核心,信息資源為基礎,提高組織核心競爭力為目的的全面整合或再造組織業(yè)務流程的過程。知識管理是獲取、儲存、學習、共享、創(chuàng)新知識的管理控制過程。在信息化建設中,企業(yè)、政府等組織通過知識管理,從現(xiàn)有的業(yè)務流程和數(shù)據(jù)中,挖掘、獲取并確定各類知識資源,定位擁有專業(yè)知識、經(jīng)驗的個體,將個體的知識、經(jīng)驗、信息提升為組織的知識資源,有序傳遞、整合、規(guī)劃和有效利用知識資源,有助于提高組織的整體業(yè)務、技術和管理水平。
在承建單位實施信息化建設中,知識管理是通過公司內(nèi)雇員、部門、可能的跨國公司合作、與業(yè)主的溝通協(xié)調,傳遞、整合、有效利用本單位的知識資源,運用信息技術,通過設計最優(yōu)技術方案、控制施工質量,共享和創(chuàng)造知識價值。
在信息化建設中,對組織內(nèi)各種各類知識進行評估,挖掘、獲取真正有用的知識。知識不僅僅是信息,是顯性知識和隱性知識的集合。通過評估,區(qū)分知識和信息、知識管理和信息管理,以實現(xiàn)資源的充分開發(fā)與應用。
整合或再造業(yè)務流程,是與知識管理密切相關的。1990年美國管理專家Michael Hammer提出了“業(yè)務流程重組”(Business Process ReengineeringBPR)的概念,它是以用戶需求為導向,信息化、知識化為基礎,對用戶的業(yè)務流程進行再思考、關鍵性的重新設計和根本的變革,從而獲得在成本、質量、服務和速度等方面業(yè)績的持續(xù)改善。在業(yè)務流程重組中,信息(知識)的獲取、分類、存儲、利用,只有與知識管理結合,才能夠發(fā)揮更有效的作用。
知識管理技術貫穿于信息化建設始終,它與信息技術相輔相成。在知識獲取、學習、共享、創(chuàng)新的過程中,整合各種信息技術,構建完整的知識管理體系,是知識經(jīng)濟時代信息技術的新發(fā)展。
二、信息資源規(guī)劃和整合
信息資源整合(Information Resource Integrating, IRI)的前提是進行統(tǒng)一的信息資源規(guī)劃(Information Resource Planning, IRP),消除“信息孤島”,共享信息資源。信息資源的規(guī)劃是實施信息化工程的基礎,IRP的基礎是建立信息資源管理基礎標準,IRI的實質是通過信息技術改造、重建或重構數(shù)據(jù)環(huán)境。信息產(chǎn)業(yè)部的《信息系統(tǒng)工程監(jiān)理暫行規(guī)定》中定義信息資源系統(tǒng)為“以信息技術為主要手段建立的信息資源采集、儲存、處理的資源系統(tǒng)”。
在信息化建設中,信息資源規(guī)劃是很重要的一環(huán)。在組織的生產(chǎn)、經(jīng)營、服務活動中,會產(chǎn)生大量的數(shù)據(jù)、資料、指標、圖紙、報表及其它顯性資源,也存在各種各類的知識、擁有專業(yè)知識和經(jīng)驗的個體等隱性資源。信息資源規(guī)劃是對實施信息化后產(chǎn)生、控制、使用這些資源進行識別和分類;評估、挖掘、獲取、共享各類知識;對承載信息資源的信息基礎設施進行分析、設計和指導。
(一)信息資源規(guī)劃的主要任務
信息資源規(guī)劃的任務是對支撐業(yè)務流程的邏輯相關的數(shù)據(jù)進行分類,建立具有結構化、標準化、一致性的共享數(shù)據(jù)庫。分析業(yè)務流程重組后產(chǎn)生、控制和使用的數(shù)據(jù),了解各種數(shù)據(jù)的內(nèi)容、范圍、可靠性等,理解數(shù)據(jù)的共享要求和應用策略以及數(shù)據(jù)使用中的問題,使信息資源規(guī)劃能夠滿足數(shù)據(jù)資源的管理要求。
(二)信息資源管理標準
信息資源管理標準是指決定信息系統(tǒng)質量的、進行信息資源開發(fā)利用的基本標準。威廉·德雷爾1985年在其《數(shù)據(jù)管理》專著中總結了信息資源管理的基礎標準———數(shù)據(jù)管理五項標準,內(nèi)容如下:
1.數(shù)據(jù)元素標準。數(shù)據(jù)元素(Data Elements)是信息資源中最小的信息單位,是抽象的數(shù)據(jù)對象。它的質量是構建穩(wěn)定的數(shù)據(jù)結構基礎的關鍵。數(shù)據(jù)元素標準包括數(shù)據(jù)元素命名標準、標數(shù)據(jù)元素識標準和數(shù)據(jù)元素一致性標準。
2.信息分類編碼標準。是信息標準中的基礎標準。信息分類編碼(Information Classifying and Coding)的對象,是一些最重要的數(shù)據(jù)元素,自動處理、檢索、存儲和傳輸信息的質量及效率與這些元素緊密相關。信息分類是根據(jù)信息內(nèi)容的屬性或特征,將信息按一定的原則和方法進行區(qū)分和歸類,并建立一定的分類系統(tǒng)和排列順序,便于管理和使用信息。信息編碼就是在信息分類的基礎上,將編碼對象賦予有一定規(guī)律性的、易于計算機和人識別和處理的符號。信息分類編碼工作要確定每個編碼對象的編碼規(guī)則、碼表結構和代碼表。
3.用戶視圖標準。用戶視圖(User View)是一些數(shù)據(jù)元素的集合,表示用戶對信息需求和數(shù)據(jù)實體的最終解釋。用戶視圖是數(shù)據(jù)的系統(tǒng)外在表現(xiàn)形式,是系統(tǒng)的輸入、輸出媒介和手段。用戶視圖與外部數(shù)據(jù)流是同一詞,來自某個數(shù)據(jù)源或流向某個數(shù)據(jù)接收端的數(shù)據(jù)流。常用的用戶視圖有紙面的,如圖紙、單證、表單、報表、賬冊等;有電子的,如屏幕格式等。
4.概念數(shù)據(jù)庫標準。概念數(shù)據(jù)庫(Conceptual Database)是用戶對數(shù)據(jù)存儲的最終解釋。用戶的信息需求,應首先界定概念數(shù)據(jù)庫。概念數(shù)據(jù)庫是綜合信息資源用戶的數(shù)據(jù)要求構成的全局數(shù)據(jù)庫,表示數(shù)據(jù)庫的整體數(shù)據(jù)組織狀況和邏輯結構。
5.邏輯數(shù)據(jù)庫標準。邏輯數(shù)據(jù)庫(Logical Database)是系統(tǒng)分析設計人員的解釋。在關系數(shù)據(jù)庫模型中,邏輯數(shù)據(jù)庫是一組規(guī)范化的基本表(Base Table),是從概念數(shù)據(jù)庫中映射出的所需信息。邏輯數(shù)據(jù)庫表示的是局部數(shù)據(jù)的數(shù)據(jù)庫邏輯結構。
(三)信息資源規(guī)劃方案
在定義數(shù)據(jù)管理標準的基礎上,制定信息資源規(guī)劃方案,為業(yè)務流程重組提供依據(jù),為系統(tǒng)設計提供基礎。
在信息資源規(guī)劃中,將隱性資源轉變?yōu)轱@性資源,有序傳遞、整合、規(guī)劃和有效利用各類知識資源。因此,信息資源規(guī)劃是資源的知識管理規(guī)劃。信息技術的投資,可能不會給企業(yè)帶來明顯的效益,因為基于信息的競爭優(yōu)勢正在逐漸轉變?yōu)榛谥R管理的競爭優(yōu)勢,以信息資源規(guī)劃為核心的信息系統(tǒng)規(guī)劃,如果不實施知識管理,將不會產(chǎn)生顯著的信息化效益。
(四)資源整合
我國政府信息化進程從20世紀80年代開始到現(xiàn)在已有20多年的時間。政府部門的信息資源建設和政府內(nèi)網(wǎng)信息門戶建設已具較大規(guī)模,但由于缺乏統(tǒng)一規(guī)劃,造成了各部門應用系統(tǒng)的開發(fā)平臺不同、操作系統(tǒng)不同,特別是數(shù)據(jù)庫管理系統(tǒng)千差萬別,各系統(tǒng)之間“不聯(lián)不通”,從而形成了一個個“信息孤島”。因此當前電子政務建設面臨著兩項任務,一項是政府信息資源整合、流程優(yōu)化,建立有效的領導決策支持系統(tǒng);另一項是提供周到、方便的公共服務能力,即構建電子服務型政府。
一、信息資源整合
在短期內(nèi)建設完成電子服務型政府的困難是:我國目前電子政務物理網(wǎng)的基礎設施和單項應用雖然很豐富,但是信息資源共享與交換能力不足,因此重視數(shù)據(jù)流分析和辦公流程整合,搞好軟件系統(tǒng)的頂層設計是電子政務建設必須經(jīng)歷的重要階段。信息資源整合的三項內(nèi)容:內(nèi)容整合、數(shù)據(jù)整合、應用整合。
從總體上看,內(nèi)容整合包括對分散異構信息資源體系的整合。首先,原則上是在兼顧信息資源現(xiàn)有配置與管理狀況的條件下,實現(xiàn)無縫整合;其次,在新的信息交換與共享平臺上,開發(fā)新的應用,實現(xiàn)信息資源的最大增值。
數(shù)據(jù)整合的關鍵是構建基礎數(shù)據(jù)庫和建立數(shù)據(jù)中心。基礎數(shù)據(jù)庫包括人口數(shù)據(jù)庫、法人單位數(shù)據(jù)庫、自然資源和空間地理數(shù)據(jù)庫、宏觀經(jīng)濟數(shù)據(jù)庫和各地方特殊資源數(shù)據(jù)庫等。其中數(shù)據(jù)中心的建立是電子政務的基石,是政府信息化的基礎設施。
應用整合包括包含G2G、G2B、G2C和G2E(政府對公務員)等模式下的政務應用系統(tǒng)及協(xié)同工作與決策支持系統(tǒng)。
此外,電子政務標準規(guī)范體系和電子政務安全體系作為電子政務建設的核心內(nèi)容,也不容忽視。
二、信息資源整合的難點
電子政務工程建設經(jīng)過多年的開發(fā)和積累,政府各部門存在了大量的數(shù)據(jù)庫,對這些現(xiàn)有數(shù)據(jù)庫系統(tǒng)進行整合中遇到的難題主要有:
1.對現(xiàn)有分散異構的信息資源如何無縫接入。包括結構化數(shù)據(jù)資源的接入、非結構化數(shù)據(jù)的接入和應用軟件系統(tǒng)的接入。
2.整合后信息系統(tǒng)的管理問題?,F(xiàn)有信息資源的管理分為自上而下的管理、集中式管理、可控性自主管理、個性化管理和實時性管理等多種管理模式。信息資源整合后將實行分布式信息資源管理。如何實現(xiàn)物理上分散、邏輯上集中、應用上分散、管理與服務集中將是面臨的主要難題。
3.如何滿足新的需求。包括共享需求、交換需求、協(xié)同需求等。
4.支持不同用戶的訪問需求。包括支持不用授權的可控性訪問、不同用戶的個性化服務、支持單一性訪問、支持實時性的應用需求。
三、信息資源整合方案
整合后的管理架構體系分5層,如圖1所示。
該管理架構的優(yōu)勢是:
1.視圖管理層中所有管理模塊都提供與WebService的接口,易于實現(xiàn)分布部屬,統(tǒng)一管理。
2.統(tǒng)一的資源目錄層PKI和PMI中心層中的授權管理可以靈活定義用戶類型和用戶屬性,從而可以方便地定義信息欄目下的不同條目或應用下的不同操作,靈活定制授權策略。支持第三方CA認證及其資源目錄系統(tǒng)和第三方應用系統(tǒng)的集成。
3.組件封裝層:涵蓋了日常工作中用到的各種文件模版,并提供舊文件查詢等功能。
4.軟件層:提供各種辦公應用軟件及專用軟件。
四、信息資源整合的成功案例
2005年全國電子政務建設步入新的發(fā)展階段。以河北省電子政務“112”工程為例,該工程的重點是構建了統(tǒng)一的電子政務平臺和12個應用系統(tǒng)。
1.統(tǒng)一的電子政務平臺:公務內(nèi)網(wǎng)、公務外網(wǎng)和信息交換系統(tǒng)
2.12個重點應用系統(tǒng):辦公及網(wǎng)上審批系統(tǒng)、財稅和審計監(jiān)管系統(tǒng)、社會保障信息系統(tǒng)、宏觀經(jīng)濟信息系統(tǒng)、農(nóng)業(yè)信息及服務系統(tǒng)、自然資源和基礎地理信息系統(tǒng)、社區(qū)綜合管理服務系統(tǒng)、人口基本信息管理系統(tǒng)、應急聯(lián)動信息系統(tǒng)、公共衛(wèi)生信息系統(tǒng)、信用信息服務系統(tǒng)、綜合教育信息系統(tǒng)。
系統(tǒng)建設分三個階段進行:
第一階段(需求分析階段):主要任務是業(yè)務梳理和用戶視圖及數(shù)據(jù)流分析。通過業(yè)務梳理和分析,按照信息工程方法論,建立起由職能域、業(yè)務過程、業(yè)務活動構成的業(yè)務模型;通過對報表、單證、帳冊等用戶視圖的登記和拆分,得到所涉及的數(shù)據(jù)項及其分布情況;通過對數(shù)據(jù)流也就是用戶視圖流動的分析,得到業(yè)務與數(shù)據(jù)的關聯(lián)關系,形成數(shù)據(jù)流程圖。通過對輸入、輸出、存儲等數(shù)據(jù)流的量化分析,得到對網(wǎng)絡通信和數(shù)據(jù)存儲設備的量化需求。
第二階段(系統(tǒng)建模階段):系統(tǒng)建模是需求分析的繼續(xù)和定型,這一階段的主要任務是建立系統(tǒng)的功能模型、數(shù)據(jù)模型和體系結構模型。在對需求分析階段得到的業(yè)務過程、業(yè)務活動能否計算機化進行分析的基礎上,將可計算機化的業(yè)務過程、業(yè)務活動用功能模塊和程序模塊表達出來,建立起功能模型,解決系統(tǒng)做什么的問題;通過對需求階段得到的數(shù)據(jù)流程圖、用戶視圖、數(shù)據(jù)項及其分布情況的進一步分析、分類和規(guī)范化,按業(yè)務主題和業(yè)務需要建立起由主題數(shù)據(jù)庫、基本表、數(shù)據(jù)元素集構成的數(shù)據(jù)模型,解決系統(tǒng)信息如何組織的問題;通過對功能模型和數(shù)據(jù)模型關聯(lián)關系的分析,建立起系統(tǒng)的體系結構模型,表達出子系統(tǒng)與主題數(shù)據(jù)庫的關聯(lián)情況以及各子系統(tǒng)的程序模塊與基本表的關聯(lián)情況,為共享數(shù)據(jù)庫的創(chuàng)建與使用、數(shù)據(jù)分布分析和制定開發(fā)計劃提供決策依據(jù)。
第三階段(信息分類編碼階段):主要任務是數(shù)據(jù)元素規(guī)范化、信息分類編碼和專項報告編制。利用數(shù)據(jù)元素規(guī)范化理論和方法,對基本表中的每一個數(shù)據(jù)元素進行分析、規(guī)范和一致性控制,數(shù)據(jù)模型也得到進一步完善;通過對數(shù)據(jù)元素內(nèi)涵的分析,識別信息分類編碼對象并進行適當分類,按照國際、國家、地方、企業(yè)的順序,進行信息分類編碼標準調研,對確需自己進行編碼的對象,要制定編碼規(guī)則、編制相應的代碼表,并通過收集已有的編碼標準,最終形成系統(tǒng)所需的完整的信息分類編碼標準;在完成信息資源規(guī)劃方案的基礎上,通過對整個過程和成果的總結與提煉,分別形成流程優(yōu)化、信息資源管理基礎標準、數(shù)據(jù)交換標準、數(shù)據(jù)環(huán)境建設、投資分析等五個專項報告。
2005年4月29日,河北省電子政務“112”工程順利通過國家信息化專家組的評審,開始在電子政務建設中發(fā)揮效用。
關鍵詞:知識庫;農(nóng)業(yè)信息分類;mysql
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)32-7560-02
Abstract: Through the research on database technology and techniques for classification of agricultural information, designing the structure of agricultural technology database and developing the agricultural information acquisition system, provides the input interface for the agricultural knowledge acquisition. The design of agricultural database building a foundation for the developing of agricultural knowledge retrieval system. The practical application proves that, the agricultural knowledge database providing a good support for the development of agricultural information retrieval system.
Key word: knowledge database; agricultural information classification; mysql
新疆地域遼闊,農(nóng)業(yè)、牧業(yè)生產(chǎn)較分散,特別是牧民生產(chǎn)生活地點不固定,農(nóng)業(yè)科技人員很難進行定點科技服務。通過農(nóng)業(yè)知識庫建設,建立農(nóng)業(yè)信息話務咨詢中心,農(nóng)牧民在田間地頭通過為農(nóng)服務熱線即可咨詢生產(chǎn)過程中遇到的各種問題,這將大大提高我區(qū)為農(nóng)服務水平,及時幫助農(nóng)戶快速解決生產(chǎn)中遇到的各種問題,提高為農(nóng)服務質量,促進我區(qū)農(nóng)、林、牧、副、漁業(yè)快速發(fā)展。因此農(nóng)業(yè)知識庫的構建與實現(xiàn)是建立農(nóng)業(yè)信息話務中心的迫切需求。
1 農(nóng)業(yè)信息分類
農(nóng)業(yè)知識庫需要儲存大量的農(nóng)業(yè)數(shù)據(jù),為了合理的構建農(nóng)業(yè)知識庫,需要研究農(nóng)業(yè)信息科學的分類方法。經(jīng)過調查研究、咨詢相關專家以及查閱相關書籍,依據(jù)“農(nóng)業(yè)信息分類標準草案”,我們將農(nóng)業(yè)信息分為種植業(yè)及制品、漁業(yè)、畜牧業(yè)、農(nóng)業(yè)生產(chǎn)資料、園林、農(nóng)機械、植物病理、動物病理類,每個大類下面又分二級類別、三級類別、四級類別。以種植業(yè)及其制品為例,其二級類別又可分為糧食作物、經(jīng)濟作物、蔬菜、瓜果類、油類。二級類別下又設三級類別,以糧食作物為例其三級類別又可分為谷物,三級類別下又設四級類別,以谷物為例,其四級類別包括大麥、燕麥、蕎麥、青稞等具體植物;經(jīng)濟作物的三級級類別又可分為油料、豆類、棉麻、糖類作物。油料的四級類別又分為花生、油菜、芥菜等植物;豆類的四級類別包括大豆、蠶豆、豌豆、等植物;棉、麻的四級類別包括棉花、細絨棉、木棉、野麻、劍麻等植物;糖類作物的四級類別包括甘蔗、甜菜。蔬菜的三級類別又可分為根菜類、莖菜類、葉菜類、花菜類、果菜類、種子類。根菜的四級類別分為蘿卜、大頭菜、牛蒡等植物;莖菜類的四級類別又分為馬鈴薯、菊芋、藕等植物;葉菜類的四級類別包括小白菜、菠菜、芹菜等植物;花菜類下面有花椰菜、青花菜、金針菜等植物;果菜類四級類別包括黃瓜、南瓜、苦瓜等植物;種菜類四級類別包括籽用西瓜、蓮子、芡實;瓜果類三級類別包括瓜類、果類、堅果、干果。瓜類四級類別包括西瓜、甜瓜、哈密瓜等植物;果類下面有蘋果、桃、石榴等植物;堅果、干果下面有按巴旦木、核桃、葡萄干等植物。油類又可分為食用油。食用油下面有花生油、豆油、菜籽油等。按照這樣的方法將其余七類由大至小細分。
3 知識錄入系統(tǒng)的設計與實現(xiàn)
知識庫數(shù)據(jù)的獲取主要包括三種途徑,第一種途徑是通過網(wǎng)絡爬蟲從相關農(nóng)業(yè)網(wǎng)站抓取信息,然后分類導入知識庫,第二種途徑為人工錄入已掌握的大量農(nóng)業(yè)科技信息,第三種途徑為用戶檢索過程中查詢不到的關鍵詞經(jīng)客服人員搜索再次錄入知識庫,通過這三種途徑不斷豐富農(nóng)業(yè)知識庫,為方便人工錄入,開發(fā)了農(nóng)業(yè)知識庫錄入接口,開發(fā)技術采用jsp+servlet+strus,服務器使用fedora14.農(nóng)業(yè)知識錄入界面如圖2。
在知識錄入過程中,首先要選擇所錄農(nóng)業(yè)科技知識所屬一級類別、二級類別、三級類別和四級類別,然后在標題欄中輸入農(nóng)業(yè)知識標題,在內(nèi)容欄中輸入農(nóng)業(yè)知識內(nèi)容,點擊提交即可。農(nóng)業(yè)信息的分類不但利于數(shù)據(jù)的存儲,而且為后期開發(fā)農(nóng)業(yè)科技知識檢索系統(tǒng)及用戶個性信息定制提供了基礎。
4 結束語
目前該知識庫已設計完畢,數(shù)據(jù)錄入工作正在進行,已錄入農(nóng)業(yè)科技知識3000余條,網(wǎng)絡爬蟲采集數(shù)據(jù)經(jīng)分類入庫350多萬條,為農(nóng)業(yè)知識檢索系統(tǒng)提供了數(shù)據(jù)支持,起到了為農(nóng)服務的目的。
參考文獻:
[1] 李永可,李悅,陳燕紅,等.農(nóng)業(yè)知識檢索系統(tǒng)的設計與實現(xiàn)[J].電腦知識與技術,2014,10(23):5449-5452.
[2] 李永可,張?zhí)t,馮向萍.中文農(nóng)業(yè)網(wǎng)站多元線性回歸識別研究[J].新疆農(nóng)業(yè)大學學報,2011,34(5):442-446.
[3] 胡毅,劉波,方逵.農(nóng)業(yè)知識庫知識檢索系統(tǒng)研究與實現(xiàn)[J].農(nóng)機化研究,2013(6):13-18.
[4] 王玉娟.農(nóng)業(yè)知識文本庫檢索系統(tǒng)關鍵技術研究[D].長沙:湖南農(nóng)業(yè)大學,2012.
[5] 王斌.信息檢索導論[M].北京:人民郵電出版社,2010.
[6] 王玉娟,方逵.農(nóng)業(yè)知識庫檢索系統(tǒng)探索[J].寧夏農(nóng)林科技.2012(4):24-27
[7] 羅武.農(nóng)業(yè)知識庫知識錄入系統(tǒng)關鍵技術研究與實現(xiàn)[D].長沙:湖南農(nóng)業(yè)大學,2011.
P鍵詞:工程項目 WBS 計算機
一、WBS簡介
Work Breakdown Structure(WBS)是一種全面系統(tǒng)的工程項目分析法,是項目管理的基礎性工作。[1]它可以將龐大的工程分解為方便管理的工作包,這樣可以增加對工程的費用、進度和質量控制的準確度。早在在上世紀七八十年代,就成為國際上進行工程項目管理的基本方法。
WBS是一個由軟件、硬件、服務以及資料組成的以產(chǎn)品為中心的層次體系,它確定了整個項目工程的走向,對項目工程起到了決定作用。[2]WBS可以對需要進行研制或者生產(chǎn)的產(chǎn)品進行顯示并且在最終的產(chǎn)品與工作單元之間建立起一座橋梁,在確定產(chǎn)品單元時起著至關重要的作用。WBS具體可以分為四類,分別為:綱要性WBS、項目綱要性WBS,合同WBS和項目WBS,它的建立必須遵守整體性、系統(tǒng)性和可追溯性的原則,這是WBS作為工程項目管理的要求。那么,為了實現(xiàn)這三項原則,在針對WBS進行設計時要特別注意結構、代碼和報告這三要素的設計。
二、工作包模型
工作包是工作包模型的基本構成單元,而工作包又是在對項目進行分解后的結果上形成的。工作包模型的思路就是將工作包作為整個項目的具體控制對象,實現(xiàn)高效化管理。工期控制、費用控制等在項目進行中對各個單元的控制都可以成為工作包的控制對象,這樣一來可以為整個工程提供一個完整準確的的信息。由于工作包的上述屬性導致由其組成的層次結構體系在反映工程項目生產(chǎn)過程的同時還可以反映項目的內(nèi)部聯(lián)系和目標要求,進而支持項目控制的整個過程。
在工作包模型建立后,可以利用計算機數(shù)據(jù)庫技術對整個工程項目進行集成化管理。工程項目的分類與編碼關系到計算機在工程項目中充分發(fā)揮自身的功能,因此工作包的建立尤其重要。
如圖一所示工作包模型:
圖一:工作包模型
三、工程項目信息的分類體系
工程項目信息分類體系始于西方國家,經(jīng)過幾十年的發(fā)展演變已經(jīng)形成了多個體系,其分類領域也逐漸擴大。[3]這一演變正是工程項目信息管理內(nèi)容增加的寫照。信息分類是建立WBS 的基礎,因為不同的項目參與者有不同的理解,他們各自按照自身從事的行業(yè)來制定信息分類體系,這些體系勢必會與信息分類體系對應的編碼體系有所差別。這大大影響了項目參與者與各方的信息交流,為計算機技術在建筑業(yè)中的應用帶來了不便。
在眾多工程項目信息分類體系中,ISO集眾家之所長提出了按照空間和工種的特性、設施種類、建筑材料等逐層分解的方法。這種方法目前應用最為廣泛,具體分類標準如下:
1.設施:按照用途劃分,比如房屋、道路、車站、廠房、大壩等。
2.空間:按照范圍構成劃分,比如招待所、公寓樓、娛樂區(qū)、辦公樓、道路區(qū)等。
3.分部:按照設施的物理構成部分以及一定的功能性劃分。比如外墻、供熱系統(tǒng)、電力系統(tǒng)等。
4.工作段:按照工種特性來分,且必須小于分部。比如結構工程電氣工程等。
5.建筑配件和材料:工程項目永久性的一部分,按照不同用途來進行分類。比如用于大壩觀測、用于觀測自動化系統(tǒng)信號傳遞等。
6.建筑輔助:在工程項目中國其臨時作用且不構成永久性的部分,比如梯子、腳手架、設備等。
這個ISO技術報告框架是多國專家學者在對本國具體工程項目進行研究后得出的工程項目分類和編碼體系。這種分類體系是在ISO技術報告上進行細分后產(chǎn)生的,使得層次更加清晰結構更見簡單明了,更好的突出了重點,有利于對工程項目的整體控制且包括了所有的土木工程,適合WBS的編制。
四、工程項目信息編碼的內(nèi)容與方式
對項目分解體系進行編碼是項目信息編碼的主要內(nèi)容,包括時間上、參與者(建設方、設計方、承包商等)建筑材料、建筑設備等有型資源的編碼和項目文檔的編碼等。
編碼可以采用字母和符號等多種方式來進行。比較常見的簡單編碼結構主要是樹狀結構,這種結構主要是指將下一級的編碼進行匯總后形成上一級,是一個如樹狀的包含關系。這種編碼方式雖然有利于信息的匯總但是這種分類方法缺陷很多,比如在擴展性上就受到了本身結構的限制。而比較復雜的編碼方式有分面結構,就是指將編碼分為不同的部分,然后對其進行結合形成完整的意義。這種結構相對于上述的樹狀結構擴展性更強。第三種編碼方式是結合了前兩種方式產(chǎn)生的,是指在保持樹狀結構的同時改善匯總方式,采取不同組合的方法增強擴展力度。
以上三種編碼方式已經(jīng)被廣泛應用于各個國家或者地區(qū)的項目編碼體系中,但是隨著計算機應用技術水平的逐步提高,國際上比較認可的是第二種方式即分面結構。綜上所述,不同的編碼方式有不同的優(yōu)點與缺點,應該根據(jù)具體情況具體分析,選擇最佳的編碼方式,保證項目的穩(wěn)定性與兼容性。
五、結語
工程項目的建設必定會產(chǎn)生大量的數(shù)據(jù),那么對數(shù)據(jù)進行有效的分析與整理就成為了項目管理的重點。為了滿足工作包模型及數(shù)據(jù)結構建立的需要,應當對工程項目中產(chǎn)生的數(shù)據(jù)進行重點統(tǒng)計分析,利用計算機技術,綜合整體的工程項目進行取舍,建立起工作包的關系模型。隨后透過關系模型建立數(shù)據(jù)庫模型就大大的降低了難度,更加快捷簡單。計算據(jù)數(shù)據(jù)庫是整個工程項目中應用計算機技術最為重要的部分,只有將工作包與計算機緊密結合才可能實現(xiàn)管理手段的飛躍。而將其結合的方式就是建立工作包,這樣可以極大的提高項目管理效率,實現(xiàn)高效管理。這樣可以使管理者更加靈活有效的組織調控項目計劃,對整個項目在宏觀上有足夠的認識。除此之外,WBS的運用還可以對項目實施中的進度、費用等進行嚴格的控制,保證項目按照計在控制中實施,實現(xiàn)效率與質量的雙贏。
參考文獻:
[1]劉金星.改進的WBS方法在工程項目管理中的應用[J].建筑經(jīng)濟,2011(6):18-21
[2]王俊軍.WBS方法在工程項目管理中的應用探討[J].工程技術,2016(9):283-283
[3]張波.工程項目管理中WBS分解及實現(xiàn)的探討[J].中國西部科技,2014(6):4-6
[關鍵詞]Web3.0分眾分類標簽
[分類號]TP393 G254
隨著互聯(lián)網(wǎng)技術的迅猛發(fā)展,Web2.0以應用的開放性、信息傳播的交互性、讀寫并存的表達方式、社會化的聯(lián)合方式和便捷化的體驗方式,使得越來越多的網(wǎng)民參與到互聯(lián)網(wǎng)信息的創(chuàng)造及中。然而,隨著信息量的快速增長,由此衍生的信息雜亂無章、信息的純凈度和可信度大大降低、搜索引擎精準度下降等問題相繼出現(xiàn)在互聯(lián)網(wǎng)用戶面前,網(wǎng)民越來越期待及時準確地獲得切合自身需求的信息和知識,以及便捷的互動交流和信息的協(xié)同共享。面對這一問題,網(wǎng)絡模式急需更新?lián)Q代,能夠為用戶提供一種更加高效、精確和個性化的互聯(lián)網(wǎng)平臺的Web3.0模式成為首選的解決方案。
1 Web3.0及其特征
Web3.0是新一代互聯(lián)網(wǎng)應用的統(tǒng)稱,它是建立在Web2.0的基礎上,包含了Web2.0的所有特點,但同時為了讓人們更好地利用網(wǎng)絡資源,Web3.0提供了一種方便管理、方便查找信息資料,能夠自己控制一切的全新的服務:網(wǎng)站內(nèi)的信息可以直接和其他網(wǎng)站相關信息進行交互,能夠對多家網(wǎng)站的信息進行整合使用,并能根據(jù)用戶需求,智能化處理互聯(lián)網(wǎng)海量信息的整合,最終聚合用戶個性化的需求,同時實現(xiàn)真正意義上的互聯(lián)互通??傊?,相對于Web1.0的“瀏覽和下載”、Web2.0的“參與、展示和互動”,Web3.0的核心理念是“個性、精準和智能”。其主要特征表現(xiàn)如下:
1.1個性化信息聚合
Web3.0最大的特點在于信息的聚合以及提供個性化的信息服務,真正的Web3.0時代不僅僅是按照用戶需求提供綜合化服務,創(chuàng)建綜合化服務平臺,更關鍵的是,把散布在互聯(lián)網(wǎng)上的各種信息點以及用戶的需求點聚合和對接起來,提供基于用戶偏好的個性化聚合服務。
1.2信息檢索的高精準度
Web3.0在對于UGC(用戶生產(chǎn)內(nèi)容)篩選性過濾的基礎上同時引入偏好信息處理與個性化引擎技術,對用戶的行為特征進行分析,既尋找可信度高的UGC源,同時對互聯(lián)網(wǎng)用戶的搜索習慣進行整理、挖掘,得出最佳的設計方案,幫助互聯(lián)網(wǎng)用戶快速、準確地搜索到自己想要感興趣的信息內(nèi)容,避免了大量信息帶來的搜索疲勞。
1.3搜索引擎的智能化
Web3.0時代的網(wǎng)絡是智能網(wǎng)絡,這是一個以整個互聯(lián)網(wǎng)為基礎,聚合了所有知識的智能平臺。在這樣的平臺上,用戶可用自然語言表達自己的查詢意圖,搜索引擎能夠對查詢進行解析,提取相關概念,組合查詢表達式,從而返回準確的結果;甚至,用戶可以提出完整的問題,通過搜索獲得一些問題的解決方案。
1.4多種終端平臺、跨網(wǎng)站和跨語言信息交互
Web3.0不僅能夠實現(xiàn)不同網(wǎng)站間的信息交互,而且還能實現(xiàn)不同終端的兼容。通過互聯(lián)網(wǎng)與通信的融合,用戶可以用所有智能終端(固定電話、移動電話、PC、IPTV以及其他智能終端)輕松享受看得見、聽得到、用得好、即時交互的信息服務。另外,Web3.0的智能翻譯引擎突破了國家、語言的限制,使用戶用自己的母語可以與全世界所有人進行交流,實現(xiàn)了更大范圍內(nèi)的信息交流與共享。
2 分眾分類及其特征
分眾分類(Folksonomy)是隨著Web2.0而產(chǎn)生的新型網(wǎng)絡信息分類法,也叫大眾分類、社會分類、自由分類等,它就是由網(wǎng)絡信息用戶自發(fā)地為某類信息定義一組標簽(Tag)進行描述,并最終根據(jù)標簽被使用的頻次選用高頻標簽作為該類信息類名的一種為網(wǎng)絡信息分類的方法。其實質就是以詞為類,但其類目卻是平面的、非等級的,它是用戶用標簽對感興趣的資料進行分類,并與他人共享標簽的過程和結果。
2.1分眾分類的優(yōu)勢
與傳統(tǒng)網(wǎng)絡信息分類方法相比,分眾分類最大的不同之處在于,它并不采用嚴格的分類標準,其分類全部由用戶直接提交,分類的形成過程完全是自發(fā)的。分眾分類的主要機制基于“開放性元數(shù)據(jù)標準”和“自然語言社群聚類”。其優(yōu)勢主要表現(xiàn)在:首先,分眾分類的標簽形成過程充分體現(xiàn)了其自由性,任何用戶都可以自由選擇自然語言語詞來對感興趣的資源進行標注,從而可以從多個維度來揭示信息內(nèi)容;其次,分眾分類具備實時性與適應性,用戶可以隨時對其閱讀或創(chuàng)建的內(nèi)容和主題創(chuàng)建標簽,并立即保存下來,并被允許即時快速的進行標簽用語的修改;第三,分眾分類為用戶提供了共享標簽的功能,任何人對內(nèi)容進行標注后,他人可立刻看到這些標簽,也可以點擊這些標簽,進而看到更多使用這個標簽的信息內(nèi)容,或是與此相近的內(nèi)容。
2.2分眾分類的局限
作為使用非控詞匯的分眾分類目前還存在一定的局限性,具體表現(xiàn)如下:
2.2.1標簽的多樣性 由于用戶認知程度不同,對同一事物的揭示程度也存在很大的差異,導致不同用戶在標注同一信息時使用了不同的標簽,但是系統(tǒng)卻無法創(chuàng)建這些標簽之間的聯(lián)系。標簽的多樣性極大的影響系統(tǒng)的檢全率。
2.2.2標簽的模糊性 分眾分類是一種基于標簽語法層次的簡單聚合分類,因此,同一標簽可能映射出不同語義的資源,而系統(tǒng)卻不能識別出各個語義的不同。標簽的模糊性使用戶不得不花更多的時間和精力找到與檢索標簽相關的記錄,因而影響到系統(tǒng)的檢準率。
2.2.3標簽的扁平化組織 分眾分類的組織方式與傳統(tǒng)的等級體系分類法組織方式不同,它是扁平化的,沒有等級層次的劃分。因此,系統(tǒng)無法識別各個標簽之間的等級層次聯(lián)系。一方面,這種由于標簽缺乏等級控制造成的信息分散也必然影響了信息的檢全率;另一方面,類目的平面非等級顯示同樣會隱藏一些有價值的信息。同時,信息越多利用標簽直接找到相關信息就越困難。
2.2.4系統(tǒng)間的交互性很低 很多網(wǎng)絡系統(tǒng)都具有標注資源和分享標簽的能力,但是目前各個分眾分類系統(tǒng)在語義表達和格式規(guī)范上并不一致,這不僅阻礙了各個系統(tǒng)之間的信息交互和軟件的自動化處理,同時也引發(fā)了一系列檢索方面的問題。另外,受語言、文化背景等因素的影響,跨國界、跨文化的分眾分類系統(tǒng)之間的交互性更低。
2.2.5標簽問語義關系缺乏 分眾分類是以高頻標簽作為類目的一種信息分類方法,其分類結構是平面的,標簽間是平等關系,缺乏對標簽間的層次體系關系、屬性關系和其他的復雜語義關系的描述,而標簽間語義關系的缺乏不僅影響到檢索的精準度,更重要的是對智能化搜索帶來諸多障礙。
3 Web3.0對分眾分類的需求
Web3.0的基礎是Web2.0,因而,分眾分類也是Web3.0的一種主要的信息組織方式。但是目前分眾分類所具有的上述局限性顯然阻礙了Web3.0的核心理念――“精準、個性和智能”的真正實現(xiàn),Web3.0的發(fā)展需求決定了分眾分類的發(fā)展方向,因而,未來的分眾分類還需要在以下幾個方面進一步拓展。
3.1微內(nèi)容的自由整合與過濾研究
微內(nèi)容是Web3.0的基本信息單元,由于Web3.0同樣具有草根性,其內(nèi)容良莠不齊,有價值的專業(yè)分析討論與各種雜談閑聊摻雜在一起,因而首先需要對微內(nèi)容進行篩選性的過濾研究。這部分的研究主要包括:研究分析用戶的行為特征,尋找可信度高的微內(nèi)容源;對微內(nèi)容的價值進行判定,并按價值量的高低作不同處理;對垃圾信息進行有效過濾等等;其次,研究如何應用Mashup技術對用戶生成的微內(nèi)容進行整合,如何利用ONTO/RSS基礎聚合技術對微內(nèi)容進行有效聚合,從而使信息的特征性更加明顯,為實現(xiàn)Web3.0的“個性化”打下基礎。
3.2微內(nèi)容的標準化與結構化研究
要實現(xiàn)Web3.0的跨平臺、跨社區(qū)、跨語言的信息共享,需要對微內(nèi)容進行標準化與結構化研究,提出一個通用的數(shù)據(jù)標準。這方面的研究主要包括微內(nèi)容的拆分標準、屬性選擇、結構化表征、數(shù)據(jù)邏輯結構標準以及數(shù)據(jù)的存儲結構標準等,其目的是使微信息之間實現(xiàn)互動,讓Web完全可編程,從而滿足復雜程序的需求,為信息在不同的應用平臺之間的整合和傳播提供支撐。目前,有關微內(nèi)容的標準化和結構化的研究則僅限于企業(yè)網(wǎng)站的構建,如紅門資訊在微內(nèi)容的拆分、詞義標準化和結構化等方面進行了深入的研究,其推出的公用信息平臺已經(jīng)實現(xiàn)了廠家信息、商家信息、品牌信息、文章信息等160多類信息平臺間的自由互動。但目前整個IT行業(yè)中并沒有一套完善的有關微內(nèi)容的拆分、屬性選擇、結構化表示等方面的標準,這對實現(xiàn)整個互聯(lián)網(wǎng)信息的無縫連接帶來障礙。
3.3標注的規(guī)范控制研究
Web3.0核心理念之一是“精準”,而因為網(wǎng)絡用戶標注行為缺乏控制,導致標簽的多樣性、模糊性和隨意性等缺點,進而影響到檢索的精準度,因而需要對用戶的標注行為進行規(guī)范性控制。主要研究包括:如何利用受控詞表等對同義詞、近義詞、專有名詞等進行限定,并構建規(guī)范的標引詞庫推薦用戶使用;如何確定標簽的含義以及標簽間的關聯(lián),以幫助用戶在創(chuàng)建標簽時進行選擇;如何利用后控手段對不斷產(chǎn)生的大量標簽進行篩選、融合和規(guī)范化處理,并將其與核心標簽關聯(lián)等等。其目的避免網(wǎng)絡用戶生產(chǎn)出各種錯誤的、無意義的、不規(guī)則的標簽,從而提高標簽系統(tǒng)的準確性、兼容性和開放性,以實現(xiàn)標簽集合的移植與共享,促進不同網(wǎng)絡信息系統(tǒng)對信息資源的協(xié)同組織。目前,國內(nèi)外學者都對標簽的規(guī)范控制研究顯示出極大的興趣,紛紛提出了多種規(guī)范標注行為,從而提高標簽質量的解決措施,如有些網(wǎng)站在用戶標注時提供一些規(guī)范詞供用戶選擇,或對用戶的標注結果進行詞義轉換等,但總的來說研究的系統(tǒng)性不夠,其深度和廣度都有待加深與拓寬,從而提高檢索的“精準度”。
3.4標簽的基本屬性研究
標簽是分眾分類形成和使用的基礎,也是分眾分類類目體系的基本構成單元。標簽指代并標示W(wǎng)eb3.0環(huán)境中的各種微內(nèi)容,通過查找標簽能夠檢索到關聯(lián)的微內(nèi)容。因而,標簽本身的相關屬性決著信息檢索的質量和效率,所以,需要對標簽的特征、標簽的價值判定(包括垃圾標簽的處理)、標簽使用量的分布規(guī)律、標簽的賦予權、標簽的翻譯、標簽庫的構建等展開進一步的研究;同時,因為目前的標簽比較側重于橫向關系的表達,而專業(yè)性、學術性信息的表達則需要縱向和橫向兩個方面的參照系,因而,如何加強縱向關系的表達,仍然有待于進一步研究。目前,對標簽的特征、標簽價值判定的相關研究比較多,而對標簽使用量的分布規(guī)律、標簽的賦予權、標簽的翻譯、標簽庫的構建等方面的研究相對較少。
3.5傳統(tǒng)分類法與大眾分類法的融合研究
分眾分類是由網(wǎng)絡用戶的自發(fā)標引行為產(chǎn)生,盡管這在一定程度上體現(xiàn)了用戶對知識分類的共性,但由于不同使用目的對信息的類分會使得相同的信息被劃分在不同的類別中。這種平面勝的分類體系,既無法準確地表達出相關標簽的層次,也難揭示出信息之間復雜的關系;另外,受大眾淺層信息需求的誤導,很多有價值的信息也容易被淹沒。因而,分眾分類的質量無法滿足Web3.0檢索精準度的需求。而傳統(tǒng)分類法特別是文獻分類法歷史悠久,在一定程度上體現(xiàn)了知識分類的科學性。為此,應該將分眾分類與傳統(tǒng)分類法進行融合,以提高信息分類的質量和效率,如可先對選定范圍內(nèi)全部信息劃分大類的基礎上允許網(wǎng)絡用戶再進行知識細分。把眾多的標簽先按人為大類存放,既增強了標引一致性,又降低了平面非等級結構的標簽所帶來的檢索難度。
3.6標簽的聚類研究
由于分眾分類允許用戶使用不同的標簽來標記相似的資源,但并不了解這些標簽之間的關系,因而其內(nèi)容檢索機制受到嚴重的阻礙。為克服這一局限,有必要針對標簽的統(tǒng)計學規(guī)律、標簽間的共現(xiàn)分析、層次分析、標簽與特定人和物的相關度、標簽間的相似度比較等問題進行聚類分析,其目的是尋找相關標簽群,從而形成立體的分類體系,并在此基礎上展開標簽關系庫的構建研究。顯然,這部分的研究有助于實現(xiàn)Web3.0的“精準”和“個性化信息聚合”。
3.7標簽間的關聯(lián)研究
Web3.0的特征之一是要讓用戶跨越不同的應用平臺,并共享不同社區(qū)的信息資源,而這種信息的共享除了需要相關內(nèi)容的標準化、結構化和規(guī)范化研究外,更重要的是通過標簽的方式進行相互鏈接,現(xiàn)有的標簽只能做到對站內(nèi)的關鍵詞進行關聯(lián),不同網(wǎng)站之間站信息沒有形成真正的網(wǎng)絡和關聯(lián),往往存在信息“孤島”,常常要借助其他的搜索引擎,因而未來的研究應該著重予標簽間關聯(lián)的深化研究。一方面,研究同一網(wǎng)站中同一文本和不同文本間的所有標簽之間的自動鏈接技術;另一方面,研究不同網(wǎng)站間標簽的關聯(lián),從而在更大范圍、更高層次上建立起詞間關系網(wǎng)絡,為實現(xiàn)Web3.0的“跨平臺”信息交互打下基礎。
3.8標簽與本體的結合研究
本體是在語義網(wǎng)環(huán)境下為解決語義歧義、實現(xiàn)信息智能處理而提出的一種形式化描述的、共享的概念認知模型,它是對某一領域知識的規(guī)范化描述,不僅提供了概念明確的定義,而且揭示了概念問豐富的語義關系,使知識能夠在人與人之間、人和系統(tǒng)之間以及各種異構系統(tǒng)之間進行廣泛的共享和交流。顯然,本體所具備的特性正好彌補了分眾分類的許多不足,因而,需要充分挖掘標簽間的語義關系,將標簽與本體進行結合研究。具體研究包括:分析分眾分類中用戶、網(wǎng)絡資源和標簽三者之間的同現(xiàn)關系,對分眾分類中的各種標簽進行語義分析,研究標簽之間的主題相關性,并給出這些標簽間相互關系的明確定義,同時探討如何基于標簽的語義關系構建被標注對象之間的聯(lián)系,并在標簽中建立起概念層次,構建大眾標注中各類標簽詞的本體,從而構成語義Web的基礎,真正實現(xiàn)web3.0的“智能化”。目前,這方面的研究多集中在標簽語義的提取、標簽本體的構建等方面,并推出了多種語義標注平臺。但是目前在大多數(shù)語義標注的過程中仍需要大量人工的輔助,標注平臺的可用性、互用性、重用性和擴展性較差,需要進一步提高。
3.9用戶興趣模型構建研究
概念模型的作用
概念模型是對某一領域信息高度抽象化的靜態(tài)描述,它包括類、類關聯(lián)和類屬性等模型基本元素的定義,是進一步細化應用系統(tǒng)模型的基礎。
1994年,國際標準化組織第215技術委員會提出了“衛(wèi)生信息建??蚣堋薄T摽蚣苷f明了信息模型應當是由概念模型到邏輯模型,最后細化到物理模型。2002年美國CDC在“公共衛(wèi)生概念數(shù)據(jù)模型”一文中提出信息模型可劃分為主題域模型、類關系模型、概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、數(shù)據(jù)庫設計模型和物理數(shù)據(jù)庫模型,它們分別處于上、中、下三個層級,這種層級關系與ISO提出的層級結構一致,只是美國CDC的層級劃分更加細致。
因此,概念模型是連接高層模型和低層模型的橋梁和紐帶。對于一個具體信息的開發(fā)過程而言,上層模型在某個領域內(nèi)是高度抽象和概括的,它們不涉及過多的細節(jié),獨立于具體的信息系統(tǒng); 對整個領域的信息化建設都具有指導意義,它是信息標準化的基礎。
公共衛(wèi)生信息領域具有多領域跨學科的特點。概念模型提供了一個易于理解的公共衛(wèi)生信息的整體框架,是公共衛(wèi)生數(shù)據(jù)字典的基礎框架。在概念模型的指導下,對公共衛(wèi)生數(shù)據(jù)元的理解和應用變得更加方便和容易。因此,概念模型將為公共衛(wèi)生信息系統(tǒng)的開發(fā)提供一個整體框架和數(shù)據(jù)應用指南。
在公共衛(wèi)生信息領域內(nèi),該概念模型可以支持多個信息系統(tǒng)的開發(fā),減少重復性工作,降低開發(fā)成本,加快系統(tǒng)的開發(fā)速度。在同一個概念模型指導下開發(fā)的多個系統(tǒng)間具有良好的一致性,同時也為系統(tǒng)間的數(shù)據(jù)交換與共享奠定良好基礎。
概念模型的構建方法
對于一個具體系統(tǒng)而言,建立一個模型不是很困難,但建立一個抽象的元模型――概念模型則要困難得多。建立國家公共衛(wèi)生概念模型需要經(jīng)歷從具體到抽象這樣一個反復的過程。HL7(Health Level 7)推薦的建立概念模型的技術路線與方法是從用例分析到信息分析,最后到建立概念信息模型。
類、類關聯(lián)、類屬性和數(shù)據(jù)類型是概念模型的重要組成部分。概念模型中的類屬性同樣具有較高的抽象性和一般性,發(fā)現(xiàn)這些屬性也需要經(jīng)過從具體實例分析――領域信息分析――概念信息模型分析這樣一個抽象與泛化的過程。
我國公共衛(wèi)生信息概念模型的構建主要是通過以下步驟實現(xiàn)的:
1. 主題域的確定
信息是對于活動、活動關聯(lián)方以及它們之間關系的抽象與描述。在公共衛(wèi)生領域,參照美國CDC提出的公共衛(wèi)生概念數(shù)據(jù)模型(PHCDM),將我國公共衛(wèi)生劃分為衛(wèi)生相關活動、參與者、材料和位置4個主題域。其中衛(wèi)生相關活動是衛(wèi)生信息來源的主體,是四個主題域中最重要、最活躍的一個,而其余三個均為活動的關聯(lián)方,位置說明活動發(fā)生的地點,參與者為活動的參與方如衛(wèi)生服務的提供方或接受方,材料是活動中所涉及的物質,比如標本、菌株等等。這些構成了公共衛(wèi)生信息概念模型的四個主題域。
2. 類
具有相同屬性的同類事物、概念組成類。以上四個主題域各為一類,每個主題域下又可以分成若干主類。以衛(wèi)生相關活動為例,結合我國公共衛(wèi)生信息的分類框架,可以將衛(wèi)生相關活動抽象為四個主類――疾病預防控制、公共衛(wèi)生服務、公共衛(wèi)生管理及衛(wèi)生監(jiān)督。
3. 類關聯(lián)與屬性設置
類之間存在一定的聯(lián)系,稱為類關聯(lián),其作用在于使不同的類形成一個完整、聯(lián)系的結構。在公共衛(wèi)生信息概念模型的建模中,主要涉及父子類關聯(lián),關系關聯(lián)和參與關聯(lián)三種類關聯(lián)。
父子類關聯(lián)指的是每個類(主類或子類)下面還可以根據(jù)實際劃分為若干更小的類。上位類(通稱為父類)與下位類(通稱為子類)關聯(lián)稱為父子類關聯(lián)。很顯然,子類對于父類的屬性有繼承的關系。
關系關聯(lián)描述的是在同一主類內(nèi)部各個類或者是實例之間的關聯(lián)關系,如疾病預防控制主類的不同活動之間(疫情暴發(fā)與檢測之間)的關系。
參與關聯(lián)則是指不同主類的類之間發(fā)生的關系。例如疫情監(jiān)測類(屬于衛(wèi)生相關活動主題域的某個類)與調查者(屬于參與者主題域的某個類),或者與標本(屬于材料主題域中的某個類)之間存在參與的關系等。
屬性是對類以及類關聯(lián)所具有的特性的描述,是描述類的特征的元數(shù)據(jù),改變屬性的值可以改變類的行為和外觀。概念模型類屬性設置應遵循HL7 RIM所規(guī)范的屬性格式及內(nèi)容,在此基礎上按照自身的需求精化、修飾屬性,形成模型獨特的屬性。
4. 概念模型的建模技術與方法
首先是應用UML的用例分析方法進行業(yè)務分析。這是指對業(yè)務過程中所有參與元素的拆解、對比、描述、再定義與組合。然后在用例分析的基礎上,進行泛化分析。即對各組成元素進行分析、判別、抽象,并歸納成不同的類。下圖1為在衛(wèi)生檢測中的幾個用例分析過程。圖2為泛化與抽象過程。經(jīng)過泛化與抽象,對衛(wèi)生檢測相關活動,可提煉出5個子類: 申請、受理、檢測、報告、質量控制。用例分析與泛化是公共衛(wèi)生信息概念模型建模的重要階段和技術,要應用于公共衛(wèi)生信息概念模型建模的全過程中。
公共衛(wèi)生概念模型框架與內(nèi)容
我國公共衛(wèi)生信息的概念模型包括了4個主題域及35個類。其核心為4個主題域(衛(wèi)生相關活動,參與者、材料及位置)。在模型的建立中,公共衛(wèi)生相關活動主題域及各級子類的確定采用了公共衛(wèi)生信息分類框架的結果。作為模型,還對其他3個主題域進行了詳細的分類,并增加了關聯(lián)類的內(nèi)容及對于類屬性描述的要求。在這里要區(qū)分信息分類與模型之間的關系及區(qū)別。信息分類框架關心的是對信息的分類,確定信息所在的位置以便用戶存放、查找及使用,因此并不涉及對于主題域、類之間的關聯(lián)以及類屬性的描述。而建立模型的目的是為了理解信息,描述信息。理解信息包括了解信息的來源(借助于信息框架)及關聯(lián),描述信息包括對數(shù)據(jù)元這個信息的基本單元屬性及關聯(lián)的描述,以便在統(tǒng)一的規(guī)范下查詢、使用信息。
概念模型的應用
概念模型可以輔助系統(tǒng)設計者分析所需要采集的數(shù)據(jù)及屬性,建立相應的邏輯數(shù)據(jù)模型(Logical Data Model),從而規(guī)范信息系統(tǒng)的建設。下面以傷害監(jiān)測為例說明模型的應用。