公務員期刊網(wǎng) 論文中心 正文

電子文件管理下物聯(lián)網(wǎng)數(shù)據(jù)管理淺析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了電子文件管理下物聯(lián)網(wǎng)數(shù)據(jù)管理淺析范文,希望能給你帶來靈感和參考,敬請閱讀。

電子文件管理下物聯(lián)網(wǎng)數(shù)據(jù)管理淺析

摘要:通過介紹國外管理物聯(lián)網(wǎng)數(shù)據(jù)的經(jīng)驗,得出物聯(lián)網(wǎng)數(shù)據(jù)管理要根據(jù)物聯(lián)網(wǎng)數(shù)據(jù)的屬性和特點,依照GARP準則,拓寬NOARK標準,在電子文件管理系統(tǒng)中收集和管理物聯(lián)網(wǎng)數(shù)據(jù)?;谶@些管理準則,提出我國物聯(lián)網(wǎng)數(shù)據(jù)管理要從物聯(lián)網(wǎng)數(shù)據(jù)開放、元數(shù)據(jù)建模、數(shù)據(jù)保護幾方面入手,提高物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量,實現(xiàn)物聯(lián)網(wǎng)數(shù)據(jù)價值。

關鍵詞:電子文件;物聯(lián)網(wǎng)數(shù)據(jù);數(shù)據(jù)管理;元數(shù)據(jù);可信性

挪威的托馬斯·索德林等學者應用GARP準則和NOARK標準,從宏觀和微觀相結合的角度,按照公開的和涉及隱私非公開的兩種分類方式,分析芝加哥開放數(shù)據(jù)門戶的水資源管理系統(tǒng)和挪威海關管理的用于識別車輛的ANPR系統(tǒng)的數(shù)據(jù)管理,從這兩個案例分析中得出物聯(lián)網(wǎng)數(shù)據(jù)的管理方法,他們建議在靈活的電子文件保存系統(tǒng)中收集和管理物聯(lián)網(wǎng)數(shù)據(jù),從而更好地實現(xiàn)信息治理。

1物聯(lián)網(wǎng)數(shù)據(jù)的屬性及其與文件的關系

物聯(lián)網(wǎng)數(shù)據(jù)要按照生成、利用、保管的流程來統(tǒng)一管理,對數(shù)據(jù)的管理貫穿其整個生命周期。物聯(lián)網(wǎng)數(shù)據(jù)也像文件一樣可以被移交、分類、保存。而一些檔案館的電子文件最早都是來自部分數(shù)據(jù)庫的數(shù)據(jù)集。數(shù)據(jù)集以兩種方式分類編目,一種是作為數(shù)據(jù),一種是作為電子文件。因此挪威的學者認為可將物聯(lián)網(wǎng)數(shù)據(jù)看作文件來對待和管理,在一個靈活的電子文件保存系統(tǒng)中收集和管理,可以實現(xiàn)更好的信息治理。希望使用標準方法來避免潛在的供應商鎖定情況,并確保互操作性。由此可見,做好電子文件管理是完成物聯(lián)網(wǎng)數(shù)據(jù)管理的前提條件。

2國外電子文件管理的準則在物聯(lián)網(wǎng)數(shù)據(jù)管理中的體現(xiàn)

國外有影響力的電子文件管理規(guī)范有GARP和挪威的NOARK。GARP(GenerallyAcceptedRecordkeepingPrinciples),就是通用的電子文件管理準則,主要包含八條內(nèi)容:可問責、透明度、完整性、保護性、合法性、可用性、保管和處置。這些準則構成了一個廣泛使用的全球標準,確定了記錄管理、記錄和信息管理(RIM)以及信息管理程序的關鍵特征和良好實踐的高層框架。該原則以實踐經(jīng)驗為基礎,基于對法律原則和信息論的廣泛思考和分析。它們的目的是為組織提供管理信息的行為標準和判斷行為的準則。[1]NOARK準則包含了電子文件保管標準,從電子文件創(chuàng)建到最后的處置都有體現(xiàn)。在2019年,它的標準進一步明確了應用程序編程接口,NOARK也是保存標準,它是XML表的具體表現(xiàn)。NOARK以全宗為目標,在某種程度上,NOARK標準可以被看作是關于收集和全宗的正確闡釋。NOARK標準還提出一個元數(shù)據(jù)模型來管理中央元數(shù)據(jù)以及電子文件。

2.1問責制Accountibility。指高級行政人員應負責將信息管理工作交給適當?shù)膫€人。在芝加哥的行政命令中,設立了向首席信息官報告的首席數(shù)據(jù)官。芝加哥的開放數(shù)據(jù)門戶是根據(jù)市長的行政命令建立的,問責制要求高層管理人員對政策的實施效果進行監(jiān)督。托馬斯·索德林認為將物聯(lián)網(wǎng)數(shù)據(jù)當作電子文件對待,并在電子文件管理系統(tǒng)中管理這些數(shù)據(jù),這樣的做法會讓公共機構更符合問責原則。當描述處理物聯(lián)網(wǎng)數(shù)據(jù)時,作為信息管理者要特別關注物聯(lián)網(wǎng)數(shù)據(jù)的隱私問題。而開放數(shù)據(jù)訪問也應該遵循可問責原則。

2.2透明度Transparency。一個組織的業(yè)務過程和活動,包括其信息治理計劃,應以公開的和可驗證的方式進行記錄,該文件應提供給所有人員和適當?shù)南嚓P方。透明度原則要求過程是公開的和可驗證的,涉密和不涉密的案例都體現(xiàn)了數(shù)據(jù)的透明度,而透明度原則不應該泄露組織機構職能的秘密。芝加哥開放數(shù)據(jù)門戶符合透明度原則,在開放門戶內(nèi),向任一訪問者提供關于數(shù)據(jù)的描述。挪威海關發(fā)布有限的ANPR系統(tǒng)信息,也是為了避免泄露太多操作信息。

2.3完整性Integrity。建立信息治理方案,使組織產(chǎn)生或管理的信息資產(chǎn)具有真實性和可信性的合理保證。設備的質(zhì)量和位置,數(shù)據(jù)收集的多端點和物聯(lián)網(wǎng)設備供應商的多樣性和產(chǎn)品的不兼容性,都會影響數(shù)據(jù)的收集質(zhì)量。因此在物聯(lián)網(wǎng)數(shù)據(jù)管理過程中需要形成一種可信機制。NOARK標準從遵循保護原則和開放性兩方面確保完整性原則,這一標準也支持其它完整性機制,比如校驗數(shù)據(jù)可以集中覆蓋上傳的文檔,來源于物聯(lián)網(wǎng)的數(shù)據(jù)轉換成文檔的可以被這樣的固定信息覆蓋。

2.4保護性準則Protection。保護性準則指應制定信息治理方案,以確保對私有的、機密的、特權的、秘密的、對業(yè)務連續(xù)性至關重要的或其他需要保護的信息資產(chǎn)有適當程度的保護。物聯(lián)網(wǎng)中數(shù)據(jù)的保護性原則包含兩方面內(nèi)容,一方面指保護物聯(lián)網(wǎng)設備的安全,另一方面指網(wǎng)絡傳輸?shù)臄?shù)據(jù)隱私保護。在NOARK標準中,保護性準則體現(xiàn)在電子文件管理系統(tǒng)中關于用戶、組織和職責的明確詳細的要求和規(guī)定以及合理的訪問控制機制。物聯(lián)網(wǎng)數(shù)據(jù)的保護性方面,利用最終的API可以保證物聯(lián)網(wǎng)設備在間隔時間內(nèi)向文件保存系統(tǒng)推送定義好的一組信息。學者們認為挪威海關總署汽車管理案例是在汽車管理系統(tǒng)中出現(xiàn)的問題,沒有體現(xiàn)保護性準則。在這個案例中沒有明確規(guī)定訪問數(shù)據(jù)的主體,缺少數(shù)據(jù)安全的文檔。

2.5可用性Availability??捎眯詼蕜t是指組織應維護其信息資產(chǎn),以確保其及時、有效和準確地檢索。物聯(lián)網(wǎng)數(shù)據(jù)的可用性有即時和可用兩方面涵義。數(shù)據(jù)檢索是捕獲物聯(lián)網(wǎng)數(shù)據(jù)的重要意義所在,開放數(shù)據(jù)門戶和NOARK-API一樣體現(xiàn)了數(shù)據(jù)檢索標準。在數(shù)據(jù)收集方面,物聯(lián)網(wǎng)數(shù)據(jù)具有即時性;在數(shù)據(jù)檢索方面,檢索界面應該易于使用,并適用于元數(shù)據(jù)的描述。查詢規(guī)范協(xié)議是可調(diào)整的,在有界區(qū)域內(nèi)檢索??捎眯栽瓌t還需要物聯(lián)網(wǎng)電子文件管理系統(tǒng)應用現(xiàn)代的REST-BASEDAPI方法,系統(tǒng)將需要通過及時檢索文件來處理大量數(shù)據(jù),支持快速解決各種領域物聯(lián)網(wǎng)數(shù)據(jù)的彈性方法來搜索。

2.6合法合規(guī)性Compliance。信息治理計劃的構建應符合適用法律、其他有約束力的權威和組織的政策。ANPR-data案例表明挪威海關總署在信息收集方面侵犯了個人隱私,超出了相關的法律規(guī)定范圍。雖然立法會滯后于技術更新,但是收集物聯(lián)網(wǎng)數(shù)據(jù)的公共機構必須遵守法律和規(guī)定。

2.7保管Retention。保管準則是指組織應考慮其法律、法規(guī)、財政、運營和歷史要求,在適當時間內(nèi)維護其信息資產(chǎn)。物聯(lián)網(wǎng)關于數(shù)據(jù)保存沒有明確要求,保管性是個寬泛的專題,但對于維護公民個人合法權益是必不可少的。保管期限保證電子文件根據(jù)不同的職責內(nèi)容保存足夠的時間。保管期限也覆蓋了保存的各方面,在電子文件生命周期中也適用。芝加哥的開放門戶提供了電子文件保存的易保存格式,甚至允許利用者下載全部的數(shù)據(jù)集,包括一些附加的元數(shù)據(jù)。車輛識別案例看起來是多數(shù)電子文件在短時間保存后刪除,需要被保存的是可能受關注的車牌,它應該被控制。在某些特定階段,這樣的電子文件出于長期保存的原因應考慮遷移的問題。NOARK標準還定義了與XSD表相關的元數(shù)據(jù)保存模型,描述是可擴展的,可以覆蓋這里提到的案例。

2.8處置Disposition。處置原則,組織應根據(jù)適用法律和組織政策,對不再需要維護的信息資產(chǎn)提供安全和適當?shù)奶幹谩L幹霉δ苁请娮游募4嫦到y(tǒng)必須支持的基本功能。物聯(lián)網(wǎng)數(shù)據(jù)的保存和刪除要求有待進一步明確。歐洲通過GDPR立法加強關于個人信息的定位、檢索和刪除的要求。在挪威的汽車管理系統(tǒng)案例中,體現(xiàn)了對數(shù)據(jù)的保存和刪除的需要。挪威海關沒有按照法律法規(guī)要求處置數(shù)據(jù),存在侵犯隱私的問題,因此被挪威數(shù)據(jù)保護局給予罰款的處罰。文件保管是依據(jù)它的價值而定,但物聯(lián)網(wǎng)數(shù)據(jù)的價值是潛在的,有時是以長期價值的形式存在,因此物聯(lián)網(wǎng)數(shù)據(jù)的保存有時采用實時保存方法。根據(jù)標準化的方法,處置是自動和電子文件相關,保證數(shù)據(jù)在特定的時間刪除。如果有特殊延長保存電子文件期限的要求,那么會有個別文件的特定遷移規(guī)則。隨著物聯(lián)網(wǎng)數(shù)據(jù)的增長,需要處置功能的要求更加明確。因為有些數(shù)據(jù)的價值比較小,比如個人的文件,或者另一些數(shù)據(jù)沒有歷史價值。實時性的數(shù)據(jù)可能會被刪除,受隱私法保護的數(shù)據(jù)要求被自動處置,組織的問責制和透明機制不能保證數(shù)據(jù)處理的合法性和合規(guī)性。信息安全是體現(xiàn)保護性和完整性原則的要求。對于涉密數(shù)據(jù)要協(xié)調(diào)處理數(shù)據(jù)收集和隱私權保護之間的關系。隨著信息共享的擴大,應該有保留或者刪除數(shù)據(jù)的要求,以保證在合適的時間自動處理數(shù)據(jù)。建立在物聯(lián)網(wǎng)門戶基礎上的合理的電子文件保管原則來處理物聯(lián)網(wǎng)數(shù)據(jù)的快速增長,這也許會幫助政府機構找到最好的管理物聯(lián)網(wǎng)數(shù)據(jù)的方法,研究出超越電子文件保管標準的方法,幫助避免供應商鎖定和供應商競爭。

3面向物聯(lián)網(wǎng)數(shù)據(jù),拓展NOARK的電子文件保管標準

物聯(lián)網(wǎng)數(shù)據(jù)的異構性和難以捉摸性導致無法找出一種普遍的標準化方法來管理,但是研究建立在標準基礎上的方法來管理物聯(lián)網(wǎng)數(shù)據(jù)是有價值的。因為標準化可以提高互操作性、可以避免潛在的供應商鎖定問題。將物聯(lián)網(wǎng)數(shù)據(jù)管理方法建立在保存電子文件的標準上是可行的,應用彈性的API可以處理高難度的數(shù)據(jù)異構性,這樣的數(shù)據(jù)處理標準包括彈性和可擴展的元數(shù)據(jù)模型;可擴展的元數(shù)據(jù)保存模型;捕獲和檢索物聯(lián)網(wǎng)數(shù)據(jù)的標準化搜索協(xié)議;支持保存和處置功能。NOARK標準在API描述方面符合以上要求,即使這里的元數(shù)據(jù)標準是彈性的,但是在不打破一致性的前提下,標準的拓展程度還是受限的。[2]這里數(shù)據(jù)模型的拓展要注意是否涉密的物聯(lián)網(wǎng)數(shù)據(jù)。對于涉密的物聯(lián)網(wǎng)數(shù)據(jù),或特殊數(shù)據(jù)保存要擴展文件實體,這個包括定位、時間戳等特性,將相關捕獲的圖片與相應的文檔元數(shù)據(jù)一起保存。建立NOARK的彈性API模型,捕獲和檢索物聯(lián)網(wǎng)數(shù)據(jù),有兩種記錄方法,文檔法和文件法。iso15489標準中電子文件和文檔的區(qū)別描述是,文檔是結構化和非結構化信息,所有的電子文件都是文檔,但不是全部的文檔記錄。文檔可以編輯,直到文檔成為電子文件。而NOARK中文檔是關于格式描述和附加的元數(shù)據(jù)。文檔法可以設為適合檔案保存的格式,文件法要為保存和遷移數(shù)據(jù)作準備;通過拓展元數(shù)據(jù)模型,使之更易檢索,實體擴展和添加屬性幫助物聯(lián)網(wǎng)數(shù)據(jù)在類和文件的基礎上聚合記錄。在芝加哥水管理系統(tǒng)方面,運用拓展NOARK標準的方法,文件法適用拓展實體并添加相關屬性,將記錄的水質(zhì)價值作為文件。文檔法和文件法都將水質(zhì)讀數(shù)記錄放在電子文件保存結構中,為了保存的目的而遷移數(shù)據(jù)也很重要,文件法還提高了數(shù)據(jù)的易檢索性。在ANPR案例中,NOARK的元數(shù)據(jù)模型拓展意味著處置規(guī)則可以自動和電子文件關聯(lián),確保在合適的時間刪除文件。合理的訪問控制機制可以減少挪威數(shù)據(jù)保護局對其的批判,因為信息的安全是保護性和完整性原則的基本要求。

4物聯(lián)網(wǎng)數(shù)據(jù)管理帶來的啟示

4.1建立一體化物聯(lián)網(wǎng)數(shù)據(jù)開放共享體系,實現(xiàn)物聯(lián)網(wǎng)數(shù)據(jù)的集中管理。物聯(lián)網(wǎng)數(shù)據(jù)可能代表存在于電子文件管理系統(tǒng)中一種新類型的數(shù)據(jù)和文件,物聯(lián)網(wǎng)數(shù)據(jù)更具有可變的特性和要求,這容易導致潛在的大量實時數(shù)據(jù)和非實時數(shù)據(jù)。因而會帶來數(shù)據(jù)交換的不連續(xù)。如果這種數(shù)據(jù)數(shù)量增加,會阻礙數(shù)據(jù)的檢索,影響可用性和檢索性原則。實現(xiàn)物聯(lián)網(wǎng)數(shù)據(jù)開放,還離不開標準化的數(shù)據(jù)原則和數(shù)據(jù)管理流程,這需要建立起真正統(tǒng)一的物聯(lián)網(wǎng)數(shù)據(jù)生成、使用、反饋、評價標準,進一步提高物聯(lián)網(wǎng)的數(shù)據(jù)質(zhì)量,消除因數(shù)據(jù)標準缺失產(chǎn)生的無效數(shù)據(jù)和虛假數(shù)據(jù),克服數(shù)據(jù)價值化的障礙。

4.2加強元數(shù)據(jù)管理,實現(xiàn)物聯(lián)網(wǎng)數(shù)據(jù)管理的標準化。建立元數(shù)據(jù)模型是實現(xiàn)物聯(lián)網(wǎng)數(shù)據(jù)的自動收集和管理的一種有效方法。通過數(shù)據(jù)建模,根據(jù)業(yè)務上下文和解決方案上下文,建立一個合適的元數(shù)據(jù)標準。在數(shù)據(jù)流程設計方面,根據(jù)業(yè)務類型或條件設計業(yè)務規(guī)則,建立元數(shù)據(jù)模型要遵循元數(shù)據(jù)的靈活性、可擴展性、可檢索性導向,提高收集的物聯(lián)網(wǎng)數(shù)據(jù)標準化程度。分開保存元數(shù)據(jù)和物聯(lián)網(wǎng)數(shù)據(jù),實現(xiàn)內(nèi)容檢索和數(shù)據(jù)價值挖掘。由于物聯(lián)網(wǎng)數(shù)據(jù)量巨大,而元數(shù)據(jù)相對數(shù)量較小,可以將元數(shù)據(jù)單獨保存,方便對物聯(lián)網(wǎng)數(shù)據(jù)的檢索。

4.3建立安全機制,保護數(shù)據(jù)隱私和信息安全。物聯(lián)網(wǎng)數(shù)據(jù)安全指的是遵循數(shù)據(jù)機密性(Confidentiality)、完整性(Integrity)和可用性(Availability)3個原則(即CIA原則),以保證物聯(lián)網(wǎng)的數(shù)據(jù)安全。在設計階段,要充分考慮隱私、數(shù)據(jù)保護和信息安全統(tǒng)一的要求。根據(jù)這些要求,制定相應的策略管理,包括數(shù)據(jù)收集策略、數(shù)據(jù)存儲策略和數(shù)據(jù)安全策略等。數(shù)據(jù)安全策略可以從法律層面和技術層面兩方面來實施。法律層面,具有約束力的法律和高水平的數(shù)據(jù)保護法結合,可以實現(xiàn)物聯(lián)網(wǎng)技術的保護性和可信性的選擇。數(shù)據(jù)保護立法應具有一致性和專業(yè)性,要考慮國際上的協(xié)調(diào)性。國際上已有歐盟的《通用數(shù)據(jù)保護條例》(GDPR),我們的數(shù)據(jù)立法可以考慮納入這些默認的數(shù)據(jù)保護條款。新一輪的網(wǎng)絡安全立法要補充數(shù)據(jù)隱私的協(xié)議,隔離物聯(lián)網(wǎng)設備,監(jiān)控數(shù)據(jù)記錄。隱私保護除了考慮不泄露信息,還要考慮數(shù)據(jù)應用。技術層面可以應用加密技術和區(qū)塊鏈技術,制定適當?shù)碾[私策略。根據(jù)靈敏度對數(shù)據(jù)分類,依據(jù)個人識別信息、敏感信息、安全信息和公開信息等分類管理。然后要考慮到物聯(lián)網(wǎng)的多個系統(tǒng),多個登錄點,分布式方法,互操作的方式,結合具體的安全策略,建立訪問控制模型,對數(shù)據(jù)的訪問和操作進行控制。明確定義獲取數(shù)據(jù)的主體權限,從主體、客體和控制策略這些要素著手,通過身份認證、授權、文件保護和審計等主要功能,實現(xiàn)訪問控制,應用數(shù)據(jù)加密等技術確保數(shù)據(jù)隱私,基于數(shù)據(jù)的粒度訪問每部分數(shù)據(jù),保證系統(tǒng)資源的合法性、完整性和時效性。

4.4發(fā)展監(jiān)管制度,實行第三方監(jiān)管,保證物聯(lián)網(wǎng)數(shù)據(jù)的可信性。法律不能涵蓋所有數(shù)據(jù)安全問題,歐洲的《一般數(shù)據(jù)保護條例》和美國的《2015年網(wǎng)絡安全法案》,都在努力利用監(jiān)管的方式來平衡技術創(chuàng)新與數(shù)據(jù)主體利益的保護關系。美國的聯(lián)邦貿(mào)易委員會依據(jù)《聯(lián)邦貿(mào)易委員會法案》的規(guī)定,對沒有采取充分措施保護消費者數(shù)據(jù)的組織加以懲罰。法律賦予第三方機構以相應的權力確保物聯(lián)網(wǎng)設備供應商的行為符合公平和公正的要求。我國的《數(shù)據(jù)安全法(草案)》和《個人信息保護法》,都體現(xiàn)了尋求發(fā)展和安全的平衡,不同利益主體之間的平衡,各國家、各地區(qū)、各部門要主動擔負不同的監(jiān)管職責。

作者:黃睿 單慶元 單位:大連工業(yè)大學檔案館