前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)視覺綜述主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞 疲勞駕駛 人眼、人臉 嘴巴 專利
中圖分號:C18 文獻(xiàn)標(biāo)識碼:A
0引言
造成交通事故的原因25%-30%產(chǎn)生于疲勞駕駛,因此疲勞駕駛已成為誘發(fā)交通事故的重要因素。國內(nèi)外專家和學(xué)者針對疲勞駕駛的檢測開展了大量的研究工作,目前研究的重心主要集中在基于計算機(jī)視覺的疲勞駕駛檢測,因此對基于計算機(jī)視覺的疲勞駕駛檢測的相關(guān)專利進(jìn)行分析尤為必要。
1基于計算機(jī)視覺的疲勞駕駛檢測專利申請數(shù)據(jù)分析
1.1全球?qū)@暾埩口厔?/p>
從圖1可以看出,基于計算機(jī)視覺的疲勞駕駛檢測專利申請量從1990-2001年間處于技術(shù)研發(fā)初期,專利申請量相對較少。從2002年開始該領(lǐng)域的專利申請量逐漸呈現(xiàn)持續(xù)增長趨勢,并在2014年達(dá)到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對疲勞駕駛的檢測也越來越重視,相應(yīng)的研究也正不斷增加?;诖耍诮窈蟮囊欢螘r間內(nèi),相關(guān)的專利申請量有望繼續(xù)保持。
1.2專利申請產(chǎn)出地區(qū)分布
目前各領(lǐng)域的專利申請量主要集中在中國、美國、韓國、日本和歐洲,通過對該領(lǐng)域在中國、美國、韓國、日本和歐洲的專利申請量進(jìn)行統(tǒng)計分析發(fā)現(xiàn),中國的申請量以48%的占比雄居第一,其他幾個地區(qū)的申請量相差不大,具體如圖2所示。
1.3在華專利申請量變化趨勢
圖3為1990年至2014年基于計算機(jī)視覺的疲勞駕駛檢測在華的申請量變化趨勢圖,由該圖可以看出,1990-2002年是技術(shù)的萌芽期,在2003年以后申請量才呈現(xiàn)逐年增長的趨勢,并且在2012年-2014年將均維持在較高的申請量。因此,該領(lǐng)域國內(nèi)雖然起步較晚,但是最近幾年申請量相對其他地區(qū)卻具有壓制性的優(yōu)勢。
1.4在華主要申請人分析
圖4展示了在華主要申請人的申請量份額,主要以科研院所和大型汽車企業(yè)為主,其中吉利汽車公司以領(lǐng)先優(yōu)勢排名第一。
2主要技術(shù)分支的專利申請分析
基于計算機(jī)視覺的疲勞駕駛檢測的主要技術(shù)分支有:基于人眼的駕駛疲勞檢測、基于人臉的駕駛疲勞檢測、基于嘴巴的疲勞檢測。下面從三個技術(shù)分支的發(fā)展概況、三個技術(shù)分支的主要工作原理及重點專利等方面進(jìn)行分析。
2.1全球?qū)@暾堉饕夹g(shù)分支的申請量趨勢圖
由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測的申請量呈現(xiàn)較快增長,申請量也較基于嘴巴的疲勞檢測的申請量大,體現(xiàn)了該領(lǐng)域近年來的發(fā)展趨勢,并體現(xiàn)出基于人眼和人臉的駕駛疲勞檢測的技術(shù)分支發(fā)展已較為成熟。三個技術(shù)分支在2006年之前,申請量的差別不大且數(shù)量均較小,顯示出在2006年以前三個分支的區(qū)別并不明顯,發(fā)展也較為緩慢,這說明基于計算機(jī)視覺的疲勞駕駛檢測也是近10年才興起的一項技術(shù),它依賴于圖像處理技術(shù)的發(fā)展水平。
2.2在華專利申請主要技術(shù)分支的申請量趨勢圖
由圖7可知,三個技術(shù)分支在2006年以前均只有零星的申請量,這與該領(lǐng)域在全球的發(fā)展情況相符合,基于人眼的疲勞駕駛檢測在華申請量自2006年以來呈現(xiàn)穩(wěn)步增長,且近年來申請量最大?;谌四樀钠隈{駛檢測申請量雖小于基于人眼的疲勞駕駛檢測,但近年來的申請量也呈現(xiàn)出穩(wěn)步增長的勢頭。然而,基于嘴巴的疲勞駕駛檢測雖有增長趨勢,但申請量一直都較小。由此可知,在國內(nèi)疲勞駕駛的檢測主要是采用人眼檢測和人臉檢測,這兩個分支是國內(nèi)的研究的熱門,也是今后國內(nèi)在該領(lǐng)域的發(fā)展趨勢。
3結(jié)語
通過對基于計算機(jī)視覺的疲勞駕駛檢測專利的申請量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個技術(shù)分支的申請量趨勢分析可知,基于計算機(jī)視覺的疲勞駕駛檢測在近10年取得了較快發(fā)展,這與計算機(jī)圖像處理技術(shù)的發(fā)展密不可分;同時,科研院所作為該領(lǐng)域研究的主體,應(yīng)加強與中小企業(yè)的合作。國內(nèi)疲勞駕駛的檢測研究主要集中在人眼檢測和人臉檢測,這兩個分支是國內(nèi)的研究的熱門,同時,基于人眼的疲勞檢測其發(fā)展方向明確,后續(xù)發(fā)展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實際的要求。
參考文獻(xiàn)
[1] 朱淑亮.基于視頻圖像分析與信息融合的駕駛員疲勞檢測技術(shù)研究[J].濟(jì)南:山東大學(xué),2011.
[2] 劉學(xué).基于人臉圖像分析的疲勞駕駛檢測方法研究[J].南京:南京航空航天大學(xué),2012.
[3] 張靈聰,王正國,朱佩芳,等.汽車駕駛疲勞研究綜述[J].人類工效學(xué),2003.
近年來,計算機(jī)視覺在安防領(lǐng)域的應(yīng)用正備受關(guān)注,身份識別是核心問題。人臉識別是一種基于臉部特征信息進(jìn)行身份識別的技術(shù),人臉檢測是其中的基礎(chǔ)和關(guān)鍵部分。介紹了四種不同的人臉檢測技術(shù),分析了相關(guān)的算法和理論,概述了各自的優(yōu)缺點。最后,討論了人臉檢測技術(shù)今后的研究方向及發(fā)展趨勢。
【關(guān)鍵詞】計算機(jī)視覺 身份識別 人臉檢測
1 人臉檢測問題綜述
在國土安全和社會安全問題日益突顯的背景下,世界各國家都對安防領(lǐng)域進(jìn)行不遺余力地投入。隨著計算機(jī)視覺技術(shù)的不斷發(fā)展,基于生物特征識別的身份識別技術(shù)受到人們的廣泛關(guān)注,在未來一段時間內(nèi)生物識別技術(shù)將成為信息產(chǎn)業(yè)的一次革命。其中人臉識別技術(shù)作為一種極具潛力的生物識別方式,以其識別速度快,主動性強,性價比高等顯著的技術(shù)優(yōu)勢,在各個領(lǐng)域都體現(xiàn)出了巨大的商業(yè)價值和社會價值。
人臉檢測是人臉識別的前提和關(guān)鍵,一般采用相機(jī)實時采集含有人臉的圖像或視頻流,并自動在圖像中對人臉進(jìn)行檢測和跟蹤。人臉的自動檢測是一項頗有難度的工作,主要體現(xiàn)在:(1)不同族群年齡等問題導(dǎo)致人臉的差異性。(2)人臉上的胡須等附屬物對檢測造成的干擾。(3)人體姿態(tài)變化和遮擋物存在對檢測的影響。(4)環(huán)境和硬件條件對圖像采集效果的影響。針對這些問題,國內(nèi)外著名高校和科研機(jī)構(gòu)進(jìn)行了很多相關(guān)的研究,致力于解決在復(fù)雜背景下如何準(zhǔn)確高效地進(jìn)行人臉檢測的問題。
2 實現(xiàn)人臉檢測的相關(guān)技術(shù)
根據(jù)近年來計算機(jī)視覺領(lǐng)域人臉檢測問題的研究進(jìn)展,本文在這里進(jìn)行總結(jié)性綜述,目前人臉檢測的方法可以分為基于知識和統(tǒng)計兩類,有以下四種常用的檢測算法。
2.1 模板匹配
模板匹配可以分成固定模板和變形模板。固定模板指的是根據(jù)先驗數(shù)據(jù)歸納出一個統(tǒng)一的模板,然后根據(jù)一個能量函數(shù)確定被檢測區(qū)域中和模板相關(guān)程度較高的位置,即人臉位置。由于不同人物之間臉部的差異性很大,加上環(huán)境等因素的影響,此方法并不具有很強的實用性。變形模板原理上和固定模板的操作方式相同,不過變形模板自身的參數(shù)模型在一定范圍內(nèi)具有可變性,因此檢測的動態(tài)范圍更大,檢測效果相對較好一些。
2.2 樣本學(xué)習(xí)
由于人臉的復(fù)雜性,顯式描述十分困難,因此基于統(tǒng)計模式的檢測方法受到了人們的廣泛關(guān)注。此方法將人臉看做一種模式,通過對大量樣本圖像的機(jī)器學(xué)習(xí)完成分類器的構(gòu)造,利用分類器實現(xiàn)對人臉的檢測判別,在這里問題被轉(zhuǎn)化為模式識別中的二分類的形式。
首先,需要建立一個樣本空間,其中包括“人臉”和“非人臉”的正負(fù)兩種樣本,對樣本圖片歸一化處理后,順序展開后進(jìn)行主分量分解,在大量樣本形成的高維矩陣中計算其特征值和特征向量,然后采用一定的學(xué)習(xí)機(jī)制在特征空間中建立分類,以此可得到用來檢測樣本圖片是否為人臉的正負(fù)判別規(guī)則式,二者為互斥關(guān)系。此檢測方法具有較高的準(zhǔn)確度,但是需要大量的正負(fù)樣本圖片,MIT等一些高校和研究機(jī)構(gòu)建立了開放的人臉庫。
2.3 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(ANN )是將模式的統(tǒng)計特性包含在ANN的結(jié)構(gòu)和參數(shù)中,對于人臉這類復(fù)雜的、難以顯式描述的抽象型模式,這一檢測方法具有其自身特別的優(yōu)勢。
神經(jīng)網(wǎng)絡(luò)方法本質(zhì)上也是基于樣本學(xué)習(xí),首先使用經(jīng)過預(yù)處理的“人臉”樣本以及采用“自舉”方法收集分類器錯分的樣本作為正負(fù)樣本訓(xùn)練各個ANN,然后根據(jù)結(jié)果進(jìn)一步對分類器進(jìn)行修正,構(gòu)造多層感知器(MLP)網(wǎng)絡(luò)作為分類器對人臉進(jìn)行檢測。人工神經(jīng)網(wǎng)絡(luò)是并行分布式系統(tǒng),采用了與傳統(tǒng)人工智能和信息處理技術(shù)不同的原理,模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行目標(biāo)檢測。神經(jīng)網(wǎng)絡(luò)模型克服了傳統(tǒng)的基于算數(shù)邏輯符號的人工智能在處理直覺、非結(jié)構(gòu)化信息方面的缺陷,具有自適應(yīng)、自組織和實時學(xué)習(xí)的特點,應(yīng)用在人臉檢測問題中性能表現(xiàn)突出。
2.4 基于隱馬爾可夫模型
隱馬爾可夫模型(HMM)是一種雙重隨機(jī)過程,一種是有限狀態(tài)的馬爾可夫鏈,另一種是序列的觀察值。由于只能通過觀察值得到馬爾可夫鏈的狀態(tài),因此稱之為隱馬爾可夫模型。對于人臉而言,可以把它分為前額、眼睛、鼻子、嘴巴、下巴五個部分來檢測。根據(jù)這五個區(qū)域位置順序不變性,可以分別用相應(yīng)的觀察向量序列檢測每一個部分,使用一個包含五個狀態(tài)的一維連續(xù)HMM來表示人臉。接著對各塊進(jìn)行KL變換,提取每塊一些最大的特征向量作為觀察值對HMM進(jìn)行訓(xùn)練。此后,還提出了一種嵌入式隱馬爾可夫模型,該方法除了將人臉劃分為五塊外,還在每塊中從左至右嵌入了一個HMM。接著進(jìn)行二維DCT變換,把變換后得到的系數(shù)作為訓(xùn)練值。
3 結(jié)束語
人臉檢測是個發(fā)展很快的研究方向,人臉檢測技術(shù)的發(fā)展趨勢是利用多特征,多種分類方式進(jìn)行啟發(fā)式知識與統(tǒng)計學(xué)習(xí)方法的結(jié)合,未來對人臉檢測的研究將會更注重其實時的應(yīng)用,這就對檢測算法的效率提出了更高的要求。另外,可以消除光照對人臉成像影響的紅外人臉識別技術(shù),加入相互對比機(jī)制的包含正臉、側(cè)臉三維信息的人臉三維模型重建檢測技術(shù)也正在研究當(dāng)中。隨著技術(shù)的不斷進(jìn)步和市場逐漸的規(guī)范化,人臉檢測識別技術(shù)會越來越多地應(yīng)用于社會的各個領(lǐng)域,在促進(jìn)社會發(fā)展的同時方便人們的生活。
參考文獻(xiàn)
[1]許燕,王維蘭.基于視覺運動人臉檢測技術(shù)的研究[J].計算機(jī)仿真, 2014(1):434-437.
[2]孫寧,鄒采榮,趙力.人臉檢測綜述[J].電路與系統(tǒng)學(xué)報,2006,11(6):101-108.
作者簡介
姚坤(1990-),男,現(xiàn)為聊城大學(xué)物理科學(xué)與信息工程學(xué)院碩士研究生,主要研究方向為機(jī)器視覺。
論文關(guān)鍵詞:表面粗糙度,非接觸,光學(xué)測量
隨著科學(xué)技術(shù)的進(jìn)步和社會的發(fā)展,人們對于機(jī)械產(chǎn)品表面質(zhì)量的要求越來越高。表面粗糙度是評價工件表面質(zhì)量的一個重要指標(biāo),國內(nèi)外很多學(xué)者在表面粗糙度檢測方面做了大量研究工作。目前測量表面粗糙度的主要方法有:接觸式測量和非接觸式測量。
1 接觸式測量
接觸式測量就是測量裝置的探測部分直接接觸被測表面,能夠直觀地反映被測表面的信息,接觸式測量方法主要是觸針法,該方法經(jīng)過幾十年的充分發(fā)展,以其穩(wěn)定、可靠的特點被廣泛應(yīng)用。但接觸式測量存在很大的缺陷,具體表現(xiàn)在:(1)對高精度表面及軟質(zhì)金屬表面有劃傷破壞作用;(2)受觸針尖端圓弧半徑的限制,其測量精度有限;(3)因觸針磨損及測量速度的限制,無法實現(xiàn)在線實時測量[1]。
2 非接觸式測量
為了克服接觸式測量方法的不足非接觸,人們對非接觸式測量方法進(jìn)行了廣泛研究。研究表明,非接觸式測量方法具有非接觸、無損傷、快速、測量精度高、易于實現(xiàn)在線測量、響應(yīng)速度快等優(yōu)點。目前已有的非接觸式測量方法包括各種光學(xué)測量方法、超聲法、掃描隧道顯微鏡法、基于計算機(jī)視覺技術(shù)的表面粗糙度檢測方法等。這里我們只對基于光學(xué)散射原理的測量方法、基于光學(xué)干涉原理的測量方法和基于計算機(jī)視覺技術(shù)的測量方法做簡單介紹論文格式模板。
2.1基于光學(xué)散射原理的測量方法
當(dāng)一束光以一定的角度照射到物體表面后,加工表面的粗糙不平將引起發(fā)生散射現(xiàn)象。研究表明:表面粗糙度和散射光強度分布有一定的關(guān)系。對于表面粗糙度數(shù)值較小的表面,散射光能較弱,反射光能較強;反之,表面粗糙度數(shù)值較大的表面,散射光能較強,反射光能較弱。
基于光學(xué)散射原理測量表面粗糙度的研究方法和理論較多。四川聯(lián)合大學(xué)和哈爾濱理工大學(xué)相繼提出了一種稱之為散射特征值的參數(shù),表征被測物體表面上反射光和散射光的分散度,散射特征值與被測物體表面的粗糙度有很好的對應(yīng)關(guān)系[2]。哈爾濱理工大學(xué)利用已知表面粗糙度參數(shù)值的標(biāo)準(zhǔn)樣塊測得其散射特征值,建立—關(guān)系曲線,從而實現(xiàn)利用散射特征值測量火炮內(nèi)膛表面粗糙度[3]。
基于光學(xué)散射原理的表面粗糙度檢測方法,具有結(jié)構(gòu)簡單、體積小、易于集成產(chǎn)品、動態(tài)響應(yīng)好、適于在線測量等優(yōu)點。該方法的缺點是測量精度不高,用于超光滑表面粗糙度的測量還有待進(jìn)一步改進(jìn)。
2.2基于光學(xué)干涉原理的測量方法
當(dāng)相干光照射到工件表面同一位置時,由于光波的相互位相關(guān)系,將產(chǎn)生光波干涉現(xiàn)象。一般的干涉法測量是利用被測面和標(biāo)準(zhǔn)參考面反射的光束進(jìn)行比較,對干涉條紋做適當(dāng)變換,通過測量干涉條紋的相對變形來定量檢測表面粗糙度。該方法的測量精度取決于光的波長。但是由于干涉條紋的分辨率是以光波波長的一半為極限的,僅從條紋的狀態(tài)無法判斷表面是凸起還是凹陷,因此非接觸,作為一種具有較好分辨率、寬測量范圍的表面粗糙度在線檢測技術(shù),這種干涉法測量技術(shù)還有待于進(jìn)一步發(fā)展[4]。
基于光學(xué)干涉原理,1984年美國洛克西德導(dǎo)彈公司huang采用共模抑制技術(shù)研制成功了光學(xué)外差輪廓儀,光外差干涉檢測技術(shù)是一種具有納米級測量準(zhǔn)確度的高精度光學(xué)測量方法,適用于精加工、超精加工表面的測量,而且可以進(jìn)行動態(tài)時間的研究;華中理工大學(xué)采用光外差干涉方法研制出2D-SROP-1型表面粗糙度輪廓儀[5]。美國的維易科(VEECO)精密儀器有限公司,采用共光路干涉法研制了WYKO激光干涉儀和光學(xué)輪廓儀,可用來測量干涉條紋位相[6]。
基于光學(xué)干涉原理測量表面粗糙度分辨率高,適于測量超光滑表面粗糙度,但由于該方法的測量精度受光波波長的影響很大,所以其測量范圍受到一定影響。
2.3基于計算機(jī)視覺技術(shù)的測量方法
基于計算機(jī)視覺的粗糙度測量方法是指使用攝像機(jī)抓取圖像,然后將該圖像傳送至處理單元,通過數(shù)字化處理,根據(jù)像素分布和灰度、紋理、形狀、顏色等信息,選用合理的算法計算工件的粗糙度參數(shù)值。近年來,隨著計算機(jī)技術(shù)和工業(yè)生產(chǎn)的不斷發(fā)展,該方法受到越來越多的關(guān)注。
北京理工大學(xué)的王仲春等人采用顯微鏡對檢測表面進(jìn)行放大,并通過對CCD采集加工表面微觀圖像進(jìn)行處理實現(xiàn)了表面粗糙度的檢測[7]論文格式模板。哈爾濱理工大學(xué)吳春亞、劉獻(xiàn)禮等為解決機(jī)械加工表面粗糙度的快速、在線檢測,設(shè)計了一種表面粗糙度圖像檢測方法,建立了圖像灰度變化信息與表面粗糙度之間的關(guān)系模型[8]。英國學(xué)者Hossein Ragheb和Edwin R. Hancock通過數(shù)碼相機(jī)拍攝的表面反射圖來估計表面粗糙度參數(shù)非接觸,運用Vernold–Harvey修正的B–K散射理論模型獲得了比Oren–Nayar模型更好的粗糙度估計結(jié)果[9]。澳大利亞學(xué)者Ghassan A. Al-Kindi和Bijan Shirinzadeh對基于顯微視覺的不同機(jī)械加工表面粗糙度參數(shù)獲取的可行性進(jìn)行了評估,討論了照射光源與表面輻照度模型對檢測的影響,結(jié)果顯示盡管從視覺數(shù)據(jù)和觸針數(shù)據(jù)所獲得的粗糙度參數(shù)存在一定差異,但是基于視覺的方法仍是一種可靠的粗糙度參數(shù)估計方法[10-11]。
可以看出,基于計算機(jī)視覺技術(shù)的測量方法主要有統(tǒng)計分析、特征映射和神經(jīng)網(wǎng)絡(luò)等黑箱估計法。通過這些方法獲得的表面粗糙度參數(shù)的估計值受諸多因素的影響,難以給出其準(zhǔn)確的物理解釋。真正要定量地計算出粗糙度參數(shù),需要科學(xué)的計算。
但是隨著機(jī)械加工自動化水平的提高,基于計算機(jī)視覺技術(shù)的檢測方法處理內(nèi)容豐富、處理精度高、處理速度快、易于集成等優(yōu)點將受到越來越多的重視。
3 結(jié)束語
接觸式測量測量速度較慢,容易劃傷工件表面,并且不適用于連續(xù)生產(chǎn)材料表面的檢測。非接觸式測量具有無損傷、快速、測量精度高、易于實現(xiàn)在線測量等優(yōu)點,已成為表面粗糙度檢測的重點研究方向。非接觸測量以光學(xué)法為主,隨著計算機(jī)技術(shù)和工業(yè)生產(chǎn)的迅猛發(fā)展,基于計算機(jī)視覺技術(shù)的表面粗糙度非接觸式檢測方法受到越來越多的重視。
參考文獻(xiàn):
[1]劉斌,馮其波,匡萃方.表面粗糙度測量方法綜述[J]. 光學(xué)儀器, 2004, 26(5): 54-55.
[2]苑惠娟等.非接觸式表面粗糙度測量儀[J].哈爾濱科學(xué)技術(shù)大學(xué)學(xué)報,1995,19(6):30-34.
[3]強熙富,張詠,許文海.?dāng)U展激光散射法測量粗糙度的測量范圍的研究[J].計量學(xué)報,1990,11(2):81-85.
[4]王文卓,李大勇,陳捷.表面粗糙度非接觸式測量技術(shù)研究概況[J].機(jī)械工程師,2004,11:6-9.
[5]王菊香.2D-SROP-1型表面粗糙度輪廓儀[J].工業(yè)計量,1994,(4):27-29.
[6]徐德衍等.光學(xué)表面粗糙度研究的進(jìn)展與方向[J].光學(xué)儀器,1996,18(1):32-41.
[7]王仲春,高岳,黃粵熙等.顯微成像檢測表面粗糙度[J]. 光學(xué)技術(shù), 1998, 5: 46-48.
[8]吳春亞,劉獻(xiàn)禮,王玉景等.機(jī)械加工表面粗糙度的圖像檢測方法[J]. 哈爾濱理工大學(xué)學(xué)報, 2007, 12(3): 148-151.
[9]Hossein Ragheb, Edwin R.Hancock. The modified Beckmann–Kirchhoff scattering theory for rough surfaceanalysis[J]. Pattern Recognition, 2007, 40: 2004-2020.
[10]Ghassan A. Al-Kindi, BijanShirinzadeh. An evaluation of surface roughness parameters measurement usingvision-based data[J]. International Journal of Machine Tools & Manufacture,2007, 47: 697-708.
[11]Ghassan A. Al-Kindi, BijanShirinzadeh. Feasibility assessment of vision-based surface roughnessparameters acquisition for different types of machined specimens[J]. Image andVision Computing, 2008, 6: 1-15.
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。
7年代末,在公開的技術(shù)文獻(xiàn)中開始出現(xiàn)基于多系統(tǒng)的整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(dfs)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進(jìn)行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進(jìn)行定位與估計,并完全能對態(tài)勢及帶來的威脅進(jìn)行實時評估”。
1998年1月,buchroithner和wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻(xiàn)中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等。
1.2基本內(nèi)容
信息融合是系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進(jìn)行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當(dāng)運用各種現(xiàn)代信息處理方法,通過計算機(jī)實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準(zhǔn)則進(jìn)行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。
(2)多傳感器id/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標(biāo),對這些數(shù)據(jù)進(jìn)行綜合,改進(jìn)對該目標(biāo)的估計,或?qū)φ麄€當(dāng)前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認(rèn)識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進(jìn)行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進(jìn)行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進(jìn)一步改善。
(3)決策層融合。首先
每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進(jìn)行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準(zhǔn)則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預(yù)處理。進(jìn)行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負(fù)擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評估。融合目標(biāo)的位置、速度、身份等參數(shù),以達(dá)到對這些參數(shù)的精確表達(dá)。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。
態(tài)勢評估。根據(jù)當(dāng)前的環(huán)境推斷出檢測目標(biāo)與事件之間的關(guān)系,以判斷檢測目標(biāo)的意圖。威脅評估。結(jié)合當(dāng)前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當(dāng)前的環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進(jìn)行傳感器資源的合理配置。人機(jī)接口。提供人與計算機(jī)間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。
二、多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用modis(moderateresolutionimagingspectroradiometer)數(shù)據(jù)測定森林火點時的2、22、23波段的傳感器輻射值已達(dá)飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為25m的可見光通道的數(shù)據(jù),較好地進(jìn)行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準(zhǔn)確度。為進(jìn)一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機(jī)獲得gps接收機(jī)輸出的有關(guān)信息通過與rs實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準(zhǔn)確度和敏感性。
2.2森林蓄積特征的估計
hampusholmstrom等在瑞典南部的試驗區(qū)將spot-4×s衛(wèi)星數(shù)據(jù)和carabas-iivhfsar傳感器的雷達(dá)數(shù)據(jù)進(jìn)行了融合,采用knn(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進(jìn)行了估計。
knn方法就是采用目標(biāo)樣地鄰近k個(k=1)最近樣地的加權(quán)來估計目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達(dá)數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進(jìn)行估計,并對三種不同的數(shù)據(jù)方法進(jìn)行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達(dá)數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合gis信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森
林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。 trevorjdavis等22年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的gis數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)
的快速更新,認(rèn)為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機(jī)側(cè)面裝上可視的數(shù)字?jǐn)z像裝置,利用gps對測點進(jìn)行定位,對特殊地區(qū)的攝像進(jìn)行拍攝,同時與對應(yīng)的gis數(shù)據(jù)進(jìn)行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠(yuǎn)、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長的有機(jī)體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴(yán)重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進(jìn)行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機(jī)械調(diào)整時間長等問題。
3.1.2單一傳感器在木材檢測中的應(yīng)用
對木材及人造板進(jìn)行無損檢測的方法很多,如超聲波、微波、射線、機(jī)械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。
隨著計算機(jī)視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準(zhǔn)確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機(jī)理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機(jī)或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進(jìn)行原木三維模型真實再現(xiàn)的計算機(jī)視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機(jī)視覺技術(shù)對木材刨花的尺寸大小進(jìn)行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進(jìn)行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。
在制材加工過程中,利用計算機(jī)視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進(jìn)行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機(jī)視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進(jìn)行分等分級,實現(xiàn)自動化生產(chǎn)過程。wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機(jī)視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機(jī)視覺技術(shù)對刨花板施膠效果進(jìn)行了定量分析。
x射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的結(jié)構(gòu)和性質(zhì)等進(jìn)行檢測,并對木材內(nèi)部的各種缺陷進(jìn)行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當(dāng)成節(jié)子,
造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和x射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測到木材的缺陷。
基于多傳感器(機(jī)器視覺及x射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準(zhǔn)確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;auburn大學(xué)的生物系統(tǒng)工程系和usda南方林業(yè)實驗站與有關(guān)公司合作開展用gps和其他傳感器研究林業(yè)機(jī)器系統(tǒng)的性能和生產(chǎn)效率。
今年5月,美國亞馬遜公司收購了一支歐洲頂級機(jī)器視覺團(tuán)隊用于無人機(jī)領(lǐng)域研究。同樣在5月,英特爾集成電路公司收購了俄羅斯計算機(jī)視覺公司Itseez,用于無人駕駛領(lǐng)域;6月初,俄羅斯計算機(jī)視覺公司VisionLabs開發(fā)了一個通用的開源計算機(jī)視覺開發(fā)平臺,F(xiàn)acebook與谷歌為其提供資金并測試開發(fā)成果……
而在國內(nèi),4月,維視機(jī)器人與ABB達(dá)成了以工業(yè)機(jī)器人、機(jī)器視覺為首要發(fā)展的共識,維視將加快工業(yè)機(jī)器人領(lǐng)域的產(chǎn)品升級,加強以智能視覺為核心的智能制造競爭優(yōu)勢;觸景無限打造了集技術(shù)先進(jìn)、性能卓越、成熟可靠、使用友好于一身的嵌入式視覺感知解決方案――Vision Card;曠視(Face++)多年來專注機(jī)器視覺技術(shù)的研發(fā)與應(yīng)用,目前已經(jīng)與國內(nèi)多家Top級機(jī)器人廠商開展深度合作,力圖賦予機(jī)器人一雙眼睛看懂世界。
一系列的行業(yè)動態(tài)無疑表現(xiàn)出了機(jī)器視覺這項技術(shù)的火熱程度和廣闊前景。賽迪顧問電子信息產(chǎn)業(yè)研究中心高級咨詢師向陽認(rèn)為,從產(chǎn)業(yè)投資回報率分析,機(jī)器視覺前景廣闊,值得投資。他說,盡管人工智能蓬勃發(fā)展,但依然有許多關(guān)鍵節(jié)點問題有待突破,機(jī)器視覺就是其中之一。目前的軟硬件水平還不能讓機(jī)器具備與人類似的視覺、聽覺、嗅覺和觸覺等感知力。
所謂機(jī)器視覺是指采用機(jī)器代替人眼來做測量與判斷,通過計算機(jī)攝取圖像來模擬人的視覺功能,實現(xiàn)人眼視覺的延伸。
通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進(jìn)行各種運算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。
商湯科技CEO徐立表示,機(jī)器視覺從整個的流程可以分為三大塊,首先就是可以模擬人的眼睛。機(jī)器也像人一樣,需要捕獲更高質(zhì)量的圖像,它得到的影像和內(nèi)容可能比人得到的更加清晰和完美。其次是感知。最后是對視頻輸入的識別。
另外,曠視(Face++)創(chuàng)始人印奇認(rèn)為,要完成自然、快速的人機(jī)交互,機(jī)器人需要以實時視頻流式傳輸方式將圖像數(shù)據(jù)傳遞到本地專用服務(wù)器中,并通過核心的機(jī)器視覺算法對數(shù)據(jù)進(jìn)行分析處理最終反饋結(jié)果,這是軟硬一體化的應(yīng)用場景。
當(dāng)前,從全球產(chǎn)業(yè)發(fā)展來看,國際機(jī)器視覺市場正處于產(chǎn)業(yè)成熟期,未來3~5年歐美日機(jī)器視覺技術(shù)仍將有不斷創(chuàng)新,國際機(jī)器視覺市場規(guī)模有望繼續(xù)增長。國內(nèi)機(jī)器視覺專利數(shù)量逐年增加,各大高校及企業(yè)紛紛投入精力在機(jī)器視覺領(lǐng)域進(jìn)行研究。國內(nèi)機(jī)器視覺公司如雨后春筍般出現(xiàn)、發(fā)展,預(yù)計到2020年前后,國內(nèi)機(jī)器視覺將進(jìn)入產(chǎn)業(yè)成熟期。
現(xiàn)在,雖然機(jī)器視覺的應(yīng)用場景多聚集在智能制造領(lǐng)域,但隨著新技術(shù)的不斷涌現(xiàn),這一應(yīng)用技術(shù)將擴(kuò)展至消費電子、可穿戴式設(shè)備、汽車先進(jìn)駕駛輔助系統(tǒng)以及智能化監(jiān)控等更貼近大眾生活的領(lǐng)域。另外,在發(fā)展的過程中,諸多技術(shù)難點仍舊會成為阻礙因素,不過擁有一雙“慧眼”的機(jī)器人必能輕松應(yīng)對。
通過梳理應(yīng)用場景、技術(shù)難點和行業(yè)趨勢,《中國信息化周報》試圖揭開機(jī)器視覺的神秘面紗。
應(yīng)用場景 機(jī)器視覺“玩”轉(zhuǎn)多種場景
1生產(chǎn)組裝
“我們研制的手眼力機(jī)器人在電腦主板生產(chǎn)線上,在機(jī)器視覺技術(shù)的作用下,可以精確地安裝幾毫米的電容?!薄吨袊畔⒒軋蟆酚浾呗牭脚_灣工業(yè)研究所張所f教授在講座中如此說到并以視頻展示。視覺技術(shù)讓機(jī)械手臂擁有3D視覺能力,可以靠視覺導(dǎo)引、定位,成為夾取物件的要件。除了視覺定位,手眼力協(xié)調(diào)機(jī)器人的關(guān)鍵技術(shù)還有矩陣的感測器,可以協(xié)助機(jī)器人知道抓取的位置與力量大小。機(jī)器人具備三大力量控制功能,第一,力量控制能順應(yīng)導(dǎo)引,讓作業(yè)員能夠牽著機(jī)械手臂來做教導(dǎo)機(jī)器做重復(fù)的事情。第二,人機(jī)安全。機(jī)器人一碰倒東西就會停下來,因為機(jī)器手臂有能力感測碰撞力量,接觸到外物的碰撞和人的碰撞,機(jī)器手臂會立即停止。第三,能精確控制夾取力道,對于易碎物品、軟性物品的夾取。由于視覺定位以及力量感測能力,使得普通的機(jī)器搖身一變成為更像人類的行為,可以協(xié)助作業(yè)員做更高端、更精密的組裝檢測工作。
2醫(yī)療器械缺陷檢測
隨著醫(yī)療水平和醫(yī)療器械的不斷提高和更新,一次性注射針以其方便、衛(wèi)生的特點深受用戶的喜愛,其需求量也迅速增大,而針頭外觀的好壞直接影響到一次性注射針的質(zhì)量。所以為了減少不合格品的數(shù)量,需要增加檢測工序。
一次性注射針可以分為針座和針頭兩個部分。針座的缺陷對產(chǎn)品的質(zhì)量影響可以不計。而針頭就存在著兩種缺陷情況:首先針頭在制作過程中針尖部位可能會產(chǎn)生毛刺;其次針頭在自動裝配過程中可能會產(chǎn)生倒插現(xiàn)象(針尖部位入針座)。影響針頭的缺陷為:針尖毛刺、倒插。其中倒插不僅會對產(chǎn)品的質(zhì)量產(chǎn)生直接的影響,而且嚴(yán)重的會危害到人的生命。
通過利用自動化機(jī)器視覺檢測系統(tǒng)使得光纖傳感器感應(yīng)到注射針,然后觸發(fā)圖像處理器拍攝圖片,并進(jìn)行圖像分析處理,最后驅(qū)動剔除裝置。目前的剔除方法則采用整排剔除,如果具有更高的自動化水平,可以為每個針座加裝吸盤。
3電子焊接制造
在焊線技術(shù)中,因為芯片維度的縮小,需要較強大的影像放大功能。在此環(huán)境中,高質(zhì)量的成像鏡頭系統(tǒng)必須滿足特殊的最佳化需求。與一般影像處理技術(shù)相比,這里對照明、對比、失真或焦距深度等問題的要求,都逐一被放大。芯片、涂漆表面、圖樣與質(zhì)地的質(zhì)量對比可能會因為材質(zhì)關(guān)系呈現(xiàn)出很大的相異性。在這些小型芯片中微小的偏移,將對影像的對比方面的質(zhì)量造成很大影響。
另外,由于機(jī)器視覺工具絕佳的操作模式、可靠度及視覺算法的高準(zhǔn)確度,其精度可高達(dá)亞像素區(qū)塊。在印模或焊線機(jī)器中的主要影像處理作業(yè)決定芯片與位置,及其圖樣、邊緣、圓圈及鉆孔,從而很好地解決了芯片焊接過程中的諸多問題。
4空瓶檢測
機(jī)器視覺空瓶檢測系統(tǒng)主要由相機(jī)、鏡頭、光源、圖像采集卡、PC平臺和控制單元等六部分組成,各個部分之間相互配合,最終完成對酒瓶的質(zhì)量檢測和剔除。
在系統(tǒng)運行過程中,PLC負(fù)責(zé)及時地通知圖像采集子系統(tǒng)啟動CCD攝像機(jī),抓拍處于拍攝位置的空瓶。為了達(dá)到這一目的,需要使用光電傳感器來檢測空瓶的位置。并將光電傳感器安裝到CCD攝像機(jī)拍攝位置旁,把輸出接到PLC的I/O輸入口上。當(dāng)沒有空瓶經(jīng)過時,光電傳感器可以接收到反射光束,沒有輸出信號,而當(dāng)有空瓶經(jīng)過時,光電傳感器無法接收到返回的光束,于是輸出觸發(fā)信號。PLC從輸入口接收到此信號后,即可判定空瓶已到達(dá)拍攝位置,從I/O輸出口輸出啟動信號給圖像采集系統(tǒng),啟動CCD攝像機(jī),攝像機(jī)及時進(jìn)行拍攝,獲取被檢空瓶的圖像。
5汽車零部件制造
汽車行業(yè)產(chǎn)品的精度和質(zhì)量都必須滿足要求的這種需求正在與日俱增。因此,現(xiàn)在汽車行業(yè)生產(chǎn)的特點是越來越快的生產(chǎn)周期和大量原材料和零部件的供應(yīng)。這就給機(jī)器視覺系統(tǒng)提供了用武之地,機(jī)器視覺正逐步被看做任何自動化解決方案中的一個完整的組成部分。
另外,在電子工業(yè)中,特別是像高精度的晶片位置識別或位置校正以及用于SMT(表面安裝設(shè)備)裝配零件檢測這樣的領(lǐng)域,幾年來已經(jīng)形成了這樣的共識:現(xiàn)在要滿足高質(zhì)量和生產(chǎn)標(biāo)準(zhǔn)的唯一方式就是使用靈活的圖像處理方法。不管怎樣,機(jī)器視覺目前已經(jīng)是不可缺少的了,即便是擁有能夠提供最佳精度級別的三維自動裝配和適應(yīng)大量不同種類和改進(jìn)種類裝配線的汽車行業(yè)也不例外。
6葡萄糖藥液質(zhì)量檢測
機(jī)器視覺在醫(yī)療領(lǐng)域的應(yīng)用一直在不斷進(jìn)步,從傳統(tǒng)的藥品包裝、藥瓶、標(biāo)簽等視覺檢測到目前對生物芯片的檢測,放射科的X放射等,都引入了機(jī)器視覺系統(tǒng),完成對圖像信息的采集、存儲、管理、處理及傳輸?shù)裙δ?,使得圖像資料得以有效管理和充分利用。
以葡萄糖藥液質(zhì)量檢測為例,傳統(tǒng)的檢測方法是將帶檢測的葡萄糖用人工的方式放在流水線上,流水線的速度由檢測工人控制,當(dāng)藥品傳送到檢測工人面前時,檢測工人在專用的燈箱下判斷產(chǎn)品質(zhì)量是否合格。
人工檢測存在著很大的弊端,很難滿足流水線的檢測速度,無法實現(xiàn)實時、在線、非接觸檢測的檢測,更無法適應(yīng)現(xiàn)代的質(zhì)量控制和統(tǒng)計流程控制。
而基于機(jī)器視覺技術(shù)的葡萄糖藥液質(zhì)量檢測,可以實現(xiàn)無接觸式的檢測。根據(jù)葡萄糖藥液雜質(zhì)檢測的特點設(shè)計了專用的視覺成像方案。待檢測的葡萄糖藥瓶被卡在轉(zhuǎn)床上,轉(zhuǎn)床旋轉(zhuǎn)的時候帶動藥瓶高速旋轉(zhuǎn),用于機(jī)器視覺的專用LED光源安裝在光源盒內(nèi),CCD攝像將拍攝到的圖像傳輸?shù)焦た貦C(jī)。
在此過程中連續(xù)拍攝7幅圖像,在這一序列的運動圖像中,對運動目標(biāo)進(jìn)行識別, 當(dāng)識別到的目標(biāo)超過規(guī)定的容許指標(biāo)時,判斷此瓶藥液為不合格。
相關(guān)鏈接
淺談計算機(jī)視覺與機(jī)器視覺的異同
從學(xué)科分類上, 二者都被認(rèn)為是人工智能下屬科目,不過計算機(jī)視覺偏軟件,通過算法對圖像進(jìn)行識別分析,而機(jī)器視覺軟硬件都包括(采集設(shè)備、光源、鏡頭、控制、機(jī)構(gòu)、算法等),指的是系統(tǒng),更偏實際應(yīng)用。簡單地說,可以認(rèn)為計算機(jī)視覺是研究“讓機(jī)器怎么看”的科學(xué),而機(jī)器視覺是研究“看了之后怎么用”的科學(xué)。
不過,機(jī)器視覺和計算機(jī)視覺并沒有很清晰的界限,而是緊密的聯(lián)系在一起,它們有著相同的理論,只是在實際應(yīng)用中有所不同。計算機(jī)視覺與機(jī)器視覺都是要從圖像中獲取對世界的描述,因此,對基本層的圖像獲取、圖像處理,中層的圖像分割、圖像分析和高層的圖像理解這些理論知識的掌握對兩者來說都是“萬變不離其宗”。
技術(shù)難點 在多重困難中實現(xiàn)“閃轉(zhuǎn)騰挪”
關(guān)于機(jī)器視覺的概念在綜述中已經(jīng)講得很明白,既然是代替人眼來做測量和判斷,那么在提取視覺信息的時候,勢必會像人眼一樣受到一些客觀因素的影響。光照的強弱、物體的位置以及運動速度的快慢,都會影響眼睛的觀察效果。對于機(jī)器視覺而言,這些同樣是重點和難點所在。
打光的穩(wěn)定性
工業(yè)視覺應(yīng)用一般分成四大類:定位、測量、檢測和識別,其中測量對光照的穩(wěn)定性要求最高,因為光照只要發(fā)生10%~20%的變化,測量結(jié)果將可能偏差出1~2個像素,這不是軟件的問題,這是光照變化,導(dǎo)致了圖像上邊緣位置發(fā)生了變化,即使再厲害的軟件也解決不了問題,必須從系統(tǒng)設(shè)計的角度,排除環(huán)境光的干擾,同時要保證主動照明光源的發(fā)光穩(wěn)定性。當(dāng)然通過硬件相機(jī)分辨率的提升也是提高精度、抗環(huán)境干擾的一種辦法。比如之前的相機(jī)對應(yīng)物體空間尺寸是1個像素10um,而通過提升分辨率后變成 1個像素5um,精度近似可以認(rèn)為提升1倍,對環(huán)境的干擾自然增強。
工件位置的不一致性
一般做測量的項目,無論是離線檢測,還是在線檢測,只要是全自動化檢測設(shè)備,第一步工作都是要能找到待測目標(biāo)物。每次待測目標(biāo)物出現(xiàn)在拍攝視場中時,要能精確知道待測目標(biāo)物在哪里,即使使用一些機(jī)械夾具等,也不能特別高精度保證待測目標(biāo)物每次都出現(xiàn)在同一位置,這就需要用到定位功能,如果定位不準(zhǔn)確,可能測量工具出現(xiàn)的位置就不準(zhǔn)確,測量結(jié)果有時會有較大偏差 。
標(biāo) 定
一般在高精度測量時需要做以下幾個標(biāo)定,一是光學(xué)畸變標(biāo)定(如果不是用的軟件鏡頭,一般都必須標(biāo)定);二是投影畸變的標(biāo)定,也就是因為安裝位置誤差代表的圖像畸變校正;三是物像空間標(biāo)定,也就是具體算出每個像素對應(yīng)物空間的尺寸。
不過目前的標(biāo)定算法都是基于平面的標(biāo)定,如果待測量的物體不是平面的,標(biāo)定就需要做一些特種算法來處理。
物體運動速度
如果被測量的物體不是靜止的,而是在運動狀態(tài),那么一定要考慮運動模糊對圖像精度(模糊像素=物體運動速度×相機(jī)曝光時間),這也不是只靠軟件就能夠解決的。
軟件測量精度
在測量應(yīng)用中軟件的精度只能按照1/2~1/4個像素考慮,最好按照1/2,而不能向定位應(yīng)用一樣達(dá)到1/10~1/30個像素精度,因為測量應(yīng)用中軟件能夠從圖像上提取的特征點非常少。
行業(yè)趨勢 智能制造成為“練武場”
隨著經(jīng)濟(jì)全球化的發(fā)展,各行各業(yè)的競爭漸趨激烈,要想在制造業(yè)領(lǐng)域脫穎而出,各大廠商必須不斷優(yōu)化升級,在技術(shù)、產(chǎn)品方面尋求創(chuàng)新。“智能制造”成為制造業(yè)大軍努力的方向,而人工智能新品“機(jī)器視覺”則是助力制造業(yè)實現(xiàn)“智能化”轉(zhuǎn)型的好幫手。
2015年我國了實施制造強國戰(zhàn)略第一個十年的行動綱領(lǐng)《中國制造2025》,其中“智能制造”被定位為中國制造的主攻方向,并被視為中國從制造大國向制造強國的轉(zhuǎn)變的“主力軍”,也成為中國制造業(yè)企業(yè)轉(zhuǎn)型的核心目標(biāo)。
從智能制造的角度來看,機(jī)器視覺具有非常重要的作用,尤其是在智能產(chǎn)線和智能設(shè)備中,機(jī)器視覺可以使產(chǎn)品在自動化生產(chǎn)過程中質(zhì)量更加穩(wěn)定、更加高效。由于有了視覺,智能設(shè)備生產(chǎn)的柔性化程度、效率也將會得到極大的提升。
首先,在打造智能產(chǎn)線的過程中,必須要使質(zhì)量控制能夠保持高速度、高精度、高分辨力、穩(wěn)定性好、適應(yīng)能力強以及可以長時間持續(xù)不間斷運作,人工檢驗很顯然已經(jīng)無法滿足這方面的生產(chǎn)需求,而如果有機(jī)器視覺助力,就恰恰解決了這一問題。機(jī)器視覺系統(tǒng)不僅可以滿足自動化生產(chǎn)的各種需求,而且本身最大特點在于非接觸性測量和檢驗,對于機(jī)器以及產(chǎn)品都起到了一定的保障作用。
并且,機(jī)器視覺最大的價值不僅僅在查漏等基本的檢驗環(huán)節(jié),更重要的是能夠?qū)崟r動態(tài)地檢測產(chǎn)品的質(zhì)量數(shù)據(jù)如尺寸、角度、精度等關(guān)鍵參數(shù),并通過互聯(lián)網(wǎng)將數(shù)據(jù)收集并加以分析和處理,從而實時感知、分析、決斷出產(chǎn)品的質(zhì)量問題。
另外,機(jī)器視覺還可以識別產(chǎn)品上的特征、條形碼等各種記錄產(chǎn)品信息的內(nèi)容,使生產(chǎn)過程變得可控,產(chǎn)品生產(chǎn)過程具有可追溯性,這都是打造智能生產(chǎn)線所必不可少的要求。
最后,機(jī)器視覺軟硬件產(chǎn)品正逐漸成為協(xié)作生產(chǎn)制造過程中的核心系統(tǒng),無論是用戶還是硬件供應(yīng)商都將機(jī)器視覺產(chǎn)品作為生產(chǎn)線上信息收集的工具,這就要求機(jī)器視覺產(chǎn)品大量采用標(biāo)準(zhǔn)化技術(shù),直觀地說就是要隨著自動化的開放而逐漸開放,并根據(jù)用戶的需求進(jìn)行二次開發(fā)。
機(jī)器視覺的廠商在未來十年內(nèi)也應(yīng)該不單只是提品的供應(yīng)商,而是要逐漸向一體化解決方案的系統(tǒng)集成商邁進(jìn)。隨著中國加工制造業(yè)的發(fā)展,對于機(jī)器視覺的需求也逐漸增多。同時,隨著機(jī)器視覺產(chǎn)品的增多,技術(shù)的提高,國內(nèi)機(jī)器視覺的應(yīng)用狀況將由初期的低端轉(zhuǎn)向高端。由于機(jī)器視覺的介入,自動化將朝著更智能、更快速的方向發(fā)展。
相關(guān)鏈接 機(jī)器視覺離消費市場還有多遠(yuǎn)
目前,機(jī)器視覺已在工業(yè)應(yīng)用方面取得不少突破,在消費級市場的進(jìn)展卻不大,不少人都在擔(dān)憂機(jī)器視覺在消費級市場是否能真正投入使用。
視覺技術(shù)在消費級市場最早的嘗試是微軟的Kinect。2010年,微軟聯(lián)合深度攝像頭技術(shù)方案提供商PrimeSense正式對外推出Kinect。在Kinect之后,華碩、Intel、谷歌以及蘋果也相繼在深度攝像頭的應(yīng)用場景上跟進(jìn),但后續(xù)的發(fā)展卻顯示,深度攝像頭作為獨立產(chǎn)品,市場化難度頗大。
【關(guān)鍵詞】計算機(jī)技術(shù) 電力系統(tǒng)自動化 應(yīng)用
在電力系統(tǒng)的運行中會出現(xiàn)很多問題影響系統(tǒng)的正常運行,從而導(dǎo)致電力系統(tǒng)運行效率低下,故障頻發(fā)。計算機(jī)技術(shù)在電力系統(tǒng)上的應(yīng)用就是指通過計算機(jī)技術(shù)對電力系統(tǒng)運行中的各項數(shù)據(jù)進(jìn)行收集和整理,進(jìn)行科學(xué)化分析,從而對電力系統(tǒng)中的問題自動排解或輔助人們進(jìn)行問題的判斷和處理,有效保證電力系統(tǒng)的正常運行。
1 何為電力系統(tǒng)自動化
一個完整的電力系統(tǒng)包含多個方面,例如發(fā)電、電力傳輸、電壓調(diào)整以及配電設(shè)施等。我們要想保證電力系統(tǒng)正常運行就必須對這幾個環(huán)節(jié)中的設(shè)備,例如變壓器、電線等,進(jìn)行有效地監(jiān)控、維護(hù)以及控制。由于這些工作的存在,所以電力系統(tǒng)自動化技術(shù)主要可以分為以下幾個方面。
1.1 電力網(wǎng)絡(luò)的調(diào)度實行自動化
電力網(wǎng)絡(luò)的調(diào)度自動化是電力系統(tǒng)自動化的重要環(huán)節(jié)。在我國,電力網(wǎng)絡(luò)的調(diào)度自動化是按五級進(jìn)行管理,一是國家級調(diào)度,二是區(qū)域級調(diào)度,三是省級調(diào)度,四是地區(qū)市級調(diào)度,五是縣鄉(xiāng)級調(diào)度。電力網(wǎng)絡(luò)的調(diào)度自動化主要是通過計算機(jī)網(wǎng)絡(luò)技術(shù)、終端設(shè)備等,對整個電力運行狀態(tài)數(shù)據(jù)進(jìn)行分析,對電力運行問題進(jìn)行預(yù)測,自動調(diào)度電力網(wǎng)絡(luò)發(fā)電情況。
1.2 發(fā)電、變電的自動化
發(fā)電是整個電力系統(tǒng)的基礎(chǔ),變電站是發(fā)電廠與客戶之間的重要銜接點。發(fā)電廠實行自動化管理不但節(jié)約生產(chǎn)成本,更有利于精細(xì)化的管理,切實有效地提高發(fā)電的效率和穩(wěn)定性。變電站的自動化管理,主要是取代人工管理,保證變電站時時都保持監(jiān)控狀態(tài),避免人工出現(xiàn)的漏洞,保證變電站的穩(wěn)定安全長久運行。
2 計算機(jī)技術(shù)在電力系統(tǒng)自動化應(yīng)用的發(fā)展方向
經(jīng)過多年的計算機(jī)技術(shù)在電力系統(tǒng)自動化中的應(yīng)用,我們已經(jīng)積累了很多管理和技術(shù)經(jīng)驗,在未來的發(fā)展中,計算機(jī)技術(shù)在電力系統(tǒng)自動化應(yīng)用中將會扮演著更加重要的角色。我們要充分利用這些經(jīng)驗,研發(fā)新技術(shù),不斷的革新,推進(jìn)電力系統(tǒng)自動化的發(fā)展程度。未來基于計算機(jī)技術(shù)在電力系統(tǒng)自動化中的應(yīng)用將會有以下幾種發(fā)展方向。
2.1 智能化電力網(wǎng)絡(luò)技術(shù)應(yīng)用
智能化電力網(wǎng)絡(luò)技術(shù)應(yīng)用是電力系統(tǒng)自動化的重要發(fā)展方向。智能化電力網(wǎng)絡(luò)技術(shù)主要是將發(fā)電廠、配電設(shè)備、輸電線路、調(diào)度控制、電力用戶管理等多個環(huán)節(jié)進(jìn)行有效地整合,對整個電力系統(tǒng)的運行進(jìn)行監(jiān)控,對電力故障進(jìn)行預(yù)警,從而保證電力系統(tǒng)的正常有效運行。如果智能化電力網(wǎng)絡(luò)技術(shù)得不到深入的推廣和應(yīng)用,那么電力系統(tǒng)的自動化將很難實現(xiàn)。
智能化電力網(wǎng)絡(luò)主要是將計算機(jī)技術(shù)應(yīng)用于電力系統(tǒng)自動化網(wǎng)絡(luò)中,通過與計算機(jī)技術(shù)的有效結(jié)合,既從技術(shù)角度保證電力系統(tǒng)的安全運行,又保證電力系統(tǒng)的信息數(shù)據(jù)及時傳輸和信息數(shù)據(jù)的準(zhǔn)確性,大大地促進(jìn)了我國電力發(fā)展程度,在電力系統(tǒng)自動化應(yīng)用中起著至關(guān)重要的作用。
2.2 大力投入光電式互感器的建設(shè)
電流、電壓等電力參數(shù)是電力系統(tǒng)自動化運行中的重要數(shù)據(jù),在電力系統(tǒng)自動化中起著至關(guān)重要的作用,而能有效準(zhǔn)確地提供這些參數(shù)的重要設(shè)備就是光電式互感器。在實際應(yīng)用中,光電式互感器可以有效地將高電壓、高電流按標(biāo)準(zhǔn)轉(zhuǎn)化成標(biāo)準(zhǔn)電壓和電流,保證這些參數(shù)在合理范圍內(nèi),這樣不但提高的測量設(shè)備的測量效率,還減少電力在傳輸過程中的損耗,最大限度提高電力控制的經(jīng)濟(jì)成果。需要我們注意的是,在實際工作使用中需要進(jìn)行一定比例的控制,否則超出這個比例,將會是事倍功半。最近這些年,越來越多的高校和科研機(jī)構(gòu)都在大力研究光電式互感器技術(shù),投入更多的人力物力來研究,而且已經(jīng)取得了很大的成效,將來,光電式互感器的發(fā)展前景會更加美好。
2.3 計算機(jī)視覺成像技術(shù)的開發(fā)應(yīng)用
最近幾年,人們越來越關(guān)注計算機(jī)視覺成像技術(shù)和紅外線成像技術(shù),這些技術(shù)在電力系統(tǒng)自動化中得到推廣應(yīng)用。在電力系統(tǒng)自動化中圖像信息對整個系統(tǒng)的分析判斷起著越來越重要的作用,還有其他如圖像分析、信息處理等計算機(jī)技術(shù)的標(biāo)準(zhǔn)也不斷的提高,變得更加嚴(yán)格。在某些情況下,必須有計算機(jī)技術(shù)代替人工進(jìn)行圖像的分析和處理。整個電力系統(tǒng)自動化的信息量非常巨大,而且信息的變化頻率非???,通常幾秒甚至不到一秒就有所變化,假如不能及時的發(fā)現(xiàn)已經(jīng)出現(xiàn)的問題或即將出現(xiàn)的問題,會造成不可巨大的損失。
根據(jù)上述的分析,計算機(jī)技術(shù)在電力系統(tǒng)自動化中的應(yīng)用推廣勢在必行。因為,大量的變化的數(shù)據(jù)在整個電力系統(tǒng)自動化中進(jìn)行不斷的傳輸,只靠人工是無法有效準(zhǔn)確的完成這項工作的,如果不能及時有效地處理這些信息數(shù)據(jù),那么將會導(dǎo)致整個電力系統(tǒng)自動化運行出現(xiàn)問題。我們還要重視電力系統(tǒng)自動化中的網(wǎng)絡(luò)通信技術(shù),這項技術(shù)直接影響整體的電力系統(tǒng)自動化的正常運行,網(wǎng)絡(luò)通信中的問題主要是各個環(huán)節(jié)之間的信息傳遞的準(zhǔn)確及時。由此看出,我們必須借助計算機(jī)技術(shù),將計算機(jī)技術(shù)廣泛深入的應(yīng)用于電力系統(tǒng)自動化中,保證整個電力系統(tǒng)的正常運行。
參考文獻(xiàn)
[1]陳學(xué)利,李宏毅.現(xiàn)場總線技術(shù)在電力系統(tǒng)中的應(yīng)用綜述[J].科技信息(學(xué)術(shù)研究),2008(25).
[2]中國電機(jī)工程學(xué)會電力系統(tǒng)自動化專業(yè)委員會2006全國電力系統(tǒng)自動化學(xué)術(shù)研討會征文通知[J].電網(wǎng)技術(shù),2006(07).
[3]頓珠.試論電力系統(tǒng)故障及其對繼電保護(hù)裝置的要求[J].硅谷,2010(19).
【關(guān)鍵詞】 空間推理 數(shù)據(jù)查詢 空間分析 信息挖掘
空間推理是根據(jù)地物要素的空間特性,運用合適的推理模型來推斷出新事實的過程。在GIS應(yīng)用中,主要通過要素的拓?fù)潢P(guān)系(鄰接、關(guān)聯(lián)、包含和連通等)和方向(東/西/南/北)約束來反演對象間的空間分布、形狀、方向、距離等空間信息。近年來,空間推理已在地理信息系統(tǒng)、智能導(dǎo)航、機(jī)器人、計算機(jī)視覺等領(lǐng)域引起普遍關(guān)注。
空間推理的研究主要有兩類基本的方法:基于區(qū)域連接的 RCC方法和基于點集的“9-交集”模型。RCC模型由Randell等提出,運用區(qū)域連接演算理論來表達(dá)空間區(qū)域的拓?fù)涮卣骱屯負(fù)潢P(guān)系;“9-交集”模型以實體為基礎(chǔ),對實體的內(nèi)部、邊界和外部區(qū)域做出界定,能夠很好地將兩個空間目標(biāo)的交集是空、點、線或面4種情況區(qū)分開,通過9元組建立空間關(guān)系之間的概念鄰接模型,推導(dǎo)空間關(guān)系的漸變過程,用于反映空間實體的變化過程。
空間推理在GIS中有多方面的利用,從數(shù)據(jù)查詢、空間分析和信息挖掘三方面介紹。
一、數(shù)據(jù)查詢
GIS空間數(shù)據(jù)建模與空間數(shù)據(jù)庫設(shè)計時,既要表達(dá)空間實體,也要表達(dá)空間實體間的空間關(guān)系。而目前的傳統(tǒng)關(guān)系數(shù)據(jù)庫的查詢語言因為只提供了對簡單數(shù)據(jù)類型(如整數(shù)或字符)的相等或排序等操作,不能有效地支持空間查詢。為了解決空間數(shù)據(jù)庫在空間查詢、分析與處理中的應(yīng)用問題,需要空間查詢語言的支持。例如,Arc/Info,Tiger等系統(tǒng)采用關(guān)系表法表達(dá)端點與弧段、弧端與面塊之間的拓?fù)潢P(guān)聯(lián)等空間關(guān)系,通過Macro語言方式將9-元組模型描述的結(jié)果(即:分離、相接、相交、包含/包含于、覆蓋/覆蓋于、相等)加入到查詢命令中,加強了空間數(shù)據(jù)查詢調(diào)取的可用性和高效性,比如查詢長江流經(jīng)的且與湖北省接壤的所有省份的名稱就會變得很簡單。通過空間關(guān)系的定義和應(yīng)用,節(jié)省了大數(shù)據(jù)的存儲空間,也便于進(jìn)行數(shù)據(jù)的一致性檢查、維護(hù)更新和查詢統(tǒng)計。
二、空間分析
空間推理解決了空間分析中模型描述的問題,構(gòu)成了空間分析的基礎(chǔ)。空間分析處理了空間實體間的相互關(guān)系,如點模式識別是在處理點狀目標(biāo)之間的鄰近關(guān)系與分布,疊置分析是處理多個空間目標(biāo)之間的相交、覆蓋等拓?fù)潢P(guān)系。從時空的角度來看,地理空間信息都是隨時間變化的,這種變化不僅僅是空間目標(biāo)的幾何位置 、形狀、大小的變化,也可能包括目標(biāo)間拓?fù)潢P(guān)系的變化。對時空關(guān)系的推理可以定量的分析出不同時間節(jié)點上空間圖形結(jié)構(gòu)的相似性程度,而基于拓?fù)渥儺惡蛶缀巫儺惖姆治隹梢员憩F(xiàn)數(shù)據(jù)的質(zhì)量。
三、信息挖掘
拓?fù)湫畔⒆鳛樽罨镜囊活惪臻g信息,構(gòu)成了空間關(guān)系的基礎(chǔ)。通過空間推理發(fā)現(xiàn)數(shù)據(jù)背后隱藏的規(guī)律,可以更好的為智能化生活和自動化生產(chǎn)服務(wù)。目前空間推理已廣泛應(yīng)用于地理信息系統(tǒng)、機(jī)器人導(dǎo)航、高級視覺、自然語言理解、工程設(shè)計和物理位置的常識推理等方面,并且正在不斷向其他領(lǐng)域滲透。
空間推理的發(fā)展方向是以人類認(rèn)知模式為基礎(chǔ),融合不同的空間關(guān)系描述方法,同時考慮與GIS 的結(jié)合,完善空間關(guān)系理論、增強模型的實用性,建立更符合人類認(rèn)知的空間關(guān)系描述體系,更好地解決實際問題。目前,三維、時空、模糊、層次等拓?fù)潢P(guān)系的形式化描述模型與表達(dá)方法,以及基于空間關(guān)系的認(rèn)知、推理和存取等方面都是空間推理的研究方向。
參 考 文 獻(xiàn)
[1] 陳軍,趙仁亮. GIS空間關(guān)系的基本問題與研究進(jìn)展. 測繪學(xué)報[J]. 1999.28(2):95-102
[2] 廖楚江,杜清運. GIS空間關(guān)系描述模型研究綜述. 測繪標(biāo)準(zhǔn)化[J]. 2004年第4期. 79-82
[3] 蔡少華,翟戰(zhàn)強. GIS基礎(chǔ)空間關(guān)系分析 [J]. 測繪工程,1999,8(2):38242
[4] 寇振華,應(yīng)新洋,周國兵. GIS中拓?fù)潢P(guān)系及空間推理研究. 計算機(jī)應(yīng)用研究[J]. 2005年第5期. 97-99
[5] 劉亞彬,劉大有. 空間推理與地理信息系統(tǒng)綜述 [J]. 軟件學(xué)報,2000,11(12)
[6] 杜世宏等. 不確定區(qū)域間拓?fù)潢P(guān)系定性推理. 測繪學(xué)報[J]. 2005年第4期. 349-354
[7] 孫海濱,李文輝. 基于結(jié)合空間拓?fù)浜头较蜿P(guān)系信息的空間推理. 計算機(jī)研究與發(fā)展[J]. 2006年第2期. 253-259
關(guān)鍵詞: 目標(biāo)跟蹤算法; 目標(biāo)識別; 時空方向能量; 外觀模型; 運動模型
中圖分類號: TN911.73?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2016)13?0041?05
Abstract: To reduce the impact of occlusion on target tracking performance, a target tracking algorithm based on spatiotemporal oriented?energy of adaptive update is proposed. With the algorithm, the moving target is tracked in preliminary according to its appearance model to compute the average motion vector, and then obtain the spatiotemporal oriented?energy feature of the target and construct the motion model. After that the target state is detected according to the motion model and state machine to generate the occlusion mask. For the target with different status and occlusion conditions, the appearance model and motion model of the target are self?adaptively updated by means of different parameters. In the experiment, two testing datasets (CAVIAR and York) commonly used in the world were adopted, and the indexes of average tracking error and multi?object tracking precision were employed to evaluate the tracking performance. The experimental results show that the proposed method has good target tracking performance, especially for strong robustness to target occlusion.
Keywords: target tracking algorithm; target identification; spatiotemporal oriented?energy; appearance model; motion model
0 引 言
運動目標(biāo)跟蹤是計算機(jī)視覺領(lǐng)域的研究熱點,在制導(dǎo)導(dǎo)航、人工智能、視頻監(jiān)控等領(lǐng)域應(yīng)用廣泛[1]。文獻(xiàn)[2]提出的均值漂移(Meanshift)方法是目標(biāo)跟蹤領(lǐng)域的經(jīng)典方法,其基本思想是利用概率密度的梯度爬升尋找局部最優(yōu),通過不斷迭代跟蹤目標(biāo)的最優(yōu)匹配點,實現(xiàn)目標(biāo)跟蹤。然而,該方法對目標(biāo)遮擋和光線變化的魯棒性較弱。如何提高目標(biāo)跟蹤算法對光線變化和目標(biāo)遮擋及姿態(tài)變化的適應(yīng)性是當(dāng)前目標(biāo)跟蹤領(lǐng)域的難題之一。文獻(xiàn)[3]提出了一種基于顏色紋理直方圖的帶權(quán)分塊均值漂移目標(biāo)跟蹤方法,將目標(biāo)劃分為互不重疊的矩形分塊,提取顏色直方圖和局部二元模式特征,執(zhí)行基于背景權(quán)重的Meanshift算法,提高M(jìn)eanshift方法對姿態(tài)變化和部分目標(biāo)遮擋的魯棒性。文獻(xiàn)[4]提出了一種基于SIFT特征和粒子濾波的目標(biāo)跟蹤方法,依據(jù)SIFT特征對光照、尺度以及仿射變換的不變性,提高目標(biāo)跟蹤對光照變化和部分遮擋的魯棒性。文獻(xiàn)[5]提出了一種增量視覺跟蹤(Incremental Visual Tracker,IVT)方法,在目標(biāo)跟蹤過程中,采用增量主成分分析算法自適應(yīng)更新目標(biāo)整體外觀模型,適應(yīng)光照和姿態(tài)變化;在構(gòu)建低維子空間過程中,引入一個遺忘因子,降低新數(shù)據(jù)對子空間構(gòu)建的作用,從而降低短時部分遮擋對目標(biāo)跟蹤性能的影響。該方法對目標(biāo)短時部分遮擋的跟蹤性能較好,但對于全遮擋狀態(tài)的跟蹤結(jié)果并不理想。
針對部分遮擋和全遮擋條件下的目標(biāo)跟蹤難題,本文提出一種基于時空方向能量(Spatiotemporal Oriented Energies,SOE)和模型自適應(yīng)更新的目標(biāo)跟蹤方法。SOE特征可以有效表征視頻中連續(xù)時空方向結(jié)構(gòu)的動態(tài)模式,已被成功用于動態(tài)紋理識別與場景理解、行為識別和視覺跟蹤等計算機(jī)視覺領(lǐng)域[6]。本文將歸一化的SOE特征作為跟蹤線索,檢測遮擋和進(jìn)行跟蹤。在現(xiàn)有基于外觀模型和運動模型進(jìn)行目標(biāo)跟蹤的基礎(chǔ)上,提出了模型的自適應(yīng)更新策略,避免非剛性目標(biāo)在目標(biāo)跟蹤過程中模型受損;另外,本文利用狀態(tài)機(jī)區(qū)分目標(biāo)的遮擋部分和非遮擋部分,便于在跟蹤過程中僅使用非遮擋部分的目標(biāo)數(shù)據(jù),而且還可以區(qū)分目標(biāo)的部分遮擋和全遮擋狀態(tài),從而對不同狀態(tài)采用不同的模型更新和跟蹤策略,提升目標(biāo)跟蹤性能。
1 視頻序列的SOE描述
2 基于SOE的目標(biāo)跟蹤
基于SOE的目標(biāo)跟蹤過程如圖1所示,感興趣目標(biāo)采用外觀和運動兩個模型獨立進(jìn)行描述,外觀模型用于像素跟蹤器計算目標(biāo)運動矢量,運動模型用于檢測遮擋和構(gòu)建遮擋掩膜,并估計目標(biāo)狀態(tài)。跟蹤器基于像素亮度計算整個目標(biāo)的平均運動矢量,由此提取SOE特征對目標(biāo)的時空運動進(jìn)行描述和建模。遮擋檢測和遮擋掩膜用于定位遮擋區(qū)域,在模型更新時阻止遮擋區(qū)域的更新,從而避免目標(biāo)模板的破壞,降低漂移現(xiàn)象對目標(biāo)跟蹤的影響。狀態(tài)機(jī)用于估計跟蹤過程中目標(biāo)的運動狀態(tài),對于不同的運動狀態(tài)采用不同的模型更新策略。目標(biāo)模型在跟蹤過程中自適應(yīng)更新,降低遮擋引起的目標(biāo)丟失或破壞問題。
3 實驗結(jié)果與分析
為了驗證本文方法的目標(biāo)跟蹤性能,選用國際上通用的CAVIAR[10]和York[11]兩個監(jiān)控視頻數(shù)據(jù)庫作為實驗數(shù)據(jù)庫,并與經(jīng)典的Meanshift方法[2]和目前對目標(biāo)短時部分遮擋性能最優(yōu)的IVT方法[5]進(jìn)行實驗對比,從定性和定量兩個層面評價本文方法的跟蹤性能。
3.1 定性評價
限于篇幅,本文僅列舉在York數(shù)據(jù)庫的Pop?Machines視頻中的部分目標(biāo)跟蹤結(jié)果,如圖3所示。由圖可見,三種方法在目標(biāo)未遮擋前的跟蹤結(jié)果基本一致,但目標(biāo)遮擋后,本文方法的跟蹤結(jié)果與目標(biāo)實際位置誤差明顯最小,尤其是目標(biāo)被全部遮擋之后,其他兩種方法跟蹤誤差非常大,而本文仍能保持較小的跟蹤誤差。可見本文提出的目標(biāo)跟蹤方法對目標(biāo)遮擋的魯棒性強。
3.2 定量評價
本文采用目標(biāo)跟蹤領(lǐng)域常用的平均跟蹤誤差和多目標(biāo)跟蹤精確度兩個指標(biāo)來定量評價算法的跟蹤性能[12]。
平均跟蹤誤差(Average Tracking Error,ATE):所有跟蹤目標(biāo)中,跟蹤到的目標(biāo)中心點位置與目標(biāo)中心點實際位置之間的歐氏距離的平均值。值越小性能越好。
4 結(jié) 語
本文提出了一種基于SOE和模型自適應(yīng)更新的目標(biāo)跟蹤方法,可以有效解決部分遮擋和全遮擋條件下的目標(biāo)跟蹤難題。主要設(shè)計思路包括兩個方面:一是在遮擋檢測方面,依據(jù)歸一化的SOE特征檢測遮擋和構(gòu)建遮擋掩膜,結(jié)合狀態(tài)機(jī)的思想?yún)^(qū)分目標(biāo)的不同狀態(tài),便于在跟蹤過程中避免使用遮擋部分的目標(biāo)數(shù)據(jù)引起的漂移現(xiàn)象;二是在模型自適應(yīng)更新方面,對于目標(biāo)的外觀模型和運動模型,結(jié)合遮擋掩膜和目標(biāo)狀態(tài),采用不同的策略進(jìn)行更新,有效避免模型在目標(biāo)跟蹤過程中受損,進(jìn)而提高跟蹤精度。通過在國際上通用的CAVIAR和York兩個公共測試數(shù)據(jù)集上進(jìn)行仿真實驗,證實本文方法對目標(biāo)部分遮擋和全遮擋狀態(tài)都有較小的跟蹤誤差,總體跟蹤性能指標(biāo)優(yōu)于傳統(tǒng)目標(biāo)跟蹤方法。然而,本文方法使用了多個經(jīng)驗參數(shù)和閾值,有可能影響算法對復(fù)雜環(huán)境的適應(yīng)能力,有待后續(xù)深入研究。
參考文獻(xiàn)
[1] 楊威,付耀文,龍建乾,等.基于有限集統(tǒng)計學(xué)理論的目標(biāo)跟蹤技術(shù)研究綜述[J].電子學(xué)報,2012,40(7):1440?1448.
[2] COMANCIU D, RAMESH V, MEER P. Kernel?based object tracking [J]. IEEE transactions on pattern analysis & machine intelligence, 2003, 25(5): 564?575.
[3] 李冠彬,吳賀豐.基于顏色紋理直方圖的帶權(quán)分塊均值漂移目標(biāo)跟蹤算法[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2011,23(12):2059?2066.
[4] 牛長鋒,陳登峰,劉玉樹.基于SIFT特征和粒子濾波的目標(biāo)跟蹤方法[J].機(jī)器人,2010,32(2):241?247.
[5] ROSS D A, LIM J, LIN R S, et al. Incremental learning for robust visual tracking [J]. International journal of computer vision, 2008, 77(1/3): 125?141.
[6] CANNONS K J, WILDES R P. The applicability of spatiotemporal oriented energy features to region tracking [J]. IEEE tran?sactions on pattern analysis & machine intelligence, 2014, 36(4): 784?796.
[7] FREEMAN W T, ADELSON E H. The design and use of stee?rable filters [J]. IEEE transactions on pattern analysis & machine intelligence, 1991, 13(9): 891?906.
[8] DERPANIS K G, WILDES R P. Dynamic texture recognition based on distributions of spacetime oriented structure [C]// Proceedings of 2010 IEEE Conference on Computer Vision and Pattern Recognition. San Francisco: IEEE, 2010: 191?198.
[9] BLACK M J, ANANDAN P. The robust estimation of multiple motions: parametric and piecewise?smooth flow fields [J]. Computer vision & image understanding, 1996, 63(1): 75?104.
[10] Anon. Context aware vision using image?based active recognition [EB/OL]. [2001?06?11]. http://homepages.inf.ed.ac.uk/rbf/CAVIAR/.
【關(guān)鍵詞】視覺測量 數(shù)字圖像處理 開放性實驗
【中圖分類號】G642 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1006-9682(2012)10-0001-03
一、引 言
數(shù)字圖像處理作為一門學(xué)科大約形成于20世紀(jì)60年代初期,并首次在航空航天領(lǐng)域取得了成功應(yīng)用。數(shù)字圖像處理技術(shù)的發(fā)展除了與計算機(jī)技術(shù)、信息技術(shù)的快速發(fā)展密切相關(guān)以外,還得益于其在航空航天、工業(yè)、生物醫(yī)學(xué)、軍事、通信工程、商務(wù)、環(huán)境、林業(yè)等諸多領(lǐng)域的廣泛應(yīng)用,正是這些應(yīng)用需求,促進(jìn)了數(shù)字圖像處理技術(shù)的深入研究和快速發(fā)展?!皵?shù)字圖像處理”課程是隨著計算機(jī)和信息技術(shù)發(fā)展應(yīng)運而生的一門新興課程,已成為信息類專業(yè)本科生的重要專業(yè)課。通過該課程的學(xué)習(xí),要求學(xué)生掌握數(shù)字圖像處理的基本概念和原理,能夠?qū)D像進(jìn)行各種處理,如圖像增強、圖像運算、圖像編碼、邊緣檢測等,為圖像通信、模式識別、計算機(jī)視覺以及其他交叉學(xué)科等工程領(lǐng)域的應(yīng)用奠定基礎(chǔ)。
“數(shù)字圖像處理”課程的理論教學(xué)很抽象,僅僅通過理論教學(xué)學(xué)生很難掌握數(shù)字圖像處理的基本原理。如果把數(shù)字圖像處理的廣泛應(yīng)用引入課堂理論教學(xué),將具體知識點與其在實踐中的使用相結(jié)合,同時為學(xué)生提供邊學(xué)邊實踐的機(jī)會,不僅可以提高學(xué)生的學(xué)習(xí)興趣,加深對抽象理論知識的理解,增強其動手實踐的能力,還可以拓展學(xué)生的視野,與目前學(xué)科前沿技術(shù)相銜接。
二、視覺測量技術(shù)
在現(xiàn)代三維測量新技術(shù)中,視覺測量是由計算機(jī)視覺、圖像處理、模式識別等多學(xué)科交叉結(jié)合而形成的科學(xué)。圖1所示,視覺測量是一種非接觸性測量手段,以數(shù)字圖像作為信息載體,對被測目標(biāo)進(jìn)行成像,通過提取多個像面的二維像點信息,標(biāo)定相機(jī)內(nèi)、外參數(shù),并重建、優(yōu)化被測目標(biāo)的三維信息,實現(xiàn)測量。視覺測量基于嚴(yán)謹(jǐn)?shù)睦碚摵同F(xiàn)代的硬軟件設(shè)施,可以達(dá)到相當(dāng)高的精度和可靠性,便于對大型工件、設(shè)備的尺寸、位置、三維輪廓等進(jìn)行高精度測量,而且移動方便,可快速靈活地構(gòu)建適于不同測量對象的系統(tǒng),進(jìn)行現(xiàn)場測量。目前,視覺測量技術(shù)已經(jīng)廣泛應(yīng)用于建筑工程、航空航天、汽車制造、生物醫(yī)學(xué)、考古等各個領(lǐng)域。[1~5]因此,視覺測量技術(shù)正在深入工業(yè)生產(chǎn)和社會生活的各個領(lǐng)域,研究和應(yīng)用新的基于光學(xué)、數(shù)字圖像和視覺信息融合的三維測量方法,既具有重要的理論意義,又具有重大的實用價值,應(yīng)用前景非常廣闊。
根據(jù)視覺測量的基本原理,利用數(shù)字圖像處理技術(shù)獲取的二維信息是視覺測量中相機(jī)標(biāo)定、三維重建等環(huán)節(jié)的基礎(chǔ),對于系統(tǒng)的測量精度、穩(wěn)定性等方面具有決定性的影響,是視覺測量領(lǐng)域的關(guān)鍵技術(shù)。在長期的數(shù)字圖像處理課程教學(xué)以及視覺測量研究工作中發(fā)現(xiàn),可以將視覺測量中關(guān)于數(shù)字圖像處理的應(yīng)用內(nèi)容引入課堂教學(xué)中,與具體理論知識相結(jié)合,加深學(xué)生對于課程理論的理解,使其接觸到科學(xué)研究的前沿內(nèi)容。此外,通過設(shè)置開放性實驗等環(huán)節(jié),引導(dǎo)有興趣和能力的學(xué)生進(jìn)行實踐能力的培養(yǎng),使學(xué)到的知識“活”起來。
三、視覺測量與數(shù)字圖像處理課程的融合
為了改善數(shù)字圖像處理課程的教學(xué)效果,提高教學(xué)效率,將視覺測量技術(shù)與數(shù)字圖像處理課程相融合,本文主要在教學(xué)方法和教學(xué)手段改革、視覺測量需求與理論知識點結(jié)合、實踐動手能力提高等方面進(jìn)行了研究。
1.教學(xué)方法和教學(xué)手段改革
為了貫徹學(xué)生是教育主體的教育思路,使學(xué)生學(xué)會學(xué)習(xí),并充分激發(fā)學(xué)生的創(chuàng)新能力和素質(zhì)培養(yǎng),促進(jìn)學(xué)生個性的發(fā)展,同時有利于師生彼此促進(jìn)共同進(jìn)步的原則,針對數(shù)字圖像處理課程的特點,采取了以下措施:
(1)重視數(shù)字圖像處理課程的基礎(chǔ)理論教學(xué)。數(shù)字圖像處理內(nèi)容豐富,應(yīng)用靈活廣泛,但學(xué)生在掌握某些具體應(yīng)用技術(shù)時感到理解困難。因此,在實際教學(xué)上,首先需要注重相關(guān)的基礎(chǔ)理論教學(xué)。[6]例如,數(shù)字圖像的本質(zhì)是數(shù)字信號,所以在課程前期階段,專門有針對性地復(fù)習(xí)和講解了信號分析與處理方面的基本理論,包括數(shù)字信號處理的常用方法、離散傅里葉變換和快速傅里葉變換、離散余弦變換等,這些理論在數(shù)字圖像處理課程中有具體應(yīng)用。這不僅有利于對數(shù)字圖像處理內(nèi)容的掌握,也可以反過來加深對相關(guān)理論的理解。另一方面注意授課內(nèi)容的精選,內(nèi)容不在于多,而在于少而精,突出重點,使學(xué)生在有限學(xué)時內(nèi)有最大的收獲。例如,在頻域空間進(jìn)行圖像增強時,不能將頻域空間的所有方法都對學(xué)生講授,而是突出講解了關(guān)于頻域空間與時域空間處理之間的關(guān)系,針對頻域圖像平滑介紹一種低頻濾波器,分析其原理和特點。這樣不僅節(jié)省了教學(xué)時間,而且重點突出,同時也引導(dǎo)學(xué)生查閱其他相關(guān)方法,讓他們自己去動腦思考,提高其思維能力。
(2)完善和改革課堂教學(xué)方法。在課堂教學(xué)過程中,我們始終重視啟發(fā)式教學(xué),遵循“提出問題”、“啟發(fā)式思考”、“解決問題”的教學(xué)過程,使用“問題教學(xué)法”引導(dǎo)學(xué)生去思考、分析問題,激發(fā)學(xué)生學(xué)習(xí)的積極性,提高教學(xué)效果。課堂開始時,根據(jù)授課內(nèi)容,提前向?qū)W生拋出相關(guān)問題,在講課過程中則圍繞該問題講解課程內(nèi)容,最后提出問題的解決方法。例如,在講解“直方圖均衡化圖像增強技術(shù)”一節(jié)內(nèi)容時,首先向?qū)W生展示了兩幅曝光不足和曝光過量的圖片,并且為了提高學(xué)生的學(xué)習(xí)興趣,認(rèn)識數(shù)字圖像處理的實際應(yīng)用,圖片取自于視覺測量、航空交會對接定位等領(lǐng)域的實際圖片,向?qū)W生提問,“如果實際應(yīng)用中,由于環(huán)境光的影響,拍攝到了這樣的圖片,應(yīng)該怎么辦?”課堂講解過程中,隨著直方圖、直方圖增強技術(shù)的理論、直方圖均衡化方法等內(nèi)容的展開,使學(xué)生逐漸理解并掌握直方圖均衡化方法,最后,給學(xué)生演示了直方圖均衡化方法的實現(xiàn),并看到了利用該方法對圖片增強前后的圖片效果。這種啟發(fā)引導(dǎo)式的課堂教學(xué)方法,取得了良好的效果。
(3)傳統(tǒng)和現(xiàn)代化教學(xué)手段相結(jié)合。隨著計算機(jī)、通信技術(shù)應(yīng)用的迅速普及,國內(nèi)高校的課堂教學(xué)已普遍采用了多媒體技術(shù),利用計算機(jī)、投影儀、幻燈機(jī)等現(xiàn)代化教學(xué)設(shè)備,結(jié)合計算機(jī)輔助教學(xué)(CAI)展示教學(xué)內(nèi)容。這些現(xiàn)代化技術(shù)的確為課堂帶來了很多豐富多彩的教學(xué)手段。數(shù)字圖像處理是以圖像為處理對象,其輸出的形式主要以圖像和圖形為主,該課程也十分適宜將教學(xué)內(nèi)容制成課件,采用多媒體計算機(jī)開展現(xiàn)代化教學(xué)。借助多媒體,使學(xué)生較直觀地看到各種圖像的處理需求、處理過程、處理效果等,這是普通教材和參考資料所無法比擬的。因此,我們針對課堂教學(xué)需求,進(jìn)行了多媒體課程教學(xué)資源建設(shè),如教學(xué)大綱、教學(xué)日歷、授課教案和課件等通過多媒體平成,便于講課,同時也便于學(xué)生課后的復(fù)習(xí)。例如,將視覺測量原理、過程等,通過多媒體課件的形式演示出來,相比較口頭介紹等方法具有更加直觀的效果。除了多媒體教學(xué)手段,傳統(tǒng)的板書式教學(xué)作為補充手段也在數(shù)字圖像處理課程中得到應(yīng)用,主要用在課堂教學(xué)內(nèi)容框架展示、理論推導(dǎo)等方面。
2.視覺測量與理論知識點結(jié)合
為了提高算法對于目標(biāo)特征的識別效果,視覺測量通常采用圓形或方形特征點(圖2),在獲取的圖像中對特征的成像位置進(jìn)行識別和精確定位。視覺測量對于圖像處理的要求主要包括圖像預(yù)處理、特征粗定位、特征精定位等內(nèi)容,對應(yīng)數(shù)字圖像處理課程中的圖像增強、邊緣檢測、特征識別、幾何運算等知識點。[7]
圖2 視覺測量常用特征點
(1)圖像預(yù)處理。圖像預(yù)處理的主要方法包括彩色圖像灰度化、圖像增強等,為此,在講解彩色圖像內(nèi)容時,介紹了RGB、HSI等彩色模型以及不同彩色模型之間的轉(zhuǎn)換,并引出如何將彩色信息轉(zhuǎn)換成灰度信息。通過分析彩色表示模型,建立了彩色到灰度圖像的轉(zhuǎn)換。
向?qū)W生展示常用視覺測量圖像效果的基礎(chǔ)上,為了減少圖像噪聲的影響、提高圖像識別效果,提出改善圖像質(zhì)量的目標(biāo),需要進(jìn)行圖像增強。結(jié)合圖像增強中常用的直方圖增強技術(shù)、空域和頻域圖像增強方法在視覺測量圖像處理中的實際應(yīng)用,給學(xué)生展示直觀的處理效果,加深對圖像增強方法的理解。
(2)特征點粗定位。數(shù)字圖像處理的邊緣檢測是該課程比較重要的一部分內(nèi)容,邊緣檢測中包含了多種方法,便于學(xué)生對不同邊緣檢測算法的作用效果有直觀印象,將各種算法應(yīng)用于視覺測量圖像征點的邊緣檢測,并有針對性地選擇相應(yīng)參數(shù),使學(xué)生不僅學(xué)習(xí)了各種邊緣檢測算法的使用,也看到了算法的特點。
根據(jù)視覺成像的特點,圓形特征點成像后一般為橢圓,所以,利用邊緣檢測得到的邊緣像點數(shù)據(jù),講解用邊緣點進(jìn)行指定特征識別的方法,如基于Hough變換的特征檢測方法。為了引導(dǎo)學(xué)生思考,采用啟發(fā)式講課方法,講解了Hough變換檢測直線的方法,引出如何用Hough變換檢測像面上的圓或橢圓,并鼓勵有能力的學(xué)生實現(xiàn)相應(yīng)算法。
(3)特征點精定位。特征點精定位的目的是在實現(xiàn)特征點粗定位的基礎(chǔ)上,對圓形特征點中心在像面上的精確坐標(biāo)進(jìn)行定位。精確定位主要設(shè)計到數(shù)字圖像處理中的點運算,但需要考慮采用的具體定位算法,如灰度重心法、加權(quán)灰度重心法、橢圓擬合法等。引導(dǎo)學(xué)生通過文獻(xiàn)資料查找和實現(xiàn)相關(guān)定位算法,并且與國際領(lǐng)先的專業(yè)軟件進(jìn)行定位精度對比。通過比較,可以使學(xué)生發(fā)現(xiàn)不同算法之間的區(qū)別,并分析不同的原因。進(jìn)一步,引導(dǎo)學(xué)生嘗試對定位算法做一定的改進(jìn),這種改進(jìn),不需要從算法根本上做出很大的創(chuàng)新,只是從某一方面進(jìn)行微小的變化,使其能夠適合特定的應(yīng)用需求。例如,如果對視覺測量像面上特征點定位采用加權(quán)灰度重心法時,通過調(diào)整加權(quán)系數(shù),得到不用的效果,從而分析加權(quán)系數(shù)對于定位精度的影響,并據(jù)此得出適用于該需求的結(jié)論。
四、開放性實驗
長期以來,“數(shù)字圖像處理”課程教學(xué)主要采用課堂理論教學(xué),教學(xué)內(nèi)容也多為經(jīng)典的內(nèi)容,很難反映課程內(nèi)容的時代特征。實驗教學(xué)是高等教育的重要組成部分,是抽象思維與形象思維、傳授知識與訓(xùn)練技能相結(jié)合的過程,在人才培養(yǎng)中具有課堂理論教學(xué)環(huán)節(jié)不可替代的作用,對培養(yǎng)理工科大學(xué)生的創(chuàng)造性是不可缺少的。雖然目前大多數(shù)課程都設(shè)置了實踐環(huán)節(jié),但也普遍存在著很多問題,[8]例如,實驗課成績占課程成績比例小,學(xué)生對實驗的重視度不夠,存在著抄襲他人實驗結(jié)果和報告的現(xiàn)象;實驗?zāi)J絾我唬瑢嶒瀮?nèi)容陳舊、呆板,多為驗證性實驗,缺乏創(chuàng)新性和挑戰(zhàn)性,學(xué)生完全處于被動狀態(tài),最終導(dǎo)致實驗不認(rèn)真,敷衍了事,所學(xué)的知識和操作技術(shù)遺忘快;不能保證每個學(xué)生都有充分的時間和機(jī)會做實驗,個別學(xué)生逐漸養(yǎng)成依賴心理,最終只有一部分學(xué)生得到了鍛煉;理論課與實驗課教學(xué)老師分離,造成理論和實踐環(huán)節(jié)脫節(jié)等。
針對目前“數(shù)字圖像處理”課程實驗的現(xiàn)狀,根據(jù)視覺測量像面特征點定位需求,開設(shè)相關(guān)開放性實驗項目“視覺測量特征點提取定位實驗”,實驗要求學(xué)生結(jié)合數(shù)字圖像處理課程知識理論,對視覺測量采集的數(shù)字圖像進(jìn)行處理,提取相關(guān)特征點。針對視覺測量中常用的特征點(圓形、方形)進(jìn)行自動檢測,并實現(xiàn)高精度定位,主要實驗內(nèi)容包括:圖像預(yù)處理、特征點粗定位、特征點精定位、算法設(shè)計與實現(xiàn)、實驗結(jié)果分析等。
教師在開放性實驗項目中承擔(dān)的角色主要是方案設(shè)計和實施過程中的指導(dǎo)、監(jiān)督,對方案的具體實現(xiàn)方法不做限制性要求,主要由學(xué)生結(jié)合課堂教學(xué)內(nèi)容以及查閱文獻(xiàn)資料來設(shè)計并完成。為了提高項目完成的效率,教師可以通過適當(dāng)?shù)囊龑?dǎo)為學(xué)生指出主要方向。
對于單個學(xué)生來說,這樣的實驗項目有些困難,“團(tuán)隊合作”也是新時期對科技人才素質(zhì)的要求,所以可以通過建立項目小組的方式開展實驗。小組成員將實驗內(nèi)容進(jìn)行分工,每人負(fù)責(zé)不同的部分,通過相互合作、幫助,完成整個實驗項目。通過這種形式,也在某種程度上鍛煉了學(xué)生的團(tuán)隊合作意識和合作方法。
五、結(jié)束語
通過將視覺測量領(lǐng)域研究成果引入“數(shù)字圖像處理”課程,并在教學(xué)方法、教學(xué)手段、教學(xué)內(nèi)容、開放性實踐等方面的改革和嘗試,逐步做到科學(xué)研究成果與課堂理論教學(xué)的有機(jī)結(jié)合,不僅豐富了課程的教學(xué)內(nèi)容,提高了學(xué)生的學(xué)習(xí)興趣,加深了對理論知識的理解,而且使學(xué)生接觸到科學(xué)研究的前沿領(lǐng)域,開拓了視野,對創(chuàng)新能力的培養(yǎng)鍛煉等方面也具有重要意義。
參考文獻(xiàn)
1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme
-try[M]. New York: John Wiley & Sons,2001
2 胡安文、季錚、盛慶紅.基于近景數(shù)字視覺測量的飛機(jī)表面模型重建[J].地理空間信息,2004(6):23~25
3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006
4 劉常杰、邾繼貴、葉聲華.汽車白車身機(jī)器視覺檢測系統(tǒng)[J].汽車工程,2000(6):373~376
5 彭三城、孫星明、劉國華.三維人體自動測量技術(shù)綜述[J].計算機(jī)應(yīng)用研究,2005(4):1~5
6 Wang Jun, Dong Mingli, Liang Bo. A fast target location method for the photogrammetry system[C].Proc. of SPIE-ISMCM, Beijing,2011