前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)視覺的展望主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:計算機(jī)圖形學(xué);計算機(jī)視覺;可視化技術(shù)
中圖分類號:TM862 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-2064(2017)01-0054-02
計算機(jī)圖形學(xué)、計算機(jī)視覺以及可視化技術(shù)三者均是計算機(jī)領(lǐng)域重要組成部分,要做好計算機(jī)知識,就要先學(xué)好計算機(jī)圖形學(xué),但計算機(jī)圖形學(xué)學(xué)習(xí)相對枯燥,尤其是算法教學(xué)難以理解,為解決這一問題,計算機(jī)視覺與可視化技術(shù)被應(yīng)用到計算機(jī)圖形學(xué)中。可見,三者之間存在一定的聯(lián)系,因此,有必要對計算機(jī)圖形學(xué)、計算機(jī)視覺以及可視化技術(shù)展開研究。
1 計算機(jī)圖形學(xué)概述
1.1 計算機(jī)圖形學(xué)目的
所謂的計算機(jī)圖形學(xué)實際上就是怎樣利用計算機(jī)表示圖形,并利用計算機(jī)完成圖形計算與處理,而這一過程的實現(xiàn)需要得到相關(guān)算法的支持。學(xué)習(xí)計算機(jī)圖形學(xué)的目的是利用計算機(jī)技術(shù)為人們呈現(xiàn)既帶有美感又不缺真實的圖形(如下圖1所示),為實現(xiàn)這一目標(biāo),就需要按照圖形的要求創(chuàng)設(shè)合適的場景,并在一些光照模型的作用下,做好光照效果設(shè)計,在這一過程中需要計算機(jī)圖形學(xué)能夠與其他計算機(jī)技術(shù)相配合。經(jīng)過計算機(jī)圖形學(xué)出來的圖像,多會以數(shù)字圖像的方式展示出來,總的來說,計算機(jī)圖形學(xué)與圖像處理之間存在著一定的聯(lián)系[1]。計算機(jī)圖形學(xué)的涉及范圍相對寬泛,不僅有圖形硬件設(shè)計,還包括動畫制作,虛擬現(xiàn)實等多個部分。此外,計算機(jī)圖形學(xué)在動畫制作中的應(yīng)用頻率也很高,如45分鐘一集的動畫影片中,85%的畫面都需要用算機(jī)圖形學(xué)來完成,由此可見,計算機(jī)圖形學(xué)的應(yīng)用頻率極高,并在動畫制作中發(fā)揮著不可替代的作用。因此,應(yīng)重視計算機(jī)圖形學(xué)的應(yīng)用。
1.2 計算機(jī)圖形學(xué)應(yīng)用
隨著計算機(jī)圖形學(xué)的發(fā)展,它被應(yīng)用到各個領(lǐng)域中,并發(fā)揮著重要作用。首先,在計算機(jī)輔助設(shè)計與制造中的應(yīng)用,這是計算機(jī)圖形學(xué)應(yīng)用最多的領(lǐng)域,在計算機(jī)圖形學(xué)被應(yīng)用以后,不僅可以設(shè)計出更精準(zhǔn)的圖形,還能做好人機(jī)交互設(shè)計,強(qiáng)化修改能力。計算機(jī)圖形學(xué)還被應(yīng)用到三維形體重建中,利用該技術(shù)可以將原理的二維信息轉(zhuǎn)化為三維信息,如在某次工程圖紙設(shè)計中就應(yīng)用了計算機(jī)圖形學(xué),經(jīng)過一系列的處理以后,三維形體逐漸形成,最終實現(xiàn)了重建。其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。計算機(jī)圖形學(xué)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用多以計算可視化的形式展示出來,如在腦部手術(shù)中,醫(yī)生為看清患處真實情況,經(jīng)常需要利用在可視化技術(shù)的作用下將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像,這時就體現(xiàn)了計算機(jī)圖形學(xué)在其中的應(yīng)用[2]。再者,在計算機(jī)動畫中的應(yīng)用,人們看到的動畫影片就是計算機(jī)圖形學(xué)作用的結(jié)果,以動畫人物的行走為例,為保證動畫人物的行走與自然人不存在過大差異,就需要應(yīng)用大量的計算機(jī)技術(shù),并在計算機(jī)圖形學(xué)的作用下完成設(shè)計。最后,在計算機(jī)藝術(shù)中的應(yīng)用。計算機(jī)圖形學(xué)在計算機(jī)藝術(shù)中也有廣泛應(yīng)用,它不僅可以用于藝術(shù)制作,很多場景都是通過計算機(jī)圖形學(xué)來完成的,現(xiàn)階段,一些人正在利用計算機(jī)圖形學(xué)創(chuàng)設(shè)人體模擬系統(tǒng),其目的是讓已故人士再次出現(xiàn)在熒屏上,這一目標(biāo)的實現(xiàn)就需要得到計算機(jī)圖形學(xué)的支持。
2 計算機(jī)視覺技術(shù)
2.1 計算機(jī)視覺技術(shù)含義
所謂的計算機(jī)視覺技術(shù),實際上就是用計算機(jī)取代人眼做識別、跟蹤以及測量等,同時也兼顧圖形處理,其目的是讓圖像在計算機(jī)被處理以后更適于識別。對于計算機(jī)視覺技術(shù)來說,意在實現(xiàn)人工智能,主要是從圖像與多維數(shù)據(jù)等方面實現(xiàn)人工智能系統(tǒng)設(shè)計[3]。計算機(jī)視覺是一種在相關(guān)理論與模型基礎(chǔ)上發(fā)展起來的視覺系統(tǒng),其主要構(gòu)成部分有以下幾種:
(1)程序控制,這一點主要體現(xiàn)在機(jī)器人設(shè)計上;(2)事件檢測,多體現(xiàn)在圖像監(jiān)測上;(3)信息組織,主要體現(xiàn)在圖像數(shù)據(jù)庫等方面。計算機(jī)視覺三個階段如圖2所示,通過觀察圖1可以發(fā)現(xiàn),計算機(jī)視覺存在于圖像處理始終,從早期處理直到后期結(jié)束都存在,最終實現(xiàn)了3D描述,可見,計算機(jī)視覺具有十分重要的作用[4]。
2.2 計算機(jī)視覺技術(shù)的應(yīng)用
現(xiàn)階段,現(xiàn)代社會已經(jīng)進(jìn)入信息化時代,計算機(jī)技術(shù)也被應(yīng)用到各個領(lǐng)域,并發(fā)揮著重要作用。計算機(jī)視覺的應(yīng)用促使計算機(jī)實現(xiàn)了智能化,在該技術(shù)的支持下,計算機(jī)可以像人一樣透過視覺看待世界萬物,且具有良好的適應(yīng)能力,但這一目標(biāo)的實現(xiàn)還需要很長時間,需要一系列的努力才能實現(xiàn)?,F(xiàn)階段,計算機(jī)視覺應(yīng)用最多的就是車輛視覺導(dǎo)航,然而,這種導(dǎo)航還沒有實現(xiàn)完全自主導(dǎo)航,這也是需要進(jìn)一步研究的地方。計算機(jī)視覺技術(shù)的適應(yīng)性較好,特別適合在工業(yè)領(lǐng)域應(yīng)用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運(yùn)行,其整體效果也不會受到影響,再者,計算機(jī)視覺技術(shù)的嵌入性較好,成本相對較低,尤其適合在PC方案中使用,同時,具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來說,計算機(jī)視覺技術(shù)總體效果較好,適合利用在各種工業(yè)環(huán)境中應(yīng)用,因此,應(yīng)重視計算機(jī)視覺技術(shù)的應(yīng)用[5]。同時計算機(jī)視覺還被應(yīng)用到移動機(jī)器人設(shè)計中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進(jìn)而了解到人的存在。同樣,將計算機(jī)視覺應(yīng)用到機(jī)器人設(shè)計上,可以自動檢測出正在行動的人或車輛,而無法檢測到靜止的人,之所以會出現(xiàn)這樣情況,主要是由于其中采用率步態(tài)分析法。
3 可視化技術(shù)
3.1 可視化技術(shù)含義
可視化技術(shù)是一種綜合了計算機(jī)圖形學(xué)與圖像處理于一體的技術(shù),它可以將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像并在屏幕上展示出來。在可視化技術(shù)中,融合了以上兩種技術(shù)的特點,并在多個領(lǐng)域都有應(yīng)用,隨著可視化技術(shù)的應(yīng)用,不僅有效實現(xiàn)了數(shù)據(jù)表示,還強(qiáng)化了數(shù)據(jù)處理能力,更對數(shù)據(jù)決策分析有一定作用[6]?,F(xiàn)階段,虛擬現(xiàn)實技術(shù)已經(jīng)成為可視化技術(shù)主要發(fā)展方向。
3.2 可視化技術(shù)的應(yīng)用
首先,在計算機(jī)圖形學(xué)教學(xué)中的應(yīng)用,計算機(jī)圖形學(xué)相對枯燥,相關(guān)知識也很抽象,不便于學(xué)生理解,在計算機(jī)圖形學(xué)中最重要的部分是曲線曲面,而這些曲線曲面多是與數(shù)學(xué)模型有關(guān),具有一定的抽象性,學(xué)生理解難度較大,以往教師只能通過一系列的公式演算幫助學(xué)生理解,盡管這樣依然難以讓學(xué)生掌握曲線變化情況,學(xué)生依舊無法正確理解。為減少這種情況的發(fā)生,可視化技術(shù)被應(yīng)用到計算機(jī)圖形學(xué)教學(xué)中,教師將抽象的知識用動畫的形式展示出來,學(xué)生只要觀看動畫,拖動一定的控制點就可以了解到曲線變化情況,這樣一來不僅增加了教學(xué)趣味性,學(xué)生也可以隨意變動曲線,讓復(fù)雜的知識變得簡單,深化學(xué)生對計算機(jī)圖形學(xué)知識的深度理解,同時,利用可視化技術(shù)在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強(qiáng)學(xué)生的理解能力[7]。
其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。醫(yī)學(xué)領(lǐng)域?qū)τ诳梢暬夹g(shù)的應(yīng)用主要體現(xiàn)在放射治療與矯正手術(shù)上。通過可視化技術(shù)可以屏幕上看到手術(shù)整個過程,并將原來細(xì)節(jié)部位放大,手術(shù)醫(yī)生觀察的更加細(xì)致,手術(shù)成功幾率也會大幅度提升,患者生命也能得到保證(如圖3所示)。如在對某名患者進(jìn)行身體檢查的過程中需要應(yīng)用到可視化技術(shù),由于通過檢查會獲得大量數(shù)據(jù),而這些數(shù)據(jù)又相對復(fù)雜,但在可視化技術(shù)下就可以通過圖表、曲線圖或立柱圖的方式展示出來,經(jīng)過可視化技術(shù)的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數(shù)據(jù)做出診斷,而不必再分析這些數(shù)據(jù)。據(jù)不完全統(tǒng)計,80%的醫(yī)療檢查工作都是需要利用可視化技術(shù)。
地質(zhì)勘探是我國最重要的工作之一,由于多數(shù)礦藏都深埋地下,即便使用探測儀受多種因素影響也無法了解到實際礦藏情況,這就需要應(yīng)用到可視化技術(shù),在可視化技術(shù)的作用下,相關(guān)工作人員可以了解到地下有無礦藏,如果存在礦藏,相關(guān)工作人員也可以了解到礦藏所在位置與實際儲備量,進(jìn)而為礦藏開采奠定基礎(chǔ)。如在地質(zhì)勘探中,相關(guān)工作人員利用可視化技術(shù)做地形圖整理,然后從中提取地形數(shù)據(jù),再用CATIA做導(dǎo)入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質(zhì)模型創(chuàng)建工作,同時在相關(guān)工作臺的影響下,還可以完成地形數(shù)據(jù)導(dǎo)入,進(jìn)而生成一定的地形云點,如果其中存在錯誤,可視化技術(shù)也可以將其中的錯誤內(nèi)容刪除,這些都是可視化技術(shù)所帶來的好處[8]。由此可見,可視化技術(shù)已經(jīng)成為地質(zhì)勘探中不缺少的技術(shù)。
最后,在氣象預(yù)報中的應(yīng)用(如圖4所示)。利用可視化技術(shù)能夠?qū)?shù)據(jù)轉(zhuǎn)化為圖像,通過觀察圖像就可以了解到云層變化情況,同時也能了解到實際風(fēng)力大小與風(fēng)走向等,氣象預(yù)報人員就可以根據(jù)圖像做出精準(zhǔn)分析,需要了解氣象變化的人也能了解到現(xiàn)實情況,如果氣象條件惡劣,相關(guān)工作人員也可以及時做出工作調(diào)整,減少危險事件的發(fā)生。據(jù)不完全統(tǒng)計,可視化技術(shù)在氣象預(yù)報中的應(yīng)用頻率高達(dá)100%,由此挽回的經(jīng)濟(jì)損失高達(dá)13.2億元,可見,可視化技術(shù)在氣象預(yù)報中的應(yīng)用十分有必要,因此,應(yīng)重視可視化技術(shù)在氣象預(yù)報中的應(yīng)用。
4 結(jié)語
通過以上研究得知,計算機(jī)圖形學(xué)、計算機(jī)視覺以及可視化技術(shù)三者各具特色,三者間也存在一定的關(guān)系,尤其是可視化技術(shù)綜合了前兩者的特點,并融合了其他技術(shù),在很多領(lǐng)域中都有應(yīng)用。可視化技術(shù)是現(xiàn)階段應(yīng)用最多的一種技術(shù),在計算機(jī)圖形學(xué)教學(xué)中也有應(yīng)用,并發(fā)揮著不可替代的作用。本文分析了計算機(jī)圖形學(xué)、計算機(jī)視覺以及可視化技術(shù)的含義與應(yīng)用,希望能為相關(guān)人士帶來有效參考,正確利用這些技術(shù)。
參考文獻(xiàn):
[1]陳敏雅,金旭東.淺談計算機(jī)圖形學(xué)與圖形圖像處理技術(shù)[J].長春理工大學(xué)學(xué)報,2011(01):138-139+146.
[2]柳海蘭.淺談計算機(jī)圖形學(xué)的發(fā)展及應(yīng)用[J].電腦知識與技術(shù),2010(33):9551-9552.
[3]滑瑞朋.計算機(jī)圖形學(xué)的應(yīng)用及研究[J].山西科技,2012(05):37-38+45.
[4]劉濤,仲曉春,孫成明,郭文善,陳瑛瑛,孫娟.基于計算機(jī)視覺的水稻葉部病害識別研究[J].中國農(nóng)業(yè)科學(xué),2014(04):664-674.
[5]關(guān)然,徐向民,羅雅愉,苗捷,裘索.基于計算機(jī)視覺的手勢檢測識別技術(shù)[J].計算機(jī)應(yīng)用與軟件,2013(01):155-159+164.
[6]許志杰,王晶,劉穎,范九倫.計算機(jī)視覺核心技術(shù)現(xiàn)狀與展望[J].西安郵電學(xué)院學(xué)報,2012(06):1-8.
關(guān)鍵詞:果品;無損檢測;品質(zhì)
我國水果產(chǎn)量居世界第一,果品出口成為我國外貿(mào)的重要組成部分。但是我國大多數(shù)農(nóng)產(chǎn)品國際市場競爭力弱,出口價格低廉。其中品質(zhì)因素是重要原因之一,這是由于檢測技術(shù)、評判標(biāo)準(zhǔn)等限制,所以對果品進(jìn)行合適的品質(zhì)檢測對提高經(jīng)濟(jì)效益和市場競爭力具有重要意義。對農(nóng)產(chǎn)品品質(zhì)的無損檢測,已引起國內(nèi)外廣泛關(guān)注。
所謂無損檢測,又稱非破壞檢測,是不破壞被檢對象卻能評價其品質(zhì)的方法。它利用自身力學(xué)、光學(xué)、電學(xué)及聲學(xué)等物理性質(zhì)對評價對象品質(zhì)進(jìn)行非破壞檢測,并按照一定標(biāo)準(zhǔn)進(jìn)行分級分選的新興技術(shù),廣泛應(yīng)用于工業(yè)和農(nóng)業(yè)。農(nóng)業(yè)中的無損檢測技術(shù)是利用農(nóng)產(chǎn)品的物理性質(zhì)如光學(xué)性質(zhì)、聲學(xué)性質(zhì)、電磁學(xué)性質(zhì)和熱學(xué)性質(zhì)等的變化而實現(xiàn)。目前,無損檢測技術(shù)主要包括:近紅外技術(shù)、聲學(xué)檢測技術(shù)、軟X射線技術(shù)、計算機(jī)視覺技術(shù)、核磁共振檢測技術(shù)、力學(xué)特性檢測技術(shù)等。
1.果品無損檢測技術(shù)
1.1新型可見、近紅外光譜無損檢測技術(shù)
可見、近紅外光譜法是農(nóng)產(chǎn)品內(nèi)部成分無損檢測的有效方法,是利用農(nóng)產(chǎn)品吸收、散射、反射和透射光的特性,進(jìn)而確定內(nèi)部成分的方法。近紅外分析技術(shù)作為一種高新分析技術(shù),能改造我國傳統(tǒng)農(nóng)業(yè),提高農(nóng)產(chǎn)品質(zhì)量,尤其是農(nóng)產(chǎn)品加工的質(zhì)量控制,將產(chǎn)生巨大作用。為改造我國的傳統(tǒng)行業(yè),企業(yè)迫切需要對原料進(jìn)行質(zhì)量監(jiān)測、生產(chǎn)過程監(jiān)控的設(shè)備和技術(shù)。國際經(jīng)驗來看,近紅外技術(shù)是首選。
韓東海等[1]利用柑橘正常及損傷部位在紫外光源下的差異發(fā)射性,可有效確定柑橘損傷果。Slaugther DC[2]鑒于近紅外和可見光的分光光度技術(shù),建立完好的桃及油桃內(nèi)部品質(zhì)的無損關(guān)系式,能夠預(yù)測完好無損的桃與油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通過研究近紅外光譜和可見光譜對紅玉蘋果質(zhì)量的無損測量,進(jìn)而得到雙叉光纖記錄的反射光譜與蘋果參數(shù)之間的關(guān)系。Ali Moghimi[4]等用近紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)建立獼猴桃SSC和pH的校正模型,比較多元散射校正、變量標(biāo)準(zhǔn)化、中值濾波和一階導(dǎo)數(shù)光譜預(yù)處理對所建獼猴桃SSC和pH校正模型的影響,表明變量標(biāo)準(zhǔn)化結(jié)合中值濾波和一階倒數(shù)預(yù)處理光譜后,用PCR-PLS法建立的SSC和pH的校正模型精度較高。
目前,分光檢測技術(shù)在果蔬品質(zhì)檢測中的應(yīng)用廣泛,因為這種方法具有適應(yīng)性強(qiáng)、高檢測靈敏度、人體無害性、靈活使用性、成本低廉和自動化易實現(xiàn)性等優(yōu)勢。利用這種技術(shù)能自動分級果品,而合理的分級標(biāo)準(zhǔn),便于果品深加工和遠(yuǎn)銷售。近紅外光譜的研究雖起步較晚,但是其應(yīng)用廣,特別是在農(nóng)產(chǎn)品的品質(zhì)檢測和分級領(lǐng)域取得較大的進(jìn)展,開發(fā)應(yīng)用前景廣闊。
1.2聲學(xué)無損檢測技術(shù)
聲學(xué)無損檢測技術(shù)是利用果品聲學(xué)特性與內(nèi)部組織變化的關(guān)系,例如結(jié)構(gòu)、成分、物理狀態(tài)等物化特性信息來檢測果品品質(zhì)。聲學(xué)特性是指在聲波作用下農(nóng)產(chǎn)品的反射、散射和吸收特性、衰減系數(shù)和傳播速度及其本身的聲阻抗與固有頻率等,它們均反映聲波與農(nóng)產(chǎn)品相互作用的規(guī)律,這些特性隨農(nóng)產(chǎn)品內(nèi)部組織變化而變化。一般使用低能超聲波來檢測,因為低能超聲波在被檢測物中傳播不會引起物理或化學(xué)特性變化。超聲方法檢測果品品質(zhì)始于近年,國內(nèi)外研究集中針對水果成熟度、硬度和內(nèi)部質(zhì)量缺陷等無損檢測。
與光學(xué)、電學(xué)及其他無損檢測技術(shù)相比,聲學(xué)無損檢測技術(shù)具有適應(yīng)性強(qiáng)、投資較低、操作簡便快捷等有死,特別適用于在線檢測,在農(nóng)產(chǎn)品檢測領(lǐng)域應(yīng)用前景良好[5]。
1.3軟X射線技術(shù)
適用性極強(qiáng)的X射線成像能夠與圖像識別、人工智能、現(xiàn)代通信技術(shù)等相聯(lián)系。若待檢測物體的密度和厚度不同,則不同的透射X射線量產(chǎn)生。鑒于分析穿透量,進(jìn)而判斷果品內(nèi)部品質(zhì)。軟X射線擁有巨大優(yōu)勢,特別是在農(nóng)產(chǎn)品的內(nèi)部品質(zhì)檢測上,因軟X射線具有穿透物料的特性,所以檢測那種易損壞的農(nóng)產(chǎn)品,能無損檢測內(nèi)部的品質(zhì)。所需X射線強(qiáng)度方面,農(nóng)產(chǎn)品檢測弱于工業(yè),所以稱為低能X射線或軟X射線。這種X射線成像技術(shù)來檢測農(nóng)產(chǎn)品內(nèi)部品質(zhì)方法已經(jīng)受到研究者關(guān)注,例如基于X射線成像技術(shù)的檢測核桃果核與果肉厚度,基于X射線圖像的評價牛肉嫩度,以及評價紅毛丹內(nèi)部品質(zhì)等。韓東海[6]用X射線來檢測柑橘皺皮果,結(jié)果表明射線與激光分析法在果實品質(zhì)檢測中的可行性。然而目前國內(nèi)此方面的技術(shù)開發(fā)較落后,期待學(xué)者們進(jìn)一步的研究和探索。
1.4計算機(jī)視覺技術(shù)
伴隨專業(yè)化的圖像處理技術(shù)以及下降的計算機(jī)硬件成本和高速度特性,計算機(jī)視覺技術(shù)對農(nóng)產(chǎn)品品質(zhì)自動識別和分級的應(yīng)用日益廣泛。計算機(jī)視覺技術(shù)即以各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,借助于計算機(jī)替代大腦完成處理和解釋。計算機(jī)視覺的最終研究目標(biāo)是使計算機(jī)可以像人一樣,通過視覺觀察來理解世界,具有自主適應(yīng)環(huán)境的能力。
基于機(jī)器視覺的果品無損檢測的技術(shù),一般是借助于CCD攝像頭獲取果品圖像,圖像信息輸入計算機(jī),進(jìn)而應(yīng)用檢測方法和算法得到果品在大小、缺陷、外部損傷、內(nèi)部品質(zhì)等方面的特質(zhì)值,從而來分級果品[7]。這種方法通常是由CCD攝像頭、配備圖像采集卡的計算機(jī)、光照系統(tǒng)和專用圖像處理軟件組成。在一定光源照射情況下,利用CCD攝像頭得到水果形狀、顏色、缺陷等視覺方面的圖像信息,憑借圖像采集卡轉(zhuǎn)換為數(shù)字信號傳輸?shù)诫娔X,分隔圖像、提取特征值,從而得到特征值參數(shù)和水果顏色、質(zhì)量狀況、破損程度等品質(zhì)指標(biāo)間模型關(guān)系,進(jìn)而確定內(nèi)外品質(zhì)等級。這種方法快速、準(zhǔn)確、無損,使用一次能同時檢測多項品質(zhì)指標(biāo),方便設(shè)計自動分級流水線,自動識別水果外在品質(zhì)(外形、缺陷、顏色、大小等)和內(nèi)在品質(zhì)(成熟度、堅實度、含糖量、含水率等),因此具有廣闊的應(yīng)用前景[8]。
我國利用計算機(jī)視覺系統(tǒng),檢測農(nóng)產(chǎn)品品質(zhì)和分類農(nóng)產(chǎn)品的研究方法開展較晚,始于20世紀(jì)90年代,但逐漸受到重視。與國際先進(jìn)水平相比,在農(nóng)業(yè)領(lǐng)域的應(yīng)用我國計算機(jī)視覺技術(shù)研究具有一定程度的差距,我國目前處于實驗研究以及理論探索階段,實用化和商品化的程度還未達(dá)到。這項項目基于數(shù)碼攝像技術(shù),通過電腦直接處理圖像信息,其研發(fā)促使使我國獲得最快速、最便利的視覺技術(shù)。
1.5核磁共振檢測技術(shù)
1946年,核磁共振現(xiàn)象由美國科學(xué)家F.Bloch和E.M.Purcell發(fā)現(xiàn),這一技術(shù)廣泛應(yīng)用于研究物質(zhì)結(jié)構(gòu)。核磁共振可以便利地生成果實內(nèi)部組織結(jié)構(gòu)的高清圖像。方便檢測果品壓傷、蟲害以及成熟度,因此在檢測蘋果、香蕉糖度等方面潛在價值極高。而那些因采收成熟度而影響品質(zhì)的品種,鑒于核磁共振技術(shù),能提高收獲和運(yùn)輸可靠性?,F(xiàn)階段,這種技術(shù)要想真正應(yīng)用于果品檢測和評價果品質(zhì)量,還存在諸多問題,然而其優(yōu)勢明顯,這種技術(shù)無疑是一種良好的果品無損檢測方法[9]。
1.6力學(xué)特性檢測技術(shù)
基于動力學(xué)原理測度農(nóng)產(chǎn)品硬度的檢測方法是力學(xué)特性檢測技術(shù)。采用振動頻率分析法以及沖擊力檢測法,檢測果品堅實度來判斷果實成熟度。力學(xué)特性檢測技術(shù)方便判斷果品的采收期,依照成熟度分級、貯藏果品,確定果品的保鮮期和貯存期。盡管這種技術(shù)具有較為堅實的實踐應(yīng)用基礎(chǔ)及歷史,但介于果品品質(zhì)和物理參數(shù)間的復(fù)雜關(guān)系,實際應(yīng)用是一個漫長的研究過程[10]。
關(guān)鍵詞:深度學(xué)習(xí);行為識別;神經(jīng)網(wǎng)絡(luò)
1 概述
動作行為識別是計算機(jī)視覺領(lǐng)域中的一個研究熱點,已經(jīng)廣泛應(yīng)用于智能監(jiān)控、人機(jī)交互、視頻檢索等領(lǐng)域中[1]。動作行為識別技術(shù)是通過對視頻或者圖像中人體動作行為做出有意義的判斷。有效表達(dá)圖像(視頻)中的實際目標(biāo)和場景內(nèi)容是最基本,最核心的問題。因此,對于特征的構(gòu)建和選擇得到廣泛關(guān)注,例如STIP、SIFT、MSER等。但是,能通過無監(jiān)督方式讓機(jī)器自動從樣本中學(xué)習(xí)到表征樣本的特征,會讓人們更好地利用計算機(jī)來實現(xiàn)人的視覺功能。而深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的延伸和發(fā)展,是通過逐層構(gòu)建一個多層網(wǎng)絡(luò)來使得機(jī)器自動學(xué)習(xí)到隱含在數(shù)據(jù)內(nèi)部的關(guān)系,從而讓學(xué)習(xí)到的特征更加準(zhǔn)確性。
文章旨在探討深度學(xué)習(xí)與機(jī)器學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))之間的關(guān)系,并且介紹深度學(xué)習(xí)的由來、概念和原理;同時介紹目前深度學(xué)習(xí)在計算機(jī)視覺中的應(yīng)用。最后提出深度學(xué)習(xí)目前發(fā)展所面臨的問題,以及對未來的展望。
2 深度學(xué)習(xí)
2.1 深度學(xué)習(xí)概述
深度學(xué)習(xí)源于人工神經(jīng)網(wǎng)絡(luò)的研究,是機(jī)器學(xué)習(xí)的拓展。深度學(xué)習(xí)是經(jīng)過組合低層特征來形成更加抽象的屬性類別和特征,從中發(fā)現(xiàn)原始數(shù)據(jù)的特征表征[2]?,F(xiàn)在用于動作行為識別的技術(shù)是通過“動作表征”+“動作分類器”的框架來進(jìn)行行為識別的。其中“動作表征”是人們手動設(shè)計特征獲取到的,也就是在目前識別框架內(nèi)存在一個對動作圖像(視頻)的預(yù)處理過程。
深度學(xué)習(xí)和淺層學(xué)習(xí)相對。目前許多學(xué)習(xí)算法是淺層網(wǎng)絡(luò)學(xué)習(xí)方法,具有一定的局限性,例如在樣本有限的狀況下,表示復(fù)雜函數(shù)的能力有限制,且對復(fù)雜分類問題的泛化能力也會受到一定約束[3]。而深度學(xué)習(xí)通過學(xué)習(xí)深層非線性網(wǎng)絡(luò)結(jié)構(gòu),達(dá)到復(fù)雜函數(shù)逼近,又能在樣本少的情況下學(xué)習(xí)原始數(shù)據(jù)的特征。BP算法作為傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的典型算法,雖然訓(xùn)練多層網(wǎng)絡(luò),但僅含幾層網(wǎng)絡(luò),訓(xùn)練方法很不理想[3]。因為其輸入和輸出間非線性映射讓網(wǎng)絡(luò)誤差函數(shù)形成含多個極小點的非線性空間,因而經(jīng)常收斂到局部最小,且隨著網(wǎng)絡(luò)層數(shù)的增加,容易過擬合。而深度學(xué)習(xí)可以獲得分布式表示,通過逐層學(xué)習(xí)算法來得到原始輸入數(shù)據(jù)的主要變量。通過深度學(xué)習(xí)的非監(jiān)督訓(xùn)練完成,同時利用生成性訓(xùn)練避免因函數(shù)表達(dá)能力過強(qiáng)而出現(xiàn)過擬合情況。
2.2 深度學(xué)習(xí)原理
傳統(tǒng)機(jī)器學(xué)習(xí)僅含單層非線性變換的淺層網(wǎng)絡(luò)結(jié)構(gòu),而且淺層模型單一。這對于深度網(wǎng)絡(luò)來說易造成陷入最優(yōu)或產(chǎn)生梯度分散等問題。因此,Hinton等人在基于深度置信網(wǎng)(DBNs)的情況下提出非監(jiān)督貪婪逐層訓(xùn)練算法,隨后提出了多層次自動編碼器深層結(jié)構(gòu),這給解決深層網(wǎng)絡(luò)結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來了希望。此外Lecun等人提出的卷積神經(jīng)網(wǎng)絡(luò)是第一個多層次結(jié)構(gòu)的學(xué)習(xí)算法。同時深度學(xué)習(xí)還出現(xiàn)了許多結(jié)構(gòu):多層感知機(jī)、去噪自動編碼器、稀疏編碼等。
卷積神經(jīng)網(wǎng)絡(luò)是第一個真正采用多層次網(wǎng)絡(luò)結(jié)構(gòu),具有魯棒性的深度學(xué)習(xí)算法,通過探究數(shù)據(jù)在空間上的相關(guān)性,減少訓(xùn)練參數(shù)的數(shù)量。而且卷積神經(jīng)網(wǎng)絡(luò)(CNN)適應(yīng)性強(qiáng),善于發(fā)現(xiàn)數(shù)據(jù)的局部特征。它的權(quán)重共享結(jié)構(gòu)降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量,使得卷積神經(jīng)網(wǎng)絡(luò)在模式識別中取得了很好的結(jié)果。
自動編碼器的核心關(guān)鍵是將原始圖像(視頻)輸入信號進(jìn)行編碼,使用編碼后的信號來重建原始信號,使得兩者之間的重建誤差最小。通過將原始信號編碼成另一形式,能夠有效地提取信號中的主要信息,能夠簡潔地表達(dá)原始圖像(視頻)的特征。
3 深度學(xué)習(xí)的應(yīng)用
3.1 語音識別
從2009年開始,微軟研究院語音識別專家通過與Hinton合作,首先將RBM和DBN引入到語音識別聲學(xué)模型訓(xùn)練中,使得語音識別的錯誤率相對減低30%,這徹底改變了語音識別原有的技術(shù)框架。在國際上,IBM、google等公司都快速進(jìn)行了DNN語音識別的研究,并且速度飛快。國內(nèi)方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進(jìn)行深度學(xué)習(xí)在語音識別上的研究。
3.2 視頻中的動作行為識別
準(zhǔn)確迅速識別視頻中人的動作行為對于視頻搜索和視頻監(jiān)控具有劃時代的意義。最近幾年,深度學(xué)習(xí)技術(shù)被應(yīng)用于視頻動作行為識別中。如Ji等人[4]提出多層網(wǎng)絡(luò)的3D卷積神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)視頻中的時空特征,并通過卷積來實現(xiàn)對整個視頻特征的學(xué)習(xí),從而代替之前的時空興趣點檢測和特征描述提取。在TRECVID數(shù)據(jù)庫上進(jìn)行的實驗取得了不錯效果。
4 結(jié)束語
文章對深度學(xué)習(xí)的主要概念進(jìn)行了全面闡述,包括其由來、原理、研究進(jìn)展和相應(yīng)的應(yīng)用等。在很多領(lǐng)域中,深度學(xué)習(xí)都表現(xiàn)了潛在的巨大價值,但深度學(xué)習(xí)作為淺層學(xué)習(xí)的延伸,仍處于發(fā)展階段,還有很多問題值得我們深入探討:
(1)我們需要了解深度學(xué)習(xí)的樣本復(fù)雜度,需要多少訓(xùn)練樣本才能學(xué)習(xí)到足夠的深度模型。
(2)在推進(jìn)深度學(xué)習(xí)的學(xué)習(xí)理論和計算理論的同時,我們是否可以建立一個通用的深度學(xué)習(xí)網(wǎng)絡(luò)模型,作為統(tǒng)一的框架來處理語音、圖像和語言。
(3)神經(jīng)網(wǎng)絡(luò)具有前饋性連接和反饋性連接,可是我們研究的深度網(wǎng)絡(luò)中還沒有加入反饋連接,這些都給深度學(xué)習(xí)的研究帶來了嚴(yán)峻的挑戰(zhàn)。
參考文獻(xiàn)
[1]王亮,胡衛(wèi)明,譚鐵牛.人運(yùn)動的視覺分析綜述[J].計算機(jī)學(xué)報,2002,25(3):225-237.
[2]余凱,賈磊,陳雨強(qiáng).深度學(xué)習(xí)的昨天、今天和明天[J].計算機(jī)研究與發(fā)展,2013,50(9):1799-1804.
關(guān)鍵詞:立體視覺;圖像分割;陰影抑制;三維重建
1 概述
立體視覺的交通場景理解系統(tǒng)關(guān)鍵技術(shù)主要解決交通對象(行人、汽車、摩托車、自行車等)的三維信息模型化;低層處理,即先把圖像數(shù)字符號化和特征c的提取過程,主要包括圖像的分割和描述;運(yùn)動檢測與運(yùn)動匹配,主要技術(shù)有基于時空梯度的方法、基于相關(guān)的方法、頻率域法等;模型匹配與識別;交通對象的陰影檢測;系統(tǒng)實時性,由于三維重構(gòu)計算量較大,提高系統(tǒng)實時性等六大問題。其中對三維重建、運(yùn)動檢測與運(yùn)動匹配和模型匹配與識別是立體視覺的交通場景理解系統(tǒng)關(guān)鍵技術(shù)主要研究方向。
從計算機(jī)視覺的角度進(jìn)行分類,基于模型交通流量檢測技術(shù)的方法可以分類為:基于區(qū)域跟蹤的方法;基于動態(tài)輪廓的目標(biāo)跟蹤方法;基于特征的跟蹤方法;基于3D模型(立體視覺)的車輛跟蹤識別方法。
2 立體視覺的三維重建研究方法
基于立體視覺的三維重建是指通過對二維圖像的處理,利用立體視覺的原理獲取場景中目標(biāo)的三維信息。雙目立體視覺是直接模擬人類雙眼來處理景物的一種新型研究方法,由于其靈活性較高,可以測量多種條件下景物的三維信息。
2.1 圖像自適應(yīng)閾值分割法
圖像自適應(yīng)閾值分割法無論參數(shù)的選取為何種特征值,都能準(zhǔn)確快速的捕捉待處理的運(yùn)動目標(biāo)。采用自適應(yīng)閾值分割方法對獲得的交通對象的視頻圖像進(jìn)行處理,把交通目標(biāo)特征層經(jīng)行分類處理,提高了類判別能力。同時,閾值來源較為廣泛和準(zhǔn)確,因此,不僅具有較好的識別率還具有較強(qiáng)的實時性。在背景存在微小運(yùn)動和環(huán)境亮度突變的情形下也具有很好的魯棒性。徐文聰?shù)热酥饕獜淖赃m應(yīng)閾值分割的方法對運(yùn)動車輛進(jìn)行檢測和流量統(tǒng)計。
在徐文聰研究中,閾值的取值為圖像的形態(tài)值,結(jié)合車道線和標(biāo)定的攝像機(jī)內(nèi)外參數(shù),利用Dtsu算法提取候選車燈連通域信息。張虹波、孫明玉研究中,閾值的取值為圖像的灰度值。張虹波利用圖像差分方法獲得運(yùn)動目標(biāo)。提取虛擬檢測區(qū)域內(nèi)的車輛圖像,進(jìn)行圖像的數(shù)字化和濾除噪聲等預(yù)處理,對視頻圖像提取背景模型,得到車流量信息。孫明玉提出基于新型自適應(yīng)閾值的運(yùn)動目標(biāo)提取算法。孫明玉[4]提出基于新型自適應(yīng)閾值的運(yùn)動目標(biāo)提取算法。首先,根據(jù)運(yùn)動屬性,分成兩個聚類,一是運(yùn)動目標(biāo),二是背景。對提取的圖像按像素灰度進(jìn)行分類,以聚類間的方根-算術(shù)均值距離最大值作為分割閾選擇的準(zhǔn)則,實時更新提取的運(yùn)動目標(biāo)的二值化閾值,從而實現(xiàn)對運(yùn)動目標(biāo)的準(zhǔn)確完整提取。
2.2 基于側(cè)影輪廓的三維重建方法
基于側(cè)影輪廓的三維建模是一種新的建模方法,也稱為可見外殼 (Visual Hull)生成方法。側(cè)影輪廓法是利用攝像機(jī)拍攝的不同角度的圖像進(jìn)行立體重建,具有良好的幾何和拓?fù)浣Y(jié)構(gòu)的一致性,同時提取的特征點較少,易于計算,有較好的魯棒性。
阮孟貴、章毓晉利用攝像機(jī)在各個相異的角度獲取的多幅圖像完成三維重建。主要利用反射投影的交叉輪廓進(jìn)行匹配,重建物體表面。伍燕萍用Marching Cubes算法,把獲取的多幅圖像進(jìn)行側(cè)影輪廓重建,生成物體的可見外殼。曹煜利用平面鏡反射原理,對圖像輪廓線之間極的線幾何關(guān)系進(jìn)行分析,獲得相應(yīng)的相機(jī)內(nèi)外參數(shù),實現(xiàn)目標(biāo)物體的三維重建。
2.3 基于序列圖像的三維重建方法
序列圖像法主要是利用數(shù)字圖像處理的方法對圖像二值化,便于計算機(jī)處理。通過對提取的特征點之間進(jìn)行相似度的匹配,利用矩陣分析進(jìn)行三維重建。此類方法關(guān)鍵在于正確三維數(shù)據(jù)的獲取,利用計算機(jī)相關(guān)軟件進(jìn)行圖像掃描、圖像預(yù)處理、建立數(shù)據(jù)模型,怎樣辨別噪聲是此方法的難點。雖然序列圖像法存在一定的噪聲污染,但由于其設(shè)備簡單,在交通場景中運(yùn)用面較廣。
劉同敏利用提取的圖像序列作為測量矩陣的參數(shù),提出了一種基于匹配相似度的最小二乘法三維重建方法。譚論正提出了基于PCA的交通場景點的重建方法。利用最小二乘法求場景點的三維軌跡,根據(jù)獲得的數(shù)據(jù)實現(xiàn)運(yùn)動目標(biāo)和背景模型的三維重建。孫麗娟通過透視投影重建算法中引入了迭代算法。利用矩陣擾動理論,分析圖像噪聲對不同特征點重構(gòu)的影響,得出圖像數(shù)量越多重建精度越高的結(jié)論。彭科舉提出了尺度不變特征變換特征和角點特征相結(jié)合的三維重建算法。
2.4 混合高斯模型進(jìn)行背景建模
隨著信息技術(shù)、計算機(jī)技術(shù)、數(shù)據(jù)通信技術(shù)、傳感器技術(shù)、電子控制技術(shù)快速發(fā)展,基于視頻的智能交通控制系統(tǒng)在交通控制中占主要作用。在交通對象的監(jiān)測中,高斯背景模型在建立對運(yùn)動目標(biāo)的提取有著至關(guān)重要的作用。研究發(fā)現(xiàn),視頻圖像提取的特征值背景顏色和像素的灰度值符合高斯分布。由于像素在時間域上的分布信息符合高斯分布,利用其構(gòu)造其背景模型能解決光線突變等問題帶來的影響,能夠適應(yīng)于戶外復(fù)雜光線的環(huán)境。此方法建模后模型的魯棒性強(qiáng),準(zhǔn)確率高。目前,高斯背景建模在交通智能控制系統(tǒng)中發(fā)揮著越來越重要的作用。
劉亞利等人提出了基于邊緣特征的混合高斯背景建模方法。此方法加快了高斯模型的收斂速度,有較強(qiáng)的光變性。同時利用像素在時間域及空間域上的分布信信息,王永忠等人提出了一種基于自適應(yīng)混合高斯模型的時空背景建模方法。監(jiān)控系統(tǒng)采集的數(shù)庫不僅僅有時間上的信息,還有空間位移信息。王永忠提出的時空背景建模方法利用時間和空間上的像素分布信息,不僅提高了建模精度還解決了傳統(tǒng)的混合高斯背景建模方法對不平穩(wěn)場景建模失效的這一缺點。
3 結(jié)束語
基于立體視覺的三維建模技術(shù)研究是一個非常有意義的研究課題,在交通參數(shù)檢測技術(shù)的研究中,我們要結(jié)合相關(guān)的計算機(jī)圖像采集和處理技術(shù),充分利用道路已有的資源,并將其采集的資源圖形化、數(shù)字化。雙目立體視覺技術(shù)對目前的單視點平面監(jiān)控系統(tǒng)缺點進(jìn)行很好的彌補(bǔ)。利用雙目立體視覺對交通對象進(jìn)行檢測和監(jiān)控,對獲得圖像數(shù)據(jù)分析,完成運(yùn)動目標(biāo)的三維空間定位和追蹤。結(jié)合現(xiàn)有的計算機(jī)、電子信息技術(shù),互聯(lián)網(wǎng)技術(shù),對交通加強(qiáng)智能化建設(shè),逐步實現(xiàn)增強(qiáng)道路交通監(jiān)控的信息化和自動化。
參考文獻(xiàn)
[1]周冬梅,張明星,代永霞,等.基于紋理的車輛陰影消除新算法[J].自動化與儀表,2014(1):133-138.
[2]徐文聰,劉海.夜間環(huán)境交通數(shù)據(jù)采集系統(tǒng)設(shè)計與實現(xiàn)[J].測控技術(shù),2012,31(6):60-66.
關(guān)鍵詞:焊接自動化;圖像處理;應(yīng)用;發(fā)展趨勢
中圖分類號:C37 文獻(xiàn)標(biāo)識碼:A
一、概述
隨著計算機(jī)視覺技術(shù)的發(fā)展,近年來利用機(jī)器視覺直接觀察焊接熔池,對焊
接質(zhì)量進(jìn)行閉環(huán)控制是通過圖像處理獲取熔池的幾何形狀信息,已是當(dāng)前研究的主要方向。
和傳統(tǒng)的手工焊和半自動焊接過程相比,使用機(jī)器視覺進(jìn)行直接觀測焊接熔池有著很明顯的優(yōu)點,采集的數(shù)字圖像信息豐富,表象直觀,且數(shù)字化的圖像數(shù)據(jù)可以實時傳輸?shù)接嬎銠C(jī)高速緩存內(nèi),提取特征信息, 進(jìn)行實時處理,同時作出在線判決,可以實現(xiàn)焊接過程質(zhì)量實時控制和傳感。
在傳統(tǒng)的手工焊接和半自動焊接過程當(dāng)中,對于一個有經(jīng)驗的焊工,通過直接觀察熔池的行為、接頭的位置、焊道外形及電弧形狀,能夠感知焊接的狀態(tài)。若是感覺到實際焊接過程中同最佳狀態(tài)不一致,為了達(dá)到最佳狀態(tài)可以通過調(diào)節(jié)各參數(shù),以獲得高質(zhì)量的焊縫。可以把這個過程劃分為眼-腦-手的控制過程。圖像處理在焊接過程中的重要意義就等同于手工焊接過程中人的眼睛,可以實現(xiàn)采集和處理焊接位置的傳感、焊接時熔池、焊道對中、熔寬和熔深的信息,然后利用計算機(jī)發(fā)出指令,實現(xiàn)焊接過程的各種工藝參數(shù)如電流、電壓、焊接速度的調(diào)節(jié)和電弧或焊絲的對中。
二、圖像處理的概念
圖像處理(image processing),用計算機(jī)對圖像進(jìn)行分析,以達(dá)到所需結(jié)果的技術(shù)。又稱影像處理。一般圖像處理就指的是對數(shù)字圖像處理。數(shù)字圖像是指用數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備經(jīng)過采樣和數(shù)字化得到的一個大的二維數(shù)組,該數(shù)組的元素稱為像素,其值為一整數(shù),稱為灰度值。圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,匹配、描述和識別以及增強(qiáng)和復(fù)原這3個部分。常見的處理包括有圖像復(fù)原、圖像數(shù)字化、圖像增強(qiáng)、圖像編碼、圖像分析和圖像分割等
三、焊接圖像攝取方法
圖像的處理一般包括量化、圖像識別和圖像預(yù)處理等幾個步驟。圖像預(yù)處理包括圖像增強(qiáng)、圖像變換和圖像恢復(fù),盡量把因為隨機(jī)因素的干擾和攝像中各種條件的限制而產(chǎn)生的不足和噪聲減小,繼而可以獲取焊縫位置的精確信息;量化由圖像卡完成;圖像識別包括邊緣提取和圖像分割等,可借助小波變換、快速傅立葉變換、概率統(tǒng)計等數(shù)學(xué)工具對圖像進(jìn)行理解、分析、模式識別和特征提取。
從國內(nèi)外大量文獻(xiàn)來看,利用機(jī)器視覺采集焊接熔池圖像的方法主要分為被動式直接視覺傳感和主動式直接視覺傳感兩大類,視覺傳感器常采用CCD攝取原始圖像。CCD是英文(Charge-Coupled Devices)的縮寫,意即“電荷耦合器件”。具有體積小、耐震動、重量輕、穩(wěn)定性好、壽命長、速度高,幾何失真小及耐高壓等一系列優(yōu)點。CCD是固態(tài)圖像傳感器的一種,固態(tài)圖像傳感器是指把布設(shè)在半導(dǎo)體襯底上的許多感光小單元的光-電信號,用所控制的時鐘脈沖讀取出來的一類功能器件。
動式直接視覺傳感利用窄帶復(fù)合濾光系統(tǒng)濾除非連續(xù)光譜的電弧強(qiáng)光,并采用高強(qiáng)脈沖激光或具有圖像增強(qiáng)器的高頻閃光燈作為輔助光源,可有效地抑制弧光獲得清晰圖像。被動式直接視覺傳感是利用焊接過程中的結(jié)構(gòu)光進(jìn)行成像。主被動式直接視覺傳感存在強(qiáng)光干擾的問題,激光焊接中,通常采用中性減光的辦法解決強(qiáng)光干擾的問題;在電弧焊中,對于短路電弧焊和脈沖電弧焊.可在短路期間或基值電流期間獲取圖像數(shù)據(jù),或者在攝像機(jī)前通入部分保護(hù)氣,減少煙霧和飛濺的影響;TIG/MIG/MAG焊時弧光在600~700nm波段內(nèi)相對光強(qiáng)最弱最穩(wěn)定,選用這一波段內(nèi)的干涉濾光片和防熱玻璃可有效地排除弧光及紅外干擾。
四、圖像處理在焊接中的應(yīng)用
現(xiàn)如今,對于圖像處理主要集中應(yīng)用在脈沖機(jī)器人焊接、TIG焊、激光焊和焊縫質(zhì)量的檢測等領(lǐng)域。圖像技術(shù)在機(jī)器人焊接領(lǐng)域應(yīng)用較廣。由于機(jī)器人需要有很強(qiáng)的適應(yīng)能力,借助三維視覺傳感系統(tǒng)和計算機(jī)圖像處理技術(shù),焊接機(jī)器人可對焊接環(huán)境進(jìn)行實時控制。通過圖像的采集,可幫助機(jī)器人進(jìn)行焊縫的對中,為機(jī)器人焊接提供實時特征信息,如熔深、熔寬和熔池的形狀等,從而實現(xiàn)焊接過程的智能控制。目前國內(nèi)哈工大的吳林教授在這方面作了較深入的研究,從焊縫位置的傳感到熔滴的過渡,從過程實時控制到最后焊接質(zhì)量的檢測都進(jìn)行了較為系統(tǒng)的研究。
哈工大的何景山博士在脈沖TIG焊熔深及熔透的彩色圖形法傳感方面進(jìn)行了較深入的研究。圖像處理目前用得最廣的領(lǐng)域是在脈沖TIG焊中,國內(nèi)外許多學(xué)者都對該領(lǐng)域進(jìn)行了積極的探索。首先創(chuàng)建了一套適用于脈沖TIG焊的彩色圖像法熔深和熔透的傳感系統(tǒng),通過對脈沖峰值和脈寬的控制實現(xiàn)對熔深和熔透的控制,其控制信息來源于基值期間,進(jìn)行圖像信息的采集。
此外,圖像處理還在焊接的其它領(lǐng)域中有一定的應(yīng)用。有的將圖像處理用于焊接缺陷的自動監(jiān)測與缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者還將圖像處理用于水下濕法焊接,通過復(fù)合濾光技術(shù)和水下CCD攝像系統(tǒng),采集出了藥芯焊絲水下濕法焊接電弧區(qū)域的圖像,用中值濾波和梯度算子的電弧區(qū)域圖像邊緣檢測方法,有效地區(qū)分了電弧燃燒區(qū)域和電弧氣泡區(qū)域。哈爾濱工業(yè)大學(xué)的何景山、楊春利等人結(jié)合采用埋弧焊進(jìn)行容器類焊接結(jié)構(gòu)制造過程中的工藝特點及實際工況,設(shè)計了一種將微型攝像機(jī)、微型半導(dǎo)體激光發(fā)生器及具有濾光功能的光學(xué)系統(tǒng)三者集成一體的焊縫視覺傳感器。
焊接控制過程中的一個重要環(huán)節(jié)就是焊接縫隙檢測,圖像處理在這方面的應(yīng)用也有許多學(xué)者研究。為了實現(xiàn)電弧焊過程的自動對中和焊縫質(zhì)量控制,必須對焊接縫隙的相對位置和坡口幾何參數(shù)進(jìn)行檢測。西安交大的梁晉、賈昌申等在《圖像法焊接縫隙檢測的研究》一文介紹了一套自行設(shè)計的計算機(jī)焊接縫隙檢測系統(tǒng),包括圖像采集卡、計算機(jī)接口、光學(xué)傳感器、圖像處理軟件,分析了它們的基本結(jié)構(gòu)和工作原理,討論了提高光學(xué)傳感器、圖像處理軟硬件等抗干擾能力的措施。該系統(tǒng)工作原理是:由光源和CCD攝像機(jī)組成的光學(xué)傳感器攝取圖象,CCD攝像機(jī)把圖象轉(zhuǎn)換為電信號,再經(jīng)圖象采集卡把模擬信號變?yōu)閿?shù)字信號存儲于計算機(jī)內(nèi),計算機(jī)對此信號進(jìn)行必要的處理,即可得到縫隙位置和坡口幾何參數(shù)信息,在監(jiān)視器屏幕上顯示出來,或經(jīng)過D/A電路給執(zhí)行機(jī)構(gòu),修正焊槍位置,實現(xiàn)閉環(huán)對中控制。有的將圖像分割和小波分析應(yīng)用于焊接領(lǐng)域,小波分析在焊縫視覺跟蹤過程中檢測焊縫,采用多次小波變換可獲得清晰的焊縫邊緣,大大簡化了硬件設(shè)備;圖像分割法可減小焊縫識別的圖像處理的復(fù)雜性,使得焊接過程的實時性增強(qiáng)。
五、圖像處理在焊接中應(yīng)用的展望
為焊接現(xiàn)象的描述及內(nèi)在規(guī)律的解釋提供了極佳的條件和直接的證據(jù),推動焊接理論和實踐的發(fā)展就是通過圖像傳感的這種方法。同時也使得研究者能夠觀察到其它傳感方法所不能觀察到的被強(qiáng)光所淹沒的豐富直觀的信息。
把圖像處理技術(shù)應(yīng)用到現(xiàn)代焊接技術(shù)中,將會推動焊接過程質(zhì)量實時傳感與控制的發(fā)展和成熟,使得焊接過程通過閉環(huán)反饋控制而實現(xiàn)完全自動化,保證焊接質(zhì)量,提高焊接生產(chǎn)效率。
總之,作為智能控制中關(guān)鍵技術(shù)―數(shù)字圖像技術(shù),在焊接過程中發(fā)揮的作用將會越來越大,將為焊接智能化生產(chǎn)作出貢獻(xiàn)?,F(xiàn)代工業(yè)正朝著信息化和智能化方向發(fā)展,現(xiàn)代焊接技術(shù)也必然要實現(xiàn)智能化。
參考文獻(xiàn):
[1]段佳佳,楊迎春.圖像處理在自動焊接中的應(yīng)用[J].電子測試,2012,02:12-15.
[2]陳彥賓,李俐群,陳鳳東,陳杰.圖像處理在自動焊接中的應(yīng)用和展望[J].材料科學(xué)與工藝,2003,01:106-112.
作者簡介:
關(guān)鍵詞:數(shù)字圖像;處理技術(shù);電子信息
中圖分類號:TN911.7 文獻(xiàn)標(biāo)識碼:A 文章編號:1000-8136(2012)09-0153-02
不論在哪種通訊手段中,人們都更愿意選擇直觀的圖像表達(dá),因此,未來社會對圖像傳遞信息的要求越來越高,及時性、直觀性、客觀性等發(fā)展條件都對現(xiàn)有的數(shù)字圖像處理技術(shù)提出了挑戰(zhàn)。
1數(shù)字圖像處理技術(shù)概述
數(shù)字圖像處理又稱為計算機(jī)圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機(jī)對其進(jìn)行處理的過程。這一過程包括對圖像進(jìn)行增強(qiáng)、除噪、分割、復(fù)原、編碼、壓縮、提取特征等內(nèi)容,圖像處理技術(shù)的產(chǎn)生離不開計算機(jī)的發(fā)展、數(shù)學(xué)的發(fā)展以及各個行業(yè)的應(yīng)用需求的增長。20世紀(jì)60年代,圖像處理的技術(shù)開始得到較為科學(xué)的應(yīng)用,人們用這種技術(shù)進(jìn)行輸出圖像的理想化處理。
經(jīng)過多年的發(fā)展,現(xiàn)在的電子圖像處理技術(shù)已具有了以下特點:更好的再現(xiàn)性:數(shù)字圖像處理與傳統(tǒng)的模擬圖像處理相比,不會因為圖像處理過程中的存儲、復(fù)制或傳輸?shù)拳h(huán)節(jié)引起圖像質(zhì)量的改變;占用的頻帶更寬:這一點是相對于語言信息而言的,圖像信息比語言信息所占頻帶要大好幾個數(shù)量級,因此圖像信息在實現(xiàn)操作的過程中難度更大;適用面寬:可以從各個途徑獲得數(shù)據(jù)源,從顯微鏡到天文望遠(yuǎn)鏡的圖像都可以進(jìn)行數(shù)字處理;具有較高的靈活性:只要可以用數(shù)學(xué)公式和數(shù)理邏輯表達(dá)的內(nèi)容,幾乎都可以用電子圖像來進(jìn)行表現(xiàn)處理.
2數(shù)字圖像處理技術(shù)的發(fā)展
自從美國在1964年開始通過衛(wèi)星獲得大量月球圖片并運(yùn)用數(shù)字技術(shù)對之進(jìn)行處理之后,越來越多的相應(yīng)技術(shù)開始被運(yùn)用到圖像處理方面,數(shù)字圖像處理也作為一門科學(xué)占據(jù)了一個獨立的學(xué)科地位,開始被各個領(lǐng)域的科學(xué)研究運(yùn)用。圖像技術(shù)再一次的飛躍式發(fā)展出現(xiàn)在1972年,標(biāo)志是CT醫(yī)學(xué)技術(shù)的誕生,在這種技術(shù)指導(dǎo)下,運(yùn)用X射線計算機(jī)斷層攝影裝置,根據(jù)人的頭部截面的投影,計算機(jī)對數(shù)據(jù)處理后重建截面圖像,這種圖像重建技術(shù)后來被推廣到全身CT的裝置中,為人類發(fā)展做出了跨時代的貢獻(xiàn),隨后,數(shù)字圖像處理技術(shù)在更多的領(lǐng)域里被運(yùn)用,發(fā)展成為一門具有無限前景的新型學(xué)科。之后十年數(shù)字圖像處理技術(shù)也朝著更高深的方向發(fā)展,人們開始通過計算機(jī)構(gòu)建出數(shù)字化的人類視覺系統(tǒng),這項技術(shù)被稱為圖像理解或計算機(jī)視覺。很多國家已在這方面投入了很多的研究精力,并取得了高深的研究成果,其中,20世紀(jì)70年代末提出的視覺計算理論為后來計算機(jī)數(shù)字圖像技術(shù)的理論發(fā)展提供了主導(dǎo)思想,但理論上如此,在實際操作中還存在著很多的困難。
我國在建國之初就展開了計算機(jī)技術(shù)的研究,而改革開放以來,我國在計算機(jī)數(shù)字圖像處理技術(shù)上的發(fā)展進(jìn)步也是非常大的,甚至在某些理論研究方面已趕上了世界先進(jìn)水平,首先,對于成像數(shù)據(jù)的收集能力方面,我國通過成功研發(fā)的一系列傳感器以及發(fā)射的對地觀測衛(wèi)星,能夠及時有效地獲得風(fēng)云、海洋、資源和環(huán)境減災(zāi)等方面的相關(guān)數(shù)據(jù),并取得了有效的數(shù)據(jù)結(jié)果和數(shù)據(jù)成像效果。另外,數(shù)字圖像處理技術(shù)應(yīng)用較為廣泛的領(lǐng)域代表分別是建筑、通行工程和生物醫(yī)學(xué)工程方面,這些方面對數(shù)字圖像處理技術(shù)的應(yīng)用,最能直接體現(xiàn)該技術(shù)的發(fā)展現(xiàn)狀。在建筑行業(yè)中,數(shù)字圖像處理技術(shù)可以將擬建造的建筑或建筑群的高度、密度以及其他可能影響建筑質(zhì)量、建筑環(huán)境的信息轉(zhuǎn)換成圖像,從而使設(shè)計者更為合理地進(jìn)行規(guī)劃;在通信工程領(lǐng)域,數(shù)字圖像技術(shù)和語音、文字等因素構(gòu)成了現(xiàn)代多媒體的基本內(nèi)容,在傳遞圖像的過程中,采用編碼技術(shù)來壓縮信息的比特量,這種技術(shù)現(xiàn)在的發(fā)展內(nèi)容包括變換編碼等,未來可能發(fā)揮作用的還有小波變換圖像壓縮編碼、分行編碼等。在生物醫(yī)學(xué)工程中,書籍圖像技術(shù)能將人體活動的機(jī)理以圖像的形式客觀地呈現(xiàn)在研究者面前,對醫(yī)學(xué)未來的發(fā)展具有不可替代的作用。
3數(shù)字圖像處理技術(shù)的發(fā)展趨勢
計算機(jī)數(shù)字圖像處理技術(shù)在未來信息技術(shù)方面將會發(fā)揮的重要作用早已被人們看到,對于計算機(jī)圖像技術(shù)的發(fā)展道路,大致可以歸結(jié)出3個原則性內(nèi)容:①未來數(shù)據(jù)圖像技術(shù)強(qiáng)調(diào)高清晰度、高速傳輸、實時圖像處理、三維成像或多維成像、智能化、自動化等方向發(fā)展。②未來數(shù)字圖像處理技術(shù)強(qiáng)調(diào)操作、運(yùn)用的方便性,圖像處理功能的集中化趨勢是必然會存在的。③更新的理論研究與更快的算法研究。理論走在實踐的前面,已經(jīng)是現(xiàn)代科學(xué)的特點,未來數(shù)字圖像處理技術(shù)的實際運(yùn)用要取得更多的發(fā)展,必然離不開理論和研究方法的更新,新理論中包括小波分析、分形幾何、形態(tài)學(xué)、遺傳算法等都將得到更深層次的發(fā)展。
4結(jié)束語
數(shù)字圖像處理技術(shù)的有效應(yīng)用在人們?nèi)粘I钪芯湍芮猩淼馗惺艿?,不管是看電視、看電影、上網(wǎng)還是移動通信,每個人都與這種技術(shù)發(fā)生著最緊密的聯(lián)系。數(shù)字圖像處理技術(shù)的發(fā)展關(guān)系到每個人對優(yōu)越的社會生活、現(xiàn)代物質(zhì)享受的程度的深淺,所以,對之進(jìn)行及時的研究和關(guān)注在電子通信行業(yè)中是非常重要的。
【關(guān)鍵詞】單目視覺 風(fēng)洞 飛機(jī)模型 位姿判別 傳感系統(tǒng)
【Abstract】In order to provide a reference for later flight control computers, the study has studied and written a software system which could discriminate the position and orientation of wind tunnels model based on monocular vision. An aircraft model with driving force is able to fly stably and autonomously in the wind tunnel. By control-law, the aircraft model stays static relative to the ground, unlocking all six degrees of freedom. Multiple LED marked points are placed on the aircraft model. The CCD industrial camera model at the top of the model continuously captures the image and returns real-time image data to an upper computer with a dynamic link library. The free-flight trials system can get the spatial position and altitude information of the aircraft model through the use of upper computer software with C/C++ language, achieving identification algorithms, as well as position and orientation solver algorithms.
【Keywords】Monocular vision wind tunnel aircraft model attitude determination sensing systems
1 引言
近年來,隨著計算機(jī)技術(shù)和圖像處理技術(shù)以及數(shù)字視頻器件的發(fā)展,計算機(jī)機(jī)器視覺與視覺檢測在許多領(lǐng)域得到了廣泛應(yīng)用[1]:如機(jī)翼表面油流試驗、壓敏漆表面壓力測量、模型變形測量、投放試驗、非接觸位移測量等.另外在工業(yè)檢測[2]中應(yīng)用更加廣泛,如流水線工件自動檢測、大型復(fù)雜曲面的三維檢測、大型工件平行度和垂直度測量、字符識別、醫(yī)學(xué)圖像分析、未來外星車導(dǎo)航[3]等等。在現(xiàn)代自動化生產(chǎn)過程[4]中,機(jī)器視覺系統(tǒng)廣泛地應(yīng)用于工況監(jiān)視、成品檢驗和質(zhì)量控制等領(lǐng)域。同時,機(jī)器視覺與視覺檢測技術(shù)逐步發(fā)展為使用視頻測量技術(shù)(Videogram-metric Technique)[5],該技術(shù)在風(fēng)洞測量[6][7]這種要求非侵入式測量中具有無可比擬的優(yōu)勢,因此在風(fēng)洞測量中得到了大量應(yīng)用。目前雖然我國利用CCD圖像傳感器設(shè)計出車牌識別[8][9]等系統(tǒng),逐步開始了工業(yè)現(xiàn)場的應(yīng)用[10],但是我國該技術(shù)起步較晚,應(yīng)用領(lǐng)域真正高端的不多。本文,將機(jī)器視覺技術(shù)應(yīng)用于基于單目視覺的風(fēng)洞模型位姿傳感系統(tǒng),提供了另一種獲取飛機(jī)空間位置信息研究飛機(jī)位姿的方法。擴(kuò)展了該技術(shù)的應(yīng)用領(lǐng)域,填補(bǔ)了國內(nèi)機(jī)器視覺技術(shù)發(fā)展的空白,順應(yīng)了時展的潮流。
2 風(fēng)洞模型及其工作原理
常規(guī)風(fēng)洞試驗一般將模型固定在支架上,支架上裝有天平測力系統(tǒng),可以帶動模型在一定自由度內(nèi)運(yùn)動。但其顯著缺點是支架對模型周圍的流場存在干擾,同時模型自由度受到約束。常規(guī)風(fēng)洞試驗如圖2.1:
而風(fēng)洞模型自由飛技術(shù)不限制模型自由度,沒有支架干擾,可以最大程度的模擬飛機(jī)在大氣中飛行的環(huán)境。本系統(tǒng)中引入機(jī)器視覺技術(shù),通過設(shè)計控制律,使模型相對于地面靜止,在模型上放置多個LED標(biāo)志物,通過CCD攝像機(jī)識別,推算模型的姿態(tài)或空間位置。如圖2.2:
3 相機(jī)接口實現(xiàn)
飛行器位姿識別屬于典型的機(jī)器視覺技術(shù)范疇,機(jī)器視覺技術(shù)是依靠圖像攝取裝置將攝取目標(biāo)轉(zhuǎn)換為圖像信號,并將該信號傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作的先進(jìn)技術(shù)。
圖像采集是機(jī)器視覺技術(shù)的兩大技術(shù)核心之一,由于既需要優(yōu)質(zhì)的圖像質(zhì)量,又需要高效的圖像采集速率,當(dāng)下普遍使用CCD相機(jī)(Charge-coupled Device)對攝取目標(biāo)進(jìn)行圖像采集。
CCD相機(jī)本質(zhì)上是一種半導(dǎo)體器件,能夠?qū)⑵胀ǖ墓鈱W(xué)影像轉(zhuǎn)化為特殊的數(shù)字信號, CCD上植入的微小光敏物質(zhì)稱作像素(Pixel)。一塊CCD上包含的像素數(shù)越多,其提供的畫面分辨率也就越高。一般而言CCD相機(jī)獲取的圖像為RGB圖像,也就是說每一個像素都由紅(R)綠(G)籃(B)三個成分組成,來表示RGB色彩空間中的一個點。CCD的作用就像膠片一樣,但它是把圖像像素轉(zhuǎn)換成數(shù)字信號。CCD上有許多排列整齊的電容,能感應(yīng)光線,并將影像轉(zhuǎn)變成數(shù)字信號。經(jīng)由外部電路的控制,每個小電容能將其所帶的電荷轉(zhuǎn)給它相鄰的電容。
相機(jī)攝取的光學(xué)影像轉(zhuǎn)換成的數(shù)字信號,通過相機(jī)的驅(qū)動程序可儲存到計算機(jī)的存儲器當(dāng)中。利用相機(jī)提供的接口配置好計算機(jī)的工程環(huán)境可以通過編寫開程序代碼對相機(jī)進(jìn)行操作控制,接口一般分為兩大類,一是主功能接口,具體功能包含攝像機(jī)開啟關(guān)閉、采集圖像、控制攝像機(jī)等具體操作,包含文件 GxIAPI.h,動態(tài)鏈接庫 GxIAPI.dll,靜態(tài)鏈接庫 GxIAPI.lib二是圖像處理接口,包含數(shù)據(jù)轉(zhuǎn)換等功能操作。利用這些接口便可編寫相應(yīng)的代碼實現(xiàn)之后的位姿識別算法,包含文件 DxImageProc.h,動態(tài)鏈接庫 DxImageProc.dll,靜態(tài)鏈接庫 DxImageProc.lib。
上述應(yīng)用接口庫支持32位編程開發(fā)工具M(jìn)icrosoft Visual C/C++。使用C/C++編程工具,用戶 應(yīng)在程序中調(diào)用相關(guān)的包含文件(.h),并將靜態(tài)鏈接庫(.lib)文件加入到工程文件中,供編譯程序在鏈接(Link)時使用。
完成上述準(zhǔn)備工作之后,便可采集圖像并根據(jù)編寫的程序?qū)D像進(jìn)行進(jìn)一步處理,其具體采集流程如圖3.1:
4 識別算法及其原理
通過CCD相機(jī)讀取到的圖像以類似矩陣的數(shù)據(jù)類型存儲在計算機(jī)中,其中黑暗環(huán)境的亮度值較低,其數(shù)據(jù)結(jié)構(gòu)中的標(biāo)記位會被標(biāo)記為0,而發(fā)光光源部分亮度值較高,其數(shù)據(jù)結(jié)構(gòu)中的標(biāo)記位會被標(biāo)記為1。其模型類似圖4.1,其中每一格代表一個像素點:
1代表亮點
該算法從矩陣首行首列開始,由左至右,由上至下開始進(jìn)行遍歷搜索,每當(dāng)搜索到亮點(標(biāo)記位為1的像素點),就對該點進(jìn)行以該點為中心,依次按照上,右上,右,右下,下,左下,左,左上的優(yōu)先順序進(jìn)行搜索判斷,若相鄰點也為1,則對該相鄰點繼續(xù)擴(kuò)展搜索,直至將所有相鄰的亮度點全部搜索完畢,之后將所有被搜索到的點標(biāo)記為ACCESS,防止下次搜索重復(fù)計算,若此次擴(kuò)展搜索獲得的亮點總數(shù)超過設(shè)定值(本程序默認(rèn)設(shè)置為200,可修改)則判定此處為亮點。按照上述方法將全圖遍歷完成后,便可求得全圖所有亮度點。搜素偽代碼如下:
//********************************************
// 尋找亮點區(qū)域,記錄相關(guān)值,并標(biāo)記已訪問
// sumi 橫坐標(biāo)之和;sumj 縱坐標(biāo)之和;
// points 點區(qū)內(nèi)像素點的數(shù)目
//********************************************
findthearea(i,j)//標(biāo)記一個片區(qū)
5 位姿判別算法
參考六自由度頭部跟蹤算法[11][12],以四個LED燈所標(biāo)記的點所在平面為,即飛機(jī)為輻射坐標(biāo)系() ,令CCD攝像機(jī)攝像坐標(biāo)系代表風(fēng)洞的坐標(biāo)系(),CCD的成像面當(dāng)成圖像坐標(biāo)系(,)。因此,判斷飛機(jī)模型的姿態(tài)可以轉(zhuǎn)化為分析輻射坐標(biāo)系對于風(fēng)洞坐標(biāo)系的位置關(guān)系。由此可求得位姿信息,方位角α,滾轉(zhuǎn)角β,偏航角。
輻射坐標(biāo)系和攝像坐標(biāo)系的變換關(guān)系為
而矩陣H的表達(dá)式
采用小孔成像模型,像點坐標(biāo)(,)為:
其中i=A,B,C,D,代表所獲取飛機(jī)模型上的4個LED燈的信息。
綜合上述公式,進(jìn)行等量代換
假設(shè)4個LED燈構(gòu)成的正方形對角線長度為2L,則4個LED燈在輻射坐標(biāo)系下的坐標(biāo)為A(0,L,0),B(L,0,0) ,C(0,-L,0),D(-L,0,0)帶入前式,可知每個LED對應(yīng)2個方程:
設(shè):
根據(jù)以上兩式轉(zhuǎn)化這6個中間變量,然后聯(lián)系轉(zhuǎn)換矩陣H,便可求得位姿角:
6 Labview接口設(shè)計
飛控計算機(jī)的系統(tǒng)狀態(tài)實時顯示程序采用LabView開發(fā),便于模型狀態(tài)數(shù)據(jù)的記錄,飛控參數(shù)的調(diào)整。位姿信息最終作為輸入數(shù)據(jù)傳送到系統(tǒng)狀態(tài)實時顯示程序,程序?qū)斎氲奈蛔诵畔⒆鲞M(jìn)一步處理。
不同的位姿信息傳送方法對實時性的影響相差較大,因此,選擇高效的數(shù)據(jù)傳送方法至關(guān)重要。本項目擬采用LabView調(diào)用動態(tài)鏈接庫的方法來實現(xiàn)數(shù)據(jù)傳送。
將獲取位姿信息源代碼編譯生成動態(tài)鏈接庫文件,然后將文件加載至LabView項目中,通過調(diào)用動態(tài)鏈接庫的接口函數(shù)來獲取位姿信息數(shù)據(jù),達(dá)到快速通訊的目的。
7 結(jié)語
風(fēng)洞模型自由飛技術(shù)是空氣動力學(xué)領(lǐng)域一項先進(jìn)的測試技術(shù),可以模擬飛機(jī)復(fù)雜的飛行動作,這項技術(shù)實現(xiàn)的關(guān)鍵之一是姿態(tài)測量。
本文針對通過飛機(jī)模型有限個標(biāo)志亮點來獲取模型位姿信息并傳送至上級處理系統(tǒng)的方法進(jìn)行了詳細(xì)的討論。通過對飛機(jī)模型姿態(tài)與模型上有限個亮點的位置信息的關(guān)系進(jìn)行分析,給出了實時位姿信息獲取系統(tǒng)的構(gòu)造思想。該系統(tǒng)提供實時的飛機(jī)模型位姿信息,為飛控計算機(jī)對模型的控制提供參考依據(jù)。
參考文獻(xiàn):
[1]賈云得.機(jī)器視覺[M].北京:科學(xué)出版社,2000.
[2]段峰,王耀南,雷曉峰,吳立釗,譚文.機(jī)器視覺技術(shù)及其應(yīng)用綜述[J].自動化博覽,2002年03期.
[3]唐向陽,張勇,李江有,黃崗,楊松,關(guān)宏;機(jī)器視覺關(guān)鍵技術(shù)的現(xiàn)狀及應(yīng)用展望[J].昆明理工大學(xué)學(xué)報(理工版),2004年02期.
[4]關(guān)勝曉.機(jī)器視覺及其應(yīng)用發(fā)展[J].自動化博覽,2005年03期.
[5]R.Shorts,W:L.Snow.Video-metric tracking of wind tunnel aerospace models at NASA
Langley research center[C].The Thompson Symposium held at the University of York
on 20th April 1 996:673~689.
[6]Hassan Mostafavi. Wind tunnel model aircraft attitude and motion analysis[J].PRO.SPIE.Signal and image processing systems performance evaluation simulmion and modeling.199I(1483):104~111.
[7]ohn V Foster,Kevin Cunningharn.Charles M.Fremaux.Dynamics modding and simulation of large transport airplanes in upset conditions[J].Navigation and control conference and exhibit,2005:l5~l 8.
[8]鄭南寧.計算機(jī)視覺與模式識別[M].北京:國防工業(yè)出版社,1998.
[9]劉煥軍,王耀南,段峰.機(jī)器視覺中的圖像采集技術(shù)[J].電腦與信息技術(shù),2003年01期
[10]王慶友,孫學(xué)株.CCD應(yīng)用技術(shù)[M].天津:天津大學(xué)出版社,1993
關(guān)鍵詞:鐵路貨車;輪對參數(shù);鐵路運(yùn)輸;安全系數(shù);自動檢測系統(tǒng)
中圖分類號:U270 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-2374(2014)33-0025-02
輪對是鐵路貨車行走過程中重要的構(gòu)件,安全高效的輪對是保證鐵路能夠快速、安全運(yùn)輸?shù)年P(guān)鍵因素,輪對故障導(dǎo)致的安全事故屢見不鮮,給鐵路運(yùn)輸造成了嚴(yán)重的損失。另外,輪對故障也會給車輛本身以及鐵路固定設(shè)施帶來一定程度的損害。目前,我國仍然依靠傳統(tǒng)的人工手動測量來對其進(jìn)行故障的檢測診斷,不但效率低下,檢測精度以及可檢測項目也不盡如人意,為鐵路正常運(yùn)行帶來了隱患。因此,發(fā)展一種新型的自動貨車輪對檢測技術(shù)對于提高我國檢測水平、提高鐵路運(yùn)輸安全系數(shù)有著重要的意義。
1 輪對自動檢測技術(shù)的原理及現(xiàn)狀
目前來說,國內(nèi)外主要應(yīng)用的輪對自動檢測技術(shù)按照原理分類,可分為以下三類:光截圖像原理技術(shù)、視覺自動測量技術(shù)以及激光位移測距技術(shù),主要應(yīng)用于貨車的入庫檢查以及地鐵在線監(jiān)查上。下面分別簡述一下這三類原理:
1.1 光截圖像原理技術(shù)
這種技術(shù)主要原理為利用三角激光測量技術(shù)來實現(xiàn)測量物體二維尺寸的目的。采用的投射光源為點狀高強(qiáng)度激光,高速的CCD相機(jī)作為圖像采集設(shè)備。當(dāng)測試完畢后會得到一系列的曲線,將其和標(biāo)準(zhǔn)的校正曲線進(jìn)行比對矯點,從而實現(xiàn)目標(biāo)參數(shù)的自動檢測。這種技術(shù)在低速以及靜態(tài)測量中的精度比較高,但是對于高速測量的精度尚不能令人滿意,這是由于CCD相機(jī)的采集速度有限而造成的。但是這種原理制備的設(shè)備價格低廉、操作簡單,得到了廣泛的應(yīng)用,如丹麥的EDOC公司、美國的BEENA公司以及國內(nèi)的哈爾濱威克公司等都有相應(yīng)的產(chǎn)品。
1.2 視覺自動測量技術(shù)
視覺自動測量技術(shù)是一種基于視覺測量系統(tǒng),建立在計算機(jī)視覺研究基礎(chǔ)上的新興技術(shù),其優(yōu)點為抗干擾能力強(qiáng)、高效易行,非常適合一些在現(xiàn)場生產(chǎn)中的在線非接觸性監(jiān)控及監(jiān)測。在實際生產(chǎn)過程中,該技術(shù)基于視頻成像原理及先進(jìn)的圖像識別功能工作,通過高速攝像機(jī)現(xiàn)場拍攝車輛輪對運(yùn)行狀況,采用逐幀截屏得到清晰圖片,再對圖片進(jìn)行識別辨認(rèn)的方法來實現(xiàn)對車輛輪對的監(jiān)控監(jiān)測。
1.3 激光位移測距技術(shù)
激光位移技術(shù)是一種高精度、高精密的非接觸行測量技術(shù),主要用于測量對象物體的位置以及位移的變化,可以準(zhǔn)確監(jiān)測出物體的位移、體積尺寸、振動頻率等物理幾何量的測量。按照原理,激光位移技術(shù)可分為激光回波法和激光三角測量法兩種,而在鐵輪貨車輪對檢測中主要用的是激光三角測量法,這種檢測方法精度高,但監(jiān)測的距離較短。在實際應(yīng)用中,左右兩路光電流從激光位移傳感器發(fā)出,通過干涉成像,就可以反推算出物體激光點和成像透鏡前面的距離,從而達(dá)到監(jiān)測的目的。目前這種技術(shù)已經(jīng)被應(yīng)用于我國部分鐵路
路段。
2 輪對自動檢測系統(tǒng)的研制及簡單介紹
2.1 系統(tǒng)結(jié)構(gòu)整體設(shè)計
根據(jù)輪對檢測工藝要求以及車間的實際工作狀況,我們設(shè)計了一種以龍門通過式機(jī)械結(jié)構(gòu)為基礎(chǔ)的輪對自動檢測系統(tǒng),其簡單組成主要包括進(jìn)給總成、升降總成、帶轉(zhuǎn)總成、測量裝置以及傳感器等。待貨車輪對沿著特定軌道進(jìn)入測量裝置后,通過各個部件的協(xié)同作用以及協(xié)調(diào)工作,自動完成對輪對各參數(shù)的測量。本裝置可以檢測的輪對參數(shù)主要包括輪緣厚度、輪座直徑、車輪直徑、車軸中央直徑等。
待測的輪對在自動計算機(jī)控制系統(tǒng)的作用下,通過導(dǎo)向裝置機(jī)構(gòu)使得輪對到達(dá)指定的測量位置,具體如下:當(dāng)輪對滾動到待測位置時,擋輪裝置將其擋住,位于裝置下方的輪對提升結(jié)構(gòu)將輪對升起后由轉(zhuǎn)動裝置驅(qū)使輪對轉(zhuǎn)動。
與此同時,測量裝置在直線電機(jī)的驅(qū)動下,通過絲杠的帶動使其沿直線運(yùn)動單元迅速下降到測量位置停止。當(dāng)測量傳感器做橫向運(yùn)動時,可以測量輪對的中央直徑,左右輪緣寬度等參數(shù);和其相連的旋轉(zhuǎn)電機(jī)可以控制測量傳感器做順時針以及逆時針的旋轉(zhuǎn),可以測量左右輪座直徑以及輪輞厚等參數(shù)。在自動控制系統(tǒng)的作用下,激光傳感器按照一定的路徑做直線往復(fù)運(yùn)動,可以自動采集被測輪對中各測量點的數(shù)據(jù),通過安裝的攝像裝置可以將裝置板上的圖像反映到計算機(jī)的顯示屏上,經(jīng)過計算機(jī)運(yùn)算處理后得到測量結(jié)果保存到相應(yīng)數(shù)據(jù)庫中并自動打印。當(dāng)采集數(shù)據(jù)完成后,左右的測量裝置以及激光傳感器自動上升到初始位置,測試的輪對停止轉(zhuǎn)動并自動下降,最后由輪推裝置推出測量位置,完成整個的工作循環(huán)。
2.2 測控系統(tǒng)設(shè)計
本自動檢測系統(tǒng)的測控系統(tǒng)主要有工業(yè)控制高精密計算機(jī)、運(yùn)動控制部分、數(shù)據(jù)自動采集處理部分以及測控軟件等部分組成。
2.2.1 工業(yè)控制高精密計算機(jī)。該部分作為整體系統(tǒng)的關(guān)鍵組成之一,擔(dān)負(fù)著處理數(shù)據(jù),采集打印圖像以及對運(yùn)動的部件進(jìn)行高精度高準(zhǔn)確度控制的作用。設(shè)計中我們采用的是方正的主機(jī),CPU為AMD 速龍II X4 740,內(nèi)存為4GB的DDR內(nèi)存,配備Dell打印機(jī),利用Windows自帶的Microsoft Visual C++ 7.0編程系統(tǒng)進(jìn)行編程。我們采用的計算機(jī)配置較高,編程系統(tǒng)較為先進(jìn),為整個檢測系統(tǒng)的優(yōu)良性能奠定了良好的基礎(chǔ)。
2.2.2 運(yùn)動控制部分。運(yùn)動控制部分主要由步進(jìn)電機(jī)、氣動控制裝置以及異步電機(jī)三部分組成。實際運(yùn)行條件下,要求本系統(tǒng)的定位精度高,整體系統(tǒng)動作平穩(wěn),沖擊力小。因為旋轉(zhuǎn)特性不同,結(jié)合實際現(xiàn)場運(yùn)行的需要,選擇合適的電機(jī)是非常重要的。在輪對旋轉(zhuǎn)中,由于對電機(jī)的要求較低,因此采用的是步進(jìn)電機(jī),最佳細(xì)分圈數(shù)為6400步/圈。在滑臺極限位置兩側(cè)安裝有光電開發(fā),實現(xiàn)對運(yùn)動極限位置的控制,保護(hù)與之相連的傳感器。設(shè)計中旋轉(zhuǎn)運(yùn)動機(jī)構(gòu)和橫向運(yùn)動機(jī)構(gòu)對電機(jī)要求較高,因此我們使用了帶有64位高性能RISC中央處理器的交流伺服電機(jī),提高了機(jī)器的響應(yīng)性。
2.2.3 數(shù)據(jù)自動采集處理部分。數(shù)據(jù)采集部分主要由激光傳感器,電渦流傳感器以及A/D采集卡三部分組成,這部分也是系統(tǒng)設(shè)計最重要的部分,其采集數(shù)據(jù)的準(zhǔn)確度決定著系統(tǒng)的檢測精度,是設(shè)計中的重點。其基本工作原理是激光傳感器輸出的電信號經(jīng)由電渦流傳感器的放大、濾波、抑躁處理后送入A/D采集卡進(jìn)行模數(shù)轉(zhuǎn)換。
設(shè)計中利用電渦流傳感器對輪對的踏面進(jìn)行高速的數(shù)據(jù)采集,計算機(jī)處理后可得踏面特征;對于車輪直徑以及車軸中央直徑等則采用激光傳感器。為排除實際操作條件下的干擾,我們自行設(shè)計了一種A/D采集卡,帶有32bit分辨率的A/D轉(zhuǎn)換器以及模擬輸入通道,保證最佳轉(zhuǎn)換精度,最大限度地保證了數(shù)據(jù)的可靠性。
2.2.4 測控軟件。本系統(tǒng)采用先進(jìn)的VC++7.0進(jìn)行軟件的設(shè)計,采用先進(jìn)的多線程編程技術(shù),利用模塊化設(shè)計方法,軟件程序結(jié)構(gòu)清晰,使用界面具有自動填入、人工修改編輯的功能,上手快,使用方便。數(shù)據(jù)庫方面,我們采用的是ODBC法來訪問Access數(shù)據(jù)庫。
3 貨車輪對自動檢測技術(shù)展望
國內(nèi)外的研究結(jié)果表明,現(xiàn)有的輪對自動檢測技術(shù)基本上已經(jīng)具備實際應(yīng)用的條件,但是目前我國的檢測系統(tǒng)大部分安裝于列車通過速度較低的路段,并且受氣候條件影響較??;而鐵路重載貨車具有速度高、環(huán)境惡劣等特點,還需對現(xiàn)有自動檢測系統(tǒng)技術(shù)作進(jìn)一步的深入研究,從而實現(xiàn)其廣泛應(yīng)用,消除安全隱患,杜絕由輪對故障導(dǎo)致的嚴(yán)重安全事故。
參考文獻(xiàn)
[1] 黃曙光,黃海,吳乃優(yōu),敖銀輝,高向東.鐵路貨車輪對自動檢測系統(tǒng)的研制[J].機(jī)電工程技術(shù),2002,(2).
關(guān)鍵詞:雙目立體視覺; 攝像機(jī)標(biāo)定;立體匹配;三維重建
中圖分類號:TP37 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2011)09-2145-03
The Analysis of the Technology and the Future Application of the Binocular Stereo Vision System
CHENG Huang-jin
(Huainan Union University, Huainan 232038, China)
Abstract: This article makes an analysis of the implementation process of the binocular stereo vision technology,presents implementation methods and drawbacks of camera calibration, feature extraction, stereo matching, especially gives a practical and effective 3D reconstruction method ,the article also analyses and prospects the future application and development of this technology.
Key words: binocular stereo vision; camera calibration; stereo matching; 3D reconstruction
雙目立體視覺(Binocular Stereo Vision)是計算機(jī)視覺的一種重要形式,它是基于視差原理,由不同位置的A、B兩臺或者同一位置的一臺攝像機(jī)(CCD)經(jīng)過位置移動或者旋轉(zhuǎn)來拍攝同一幅場景,通過計算對應(yīng)點在兩幅圖像間的位置偏差,來獲取物體三維幾何信息的方法。和其他類的體視方法相比,如投影式、透鏡板式、全息照相式等三維成像技術(shù),雙目立體視覺測量方法具有低成本、高效率、結(jié)構(gòu)簡單、精度合適等優(yōu)點。自上世紀(jì)80年代創(chuàng)立以來,經(jīng)過近幾十年的發(fā)展,雙目立體視覺已經(jīng)成為計算機(jī)被動測距方法中最重要的距離感知技術(shù),已在工業(yè)檢測、機(jī)器人導(dǎo)航、醫(yī)學(xué)機(jī)器成像、控制與檢測位姿、以及在軍事和航空測繪上等眾多領(lǐng)域中得到了越來越廣泛的應(yīng)用。
1 雙目體視系統(tǒng)的實現(xiàn)
雙目立體視覺技術(shù)的實現(xiàn)一般可分為:圖像獲取、攝像機(jī)標(biāo)定、特征提取、圖像匹配和三維重建幾個步驟,以下是各個過程的具體實現(xiàn)方法和特點。
1.1 圖像獲取
圖像獲取指的是先通過多個或單個攝像機(jī)從不同位置拍攝某物體,得到至少兩幅的二維圖像,再利用立體視覺方法對此圖像進(jìn)行處理,最終獲取同一場景的三維幾何信息的過程。立體視覺可在多種條件下靈活地測量景物的三維立體信息,在計算機(jī)被動測距方法中,它是一種最重要的距離感知技術(shù),在非接觸測量中占有越來越重要的位置。
雙目體視系統(tǒng)的圖像獲取對應(yīng)的針孔模型如圖1所示。在理想狀態(tài)下,攝像機(jī)C1與C2的光軸互相平行,內(nèi)部參數(shù)和角距也都相等,并且圖中的二維成像平面x1o1y1和x2o2y2重合,其中P1與P2分別是空間點P在C1與C2上的成像點。但在實際應(yīng)用中,需要考慮兩臺攝像機(jī)的內(nèi)部參數(shù)不完全相同帶來的影響,要精確分析雙目體視系統(tǒng)的結(jié)構(gòu)參數(shù)與測量精度之間的關(guān)系,并對某一特定點進(jìn)行三角測量試驗,進(jìn)而得到兩臺攝像機(jī)光軸夾角與該點測量誤差之間的函數(shù)關(guān)系。通常在兩攝像頭光軸夾角一定的情況下,測量誤差將隨著被測坐標(biāo)系與攝像頭坐標(biāo)系之間距離的增大而增大,在滿足測量范圍的前提下,一般選擇兩CCD之間的正向夾角為銳角,且大于45度。
1.2 攝像機(jī)標(biāo)定[2,4-5]
對雙目體視而言,攝像機(jī)或數(shù)碼相機(jī)是利用計算機(jī)技術(shù)對物理世界進(jìn)行重建前的基本測量工具,由于攝像機(jī)參數(shù)會因為組合過程、環(huán)境溫度、零件更換等發(fā)生變化,為了準(zhǔn)確定位,攝像機(jī)必須標(biāo)定。攝像機(jī)標(biāo)定是實現(xiàn)立體視覺技術(shù)的關(guān)鍵步驟之一,標(biāo)定的參數(shù)有關(guān)于光學(xué)與幾何性質(zhì)的內(nèi)部參數(shù)和涉及坐標(biāo)系三維位置與方向的外部參數(shù),為了得到兩個攝像機(jī)的內(nèi)、外參數(shù),通常先采用單攝像機(jī)的標(biāo)定方法,再通過同一世界坐標(biāo)中的一組定標(biāo)點來建立兩個攝像機(jī)之間的位置關(guān)系。
標(biāo)定方法分精度低但簡單快速的線性標(biāo)定法和考慮畸變參數(shù)但復(fù)雜繁瑣的非線性標(biāo)定法。在單攝像機(jī)標(biāo)定方法中,目前常用的主要有:直接線性變換法、傳統(tǒng)設(shè)備標(biāo)定法、透視變換矩陣法和線性與非線性結(jié)合法等。在雙攝像機(jī)標(biāo)定中,是否有精確的外部參數(shù)決定著最終的標(biāo)定結(jié)果,受結(jié)構(gòu)配置的準(zhǔn)確性和攝像機(jī)距離與視角的影響,一般都需要確定8個以上的已知世界坐標(biāo)點,才能得到比較滿意的參數(shù)矩陣。此外,雙攝像機(jī)標(biāo)定中除了考慮焦距、主點坐標(biāo)、線性誤差等以外,還需考慮徑向、切向和離心畸變,以及鏡頭校正、測量范圍等問題,應(yīng)用范圍受到了很大的限制。目前,通用性較好的有基于神經(jīng)網(wǎng)絡(luò)的雙目立體視覺攝像機(jī)標(biāo)定法,有采用線性與非線性變換結(jié)合標(biāo)定法等,前者的基本思想是先對攝像機(jī)進(jìn)行線性標(biāo)定,然后通過網(wǎng)絡(luò)訓(xùn)練建立起三維空間點位置補(bǔ)償?shù)亩鄬忧梆伾窠?jīng)網(wǎng)絡(luò)模型。后者是先利用直接線性轉(zhuǎn)換模型(DLT)得到投影矩陣,通過約束條件分解參數(shù)矩陣,分別求出攝像機(jī)內(nèi)部參數(shù);然后將得到的標(biāo)定參數(shù)作為初值,代入非線性方程進(jìn)行優(yōu)化,得到精確的標(biāo)定參數(shù)。
1.3 特征點提取[1-3]
測量中,測量精度將直接受到特征點的二維圖像坐標(biāo)能否準(zhǔn)確提取的影響,需要提取的特征點應(yīng)當(dāng)與傳感器類型及抽取特征所用技術(shù)等相適應(yīng),并且要具有足夠的魯棒性和一致性。因為在圖像獲取過程中,存在一系列的噪聲源,為了顯著的改進(jìn)圖像質(zhì)量,使圖像征點更加突出,通常在進(jìn)行特征點像的坐標(biāo)提取前,要對獲取的圖像進(jìn)行預(yù)處理。
目前,常見的特征點提取方法有邊緣提取法、興趣算子法、最小灰度差法等。其中邊緣提取法和興趣算子法對光照條件比較敏感,當(dāng)物體相鄰面的灰度近似時,這些方法能夠在較低的精度要求下,概括且有效地提取特征點,然而當(dāng)某一像素存在于局部灰度出現(xiàn)差異的區(qū)域,或者存在于具有不同灰度值的幾個相鄰區(qū)域之間時,這些方法也往往會將其作為邊緣特征點提取出來。而最小灰度差法是對數(shù)字圖像的每一個原像素,分別考察與其同行、同列或?qū)窍噜彽娜舾蓚€像素的灰度變化,再選取這些像素與原像素間灰度差的最小值來作為特征點算子值的一種方法。它可以最大程度的消除物體相鄰面及物體與背景間存在的灰度差異而造成的影響,對外界光照條件具有較強(qiáng)的適應(yīng)性,但一致性較差。
1.4 立體匹配[1-2,6]
立體匹配是雙目體視技術(shù)中最重要,也是最復(fù)雜的一步。當(dāng)二維圖像特征點提取后,關(guān)鍵任務(wù)是匹配,也就是尋求左(右)圖像中的每個特征點在右(左)圖像中的對應(yīng)點。由于將空間三維場景投影為平面二維圖像時,同一景物在不同視點下的圖像中存在著明顯差異,并且場景中的噪聲干擾、光照條件、景物的物理特性與幾何形狀、攝像機(jī)特性等諸多變化因素都將被綜合到單一的圖像灰度值中,因此僅由灰度值來定性以上這些因素和特征是十分困難的。為了求解對應(yīng)和減少錯誤匹配,人們建立了諸如唯一性約束、連續(xù)性約束、外極線約束、一致性約束等許多約束,然而隨著約束條件的增加,匹配難度相應(yīng)增大,匹配的選擇性空間相應(yīng)縮小。根據(jù)匹配基元的不同,立體匹配的算法可分為區(qū)域匹配、特征匹配和相位匹配三大類。
區(qū)域匹配算法是利用局部窗口之間灰度信息的相關(guān)程度,通過區(qū)域匹配建立特征點與對應(yīng)點之間的相互關(guān)系的一種方法,它在變化平緩且細(xì)節(jié)豐富的地方可以達(dá)到較高的精度,但該算法的計算量大、速度慢,并且存在著匹配窗大小難以選擇的缺點。與區(qū)域匹配相比,特征匹配則不直接依賴于灰度,利用對高頻噪聲不敏感的模型來提取和定位特征,因此具有較強(qiáng)的抗干擾性,算法簡便且高效,但匹配結(jié)果的精確度受到特征提取和定位過程的直接影響,特征在圖像中的稀疏性決定著特征匹配只能得到稀疏的視差場。相位匹配是近二十年才發(fā)展起來的一類匹配算法,它將相位作為匹配基元,很好的抑制了圖像的高頻噪聲,適于并行處理,能獲得亞像素級精度的致密視差,但也存在著相位奇點和相位卷繞的問題。
1.5 三維重建[1,6]
在完成了圖像獲取、攝像機(jī)標(biāo)定、特征點提取和立體匹配之后,就得到了任一被測點在兩個圖像中的對應(yīng)齊次坐標(biāo)和兩攝像機(jī)的參數(shù)矩陣,接下來就是對空間點進(jìn)行三維重建。
結(jié)合上述圖1,用兩個參數(shù)標(biāo)定過的攝像機(jī)同時觀察空間物體表面上任意一點P,在確定了攝像機(jī)圖像上的共軛對應(yīng)點P1和P2是同一空間點P的圖像點后,P點的空間位置就可以由兩直線O1P1與O2P2的交點來唯一確定,其中O1,O2分別為兩攝像機(jī)的光心。
設(shè)攝像機(jī)的投影矩陣為:
代入下式:
其中(x1,y1,1)與(x2,y2,1)分別為P1與P2在各自圖像中的齊次坐標(biāo);(X,Y,Z,1)為P點在世界坐標(biāo)系下的齊次坐標(biāo);ωi(i=1,2)為非零參數(shù),αimn(m=1,2,3;n=1,2,3,4)為投影矩陣Ai(i=1,2)中的元素,它們與攝像機(jī)的位置及成像系統(tǒng)參數(shù)有關(guān),可通過攝像機(jī)標(biāo)定來確定。
攝像機(jī)標(biāo)定后,根據(jù)式(1)和被測點P在攝像機(jī)像面上的像點坐標(biāo)(x1,y1)與(x2,y2),可將上式變形為:
(2)
即:
(3)
這樣就可以求出未知點P的三維空間坐標(biāo)(X,Y,Z)。
在測量過程中,當(dāng)標(biāo)定參照物與被測物體的相對位置始終保持不變的情況下,也可以只用一個攝像機(jī),采用多個不同位置分別拍攝的方法,得到同一物體的多幅二維圖像。
2 雙目體視系統(tǒng)的發(fā)展[1,6]
正如本文引言所述,雙目立體視覺系統(tǒng)發(fā)展到現(xiàn)在,已經(jīng)在很多領(lǐng)域得到了廣泛應(yīng)用。例如日本大阪大學(xué)自適應(yīng)機(jī)械系統(tǒng)研究院研制了一種自適應(yīng)雙目視覺伺服系統(tǒng);東京大學(xué)將實時雙目立體視覺和機(jī)器人整體姿態(tài)信息集成,開發(fā)了仿真機(jī)器人動態(tài)行走導(dǎo)航系統(tǒng);華盛頓大學(xué)與微軟公司合作為火星衛(wèi)星“探測者”號研制了寬基線立體視覺系統(tǒng),使“探測者”號能夠在火星上對其即將跨越的幾千米內(nèi)的地形進(jìn)行精確的定位和導(dǎo)航;浙江大學(xué)機(jī)械系完全利用透視成像原理,采用雙目體視方法實現(xiàn)了對多自由度機(jī)械裝置的動態(tài)、精確位姿檢測;哈工大采用異構(gòu)雙目活動視覺系統(tǒng)實現(xiàn)了全自主足球機(jī)器人導(dǎo)航等等。
但就雙目立體視覺技術(shù)的發(fā)展現(xiàn)狀而言,要構(gòu)造出類似于人眼的通用雙目立體視覺系統(tǒng),還有很長的路要走,未來的發(fā)展趨勢可總結(jié)如下:
1)如何建立更有效的雙目體視模型,能更充分地反映立體視覺不確定性的本質(zhì)屬性,為匹配提供更多的約束信息,降低立體匹配的難度;
2)探索新的適用于全面立體視覺的計算理論和匹配策略,選擇有效的匹配準(zhǔn)則和算法結(jié)構(gòu),以解決存在灰度失真、幾何畸變(透視、旋轉(zhuǎn)、縮放等)、噪聲干擾、特殊結(jié)構(gòu)(平坦區(qū)域、重復(fù)相似結(jié)構(gòu)等)及遮掩景物的匹配問題;
3)算法向并行化發(fā)展,提高速度,減少運(yùn)算量,增強(qiáng)系統(tǒng)的實用性;
4)強(qiáng)調(diào)場景與任務(wù)的約束,針對不同的應(yīng)用目的,建立有目的的和面向任務(wù)的體視系統(tǒng)。
參考文獻(xiàn):
[1] 管業(yè)鵬,童林夙.雙目立體視覺測量方法研究[J].儀器儀表學(xué)報,2003,24(6):581-584.
[2] 隋婧,金偉其.雙目立體視覺技術(shù)的實現(xiàn)及其進(jìn)展[J].電子技術(shù)應(yīng)用,2004(10):4-6.
[3] Barnard S T, Thompson W B.Disparity Analysis of Images IEEE Trans,1980,PAM I-2(4):333-340.
[4] Golub G, Loan C van, Matrix Computations[M].Balti-more,Maryland:The John Hopkins University Press,1996.