前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺(jué)的應(yīng)用方向主題范文,僅供參考,歡迎閱讀并收藏。
近年來(lái),經(jīng)濟(jì)的發(fā)展和人們生活水平的提升也使得人們的出行更加便捷,越來(lái)越多的人都是自己駕車出行,這樣導(dǎo)致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關(guān)注的重點(diǎn)問(wèn)題。信息技術(shù)的發(fā)展推動(dòng)了計(jì)算機(jī)視覺(jué)技術(shù)的出現(xiàn),為交通安全性的提升提供了一定的保障。本文主要對(duì)計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行分析,進(jìn)一步探討計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用。
【關(guān)鍵詞】計(jì)算機(jī) 視覺(jué)技術(shù) 智能交通 系統(tǒng) 應(yīng)用
智能交通系統(tǒng)簡(jiǎn)稱ITS,這是一種新型的交通管理系統(tǒng)。該系統(tǒng)主要結(jié)合了信息化技術(shù)、計(jì)算機(jī)技術(shù)以及數(shù)據(jù)傳輸技術(shù)等多種技術(shù),用來(lái)對(duì)整個(gè)交通運(yùn)輸體系進(jìn)行管理,可以實(shí)現(xiàn)人、車、路的全面監(jiān)控和管理。計(jì)算機(jī)視覺(jué)藝術(shù)作為智能交通系統(tǒng)中的一個(gè)重要環(huán)節(jié),受到相關(guān)工作人員的高度重視。隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,不僅為交通行業(yè)的發(fā)展提供了更多的便捷,同時(shí)還能夠篩選道路交通的各種信息,進(jìn)一步增強(qiáng)了智能交通系統(tǒng)的靈活性和準(zhǔn)確性。
1 計(jì)算機(jī)視覺(jué)技術(shù)的概述
計(jì)算機(jī)視覺(jué)也被稱為圖像分析和圖解理解,其包括的理論主要有攝影幾何學(xué)、概率論、圖像處理理論以及人工智能理論等部分。計(jì)算機(jī)視覺(jué)技術(shù)主要是用二維投影圖像實(shí)現(xiàn)三維物體重構(gòu)。這種技術(shù)的應(yīng)用范圍比較廣泛,不僅應(yīng)用于二維圖像識(shí)別方面,同時(shí)還用于三維物體的識(shí)別和重建上面。通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)能夠獲取專業(yè)化的三維信息,對(duì)三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)的效果來(lái)確定三維運(yùn)動(dòng)中產(chǎn)生的各種參數(shù),這一過(guò)程對(duì)攝像機(jī)運(yùn)動(dòng)問(wèn)題的關(guān)注程度較高;間接獲取的方式就是將單幅圖像和攝像機(jī)焦距相結(jié)合,來(lái)判斷被測(cè)量位置視覺(jué)上的信息。計(jì)算機(jī)視覺(jué)技術(shù)的關(guān)鍵就是實(shí)現(xiàn)特別匹配,在特殊情況下可以利用不同的攝像C同時(shí)收集運(yùn)動(dòng)信息,從而提高相關(guān)控制的精確度。
2 計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用
計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用可以實(shí)現(xiàn)道路交通的監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)自動(dòng)收費(fèi)、智能導(dǎo)航等功能,主要應(yīng)用有以下幾個(gè)方面的內(nèi)容。
2.1 交通監(jiān)控中對(duì)計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用
基于計(jì)算機(jī)視覺(jué)技術(shù)的交通監(jiān)控系統(tǒng)主要分為三個(gè)步驟,首先是對(duì)車輛和行人進(jìn)行跟蹤和分割,其次是對(duì)車流量進(jìn)行分析和計(jì)算,并且計(jì)算車輛的平均速度和道路上車輛的隊(duì)列長(zhǎng)度,最后根據(jù)道路的交通狀況來(lái)規(guī)劃形式線路,從而有效緩解道路交通擁堵的現(xiàn)狀,方便人們減少出行時(shí)間。車輛和行人作為道路中運(yùn)動(dòng)的主要目標(biāo),在監(jiān)控場(chǎng)合下,需要對(duì)運(yùn)動(dòng)時(shí)間進(jìn)行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據(jù)圖像中不同的運(yùn)動(dòng)用映射參數(shù)正確的表達(dá),這樣可以將具有同樣映射參數(shù)的光流量進(jìn)行分配,從而完成參數(shù)分割。計(jì)算機(jī)視覺(jué)在交通監(jiān)控中的應(yīng)用主要是對(duì)車輛速度、車輛數(shù)目、車輛分類進(jìn)行檢測(cè)。隨著計(jì)算機(jī)通信技術(shù)的發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)也是日新月異,基于計(jì)算機(jī)視覺(jué)的交通監(jiān)控系統(tǒng)具有較強(qiáng)的實(shí)時(shí)工作性,能夠快速的適應(yīng)高度公路以及城市道路交通的監(jiān)控。
2.2 車輛導(dǎo)航中對(duì)計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用
實(shí)現(xiàn)車輛的智能導(dǎo)航是計(jì)算機(jī)視覺(jué)技術(shù)在智能交通中應(yīng)用的典型案例。這種技術(shù)主要為駕駛?cè)藛T提供道路信息和車輛運(yùn)行狀況兩大信息。通過(guò)車輛智能導(dǎo)航系統(tǒng)的運(yùn)行能夠?qū)Φ缆穬蛇叺慕缦捱M(jìn)行有效的識(shí)別,將車輛引向規(guī)定的行駛車道,在車輛行駛過(guò)程中,該系統(tǒng)能夠自動(dòng)檢測(cè)車輛與前方其他車輛之間的距離,從而提醒駕駛?cè)藛T保持車輛的安全距離,最終實(shí)現(xiàn)安全導(dǎo)航駕駛。通過(guò)該系統(tǒng)的攝像機(jī)運(yùn)動(dòng)能夠識(shí)別其他車輛的行駛狀況,并且通過(guò)計(jì)算檢測(cè)點(diǎn)的方式計(jì)算車輛的模擬匹配點(diǎn)。車倆智能導(dǎo)航系統(tǒng)中就使用了計(jì)算機(jī)視覺(jué)技術(shù),可以從中提取相關(guān)信息,計(jì)算車輛行駛的安全距離和速度。
2.3 計(jì)算機(jī)視覺(jué)技術(shù)用于車輛輔助駕駛
計(jì)算機(jī)視覺(jué)技術(shù)在車輛輔助駕駛中的應(yīng)用主要是幫助駕駛?cè)藛T對(duì)外界的變化做出反應(yīng)。具體表現(xiàn)為車輛在市內(nèi)行駛時(shí),計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用能夠識(shí)別周邊道路的標(biāo)記,并且對(duì)交通標(biāo)志、其他車輛和行人進(jìn)行識(shí)別,然后篩選相關(guān)信息進(jìn)行計(jì)算,讓駕駛?cè)饲宄饨绲木唧w狀況,從而避開(kāi)其他的車輛和行人,能夠從根本上減少交通事故的發(fā)生,增強(qiáng)車輛的安全運(yùn)行。輔助駕駛的形式轉(zhuǎn)變?yōu)槿藱C(jī)交互的方式,一定程度上能夠滿足駕駛?cè)藛T對(duì)信息的需求。
2.4 計(jì)算機(jī)視覺(jué)技術(shù)用于車輛智能收費(fèi)
車輛收費(fèi)是車輛在公共交通位置行駛中的一個(gè)關(guān)鍵環(huán)節(jié)。隨著科學(xué)技術(shù)的發(fā)展,車輛收費(fèi)系統(tǒng)逐漸向著計(jì)算機(jī)技術(shù)的應(yīng)用方向發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)在各地區(qū)交通發(fā)展中的應(yīng)用是現(xiàn)代化交通發(fā)展的一個(gè)重要突破口。很多地區(qū)的智能化收費(fèi)都是通過(guò)識(shí)別車牌的方式來(lái)實(shí)現(xiàn)收費(fèi),我國(guó)在車牌識(shí)別這方面僅僅限制于單目車牌和雙目車牌的識(shí)別,其中單目車牌識(shí)別的核心就是將車牌照位置作為核心部分,我國(guó)大部分地區(qū)都是將單目系統(tǒng)作為核心部分來(lái)使用。采用雙目系統(tǒng)對(duì)車牌進(jìn)行識(shí)別,也可以對(duì)車輛的型號(hào)進(jìn)行識(shí)別,通過(guò)大量的實(shí)踐發(fā)現(xiàn),雙目系統(tǒng)進(jìn)行車牌識(shí)別的實(shí)用性較強(qiáng)。但是這種識(shí)別方式在實(shí)際應(yīng)用過(guò)程中仍然存在著信息獲取難度大、車牌照定位難度大等多種問(wèn)題,尤其是車輛在高速路上行駛時(shí),對(duì)于車牌信息的獲取更為困難,因此,在這方面還需要加大研究和實(shí)踐。
3 結(jié)束語(yǔ)
隨著計(jì)算機(jī)視覺(jué)技術(shù)的智能化發(fā)展,其在智能交通系統(tǒng)中的應(yīng)用能夠解決多方面的問(wèn)題。該技術(shù)的應(yīng)用不僅能夠?qū)崿F(xiàn)車輛的實(shí)時(shí)監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)車輛導(dǎo)航以及車輛收費(fèi),幫助駕駛?cè)藛T識(shí)別車輛行駛中存在的障礙物,這樣一來(lái),可以增強(qiáng)車輛行駛的安全性,同時(shí)還能夠提高我國(guó)道路交通系統(tǒng)的整體管理水平。但是該技術(shù)應(yīng)用中也存在不足之處,未來(lái)發(fā)展中需要降低視覺(jué)系統(tǒng)的價(jià)格,減少系統(tǒng)的尺寸,從而增強(qiáng)系統(tǒng)對(duì)車輛信息的處理速度,最終實(shí)現(xiàn)對(duì)道路交通的全面監(jiān)測(cè)。
參考文獻(xiàn)
[1]王春波,張衛(wèi)東,許曉鳴.計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用[J].測(cè)控技術(shù),2000(05):22-24.
[2]郁梅,蔣剛毅,郁伯康.智能交通系統(tǒng)中的計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2001(10):101-103+121.
[3]顧晶. 基于計(jì)算機(jī)視覺(jué)的智能交通監(jiān)控系統(tǒng)的研究[D].東南大學(xué),2006.
[4]謝萍萍,黃傳春.計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用[J].福建電腦,2008(10):77+133.
物體為什么會(huì)呈現(xiàn)出人們所看到的視覺(jué)效果?經(jīng)過(guò)多重反射后,光線將怎樣變化?如何讓計(jì)算機(jī)把真實(shí)世界里的物理原理數(shù)字化表現(xiàn)出來(lái)?這些都是松下康之在微軟亞洲研究院工作時(shí)要思考的問(wèn)題,攝像機(jī)拍攝出的畫(huà)面抖動(dòng)看不清怎么辦?松下康之也遇到過(guò)生活提出的小挑戰(zhàn)。
松下康之用研究員的“專屬語(yǔ)言”解釋道,“低層視覺(jué)研究”和“滿幀視頻穩(wěn)定技術(shù)”可以很好地回答和解決上面問(wèn)題。“這也正是我所從事的兩個(gè)研究方向:一個(gè)是光度學(xué),另一個(gè)是視頻分析,”微軟亞洲研究院視覺(jué)計(jì)算組主管研究員松下康之說(shuō),“兩者之間并沒(méi)有十分緊密的聯(lián)系,但這也正是有趣的地方?!?/p>
從東京大學(xué)的博士到微軟亞洲研究院實(shí)習(xí)生、從日本東京到北京的希格瑪大廈、從電氣工程學(xué)專業(yè)到以物理學(xué)為基礎(chǔ)的計(jì)算機(jī)視覺(jué)和視頻分析與合成。事實(shí)上,這種“毫無(wú)關(guān)系”所帶來(lái)的驚喜與巧合也貫穿于松下康之的經(jīng)歷之中。于是,松下康之給記者講述了一個(gè)充滿偶然與必然、選擇與堅(jiān)持的故事。言語(yǔ)間,流露出日本文化的嚴(yán)謹(jǐn)、美國(guó)式的活潑和與在微軟亞洲研究院的中國(guó)研究員一樣的親切與隨和。
邂逅未來(lái)
微軟亞洲研究院院長(zhǎng)洪小文曾說(shuō)過(guò):“創(chuàng)新更多的是意外”。而松下康之與微軟亞洲研究院的緣分,正是充滿著這種“必然的意外”。
在東京大學(xué)讀書(shū)的時(shí)候,松下康之本科、碩士、博士的專業(yè)方向都是電氣工程。那時(shí),松下康之已經(jīng)研究了智能交通系統(tǒng)。“但是,我意識(shí)到自己想做一些更加基礎(chǔ)的研究,并且希望可以把這些研究應(yīng)用到不同的事情上?!痹诓┦慨厴I(yè)前兩年,松下康之就發(fā)現(xiàn)了自己對(duì)計(jì)算機(jī)視覺(jué)領(lǐng)域的濃厚興趣。而電氣工程與計(jì)算機(jī)科學(xué)聯(lián)系緊密,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)和軟件都有學(xué)習(xí),所以對(duì)于松下康之來(lái)說(shuō),從電氣工程轉(zhuǎn)到計(jì)算機(jī)視覺(jué)并不是一個(gè)很大的跨越。
2002年,當(dāng)時(shí)松下康之還在讀博,在一次國(guó)際性的計(jì)算機(jī)視覺(jué)大會(huì)上,他見(jiàn)到了時(shí)任微軟亞洲研究院副院長(zhǎng)的沈向洋,“我之前就認(rèn)識(shí)他,還知道他在計(jì)算機(jī)視覺(jué)領(lǐng)域非常有名。我希望能有機(jī)會(huì)與他一起工作,學(xué)到更多東西?!庇谑?,松下康之向沈向洋毛遂自薦,“意外地”成了一名微軟亞洲研究院的實(shí)習(xí)生,經(jīng)過(guò)4個(gè)月的實(shí)習(xí)生活之后,松下康之發(fā)現(xiàn)自己已經(jīng)喜歡上了這里的研究環(huán)境和生活,就這樣,在微軟亞洲研究院的工作開(kāi)始了。
如何用科技來(lái)解決實(shí)際問(wèn)題,從而改變更多人的生活,一直是微軟亞洲研究院的初衷。生活也不斷地給松下康之帶來(lái)靈感和意外的收獲。
其中,“滿幀視頻穩(wěn)定技術(shù)”的“誕生”就源于松下康之的婚禮――用手持的攝像機(jī)拍攝的婚禮畫(huà)面是搖晃的,看起來(lái)很不舒服,新婚妻子對(duì)婚禮錄像效果很不滿意,松下康之就想通過(guò)研究解決視頻顫抖的問(wèn)題。“現(xiàn)有的數(shù)字影像鑲嵌技術(shù)可以對(duì)畫(huà)面進(jìn)行穩(wěn)定性處理,但如果物體移動(dòng),這種在場(chǎng)景固定的情況下才能實(shí)現(xiàn)的方法就不可行了。而通過(guò)‘滿幀視頻穩(wěn)定技術(shù)’,丟失掉的像素被自然的補(bǔ)充上了?!蓖?,還可以去除覆蓋在視頻上的文字、鏡頭上的污點(diǎn),來(lái)補(bǔ)上丟失的像素。
科技的光影魔術(shù)
“視頻分析在不久的將來(lái)將變得更加重要,因?yàn)閳D像和視頻的界限已經(jīng)越來(lái)越模糊,我相信最后一切都將變成視頻?!彼上驴抵畬?duì)記者說(shuō)。
微軟亞洲研究院的計(jì)算機(jī)視覺(jué)包括:高層視覺(jué)(如人臉識(shí)別技術(shù))和低層視覺(jué)(如光度學(xué),即研究光線與物體的相互作用),松下康之的研究方向?qū)儆诤笳摺?/p>
“光度學(xué)也非常重要,因?yàn)槿绻覀儾幻靼住蛯印习l(fā)生了什么,就無(wú)法在‘高層視覺(jué)’研究上取得突破,所以‘低層視覺(jué)’研究是非?;A(chǔ)的。如果“低層視覺(jué)”發(fā)展了,那么“高層視覺(jué)”也會(huì)隨之發(fā)展?!?/p>
雖然是“肉眼”難以察覺(jué)的變化,但是松下康之卻給記者描述了光度學(xué)形象的應(yīng)用――3D復(fù)原和現(xiàn)實(shí)物體數(shù)字化。而要實(shí)現(xiàn)上面的兩項(xiàng)應(yīng)用,很明顯需要比普通人更特別的“視力”。
“計(jì)算機(jī)視覺(jué)里有一個(gè)傳統(tǒng)的方法,叫多視角立體視覺(jué)法(multi-view stereo),通過(guò)不同視角拍攝的圖片我們可以重現(xiàn)3D,但不能做細(xì)節(jié)的重現(xiàn);還有另一種方法,叫立體光學(xué)法(photometric stereo),攝像機(jī)和物體都是固定的,但是光線是變化的,如果移動(dòng)光源就可以得到物體的不同觀察值,通過(guò)觀察值可以得到表面方向(surface orientation)。”
前者可以得到整體的形狀,但卻無(wú)法得到細(xì)節(jié),而后者不能給你整體的形狀,因?yàn)樗荒芙o你表面方向。如何把兩個(gè)技術(shù)的優(yōu)點(diǎn)結(jié)合起來(lái)得到最真實(shí)的3D圖像呢?
“我們考慮如果把一個(gè)持續(xù)光源固定在攝像機(jī)上,這樣我們就可以同時(shí)移動(dòng)光源和攝像機(jī)。”于是,松下康之和他來(lái)自東京大學(xué)的實(shí)習(xí)生一起做出了看起來(lái)與普通家用數(shù)碼產(chǎn)品沒(méi)有太大差別的“3D攝像機(jī)”。“這個(gè)3D攝像機(jī)的相關(guān)的配件在市場(chǎng)上很容易就能買到,手持永遠(yuǎn)是簡(jiǎn)單的,人們不會(huì)想要拿著一個(gè)龐然大物?!彼上驴抵蛴浾呓榻B研發(fā)背后的原因。
文化熔爐
作為美國(guó)電氣電子工程師協(xié)會(huì)2009年計(jì)算機(jī)視覺(jué)與模式識(shí)別國(guó)際會(huì)議(CVPR)和2009年計(jì)算機(jī)視覺(jué)國(guó)際會(huì)議(ICCV)的區(qū)域主席、著名期刊International Journal of Computer Vision(IJCV)和Computer Vision Applications(CVA)的編委,松下康之坦言,微軟亞洲研究院對(duì)研究員在專業(yè)領(lǐng)域的自由交流的支持,使得研究員對(duì)自己的研究領(lǐng)域“看得更遠(yuǎn)、更透徹”。
“通過(guò)這些職務(wù),我對(duì)研究方向有了更高的認(rèn)識(shí),這種視野能夠幫助我決定今后什么樣的研究更有價(jià)值。此外,我能夠認(rèn)識(shí)計(jì)算機(jī)視覺(jué)界的很多人,這是另一個(gè)收獲?!彼上驴抵χf(shuō)。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);案例推理;圖像處理;圖像描述
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項(xiàng)重要推理技術(shù)。基于案例推理與類比推理方法相似,案例推理將舊經(jīng)驗(yàn)或教訓(xùn)轉(zhuǎn)換為知識(shí),出現(xiàn)新問(wèn)題時(shí),首先查找以前是否有相似的案例,并用相似案例解決新問(wèn)題。如果沒(méi)遇到相似案例的,經(jīng)過(guò)推理后解決新問(wèn)題的方法,又會(huì)成為新的案例或新經(jīng)驗(yàn),下一次再遇到相同問(wèn)題時(shí),就可以復(fù)用這些案例或經(jīng)驗(yàn)。
這與人遇到問(wèn)題時(shí),首先會(huì)用經(jīng)驗(yàn)思考解決問(wèn)題的方式相似,這也是解決問(wèn)題較好的方法。基于案例推理應(yīng)用于工業(yè)產(chǎn)品檢測(cè)或故障診斷時(shí)具有以下特點(diǎn):
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識(shí),以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識(shí)獲取”的瓶頸。CBR知識(shí)表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡(jiǎn)化知識(shí)獲取的過(guò)。
CBR求解效率較高。是對(duì)過(guò)去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開(kāi)始推導(dǎo),可以提高對(duì)新問(wèn)題的求解效率。
CBR求解的質(zhì)量較高。CBR以過(guò)去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時(shí)該怎樣走向成功或避開(kāi)失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來(lái)問(wèn)題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測(cè)和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測(cè)和設(shè)備故障診斷中,更為智能化,更容易實(shí)現(xiàn)現(xiàn)場(chǎng)檢測(cè)和診斷,計(jì)算機(jī)視覺(jué)技術(shù)起到很大的作用。
計(jì)算機(jī)視覺(jué)是研究用計(jì)算機(jī)來(lái)模擬人和生物的視覺(jué)系統(tǒng)功能的技術(shù)學(xué)科,使計(jì)算機(jī)具有感知周圍視覺(jué)世界的能力。通過(guò)計(jì)算機(jī)視覺(jué),進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識(shí)別與分類、三維信息理解、景物描述、圖像解釋,讓計(jì)算機(jī)具有對(duì)周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。
計(jì)算機(jī)視覺(jué)隨著科學(xué)技術(shù)發(fā)展,特別計(jì)算機(jī)技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計(jì)算機(jī)視覺(jué)理論的不斷發(fā)展和日趨成熟,使計(jì)算機(jī)視覺(jué)從上世紀(jì)60年代開(kāi)始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡(jiǎn)單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運(yùn)動(dòng),由二維轉(zhuǎn)向三維,并主要著眼于對(duì)圖像的識(shí)別和理解上,也使計(jì)算機(jī)視覺(jué)的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運(yùn)用計(jì)算機(jī)視覺(jué)打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計(jì)算機(jī)中組織存儲(chǔ)。如何將信息抽取出特征變量,選擇什么語(yǔ)言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲(chǔ)器中,這關(guān)系到基于案例推理方法的效率,而且對(duì)于案例數(shù)量越來(lái)越多,結(jié)構(gòu)十分復(fù)雜的案例庫(kù),尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫(kù)中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問(wèn)題之間的不同之處,案例中的哪些部分可以用于新問(wèn)題,哪些部分不適合應(yīng)用于新問(wèn)題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫(kù)中,擴(kuò)充案例庫(kù)的案例種類與數(shù)量,這過(guò)程也是知識(shí)獲取。此過(guò)程涉及選取哪些信息保留,以及如何把新案例有機(jī)集成到案例庫(kù)中,包括如何存儲(chǔ),如何建立索引等等。
針對(duì)案例推理的關(guān)鍵技術(shù),根據(jù)檢測(cè)和故障診斷系統(tǒng)的特點(diǎn),計(jì)算機(jī)視覺(jué)主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計(jì)算。本文主要從計(jì)算機(jī)視覺(jué)如何運(yùn)用在案例推理系統(tǒng)進(jìn)行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個(gè)產(chǎn)品圖像的采集。這簡(jiǎn)單傳感器可使用光電開(kāi)關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過(guò)時(shí),產(chǎn)品遮擋住光源,使光電開(kāi)關(guān)產(chǎn)生一個(gè)0值,而沒(méi)有產(chǎn)品經(jīng)過(guò)時(shí),光電開(kāi)關(guān)產(chǎn)生相反的1值,系統(tǒng)通過(guò)判斷光電開(kāi)關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡(jiǎn)單地說(shuō)是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機(jī)和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機(jī)主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過(guò)傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測(cè)件上,CCD相機(jī)拍攝,拍攝圖像經(jīng)過(guò)圖像采集卡數(shù)字化后輸入存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備即為計(jì)算機(jī)硬盤(pán)。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對(duì)案例的組織和案例建模,案例的組織即案例的表示,相對(duì)計(jì)算機(jī)而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時(shí),又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說(shuō)圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點(diǎn),確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對(duì)產(chǎn)品輸入的原始圖像進(jìn)行處理。
在計(jì)算機(jī)視覺(jué)技術(shù)中,對(duì)原始圖像主要進(jìn)行圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺(jué)效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。具體工作流程如圖2所示:
圖2 計(jì)算機(jī)視覺(jué)的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計(jì)算機(jī)后,首先要進(jìn)行圖像的預(yù)處理,主要完成對(duì)圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來(lái)分割目標(biāo)和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過(guò)程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對(duì)象與其背景分開(kāi),并使之具有某種指定的數(shù)學(xué)或符號(hào)表達(dá)形式,使計(jì)算機(jī)能夠理解對(duì)象的具體含義,檢測(cè)出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了??刹捎枚喾N算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測(cè)診斷的效率。
特征提取是對(duì)圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒(méi)有特征,就談不上進(jìn)行檢索。圖像特征可通過(guò)圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計(jì)算機(jī)中屬性值,并從數(shù)據(jù)庫(kù)查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對(duì)話系統(tǒng):完成人機(jī)交互、問(wèn)題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫(kù)系統(tǒng):由案例庫(kù)及案例庫(kù)管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對(duì)各種已有的源數(shù)據(jù)庫(kù)的數(shù)據(jù)通過(guò)轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫(kù)協(xié)同器:根據(jù)問(wèn)題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問(wèn)題求解過(guò)程中對(duì)模型庫(kù)系統(tǒng)、方法庫(kù)系統(tǒng)、知識(shí)庫(kù)系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識(shí)庫(kù)系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識(shí)包括專家經(jīng)驗(yàn)和以規(guī)則形式表示的有關(guān)知識(shí),也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫(kù)系統(tǒng):由模型庫(kù)、算法庫(kù)、模型庫(kù)管理系統(tǒng)組成。完成模型識(shí)別和調(diào)用,并把結(jié)果綜合,送入對(duì)話系統(tǒng)顯示,作為補(bǔ)充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫(kù)系統(tǒng):存放待決策支持的所有問(wèn)題,并完成其維護(hù)與查詢等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)監(jiān)控或故障診斷,所以系統(tǒng)的檢索時(shí),也必須輸入檢索值,即輸入現(xiàn)場(chǎng)產(chǎn)品的圖像,在通過(guò)產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類識(shí)別。根據(jù)案例推理的算法檢索案例庫(kù)中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測(cè),確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計(jì)算機(jī)視覺(jué)技術(shù)中圖像檢索問(wèn)題。對(duì)提高圖像檢索的效率和準(zhǔn)確度提供了平臺(tái)。
計(jì)算機(jī)視覺(jué)技術(shù)也為案例推理系統(tǒng)實(shí)現(xiàn)產(chǎn)品現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)、監(jiān)控、診斷提供技術(shù)支持。計(jì)算機(jī)視覺(jué)技術(shù)現(xiàn)場(chǎng)的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計(jì)的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測(cè)、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。
系統(tǒng)提供的實(shí)時(shí)檢測(cè)、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻(xiàn):
[1](美)??希⊿onka,M).圖像處理分析與機(jī)器視覺(jué)[M].人民郵電出版社.
[2]王宏等譯.計(jì)算機(jī)視覺(jué)[M].電子工業(yè)出版社.
[3]蔡建榮.自然場(chǎng)景下成熟水果的計(jì)算機(jī)視覺(jué)識(shí)別[J].農(nóng)業(yè)機(jī)械,36(2):61-64.
[4]王宇輝.基于計(jì)算機(jī)視覺(jué)的錐體零件尺寸在線檢測(cè)算法[J].重型機(jī)械,2005,2:4-6
[5]駱志堅(jiān).基于計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)自動(dòng)計(jì)數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫(kù)推理中的應(yīng)用[J],南大學(xué)學(xué)報(bào)(自然科學(xué)版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預(yù)測(cè)支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.
農(nóng)業(yè)機(jī)械化不僅是人類的解放,解放勞動(dòng)力。這些年輕的勞動(dòng)力投入到其他領(lǐng)域,促進(jìn)中國(guó)的經(jīng)濟(jì)發(fā)展可以提高農(nóng)業(yè)生產(chǎn)的效率,優(yōu)化操作質(zhì)量和增加作物產(chǎn)量,有利于農(nóng)業(yè)發(fā)展和農(nóng)民收入,因此,今后應(yīng)重視先進(jìn)技術(shù)的推廣,提高農(nóng)業(yè)機(jī)械化水平。目前農(nóng)業(yè)機(jī)械的使用,一些機(jī)械在使用過(guò)程中不能清楚地確定作物的位置,機(jī)器在關(guān)閉過(guò)程中很容易錯(cuò)過(guò),所以利用新技術(shù)在農(nóng)業(yè)機(jī)械有利于彌補(bǔ)農(nóng)業(yè)機(jī)械的脆弱性,提高機(jī)器的運(yùn)作效率。
目前,高新技術(shù)的應(yīng)用范圍擴(kuò)大,農(nóng)業(yè)機(jī)械行業(yè)也開(kāi)始使用高新技術(shù),引入計(jì)算機(jī)視覺(jué)技術(shù)、自動(dòng)控制技術(shù)、信息網(wǎng)絡(luò)技術(shù)、人工智能技術(shù)、機(jī)器人技術(shù)和液壓技術(shù)在農(nóng)業(yè)機(jī)械的應(yīng)用現(xiàn)狀。
2 農(nóng)業(yè)機(jī)械的應(yīng)用技術(shù)
2.1 農(nóng)業(yè)機(jī)械的應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)
農(nóng)業(yè)機(jī)械的應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù),主要是利用計(jì)算機(jī)視覺(jué)技術(shù)在農(nóng)產(chǎn)品質(zhì)量、品位等農(nóng)業(yè)產(chǎn)品檢查,是基于圖像處理,計(jì)算機(jī)視覺(jué)的學(xué)科,主要是視覺(jué)信息處理理論。表達(dá)和計(jì)算方法研究,近年來(lái),圖像處理,計(jì)算機(jī)硬件和軟件,等可視化仿真技術(shù)的逐漸發(fā)展計(jì)算機(jī)視覺(jué)技術(shù)的使用功能也擴(kuò)大,計(jì)算機(jī)視覺(jué)技術(shù)是用來(lái)檢查農(nóng)產(chǎn)品的質(zhì)量不僅是現(xiàn)階段和分級(jí)產(chǎn)品還用于收割、種植等。
2.2 農(nóng)業(yè)機(jī)械的CAD技術(shù)
CAD技術(shù)在我國(guó)已廣泛應(yīng)用于機(jī)械工程設(shè)計(jì)制造從上個(gè)世紀(jì)60年代,我國(guó)40多年后獨(dú)立研究開(kāi)發(fā)和推廣應(yīng)用。但由于我國(guó)機(jī)械工程設(shè)計(jì)CAD系統(tǒng)的開(kāi)發(fā)過(guò)程的社會(huì)主義改革開(kāi)放的影響,以便后期的完美程度我國(guó)機(jī)械工程設(shè)計(jì)CAD系統(tǒng)程度的效率和其他性能大大受到限制,相對(duì)于我國(guó)的國(guó)外機(jī)械工程設(shè)計(jì)CAD系統(tǒng)仍處于較低水平。
2.3 農(nóng)業(yè)機(jī)械的信息網(wǎng)絡(luò)技術(shù)
信息網(wǎng)絡(luò)技術(shù)在農(nóng)業(yè)機(jī)械中的應(yīng)用非常成功,信息網(wǎng)絡(luò)技術(shù)和地理信息系統(tǒng),結(jié)合自動(dòng)化技術(shù)等技術(shù),可以監(jiān)測(cè)作物和土壤的農(nóng)業(yè)生產(chǎn),也可以生產(chǎn)作物的發(fā)展,植物病蟲(chóng)害,和實(shí)時(shí)監(jiān)控等等,然后依靠定位系統(tǒng)和地理信息系統(tǒng)來(lái)完成現(xiàn)場(chǎng)操作。
農(nóng)業(yè)機(jī)械、機(jī)器人技術(shù)應(yīng)用、信息網(wǎng)絡(luò)、計(jì)算機(jī)視覺(jué)、自動(dòng)控制技術(shù)的融合。目前,已經(jīng)開(kāi)發(fā)了采摘機(jī)器人,嫁接機(jī)器人,機(jī)器人除草,施肥機(jī)器人噴涂機(jī)器人,等。對(duì)肥料和噴涂機(jī)器人的使用,可以避免肥料、殺蟲(chóng)劑和其他化學(xué)品危害人體,達(dá)到改善環(huán)境的目的。目前雖然我國(guó)機(jī)器人技術(shù)落后于發(fā)達(dá)國(guó)家,取得了一些就,但由于現(xiàn)代機(jī)械機(jī)器人的購(gòu)買成本非常高,所以這項(xiàng)技術(shù)并沒(méi)有得到普及。
在農(nóng)業(yè)機(jī)械的設(shè)計(jì)、制造和測(cè)試,虛擬現(xiàn)實(shí)技術(shù)具有非常廣闊的發(fā)展前景,利用虛擬現(xiàn)實(shí)技術(shù)建立三維模型的農(nóng)業(yè)機(jī)械設(shè)計(jì)師不僅可以了解每一個(gè)部分的質(zhì)量,也可以完全滿足的每一部分的運(yùn)行性能三維農(nóng)業(yè)機(jī)械模型具有很高的精度,和農(nóng)業(yè)機(jī)械制造商大規(guī)模生產(chǎn)的計(jì)算機(jī)數(shù)據(jù)的基礎(chǔ)上。
在虛擬制造系統(tǒng)中,虛擬現(xiàn)實(shí)技術(shù)的基礎(chǔ),虛擬制造系統(tǒng)是由多種學(xué)科知識(shí),利用計(jì)算機(jī)技術(shù)綜合建模、仿真、生產(chǎn)、制造汽車。與此同時(shí),虛擬制造系統(tǒng)還可以制定合理的產(chǎn)品檢驗(yàn)和測(cè)試程序。目前,虛擬制造技術(shù)應(yīng)用范圍廣泛,涉及開(kāi)始工裝及模具生產(chǎn)設(shè)備,和其他領(lǐng)域,可以在生產(chǎn)部門系統(tǒng),在這一過(guò)程中完成建模、修改、分析和優(yōu)化的四個(gè)工作。此外,虛擬現(xiàn)實(shí)技術(shù)用于柔性制造系統(tǒng)和計(jì)算機(jī)集成制造系統(tǒng)的設(shè)計(jì)。
2.4 人工智能技術(shù)
近年來(lái),全球高端技術(shù)獲得了農(nóng)業(yè)機(jī)械在農(nóng)業(yè)的快速發(fā)展,管理,挖掘和采摘等實(shí)現(xiàn)智能化,使用人工智能技術(shù)研究和開(kāi)發(fā)的激光拖拉機(jī)、內(nèi)部導(dǎo)航設(shè)備,等等,可以拖拉機(jī)的方向和具置測(cè)量,并通過(guò)建立計(jì)算機(jī)數(shù)據(jù)庫(kù)將記錄相關(guān)數(shù)據(jù),使用數(shù)據(jù)庫(kù)了解排水位置、土壤濕度、等等。了解土地信息后,制定合理的土地種植方案,計(jì)算機(jī)化化肥消費(fèi),數(shù)量的農(nóng)藥和種子。
3 先進(jìn)技術(shù)的應(yīng)用在農(nóng)業(yè)機(jī)械化操作的保障措施
得到更好的應(yīng)用程序?yàn)榱舜龠M(jìn)先進(jìn)技術(shù),提高農(nóng)業(yè)機(jī)械化水平,未來(lái)應(yīng)該完善的技術(shù)推廣體系,提高農(nóng)業(yè)機(jī)械化水平,促進(jìn)農(nóng)業(yè)生產(chǎn)和發(fā)展。完善的技術(shù)推廣體系,高度重視農(nóng)業(yè)技術(shù)推廣,建立試驗(yàn)示范基地,發(fā)揮作用的指導(dǎo),讓農(nóng)民參觀和學(xué)習(xí)。讓他們意識(shí)到農(nóng)業(yè)機(jī)械設(shè)備的重要作用,加強(qiáng)農(nóng)業(yè)機(jī)械化的意識(shí),接受和使用機(jī)械設(shè)備,技術(shù)推廣和培訓(xùn)活動(dòng)。讓廣大農(nóng)民掌握農(nóng)業(yè)機(jī)械和設(shè)備的使用,提高思想認(rèn)識(shí)和應(yīng)用技能、農(nóng)業(yè)機(jī)械和農(nóng)業(yè)技術(shù)應(yīng)用于農(nóng)業(yè)生產(chǎn)。
構(gòu)建技術(shù)環(huán)境,當(dāng)?shù)卣畱?yīng)該高度重視農(nóng)業(yè)機(jī)械和農(nóng)業(yè)技術(shù)推廣的作用。提高思想認(rèn)識(shí),加強(qiáng)規(guī)劃和指導(dǎo),增加資本投資,培訓(xùn)專業(yè)人才,創(chuàng)新工作方法,對(duì)許多人來(lái)說(shuō),完善的技術(shù)推廣體系,認(rèn)真履行職責(zé),并擴(kuò)大先進(jìn)技術(shù)的影響。完善法律法規(guī),充分利用其在技術(shù)和人才優(yōu)勢(shì),重視技術(shù)的宣傳和推廣活動(dòng),增強(qiáng)服務(wù)意識(shí),擴(kuò)展廣泛的服務(wù)渠道,更好的滿足實(shí)際工作的需要,對(duì)農(nóng)業(yè)技術(shù)的發(fā)展,為推廣農(nóng)業(yè)機(jī)械和設(shè)備創(chuàng)造便利。
4 農(nóng)業(yè)機(jī)械新技術(shù)的發(fā)展
農(nóng)業(yè)機(jī)械新技術(shù)的應(yīng)用和發(fā)展是為了提高農(nóng)業(yè)的生產(chǎn)力服務(wù),所以農(nóng)業(yè)機(jī)械新技術(shù)的發(fā)展主要是以下幾點(diǎn):
首先,加快新技術(shù)的使用和推廣??茖W(xué)技術(shù)是第一生產(chǎn)力,加快計(jì)算機(jī)視覺(jué)技術(shù)、自動(dòng)控制技術(shù)和智能技術(shù)等新技術(shù)在農(nóng)業(yè)機(jī)械的使用,同時(shí)引進(jìn)國(guó)外先進(jìn)的機(jī)械、新技術(shù),促進(jìn)我國(guó)農(nóng)業(yè)的發(fā)展,提高農(nóng)業(yè)的生產(chǎn)效率具有重要意義。
第二,政府補(bǔ)貼。購(gòu)買新機(jī)器的個(gè)人組織生產(chǎn)、資本壓力,使得他們很難機(jī)械技術(shù)推廣,所以對(duì)于農(nóng)業(yè)機(jī)械推廣使用新技術(shù),政府將給予補(bǔ)貼材料,擴(kuò)大新機(jī)器的使用。
第三,提高農(nóng)業(yè)資源的利用效率。機(jī)械使用以提高農(nóng)業(yè)生產(chǎn)的效率,提高農(nóng)業(yè)資源的利用率。例如,在傳統(tǒng)的農(nóng)業(yè)生產(chǎn)過(guò)程中,和處理農(nóng)作物秸稈,絕大多數(shù)情況下燃燒,不僅浪費(fèi)資源,還污染空氣。但農(nóng)業(yè)機(jī)械的使用新技術(shù)的農(nóng)作物秸稈粉碎加工、作物秸稈可以轉(zhuǎn)化成脂肪不僅材料,提高農(nóng)業(yè)資源的使用效率,也減少了空氣污染。
關(guān)鍵詞:印制電路板;圖像處理;機(jī)器視覺(jué);PCB裸板;自動(dòng)光學(xué)檢測(cè);缺陷檢測(cè) 文獻(xiàn)標(biāo)識(shí)碼:A
中圖分類號(hào):TP391 文章編號(hào):1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005
我國(guó)是全球第一大PCB生產(chǎn)基地,作為電子產(chǎn)品承載體的電路板,其集成度和產(chǎn)量不斷在提高。為了保證電子產(chǎn)品的性能,電路板缺陷檢測(cè)技術(shù)已經(jīng)成為電子行業(yè)中非常關(guān)鍵的技術(shù)。建立在圖像處理算法基礎(chǔ)上的機(jī)器視覺(jué)檢測(cè)技術(shù)與傳統(tǒng)的人工檢測(cè)技術(shù)相比,提高了缺陷檢測(cè)的效率和準(zhǔn)確度。因此,設(shè)計(jì)一種高效精準(zhǔn)的機(jī)器視覺(jué)檢測(cè)電路板缺陷的系統(tǒng),具有非常重要的現(xiàn)實(shí)意義。評(píng)估印刷電路板質(zhì)量的一個(gè)重要因素就是表觀檢測(cè),PCB的表觀質(zhì)量對(duì)產(chǎn)品性能及成品使用安全有著極大的重要性。而伴隨著近年來(lái)在工業(yè)生產(chǎn)領(lǐng)域崛起的計(jì)算機(jī)視覺(jué),當(dāng)前表觀缺陷檢測(cè)和分類識(shí)別的研究方向已經(jīng)轉(zhuǎn)向了利用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)實(shí)現(xiàn)。計(jì)算機(jī)圖像處理識(shí)別技術(shù)這種基于計(jì)算機(jī)視覺(jué)的檢測(cè)技術(shù)成功取代了傳統(tǒng)的PCB缺陷檢測(cè)方法,在自動(dòng)光學(xué)檢測(cè)系統(tǒng)眾多應(yīng)用中占據(jù)了相對(duì)重要的地位,一躍成為PCB生產(chǎn)業(yè)表觀缺陷的主要檢測(cè)方法。
圖1 系統(tǒng)框圖
因此本文通過(guò)設(shè)計(jì)AOI自動(dòng)光學(xué)檢測(cè)系統(tǒng),搭建較為簡(jiǎn)單的PCB缺陷自動(dòng)檢測(cè)系統(tǒng)的實(shí)驗(yàn)平臺(tái),對(duì)PCB中四類較為關(guān)鍵、常見(jiàn)的缺陷進(jìn)行檢測(cè)、分析、識(shí)別、判定,為研究推廣PCB缺陷自動(dòng)檢測(cè)系統(tǒng)開(kāi)拓應(yīng)用前景,如能實(shí)現(xiàn)工業(yè)上的產(chǎn)業(yè)化檢測(cè),將有高額的經(jīng)濟(jì)收益。本文側(cè)重對(duì)PCB中的四類較為關(guān)鍵、常見(jiàn)的缺陷進(jìn)行檢測(cè)、分析、識(shí)別、判定,并且僅搭建了較為簡(jiǎn)單的PCB缺陷自動(dòng)檢測(cè)系統(tǒng)的實(shí)驗(yàn)平臺(tái),即通過(guò)復(fù)雜算法對(duì)采集到的圖像進(jìn)行處理、配準(zhǔn)、對(duì)比,從而得出PCB缺陷類型及對(duì)其進(jìn)行標(biāo)識(shí)。如圖1所示。
1 硬件設(shè)計(jì)方案
PCB缺陷檢測(cè)的總體系統(tǒng)設(shè)計(jì)方案主要是基于自動(dòng)光學(xué)檢測(cè)技術(shù)來(lái)搭建PCB缺陷檢測(cè)系統(tǒng),硬件設(shè)計(jì)是使用CNC-T程控光源高精度影像測(cè)試系統(tǒng)操作臺(tái),對(duì)待測(cè)電路板進(jìn)行圖像采集,再通過(guò)VS2010軟件所編寫(xiě)程序處理,得出待測(cè)電路板的缺陷種類。整個(gè)系統(tǒng)主要分為運(yùn)動(dòng)控制、光源、圖像采集、圖像處理四個(gè)模塊,分模塊簡(jiǎn)要闡述了實(shí)驗(yàn)過(guò)程、所需設(shè)備以及軟件算法,搭建了一個(gè)相對(duì)完整的系統(tǒng)工作平臺(tái)。
圖2 CNC-T程控光源影像操作臺(tái)
該設(shè)備具有測(cè)量元素種類齊全、手動(dòng)測(cè)量、自動(dòng)對(duì)焦等多種功能,使用該設(shè)備采集圖像進(jìn)行二維檢測(cè),測(cè)量軟體為YR-CNC,將圖像儲(chǔ)存至電腦后便由VS軟件進(jìn)行圖像處理。實(shí)驗(yàn)組成如圖3所示:
圖3 實(shí)驗(yàn)系統(tǒng)框圖
1.1 運(yùn)動(dòng)控制模塊
本系統(tǒng)運(yùn)動(dòng)流程為:被檢測(cè)的PCB在檢測(cè)臺(tái)上,通過(guò)步進(jìn)電機(jī)XY軸運(yùn)動(dòng)到攝像機(jī)拍攝區(qū)域,CCD攝像機(jī)固定在工作臺(tái)上方(Z軸),通過(guò)Z軸的運(yùn)動(dòng)實(shí)現(xiàn)聚焦。如圖4所示:
圖4 平臺(tái)運(yùn)動(dòng)示意圖
設(shè)備工作臺(tái)臺(tái)面尺寸為746mm×506mm,承載玻璃面尺寸為452mm×354mm,有效測(cè)量行程為400×300×200。本裝置既可通過(guò)軟件驅(qū)動(dòng)自動(dòng)采集圖像,也可以通過(guò)手動(dòng)控制,移動(dòng)并聚焦采集待測(cè)PCB的圖像。
1.2 光源模塊
輔助光照――采用的是正向和背向光源這兩種輔助光照。其中正光源和攝像頭同側(cè),均位于Z軸上,正光源主要用于檢測(cè)待測(cè)物體的表面特征。背光源位于檢測(cè)臺(tái)面下方,與正光源處于同軸反向關(guān)系,背光源能突出待測(cè)物體的輪廓特征,常用于檢測(cè)物體輪廓尺寸。
圖像采集:分別利用正光源突出PCB表面如走線、過(guò)孔和焊盤(pán)等主要特征,而下光源主要使PCB的輪廓尺寸和過(guò)孔產(chǎn)生強(qiáng)烈的輪廓對(duì)比。
光源:使用的是高度集中照明光源中心的LDR系列,由于該光源的傘狀結(jié)構(gòu)緊密排列著LED且采用了CCS獨(dú)創(chuàng)的柔性板,使之成為L(zhǎng)ED照明系統(tǒng)的標(biāo)準(zhǔn)模式。照明系統(tǒng)如圖5所示:
圖5 照明系統(tǒng)
1.3 圖像采集模塊
圖像采集模塊是由圖像采集卡、相機(jī)和鏡頭組成的,該模塊是圖像配準(zhǔn)階段的硬件基礎(chǔ)。計(jì)算機(jī)采集圖像的媒介就是相機(jī),而相機(jī)按照不同原理又分為多種,常見(jiàn)的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)兩類。本系統(tǒng)采用的是CCD 1/2英寸43萬(wàn)像素彩色攝像頭和高清晰度0.7~4.5X變焦倍率鏡頭,顯示分辨率為0.001mm。
1.4 圖像處理模塊
通常獲得的圖像將受到工業(yè)現(xiàn)場(chǎng)環(huán)境、光照等條件的干擾,計(jì)算機(jī)所獲得的圖像質(zhì)量多數(shù)參差不齊,圖像的清晰度不一致,大大增加了PCB缺陷檢測(cè)的難度,所以在利用復(fù)雜算法檢測(cè)、識(shí)別PCB缺陷前要先對(duì)圖像進(jìn)行預(yù)處理。
本圖像處理模塊主要通過(guò)VS軟件在OpenCV計(jì)算機(jī)視覺(jué)庫(kù)的基礎(chǔ)上,通過(guò)一系列算法對(duì)圖像進(jìn)行處理對(duì)比。
2 系統(tǒng)軟件設(shè)計(jì)
2.1 OpenCV
OpenCV(Open Source Computer Vision Library)是一個(gè)跨平臺(tái)的可以運(yùn)行在Linux、Windows和Mac OS操作系統(tǒng)上的基于(開(kāi)源)發(fā)行的計(jì)算機(jī)視覺(jué)庫(kù)。它重量輕而高效,開(kāi)放了多種接口如MATLAB、Ruby和Python等,并且在計(jì)算機(jī)視覺(jué)和圖像處理中大多數(shù)通用的算法都是被允許的。OpenCV可用于開(kāi)發(fā)實(shí)時(shí)圖像處理、計(jì)算機(jī)視覺(jué)和模式識(shí)別方案,它提供了多種函數(shù),實(shí)現(xiàn)了大量的計(jì)算機(jī)視覺(jué)算法,算法涵蓋了從最基礎(chǔ)的濾波至以高級(jí)的物體檢測(cè)。OpenCV實(shí)際上是一堆C和C++語(yǔ)言源代碼文件,許多常見(jiàn)的計(jì)算機(jī)視覺(jué)算法由這些源代碼文件實(shí)現(xiàn)。如C接口函數(shù)cvCanny()實(shí)現(xiàn)Canny邊緣檢測(cè)算法。它可直接加入到我們自己的軟件項(xiàng)目編程中,而無(wú)需去編寫(xiě)自己的Canny算子代碼,就是沒(méi)有必要重復(fù)“造輪子”。
根據(jù)OpenCV中源代碼文件巨多的特點(diǎn),以算法的功能為基準(zhǔn),將這些源文件分到多個(gè)模塊中,如core、imgproc、highgui等。將每個(gè)模塊中的源文件編譯成一個(gè)庫(kù)文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用戶在使用時(shí),僅需在自己的項(xiàng)目中添加要用的庫(kù)文件,與自己的源文件一起連接成可執(zhí)行程序即可。
OpenCV計(jì)算機(jī)視覺(jué)庫(kù)的出現(xiàn),是為了使人們利用方便快捷的計(jì)算機(jī)視覺(jué)框架,在計(jì)算機(jī)視覺(jué)領(lǐng)域可以更加輕松地設(shè)計(jì)出更為復(fù)雜的應(yīng)用程序。OpenCV涵蓋了多種計(jì)算機(jī)視覺(jué)應(yīng)用區(qū)域,如用戶界面、信息安全、醫(yī)學(xué)影像學(xué)、工廠產(chǎn)品檢驗(yàn)、立體視覺(jué)、機(jī)器人和攝像機(jī)標(biāo)定等,約有500多個(gè)函數(shù)。因?yàn)橛?jì)算機(jī)視覺(jué)與機(jī)器學(xué)習(xí)是相輔相成的,所以O(shè)penCV也開(kāi)放了MLL(Machine Learning Library)機(jī)器學(xué)習(xí)庫(kù)。MLL除了在視覺(jué)任務(wù)相關(guān)中使用,也可以很容易地應(yīng)用到其他機(jī)器學(xué)習(xí)中。
2.2 Microsoft Visual Studio2010
Visual Studio是微軟公司推出的開(kāi)發(fā)環(huán)境,是同行業(yè)中目前最流行的Windows平臺(tái)應(yīng)用程序開(kāi)發(fā)環(huán)境。Visual Studio 2010于2010年4月12日,其集成開(kāi)發(fā)環(huán)境(IDE)已被重新設(shè)計(jì)和組織,變得更簡(jiǎn)單了。
Visual Studio 2010同時(shí)帶來(lái)了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持開(kāi)發(fā)面向Windows 7的應(yīng)用程序。除了Microsoft SQL Server外,它還支持IBM DB2和Oracle數(shù)據(jù)庫(kù)。目前有專業(yè)版、高級(jí)版、旗艦版、學(xué)習(xí)版和測(cè)試版五個(gè)版本。Visual Studio的用處十分廣泛,不僅可被用來(lái)基于Windows平臺(tái)創(chuàng)建Windows應(yīng)用程序和Web應(yīng)用程序,還可被用來(lái)創(chuàng)建智能設(shè)備、Office插件和Web服務(wù)等應(yīng)用程序。微軟的Visual Studio 2010將成為一個(gè)版本的經(jīng)典,這是相當(dāng)于6.0版本。該版本可以自定義開(kāi)始頁(yè),新功能還包括:(1)C# 4.0中的動(dòng)態(tài)類型和動(dòng)態(tài)編程;(2)多顯示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增強(qiáng);(8)使用Visual C++ 2010創(chuàng)建Ribbon界面;(9)新增基于.NET平臺(tái)的語(yǔ)言F#。本課題將基于OpenCV計(jì)算機(jī)視覺(jué)庫(kù)使用Microsoft Visual Studio2010開(kāi)發(fā)環(huán)境,通過(guò)編輯算法實(shí)現(xiàn)PCB缺陷檢測(cè)。
3 圖像預(yù)處理
要使用計(jì)算機(jī)對(duì)圖像進(jìn)行處理,所得到的連續(xù)圖像就必須被轉(zhuǎn)換為離散的數(shù)據(jù)集,這是因?yàn)橛?jì)算機(jī)只能處理離散度數(shù)據(jù),這一過(guò)程我們稱之為圖像采集。圖像采集由圖像采集系統(tǒng)實(shí)現(xiàn),如圖6所示。圖像采集系統(tǒng)的三個(gè)主要模塊是成像系統(tǒng)、采樣系統(tǒng)和量化器。
圖6
將整理出的字符圖像交予識(shí)別模塊來(lái)識(shí)別,被稱為圖像的預(yù)處理。PCB的圖像預(yù)處理包括灰度化、增強(qiáng)、濾波、二值化、配準(zhǔn)等,處理后的PCB輸出的圖像質(zhì)量將得到改善,在很大程度上使得該圖像特征更直觀,方便計(jì)算機(jī)分析和處理。PCB的圖像預(yù)處理為整個(gè)PCB缺陷檢測(cè)系統(tǒng)的核心部件,很大程度上決定了檢測(cè)的準(zhǔn)確性。圖像預(yù)處理流程如圖7所示:
圖7 圖像預(yù)處理流程圖
4 PCB缺陷檢測(cè)
本文針對(duì)四種常見(jiàn)缺陷:斷路、短路、毛刺(凸起)、缺損(凹陷)進(jìn)行檢測(cè)研究。在這四種缺陷中,最為嚴(yán)重的缺陷類型是斷路和短路,它們將會(huì)使整塊板子失去本來(lái)的功能;而凸起、凹陷也可能影響到PCB在使用過(guò)程中的穩(wěn)定性能。如圖8所示為幾種常見(jiàn)的缺陷:
圖8 常見(jiàn)電路板缺陷
4.1 PCB缺陷的檢測(cè)方法
常用的PCB缺陷檢測(cè)方法有參考法和非參考法兩種。要是從概念理解和電路難易程度看,參考法明顯更加具有概念直觀、電路簡(jiǎn)單的優(yōu)勢(shì);要是從檢測(cè)所需要的條件來(lái)看,非參考法則在不需要待測(cè)PCB與標(biāo)準(zhǔn)PCB進(jìn)行準(zhǔn)確對(duì)準(zhǔn)這一點(diǎn)上優(yōu)于參考法。
本課題采用參考法進(jìn)行PCB缺陷檢測(cè)。
使用參考法對(duì)PCB缺陷進(jìn)行檢測(cè)的流程為:(1)確定標(biāo)準(zhǔn)的PCB圖像并放入?yún)⒖紟?kù);(2)通過(guò)成像設(shè)備采集待測(cè)PCB圖像,進(jìn)行圖像預(yù)處理之后,再二值化PCB待測(cè)圖像,并對(duì)其進(jìn)行連通域提??;(3)然后將處理結(jié)果與標(biāo)準(zhǔn)圖像進(jìn)行對(duì)比,利用圖像相減來(lái)判斷PCB可能存在的缺陷;(4)進(jìn)行分類,確定缺陷類型。
4.2 圖像連通域
像素是圖像中最小的單位,每個(gè)像素周圍有8個(gè)鄰接像素,常見(jiàn)的鄰接關(guān)系有兩種:4鄰接與8鄰接。4鄰接一共4個(gè)點(diǎn),即上下左右。包括對(duì)角線位置的點(diǎn),8鄰接的點(diǎn)一共有8個(gè),如圖9所示:
圖9 領(lǐng)域示圖
如果像素點(diǎn)A與B鄰接,我們稱A與B連通,即有如下的結(jié)論:
如果A與B連通、B與C連通,則A與C連通。在視覺(jué)上看來(lái),點(diǎn)與點(diǎn)相互連通,形成一個(gè)區(qū)域,而不是連通的點(diǎn)形成不同的區(qū)域。這種相互立體的所有的點(diǎn),我們稱為連通區(qū)域。連通區(qū)域標(biāo)記常用的方法有Two-Pass(兩遍掃描法)和Seed Filling(種子填充法)兩種方法,本課題主要介紹第二種。
Seed Filling來(lái)源于計(jì)算機(jī)圖形學(xué),通常應(yīng)用在填充圖形上。思路:以一個(gè)前景像素當(dāng)作種子,而后在處于同一像素值且位置相鄰的連通區(qū)域,把和種子相鄰的前景像素融合到同一組像素中,結(jié)果將是獲得一個(gè)像素集,即連通區(qū)域。接下來(lái)介紹使用種子填充法實(shí)現(xiàn)的連通區(qū)域分析法:
第一,重復(fù)掃描圖像,當(dāng)?shù)玫疆?dāng)前像素點(diǎn)B(x,y)=1時(shí)停止:(1)賦予B(x,y)一個(gè)label,并將像素位置作為種子,接著將所有位于該種子周圍的前景像素都?jí)喝霔V?;?)將棧頂像素賦以相同的label值并彈出,接著將全部位于棧頂像素周邊的前景像素都?jí)喝霔V?;?)重復(fù)(2)步驟,直到棧為空。此時(shí),圖像B中的一個(gè)像素值被標(biāo)記為label的連通區(qū)域便被找到了。
第二,在掃描結(jié)束前,重復(fù)第一個(gè)步驟,由此可以獲得圖像B中所有的連通區(qū)域在掃描結(jié)束后。
掃描所得的連通域如圖10所示:
圖10 圖像連通域提取
4.3 缺陷識(shí)別
缺陷識(shí)別具體特征如表1所示:
表1 缺陷特征
缺陷種類 二值圖像面積 連通區(qū)域數(shù)
斷路 減少 增加
短路 增加 減少
凸起 增加 不變
凹陷 減少 不變
第一,短路和斷路。在出現(xiàn)短路缺陷時(shí),待測(cè)圖像與標(biāo)準(zhǔn)圖像相比,其所包含的連通區(qū)域數(shù)將會(huì)減少。同理可得,在出現(xiàn)斷路缺陷時(shí),待測(cè)圖像與標(biāo)準(zhǔn)圖像相比,其所包含的連通區(qū)域數(shù)將會(huì)增多。因此,斷路和短路缺陷便可利用比較連通區(qū)域數(shù)來(lái)判定和識(shí)別。
第二,凸起和凹陷。凸起缺陷將導(dǎo)致導(dǎo)線和導(dǎo)線、導(dǎo)線和其他導(dǎo)體間的間隙變小,而凹陷缺陷將導(dǎo)致導(dǎo)線和導(dǎo)線、導(dǎo)線和其他導(dǎo)體間的間隙變大,二者均會(huì)導(dǎo)致PCB使用過(guò)程中出現(xiàn)不穩(wěn)定狀態(tài)。而觀察可知,這兩種缺陷的連通區(qū)域相同,差別在于各自二值化面積的大小,所以可以通過(guò)計(jì)算該待測(cè)圖像的連通區(qū)域面積來(lái)識(shí)別凸起、凹陷缺陷。
識(shí)別過(guò)程:將經(jīng)過(guò)圖像預(yù)處理的待測(cè)PCB圖像與標(biāo)準(zhǔn)圖像進(jìn)行對(duì)比后,通過(guò)算法找出缺陷。比較二者的連通區(qū)域數(shù),若前者大于后者,則標(biāo)定該缺陷點(diǎn)為斷路,反之則為短路;若二者連通區(qū)域數(shù)相同,則比較二值化圖像面積,若前者大于后者,則標(biāo)定該缺陷點(diǎn)為凸起,反之則為凹陷。檢測(cè)流程如圖11所示:
圖11 PCB缺陷檢測(cè)流程圖
5 系統(tǒng)實(shí)驗(yàn)
本文使用CNC-T程控光源高精度影像測(cè)試系統(tǒng)操作臺(tái),結(jié)合VS2010軟件基于OpenCV計(jì)算機(jī)視覺(jué)庫(kù)的算法編程來(lái)實(shí)現(xiàn)PCB的缺陷檢測(cè)。整體實(shí)驗(yàn)過(guò)程為:手動(dòng)控制操作臺(tái)捕捉、聚焦、采集待測(cè)PCB的圖像,采集到的圖像與標(biāo)準(zhǔn)圖像進(jìn)行對(duì)比、識(shí)別,得出缺陷種類并顯示結(jié)果。
本課題一共就所研究缺陷類型,做了40組實(shí)驗(yàn),通過(guò)實(shí)驗(yàn)結(jié)果計(jì)算正確率。如表2所示:
表2 實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)
缺陷類型 實(shí)驗(yàn)次數(shù) 正確率
斷路 10 100%
短路 10 100%
凸起 10 100%
凹陷 10 100%
針對(duì)不同電路板圖中出現(xiàn)的同種斷路類型進(jìn)行檢測(cè),效果如圖12a、圖12b、圖12c所示,可準(zhǔn)確檢測(cè)出缺陷存在。
圖12
針對(duì)不同電路板圖中出現(xiàn)的同種短路類型進(jìn)行檢測(cè),效果如圖13a、圖13b、圖13c所示,可準(zhǔn)確檢測(cè)出缺陷存在。
圖13
針對(duì)不同電路板圖中出現(xiàn)的同種凸起類型進(jìn)行檢測(cè),效果如圖14a、圖14b、圖14c所示,可準(zhǔn)確檢測(cè)出缺陷存在。
圖14
針對(duì)不同電路板圖中出現(xiàn)的同種凹陷類型進(jìn)行檢測(cè),效果如圖15a、圖15b、圖15c所示,可準(zhǔn)確檢測(cè)出缺陷存在。
圖15
6 結(jié)語(yǔ)
PCB板面向體積越來(lái)越小、密度越來(lái)越高的方向發(fā)展。在檢測(cè)產(chǎn)品價(jià)格方面,國(guó)外AOI檢測(cè)產(chǎn)品價(jià)格普遍偏高,而由于經(jīng)濟(jì)原因,在國(guó)內(nèi)PCB板生產(chǎn)制造商多數(shù)仍采用人工目測(cè)等傳統(tǒng)檢測(cè)方法檢測(cè)。隨著經(jīng)濟(jì)的發(fā)展,數(shù)字圖像處理研究的深入,自動(dòng)光學(xué)檢測(cè)系統(tǒng)也開(kāi)始頻繁活躍在人們視線中,但在PCB缺陷檢測(cè)方面的應(yīng)用卻還有待完善。因此,本論文建立在深入掌握工控系統(tǒng)結(jié)構(gòu)并從PCB板的質(zhì)量標(biāo)準(zhǔn)、圖像特點(diǎn)、缺陷特征及檢測(cè)要求的分析基礎(chǔ)上,對(duì)以圖像處理為基礎(chǔ)的PCB缺陷檢測(cè)技術(shù)進(jìn)行了深入研究。由于PCB缺陷自動(dòng)檢測(cè)系統(tǒng)的研究涉及多個(gè)領(lǐng)域的知識(shí),其研究過(guò)程十分耗時(shí)、繁瑣,由此,本論文僅僅對(duì)PCB缺陷檢測(cè)中較為常見(jiàn)的問(wèn)題進(jìn)行了較深入研究,并且僅搭建了較為簡(jiǎn)單的PCB缺陷自動(dòng)檢測(cè)系統(tǒng)的實(shí)驗(yàn)平臺(tái),對(duì)PCB中的四類較為關(guān)鍵、常見(jiàn)的缺陷進(jìn)行檢測(cè)、分析、識(shí)別、判定。雖然還未實(shí)現(xiàn)真正實(shí)現(xiàn)工業(yè)上產(chǎn)業(yè)化檢測(cè),但是在未來(lái)幾十年中,研究推廣的PCB缺陷自動(dòng)檢測(cè)系統(tǒng)將有十分良好的應(yīng)用前景,也將有高額的經(jīng)濟(jì)收益。
參考文獻(xiàn)
[1] 陳勝勇,劉盛,等.基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)[M].北京:科學(xué)出版社,2008.
[2] Gary Bradski,Adrian Kaebler,于仕琪,等.學(xué)習(xí)OpenCV[M].北京:清華大學(xué)出版社,2009.
[3] 周長(zhǎng)發(fā).精通Visual C++圖像處理編程(第3版)
[M].北京:電子工業(yè)出版社,2006.
[4] 黨振.中國(guó)大陸PCB產(chǎn)業(yè)的現(xiàn)狀與未來(lái)[J].印制電路信息,2006,32(1).
[5] 胡躍明,譚穎.自動(dòng)光學(xué)檢測(cè)在中國(guó)的應(yīng)用現(xiàn)狀和發(fā)展[J].微計(jì)算機(jī)信息,2006,(4).
[6] 李漢,何星,等.印刷電路板的自動(dòng)光學(xué)檢測(cè)系統(tǒng)
[J].無(wú)損檢測(cè),2004,26(6).
[7] 張利,高永英,等.PCB板檢測(cè)中的定位研究[J].中國(guó)圖像圖形學(xué),1999,4(8).
[8] 姚立新,張武學(xué),等.AOI系統(tǒng)在PCB中的應(yīng)用[J].電子工業(yè)專用備,2004,(5).
[9] 范小濤,夏雨人.一種基于圖像處理的PCB檢測(cè)算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2004,(13).
[10] 傅莉.印制電路板的發(fā)展及前景[J].電腦與電信,2010,(5).
[11] 張明軒.基于視頻序列的人臉檢測(cè)與跟蹤算法研究[D].中北大學(xué),2011.
[12] 張馳.基于機(jī)器視覺(jué)的智能控制與圖像識(shí)別問(wèn)題研究[D].蘭州理工大學(xué),2009.
[13] 謝飛.基于計(jì)算機(jī)視覺(jué)的自動(dòng)光學(xué)檢測(cè)關(guān)鍵技術(shù)與應(yīng)用研究[D].南京大學(xué),2013.
[14] 張靜.PCB表觀缺陷的自動(dòng)光學(xué)檢測(cè)理論與技術(shù)
[D].電子科技大學(xué),2013.
[15] 俞瑋.AOI技術(shù)在PCB缺陷檢測(cè)中的應(yīng)用研究[D].電子科技大學(xué),2007.
【關(guān)鍵詞】OpenCV視覺(jué)庫(kù) 圖像處理 Android平臺(tái)
Opencv全稱:Open Source Computer Vision Library,是一個(gè)可以移植到其他開(kāi)發(fā)工具中的一個(gè)跨平臺(tái)的圖像處理視覺(jué)庫(kù),它由C++語(yǔ)言編寫(xiě),主要有C++、C語(yǔ)言接口,為了能在手機(jī)等移動(dòng)端更方便的進(jìn)行圖像處理,我們利用其JAVA接口將opencv視覺(jué)庫(kù)添加到Android的開(kāi)發(fā)工具中,實(shí)現(xiàn)了在移動(dòng)端的圖像處理功能。
1 opencv的特點(diǎn)
(1)跨平臺(tái),有很好的移植性。Opencv由跨平臺(tái)的中高層API構(gòu)成,可以運(yùn)行在Linux、Windows和Mac OS操作系y上,該庫(kù)有C++、C、Java接口,我們運(yùn)用Java接口就可以將Opencv視覺(jué)庫(kù)移植到Android studio開(kāi)發(fā)工具中。
(2)免費(fèi)、開(kāi)源,與耗費(fèi)很高的商業(yè)化工具(比如 MATLAB+Simulink)有很大的區(qū)別。
(3)高效、快速、使用方便。Opencv視覺(jué)庫(kù)具有強(qiáng)大的圖像運(yùn)算功能,API中有比較完善的處理函數(shù),能夠明顯提高開(kāi)發(fā)效率。
2 Opencv在Android studio中的環(huán)境搭建流程
2.1 安裝Java JDK
需要完成JDK的下載、安裝和環(huán)境配置的流程,安裝完成后,要運(yùn)行資源管理器輸入 Java Version來(lái)驗(yàn)證是否安裝成功,若顯示Java版本信息,則安裝成功。
2.2 下載Android Studio開(kāi)發(fā)工具并安裝
在Android Studio的中文社區(qū)下載最新的Android Studio開(kāi)發(fā)工具(要包含Java SDK),并運(yùn)行Android Studio,根據(jù)安裝提示進(jìn)行安裝,并運(yùn)行開(kāi)發(fā)工具。
2.3 配置Opencv Android SDK
在Opencv官網(wǎng)(http://)下載Opencv Android SDK并解壓。在Android Studio中,新建一工程,點(diǎn)擊File并import Module,并選中解壓的Opencv SDK文件夾中的Java文件夾,這樣就將Opencv視覺(jué)庫(kù)移植到了Android Studio中。然后右鍵App project,打開(kāi)open Module Settings中的Depencies,點(diǎn)擊Module Dependency,添加OpencvLibrary,這樣就完成了深層配置。最后把Opencv SDK文件夾中的native文件夾中的libs的4個(gè)文件夾復(fù)制到所建好的工作空間中的project中的libs中。
3 圖像的灰度處理和像素取反處理的應(yīng)用舉例
本文中是用的移動(dòng)端為魅族MX3,Android版本號(hào)為5.0.1。
3.1 灰度處理
使用OpenCv將一幅圖像轉(zhuǎn)換為灰度圖像在實(shí)際應(yīng)用中也不少,轉(zhuǎn)換為灰度圖像比較簡(jiǎn)單,關(guān)鍵函數(shù): cvCvtColor:cvCvtColor(IplImage* src, IplImage* dst, CV_BRG2GRAY)。值得注意的是:最后一個(gè)參數(shù)為 CV_BRG2GRAY ,表示將BRG圖片(彩色圖片)轉(zhuǎn)換為灰度圖片(黑白),參數(shù)src、dst必須事先分配好內(nèi)存空間,使用完之后必須要釋放空間。
3.2 像素操作―取反
OpenCV中圖像取反是將圖像中的像素點(diǎn)變?yōu)樵瓉?lái)像素點(diǎn)的反色。例如,如果一副灰度圖像的每個(gè)像素值由2^8=256個(gè),假設(shè)點(diǎn)i點(diǎn)像素值為brga[i] ,則取反后的像素值為 255- brga[i]&oxff。
關(guān)鍵代碼為:
int cnum = src.channels();
byte[] bgra = new byte[cnum];
for (int i = 0;i
bgra[i] = (byte) (255 - bgra[i]&0xff);}
然后運(yùn)用matToBitmap函數(shù)將Mat格式的圖像轉(zhuǎn)換成Bitmap的圖像,并顯示在android手機(jī)移動(dòng)端。
經(jīng)過(guò)編寫(xiě)代碼并運(yùn)行得到的處理結(jié)果如圖1所示。
4 結(jié)束語(yǔ)
OpenCV視覺(jué)庫(kù)是一套簡(jiǎn)單易用且完整的計(jì)算機(jī)視覺(jué)框架,幫助開(kāi)發(fā)人員完成大量的底層工作,減少了工作量,更有效提高了設(shè)計(jì)出復(fù)雜計(jì)算機(jī)圖形處理的能力。并且我們將OpenCV移植到Android操作系統(tǒng)中去,也是圖像處理領(lǐng)域的一大進(jìn)步。我們相信,在OpenCVForAndroid的應(yīng)用不斷拓展中,眾多圖像處理領(lǐng)域會(huì)有廣泛的前景。
參考文獻(xiàn)
[1]陳雪嬌.基于Open CV的計(jì)算機(jī)視覺(jué)技術(shù)研究[J].電腦知識(shí)與技術(shù),2015(30).
[2]張家怡.圖像識(shí)別的技術(shù)現(xiàn)狀和發(fā)展趨勢(shì)[J].電腦知識(shí)與技術(shù),2010(21).
[3]黎松,平西建,丁益洪.開(kāi)放源代碼的計(jì)算機(jī)視覺(jué)類庫(kù)Open CV的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2005.22(08).
[4]何鵬,王連鵬,楚艷紅.基于Open CV 的機(jī)器視覺(jué)在智能手機(jī)中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2011(10).
[5]王福斌,李迎燕,劉杰,陳至坤.基于OpenCV的機(jī)器視覺(jué)圖像處理技術(shù)實(shí)現(xiàn)[J].機(jī)械與電子,2010(06).
作者簡(jiǎn)介
劉賢輝(1992-),男,山東省青島市人?,F(xiàn)為青島市山東科技大學(xué)在讀研究生。主要研究方向?yàn)橐苿?dòng)端的圖像處理研究
通過(guò)闡述農(nóng)業(yè)機(jī)械中的幾種新的技術(shù)手段,比如計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)信息技術(shù)、人工智能技術(shù)及液壓技術(shù)等在農(nóng)業(yè)機(jī)械中的應(yīng)用情況,對(duì)農(nóng)業(yè)機(jī)械技術(shù)的發(fā)展進(jìn)行了分析,希望可以為農(nóng)業(yè)機(jī)械設(shè)備的智能化發(fā)展提供相應(yīng)的參考依據(jù)。
關(guān)鍵詞:
農(nóng)業(yè)機(jī)械;技術(shù)手段;應(yīng)用;發(fā)展前景
我國(guó)在國(guó)際上的地位正在逐漸提高,這與我國(guó)的經(jīng)濟(jì)發(fā)展是分不開(kāi)的,經(jīng)濟(jì)的發(fā)展需要基礎(chǔ)的支持,農(nóng)業(yè)就是我國(guó)的基礎(chǔ),我國(guó)是農(nóng)業(yè)大國(guó),農(nóng)村人口基數(shù)大。隨著近幾年我國(guó)農(nóng)業(yè)的發(fā)展,很多高新技術(shù)也被運(yùn)用到農(nóng)業(yè)的機(jī)械設(shè)備中,使農(nóng)機(jī)設(shè)備向著智能化的方向發(fā)展,有效地提升了農(nóng)業(yè)生產(chǎn)的整體效率。在農(nóng)業(yè)的生產(chǎn)中使用高新技術(shù)還能夠提高農(nóng)業(yè)的生產(chǎn)效率,保證農(nóng)機(jī)相關(guān)機(jī)械的正常運(yùn)作。
1農(nóng)業(yè)機(jī)械技術(shù)的應(yīng)用分析
1.1計(jì)算機(jī)技術(shù)
這里所說(shuō)的計(jì)算機(jī)技術(shù)主要指的是計(jì)算機(jī)視覺(jué)技術(shù),這一技術(shù)最早被運(yùn)用在農(nóng)業(yè)機(jī)械上是在20世紀(jì)70年代中期,當(dāng)時(shí)主要運(yùn)用的是計(jì)算機(jī)技術(shù)中的視覺(jué)技術(shù),利用這一技術(shù)的主要目的是可以對(duì)農(nóng)產(chǎn)品的品質(zhì)質(zhì)量進(jìn)行分級(jí)別檢查。計(jì)算機(jī)視覺(jué)技術(shù)是以圖像處理為基準(zhǔn),隨著圖像處理以及視覺(jué)模擬技術(shù)的發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)不僅可以用來(lái)檢查農(nóng)產(chǎn)品的品質(zhì),而且還可以用來(lái)對(duì)農(nóng)產(chǎn)品進(jìn)行播種、收割。雖然計(jì)算機(jī)視覺(jué)技術(shù)在我國(guó)農(nóng)業(yè)技術(shù)領(lǐng)域的應(yīng)用時(shí)間還不是很長(zhǎng),在實(shí)際的使用中還有很多的問(wèn)題出現(xiàn),但是相信隨著科學(xué)技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)必將會(huì)改變傳統(tǒng)的農(nóng)業(yè)作業(yè)模式,為現(xiàn)代化農(nóng)業(yè)發(fā)展提供技術(shù)上的支持。
1.2網(wǎng)絡(luò)信息技術(shù)
網(wǎng)絡(luò)信息技術(shù)在我國(guó)農(nóng)業(yè)機(jī)械上的應(yīng)用是非常成功的,信息技術(shù)與地理信息系統(tǒng)的有機(jī)結(jié)合不僅可以為農(nóng)業(yè)的生產(chǎn)提供高精度的監(jiān)控,而且還能夠?qū)r(nóng)業(yè)生產(chǎn)中出現(xiàn)病蟲(chóng)害的情況進(jìn)行及時(shí)的檢測(cè),然后根據(jù)定位系統(tǒng)來(lái)進(jìn)行田間作業(yè)。
1.3液壓技術(shù)
液壓技術(shù)主要依靠的是微電子技術(shù)和工業(yè)傳感技術(shù),在數(shù)據(jù)的采集上,運(yùn)用液壓技術(shù)主要完成的是能量的轉(zhuǎn)換和匹配,其目的是為了讓農(nóng)業(yè)機(jī)械的效率能夠得到進(jìn)一步的提高,讓機(jī)械設(shè)備的相關(guān)系統(tǒng)特征可以得到完善,讓機(jī)械設(shè)備的可靠性能夠得到提升,這也很好地符合了環(huán)境保護(hù)的相關(guān)標(biāo)準(zhǔn)要求。而大部分的農(nóng)業(yè)機(jī)械都是采用內(nèi)燃機(jī)作為原動(dòng)力,所以很多時(shí)候都會(huì)出現(xiàn)工作負(fù)荷,一般情況下,我們都是通過(guò)電液控制手段來(lái)完成負(fù)載與原動(dòng)力之間的匹配情況,盡可能地減少功率傳輸過(guò)程中出現(xiàn)的損失,從而提高農(nóng)業(yè)機(jī)械系統(tǒng)的工作效率。
1.4人工智能技術(shù)
隨著信息全球化的不斷深入,高端技術(shù)不僅在大型的企事業(yè)單位中被運(yùn)用,在農(nóng)業(yè)中也得到了廣泛的應(yīng)用,比較有成果的就是美國(guó)利用人工智能技術(shù)研發(fā)出激光拖拉機(jī)、機(jī)械的內(nèi)部導(dǎo)航裝置,等等,這些裝置可以對(duì)拖拉機(jī)的運(yùn)行方向及所處位置進(jìn)行實(shí)時(shí)的測(cè)定,在了解地區(qū)土地信息之后,再制定合理的土地種植方案、農(nóng)藥及種子的數(shù)量,等等。
2農(nóng)業(yè)機(jī)械技術(shù)的發(fā)展趨勢(shì)
2.1推廣農(nóng)業(yè)機(jī)械產(chǎn)品的技術(shù)發(fā)展
目前在我國(guó)的農(nóng)業(yè)機(jī)械發(fā)展上,已經(jīng)開(kāi)始運(yùn)用機(jī)電智能化技術(shù)和計(jì)算機(jī)技術(shù),這使得農(nóng)業(yè)機(jī)械化設(shè)備的科技含量有了極大的提高,不僅有效地提高了農(nóng)業(yè)機(jī)械的作業(yè)效率,而且也提升了農(nóng)業(yè)的生產(chǎn)效率。
2.2農(nóng)業(yè)資源的利用率得到了提升
只有提高了農(nóng)業(yè)資源的開(kāi)發(fā)利用率,才能夠確保農(nóng)業(yè)實(shí)現(xiàn)可持續(xù)發(fā)展,同時(shí)也為保護(hù)生態(tài)環(huán)境奠定基礎(chǔ),如回收農(nóng)業(yè)生產(chǎn)的廢棄物,普及無(wú)害化的處理設(shè)備,運(yùn)用無(wú)害化技術(shù)來(lái)處理廢水可以有效地達(dá)到保護(hù)環(huán)境的作用。而在農(nóng)業(yè)種植的過(guò)程中,使用有機(jī)肥料還可以進(jìn)一步提高農(nóng)業(yè)資源的利用效率。除此之外,大力發(fā)展節(jié)能型動(dòng)力機(jī)械設(shè)備可以有效地避免出現(xiàn)資源浪費(fèi),從而提高農(nóng)業(yè)資源的整體利用效率。
2.3提高農(nóng)業(yè)機(jī)械產(chǎn)品的質(zhì)量監(jiān)督水平
要想提升農(nóng)業(yè)的機(jī)械化水平,還要從規(guī)范設(shè)計(jì)的基本要求出發(fā),全面提高農(nóng)業(yè)產(chǎn)品的質(zhì)量。在質(zhì)量提升的過(guò)程中,還要注重農(nóng)業(yè)產(chǎn)品的整體造型和外觀,農(nóng)機(jī)設(shè)備的耐久性也要經(jīng)得起考驗(yàn)。選用與農(nóng)機(jī)設(shè)備相配套的發(fā)電機(jī)及元件,能夠最大程度上提高農(nóng)業(yè)機(jī)械產(chǎn)品的質(zhì)量。在農(nóng)業(yè)機(jī)械設(shè)備完成安裝之后,還要對(duì)其進(jìn)行試運(yùn)行,只有保證了設(shè)備各項(xiàng)指標(biāo)都正常的基礎(chǔ)上,才能夠真正的投入使用,這也是提高農(nóng)業(yè)機(jī)械產(chǎn)品可靠性的前提。
2.4加大政府的補(bǔ)貼力度
各級(jí)地方政府要加大農(nóng)業(yè)機(jī)械的技術(shù)推廣,做好農(nóng)業(yè)機(jī)械的培訓(xùn)工作。國(guó)家還要將拖拉機(jī)、插秧機(jī)等農(nóng)機(jī)具作為農(nóng)具購(gòu)置補(bǔ)貼的關(guān)鍵,普及農(nóng)業(yè)機(jī)械知識(shí)。這樣也能夠更好地提高農(nóng)業(yè)機(jī)械化的發(fā)展進(jìn)程。2.5確保農(nóng)業(yè)機(jī)械技術(shù)的安全生產(chǎn)關(guān)注安全監(jiān)督管理及裝備的創(chuàng)建工作,加大農(nóng)業(yè)機(jī)械的安全投入,以便更好地滿足農(nóng)業(yè)機(jī)械工作安全監(jiān)督管理的需求。除此之外,最重要的是,要將農(nóng)業(yè)機(jī)械的安全檢驗(yàn)工作納入到各級(jí)縣市政府的財(cái)政預(yù)算當(dāng)中。
3結(jié)語(yǔ)
隨著科學(xué)技術(shù)的飛速發(fā)展,一些高新技術(shù)正在逐漸地被運(yùn)用到農(nóng)業(yè)的機(jī)械設(shè)備中,這些機(jī)械設(shè)備的出現(xiàn)不僅提高了農(nóng)業(yè)的整體生產(chǎn)水平,而且還進(jìn)一步提升了農(nóng)業(yè)的生產(chǎn)效率,很好地實(shí)現(xiàn)了農(nóng)業(yè)的可持續(xù)發(fā)展。在今后的農(nóng)業(yè)發(fā)展過(guò)程中,農(nóng)業(yè)機(jī)械也必定是智能化的,所以要求操作人員要不斷地提高自己的專業(yè)素養(yǎng),全面推廣農(nóng)業(yè)機(jī)械新技術(shù),只有這樣才能夠真正意義上實(shí)現(xiàn)我國(guó)農(nóng)業(yè)機(jī)械的智能化。
作者:徐家亮 劉曉鵬 單位:黑龍江省克東縣農(nóng)機(jī)安全監(jiān)理站
參考文獻(xiàn):
[1]陶樂(lè)然.長(zhǎng)春星宇小區(qū)新技術(shù)應(yīng)用[C]//增強(qiáng)自主創(chuàng)新能力促進(jìn)吉林經(jīng)濟(jì)發(fā)展———啟明杯•吉林省第四屆科學(xué)技術(shù)學(xué)術(shù)年會(huì)論文集(下冊(cè)).2006.
[2]劉蒙之.傳播新技術(shù)與國(guó)家發(fā)展———一種政治經(jīng)濟(jì)學(xué)的觀察[C]//中國(guó)傳播學(xué)會(huì)成立大會(huì)暨第九次全國(guó)傳播學(xué)研討會(huì)論文集.2006.
[3]張仁江,田莉.制造業(yè)企業(yè)新技術(shù)采納:動(dòng)因、路徑及障礙分析———基于T公司的縱向案例研究[C]//第六屆(2011)中國(guó)管理學(xué)年會(huì)———技術(shù)與創(chuàng)新管理分會(huì)場(chǎng)論文集.2011.
[4]胡札進(jìn),姚尚斌,徐七三“.雙低”儲(chǔ)藏與四項(xiàng)儲(chǔ)糧新技術(shù)的綜合應(yīng)用[C]//全面建設(shè)小康社會(huì):中國(guó)科技工作者的歷史責(zé)任———中國(guó)科協(xié)2003年學(xué)術(shù)年會(huì)論文集(上).2003.
[5]柳旭.淺析電視空間新技術(shù)對(duì)審美體驗(yàn)的影響[C]//2009中國(guó)電影電視技術(shù)學(xué)會(huì)影視技術(shù)文集.2010.
提起數(shù)字媒體,人們通常會(huì)想到傳媒行業(yè),其實(shí)數(shù)字媒體的應(yīng)用絕不局限于傳媒。隨著寬帶網(wǎng)絡(luò)的普及,人們?cè)谌粘I(yè)務(wù)處理過(guò)程中,正面對(duì)越來(lái)越豐富的網(wǎng)上媒體和內(nèi)容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數(shù)字媒體方面的專家一起來(lái)分享這個(gè)繽紛的世界。
三維幾何建模與形狀表示
北京大學(xué)視覺(jué)與聽(tīng)覺(jué)信息處理國(guó)家重點(diǎn)實(shí)驗(yàn)室主任教育部長(zhǎng)江學(xué)者獎(jiǎng)勵(lì)計(jì)劃特聘教授 查紅彬
精彩問(wèn)答
在背景比較復(fù)雜、有干擾的情況下模型檢索的效果怎么樣?
在模型檢索的時(shí)候并沒(méi)有考慮背景,因?yàn)檫@是做模型檢索比較容易的部分。模型檢索一般是沒(méi)有背景的,但也可以做,但是要推廣到背景比較復(fù)雜的物體上識(shí)別可能有很大的問(wèn)題,因?yàn)檫@時(shí)候匹配不僅僅是局部匹配,而是兩個(gè)子集和子集的匹配問(wèn)題,到目前為止,我們只是做沒(méi)有背景的模型檢索。
為什么要重新談?wù)撊S形狀表示問(wèn)題?在多媒體信息處理領(lǐng)域里面,有兩個(gè)比較重要的方向,這也是計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域里兩個(gè)重要的方向,一個(gè)是計(jì)算機(jī)視覺(jué),一個(gè)是計(jì)算機(jī)圖形學(xué)。計(jì)算機(jī)視覺(jué)是從圖像中通過(guò)識(shí)別或重建處理,得到一個(gè)對(duì)對(duì)象物的描述。反過(guò)來(lái)說(shuō)圖形學(xué),是對(duì)一個(gè)對(duì)象和場(chǎng)景的描述,通過(guò)繪制和動(dòng)畫(huà)生成圖像和視頻。它們從處理過(guò)程來(lái)說(shuō)是逆過(guò)程,這兩個(gè)領(lǐng)域之間有密切的關(guān)聯(lián)。
我們現(xiàn)在考慮計(jì)算機(jī)三維建?;蚰P偷拿枋?,考慮的不僅僅是計(jì)算機(jī)視覺(jué)或計(jì)算機(jī)圖形學(xué)所包含的內(nèi)容。這里面簡(jiǎn)單列舉一下,比如基于模型的三維物體識(shí)別和場(chǎng)景識(shí)別,這兩個(gè)應(yīng)該是典型的計(jì)算機(jī)視覺(jué)里面考慮的應(yīng)用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設(shè)計(jì)、變形、動(dòng)畫(huà)等等。除了兩個(gè)單獨(dú)研究的應(yīng)用之外,還要想怎么把兩者結(jié)合起來(lái),把虛擬和真實(shí)的東西無(wú)縫連接到一起,這些都牽涉到三維模型。
我們考慮的三維模型跟以前相比,應(yīng)用領(lǐng)域大了很多,要達(dá)到這個(gè)要求,對(duì)模型的表達(dá)、形狀的表達(dá)也都有了更高的要求。
怎樣找到一些更新更有效地表達(dá)形式來(lái)符合這些要求呢?這里有四個(gè)方面,現(xiàn)在能不能建立一個(gè)形狀空間,把考慮的對(duì)象完整地在形狀空間里面表達(dá)出來(lái)。第二點(diǎn)就是針對(duì)形狀的特性,表達(dá)要具有柔性,對(duì)象物的表面不都是連續(xù)的,也有一些非連續(xù)性和不規(guī)律性,這些特性怎樣能夠進(jìn)行柔性處理。第三個(gè)是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個(gè)很好的結(jié)合方法。第四是在大量的計(jì)算當(dāng)中,包括變形和動(dòng)畫(huà)中有很多編輯的工具,所以我們要求對(duì)現(xiàn)在的形狀表達(dá)有一些比較高的要求。
在計(jì)算機(jī)視覺(jué)里面有一個(gè)老大難就是識(shí)別,已有模型,但是眼前看到的是一部分三維數(shù)據(jù),怎么用這部分?jǐn)?shù)據(jù)和模型數(shù)據(jù)匹配來(lái)識(shí)別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個(gè)模型,從大量的數(shù)據(jù)中建立一個(gè)模型庫(kù),并從中抽取很多特征,把這些特征進(jìn)行組織。這里面牽涉三個(gè)比較大的問(wèn)題,第一個(gè)是形狀空間怎么構(gòu)造,沒(méi)有很好的特征表達(dá)或整理的形式,后面的匹配以及其他的工作就很難做。第二個(gè)是怎么定義基于這種特征的相似度。第三個(gè)是怎樣在形狀空間當(dāng)中搜索到最優(yōu)的匹配。
針對(duì)這些問(wèn)題我們最近一兩年做了一些工作,最近提出一個(gè)廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點(diǎn),能不能在三維形狀表示過(guò)程當(dāng)中,找到一些最關(guān)鍵的描述指令,并從中找到相互關(guān)系,把整體和局部結(jié)合起來(lái)。如果把之間的關(guān)系描述出來(lái),就能把局部結(jié)構(gòu)性的信息用整體觀點(diǎn)加進(jìn)去,這兩件工作就是我們做這件事情的主要目的。
在形狀描述問(wèn)題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結(jié)合到一起。今后幾年要用更多的模式識(shí)別的辦法,來(lái)解決面臨的圖形學(xué)或虛擬現(xiàn)實(shí)和計(jì)算機(jī)視覺(jué)當(dāng)中的很多問(wèn)題。
生活中的計(jì)算機(jī)視覺(jué)
香港中文大學(xué)信息工程系終身教授
微軟亞洲研究院視覺(jué)計(jì)算組負(fù)責(zé)人 湯曉歐
精彩問(wèn)答
微軟亞洲研究院視覺(jué)計(jì)算組在原創(chuàng)思想這一塊,引領(lǐng)下一個(gè)方向有沒(méi)有什么考慮,您談到很多對(duì)人們?nèi)粘I钣绊懞艽蟮膽?yīng)用,但是在背后的更深層的考慮,更新的創(chuàng)意在哪里呢?
我們的研究者都很年輕,我本人也才工作七年的時(shí)間,很多的算法已經(jīng)發(fā)展這么多年了,所以在開(kāi)始的時(shí)候比較容易想出來(lái)的方法,現(xiàn)在已經(jīng)很難有那么多的原創(chuàng)內(nèi)容。我們的工作是去找一些非常原創(chuàng)的內(nèi)容,有的是理論上的,有的是新的發(fā)明,這可以有很大的影響。
圖像通過(guò)閃光燈的分割,前景和背景深度差會(huì)不會(huì)影響分割效果,距離會(huì)不會(huì)影響分割效果呢?
我們這個(gè)通過(guò)閃光燈對(duì)圖像進(jìn)行分割的技術(shù),會(huì)一定程度上受到光的強(qiáng)度和距離的影響。
我們主要的研究領(lǐng)域包括計(jì)算機(jī)視覺(jué)、模式識(shí)別、圖像處理和視頻處理。下面就為大家介紹幾個(gè)比較典型的應(yīng)用。
如何將圖片的前景和后景分離?我們現(xiàn)在照兩張圖片,一張打閃光燈,一張沒(méi)有打閃光燈,這樣拍出來(lái)的照片背景沒(méi)有變化,但前景變化很厲害。在開(kāi)閃光燈的情況下拍的照片,前景和后景可以利用一些技術(shù)很容易地分開(kāi)來(lái)。
把一個(gè)圖片的前景切割出來(lái)放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復(fù)剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區(qū)域,我們可以由一個(gè)算法,從其他的地方借過(guò)來(lái),再貼上去,經(jīng)過(guò)這樣的處理后,圖像基本上和原來(lái)沒(méi)有太大的區(qū)別。
如此的修修補(bǔ)補(bǔ)又有什么用呢?比如說(shuō),你對(duì)這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來(lái),然后利用一些技術(shù)將劃出來(lái)的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個(gè)選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補(bǔ)上,而且讓別人看不出來(lái)。
現(xiàn)在大家的電腦上都會(huì)有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個(gè)屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現(xiàn)在做的是可以隨機(jī)把照片放到桌面上,但是電腦會(huì)對(duì)每張照片上的重要信息進(jìn)行篩選,在放盡可能多的照片的同時(shí),讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來(lái)就更清楚了。這個(gè)算法就是怎么讓所有圖像均勻分布,同時(shí)把所有背景都要蓋上。我們可以對(duì)圖像進(jìn)行各種處理,同時(shí)我們也可以利用一些技術(shù)知道別人有沒(méi)有處理圖像,對(duì)圖像有沒(méi)有做過(guò)手腳。
現(xiàn)在我們來(lái)說(shuō)說(shuō)視頻方面。比如說(shuō)抖動(dòng)很厲害的圖像,怎么把物體移到中間?一個(gè)辦法是把除移動(dòng)圖像外的公共部分切出來(lái),但是移動(dòng)越大,公共部分就會(huì)越來(lái)越小,更好的辦法是用一些技術(shù)把空處填上。
現(xiàn)在MSN的功能已經(jīng)越來(lái)越豐富。比如說(shuō)一段電影,你看到一件比較中意的衣服,只要你把鼠標(biāo)移動(dòng)衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價(jià)格。如果你把鼠標(biāo)在那件衣服上輕點(diǎn),電腦就會(huì)直接跳轉(zhuǎn)到這個(gè)衣服的相關(guān)網(wǎng)站。
你在視頻聊天的時(shí)候如果不想讓對(duì)方看到你所處的環(huán)境,你就可以很輕松地把背景模糊掉。如果大家對(duì)自己的長(zhǎng)相不是那么有信心,我們可以幫你改變一下你的長(zhǎng)相。為自己添一幅酷酷的墨鏡,換上一個(gè)性感的大嘴巴,這些都能輕而易舉地完成。
多媒體傳感器網(wǎng)絡(luò)
北京郵電大學(xué)教授、博士生導(dǎo)師
智能通信軟件與多媒體北京市重點(diǎn)實(shí)驗(yàn)室主任 馬華東
傳感器研究是IT非常熱門的話題, 首先我為大家介紹一下多媒體傳感器網(wǎng)絡(luò)的基本概念。從早期的巨型機(jī)到今天的小型機(jī),生物芯片尺寸越來(lái)越小,但是效率越來(lái)越高;網(wǎng)絡(luò)設(shè)備聯(lián)網(wǎng)和數(shù)據(jù)交換的需求越來(lái)越大,設(shè)備之間的傳輸量也越來(lái)越大;從信息處理的角度來(lái)看,內(nèi)容逐漸占據(jù)了主導(dǎo)地位,由數(shù)據(jù)為中心轉(zhuǎn)到以內(nèi)容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。
傳感器網(wǎng)絡(luò)是一組傳感器節(jié)點(diǎn),由組織方式協(xié)作地感知采集和處理感知對(duì)象的信息,它的基本特點(diǎn)是造價(jià)低、能量敏感、通信能力有限、計(jì)算能力弱、動(dòng)態(tài)變化。現(xiàn)在的需求是要求通信能力越來(lái)越強(qiáng),計(jì)算能力應(yīng)付節(jié)點(diǎn)的處理的要求。
右圖是目前主流的傳感器節(jié)點(diǎn)的配置,從配置來(lái)講還是比較低的,現(xiàn)在信息處理側(cè)重壓力、溫度、光、震動(dòng)等簡(jiǎn)單的數(shù)據(jù)或者是標(biāo)量數(shù)據(jù)。人類獲取信息80%是視覺(jué)信息,10%左右是聽(tīng)覺(jué)信息,也就是說(shuō)90%左右的信息是多媒體信息。傳感器網(wǎng)絡(luò)就是對(duì)音頻、視頻信息獲取后提供給使用者,使其對(duì)環(huán)境信息有一個(gè)全方位的了解,對(duì)傳感器網(wǎng)絡(luò)的應(yīng)用是非常廣泛的。
從網(wǎng)絡(luò)的結(jié)構(gòu)來(lái)講,基本結(jié)構(gòu)和原來(lái)傳感器網(wǎng)絡(luò)差別不是很大,這里面強(qiáng)調(diào)增加音頻、視頻獲取處理,網(wǎng)絡(luò)傳輸整個(gè)過(guò)程的各個(gè)環(huán)節(jié),同時(shí)這里面最好可以交互。有了這個(gè)概念以后,深入分析一下主要特點(diǎn),首先是網(wǎng)絡(luò)能力的增強(qiáng),這樣一個(gè)傳感器網(wǎng)絡(luò)應(yīng)該集信息的采集、處理傳輸、轉(zhuǎn)發(fā)、能量供應(yīng)等方面,除了傳統(tǒng)的標(biāo)量數(shù)據(jù),音頻、視頻的圖像數(shù)據(jù),都可以進(jìn)行采集處理。
現(xiàn)在多媒體傳感器網(wǎng)絡(luò)目前有哪些問(wèn)題呢?從需求來(lái)看,現(xiàn)在網(wǎng)絡(luò)是異構(gòu)的信息,媒體信息的格式,種類很多,并且差異非常大,數(shù)據(jù)量比較大,特別是音頻、視頻信息,格式比較復(fù)雜。這些信息傳輸過(guò)程中需要高速實(shí)時(shí)地傳輸,對(duì)網(wǎng)絡(luò)傳輸速率也提出了比較高的要求。媒體信息的安全問(wèn)題,也是網(wǎng)絡(luò)需要考慮的,還有服務(wù)質(zhì)量的問(wèn)題。針對(duì)這些需求,我們可以看到,通信資源和計(jì)算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問(wèn)題所在。
最后談一下多媒體傳感器網(wǎng)絡(luò)研究的挑戰(zhàn),首先是節(jié)點(diǎn)的芯片設(shè)計(jì),這是基礎(chǔ),這里面需要采用多種技術(shù),包括軟硬件協(xié)同設(shè)計(jì)的技術(shù),各種技術(shù)結(jié)合,降低成本、能耗、體積、提高運(yùn)算速度和可靠性。第二是三維場(chǎng)景的覆蓋問(wèn)題,方向性傳感模型是一個(gè)簡(jiǎn)單的二維圖形,實(shí)際上是三維圖形監(jiān)測(cè),這是一個(gè)三維場(chǎng)景方向的問(wèn)題,研究這個(gè)就復(fù)雜多了。還有一個(gè)問(wèn)題是服務(wù)質(zhì)量保證問(wèn)題,在新的網(wǎng)絡(luò)當(dāng)中服務(wù)質(zhì)量體系是什么樣,也是研究的方向。再一個(gè)是信息處理,為了使網(wǎng)絡(luò)傳輸數(shù)據(jù)量比較快,能不能在節(jié)點(diǎn)做信息處理的計(jì)算。當(dāng)然信息的安全也比較重要,用這些節(jié)點(diǎn)獲取多媒體信息怎么保證安全的質(zhì)量,使應(yīng)該看到的人看到這些信息,不應(yīng)該看到的人看不到這些信息。
在多媒體傳感器網(wǎng)絡(luò)中,我們還是做了一些工作,和一些同行學(xué)者也有一些交流,這里面也有一些質(zhì)疑,說(shuō)多媒體傳感網(wǎng)絡(luò)和原來(lái)傳感器網(wǎng)絡(luò)設(shè)計(jì)初衷是不是吻合的,原來(lái)沒(méi)有想讓它處理這么多信息,原來(lái)體積比較小,加上這些信息以后,無(wú)疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網(wǎng)絡(luò)研究有沒(méi)有必要性,如果有必要性可行不可行,這都是我們目前研究的問(wèn)題。
關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);視線追蹤;應(yīng)用
增強(qiáng)現(xiàn)實(shí)(Augmented Reality簡(jiǎn)稱AR)技術(shù)是近年來(lái)的一個(gè)研究熱點(diǎn),有著廣泛的應(yīng)用前景。它是對(duì)現(xiàn)實(shí)世界的補(bǔ)充,使得虛擬物體從感官上成為周圍真實(shí)環(huán)境的組成部分。與傳統(tǒng)的虛擬現(xiàn)實(shí)(Virtual Reality簡(jiǎn)稱VR)不同,增強(qiáng)現(xiàn)實(shí)只是實(shí)現(xiàn)對(duì)現(xiàn)實(shí)環(huán)境的增強(qiáng),加深了對(duì)現(xiàn)實(shí)環(huán)境的感受。在實(shí)際的AR體驗(yàn)中,因?yàn)槿说挠^察視線會(huì)不斷地變化,AR系統(tǒng)需要實(shí)時(shí)的根據(jù)用戶的視場(chǎng)重新建立位置坐標(biāo)系,進(jìn)行追蹤。而視線追蹤技術(shù)就是實(shí)時(shí)地跟蹤用戶頭部的位置和視線方向,根據(jù)這些信息來(lái)確定虛擬物體在真實(shí)空間坐標(biāo)中的位置,并將它實(shí)時(shí)地顯示在顯示器中的正確位置。
一、視線追蹤技術(shù)及其特點(diǎn)
(一)視線追蹤技術(shù)概述。
視線追蹤也稱為眼動(dòng)追蹤,它被認(rèn)為是研究視覺(jué)信息加工的有效手段。利用專用設(shè)備來(lái)記錄學(xué)習(xí)者的眼球運(yùn)動(dòng)(Eve-Movement,簡(jiǎn)稱眼動(dòng))情況,可以作為分析學(xué)習(xí)者內(nèi)部心理活動(dòng)情況的依據(jù)。關(guān)于視線追蹤技術(shù)的研究己有較長(zhǎng)歷史,目前它己在多個(gè)領(lǐng)域得到廣泛應(yīng)用。例如用于圖片廣告研究(網(wǎng)頁(yè)評(píng)估、設(shè)計(jì)評(píng)估等)、動(dòng)態(tài)分析(航空航天、體育運(yùn)動(dòng)、汽車、飛機(jī)駕駛等)、產(chǎn)品測(cè)試(可用性測(cè)試)、場(chǎng)景研究(商場(chǎng)購(gòu)物、店鋪裝演、家居環(huán)境等)和人機(jī)交互等多個(gè)領(lǐng)域。此外,視線追蹤在智能計(jì)算機(jī)、智能家電、虛擬現(xiàn)實(shí)和數(shù)字游戲等領(lǐng)域也有很好的應(yīng)用前景。
在眼動(dòng)實(shí)驗(yàn)研究中,當(dāng)被試對(duì)視覺(jué)信息進(jìn)行提取時(shí),其注視時(shí)間、注視次數(shù)、注視點(diǎn)序列、眼跳距離、回視次數(shù)、瞳孔直徑等通常被視為思維和心理加工的重要參數(shù)。因此,通過(guò)對(duì)被試在學(xué)習(xí)過(guò)程中的實(shí)時(shí)眼動(dòng)信息進(jìn)行觀測(cè),可用于分析和引導(dǎo)其學(xué)習(xí)的依據(jù)。眼動(dòng)模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運(yùn)動(dòng)(pursuit movement)。其中,持續(xù)一段時(shí)間、相對(duì)穩(wěn)定的眼球運(yùn)動(dòng)稱為注視;眼球快速運(yùn)動(dòng)時(shí)導(dǎo)致視覺(jué)區(qū)域的聚焦點(diǎn)產(chǎn)生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個(gè)緩慢運(yùn)動(dòng)的目標(biāo),則稱為追隨運(yùn)動(dòng)。通過(guò)分析眼動(dòng)模式和相關(guān)參數(shù),可以獲得很多重要的信息。例如,眼跳速度會(huì)隨著疲倦程度的增加而降低,而隨著學(xué)習(xí)任務(wù)難度的增加而增加;眨眼速度和眼睛睜開(kāi)程度的降低則可能意味著疲倦的加重。因此,可以據(jù)此來(lái)確定學(xué)習(xí)者的學(xué)習(xí)精神狀態(tài),或?qū)ζ鋵W(xué)習(xí)過(guò)程進(jìn)行分析,從而采取相應(yīng)的學(xué)習(xí)策略或干預(yù)措施。
(二)視線追蹤系統(tǒng)的類型及其特點(diǎn)。
人眼的注視點(diǎn)主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點(diǎn)的精確位置。國(guó)內(nèi)外將視覺(jué)跟蹤技術(shù)按照借助的媒介分為硬件和軟件兩種。以硬件為基礎(chǔ)的視線跟蹤的基本工作原理是利用圖像處理技術(shù),通過(guò)攝像機(jī)攝入瞳孔反射的紅外線記錄視線變化,達(dá)到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機(jī),這種情形用戶使用較不舒適。通過(guò)軟件實(shí)現(xiàn)的視線跟蹤方法,對(duì)用戶沒(méi)有干擾,首先利用攝像機(jī)獲取頭部、臉部或眼睛圖像,再經(jīng)過(guò)軟件分析對(duì)視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。
人與計(jì)算機(jī)交互是研究人與計(jì)算機(jī)之間溝通的技術(shù),將視線跟蹤、語(yǔ)音識(shí)別、手勢(shì)輸入、感覺(jué)反饋等引入人機(jī)交互,提高了交互的自然性和高效性。視線追蹤技術(shù)同樣引發(fā)了人機(jī)交互系統(tǒng)的改革,鼠標(biāo)、觸控板的消失,及通過(guò)追蹤人眼視線,用眼神來(lái)操作電腦、輸入文字、玩游戲。
二、視線追蹤技術(shù)在AR增強(qiáng)現(xiàn)實(shí)研究中的應(yīng)用
(一)顯示技術(shù)。
AR的簡(jiǎn)單定義就是將計(jì)算機(jī)生成的虛擬數(shù)字信息疊加到現(xiàn)實(shí)的生活場(chǎng)景中。這個(gè)“疊加”是需要通過(guò)顯示設(shè)備作為中介來(lái)實(shí)現(xiàn)。
增強(qiáng)現(xiàn)實(shí)系統(tǒng)中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設(shè)備。目前,一般的增強(qiáng)現(xiàn)實(shí)系統(tǒng)主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個(gè)基本環(huán)節(jié)構(gòu)成:虛擬信息顯示通道、真實(shí)環(huán)境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現(xiàn)實(shí)系統(tǒng)所用的浸沒(méi)式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據(jù)其中真實(shí)環(huán)境的表現(xiàn)方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學(xué)原理的光學(xué)透視式頭盔顯示器兩類。
光W透視技術(shù)是通過(guò)安裝在設(shè)備眼前的光學(xué)透鏡來(lái)呈現(xiàn)出真實(shí)和虛擬世界。首先計(jì)算機(jī)生成的虛擬信息經(jīng)過(guò)光學(xué)系統(tǒng)放大后反射后進(jìn)入視野,透過(guò)透鏡又能直接看到現(xiàn)實(shí)場(chǎng)景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實(shí)現(xiàn)AR的效果。視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來(lái)捕捉獲取外部真實(shí)環(huán)境,計(jì)算機(jī)將數(shù)字模擬信息疊加到攝像機(jī)的視頻信號(hào)上,再將真實(shí)場(chǎng)景和虛擬場(chǎng)景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場(chǎng)更大,而且不受外界的強(qiáng)光干擾。不過(guò)一旦攝像機(jī)與用戶的視點(diǎn)不能保持完全重合,會(huì)產(chǎn)生一些偏差。
(二)跟蹤注冊(cè)技術(shù)。
基于計(jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)主要是指利用計(jì)算機(jī)視覺(jué)獲取真實(shí)場(chǎng)景的信息后,經(jīng)過(guò)圖像處理方面的知識(shí)來(lái)識(shí)別和跟蹤定位真實(shí)場(chǎng)景。細(xì)分可以劃為基于傳統(tǒng)標(biāo)志的注冊(cè)算法和基于自然特征點(diǎn)無(wú)標(biāo)志注冊(cè)算法?;谟?jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)的精度較高,但是對(duì)計(jì)算量非常大,而且算法復(fù)雜,對(duì)系統(tǒng)的要求非常高。
為了取長(zhǎng)補(bǔ)短,得到更加精確的注冊(cè)結(jié)果,現(xiàn)在有結(jié)合兩種技術(shù)的混合注冊(cè)方法。通常是先由跟蹤傳感器大概估計(jì)位置姿態(tài),再通過(guò)視覺(jué)法進(jìn)一步精確調(diào)整定位。一般采用的復(fù)合法有視覺(jué)與電磁跟蹤結(jié)合、視覺(jué)與慣導(dǎo)跟蹤結(jié)合、視覺(jué)與GPS跟蹤結(jié)合等。
三、結(jié)論
在國(guó)外,增強(qiáng)現(xiàn)實(shí)早已在醫(yī)學(xué)、遙操作、制造與維修、可視化與教育培訓(xùn)、娛樂(lè)、軍事訓(xùn)練等領(lǐng)域取得了成功應(yīng)用。在國(guó)內(nèi),不少單位和個(gè)人對(duì)增強(qiáng)現(xiàn)實(shí)中的關(guān)鍵技術(shù)和算法進(jìn)行了研究,并且以牙科醫(yī)學(xué)、設(shè)備維修等許多背景得到了初步應(yīng)用研究。但國(guó)內(nèi)的研究目前仍多限于實(shí)驗(yàn)階段,與國(guó)外的應(yīng)用水平還有一定距離。
目前,隨著增強(qiáng)現(xiàn)實(shí)的快速發(fā)展,出現(xiàn)了許多新的研究方向,如新的顯示方式、照片真實(shí)感圖形繪制、調(diào)節(jié)現(xiàn)實(shí)、基于網(wǎng)絡(luò)的增強(qiáng)現(xiàn)實(shí)和針對(duì)戶外隨身增強(qiáng)現(xiàn)實(shí)系統(tǒng)的技術(shù)等等。其中涉及到的技術(shù)包括基于圖像的繪制(IBMR)、多通道信息融合、普適計(jì)算技術(shù)、顯示設(shè)備和跟蹤設(shè)備的隨身便攜化等。隨著系統(tǒng)性能的提高、操作過(guò)程的簡(jiǎn)化和設(shè)備成本的降低,增強(qiáng)現(xiàn)實(shí)會(huì)在越來(lái)越多的領(lǐng)域得到廣泛應(yīng)用。
參考文獻(xiàn):
[1]奚惠寧等.視線追蹤應(yīng)用技術(shù)的專利分析[J].電視技術(shù),2013(S2)。
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)