公務(wù)員期刊網(wǎng) 精選范文 計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

計(jì)算機(jī)視覺技術(shù)應(yīng)用精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺技術(shù)應(yīng)用主題范文,僅供參考,歡迎閱讀并收藏。

計(jì)算機(jī)視覺技術(shù)應(yīng)用

第1篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

關(guān)鍵詞:計(jì)算機(jī);視覺技術(shù);交通工程

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2014) 04-0000-01

一、引言

隨著科技的發(fā)展,計(jì)算機(jī)替代人的視覺與思維已經(jīng)成為現(xiàn)實(shí),這也是計(jì)算機(jī)視覺的突出顯現(xiàn)。那么在物體圖像中識(shí)別物體并作進(jìn)一步處理,是客觀世界的主觀反應(yīng)。在數(shù)字化圖像中,我們可以探尋出較為固定的數(shù)字聯(lián)系,在物體特征搜集并處理時(shí)做到二次實(shí)現(xiàn)。這既是對物體特征的外在顯現(xiàn)與描繪,更是對其定量信息的標(biāo)定。從交通工程領(lǐng)域的角度來看,該種技術(shù)一般應(yīng)用在交管及安全方面。監(jiān)控交通流、識(shí)別車況及高速收費(fèi)都是屬于交通管理的范疇;而對交通重大事件的勘察及甄別則是交通安全所屬。在這個(gè)基礎(chǔ)上,筆者對計(jì)算機(jī)視覺系統(tǒng)的組成及原理進(jìn)行了分析,并形成視覺處理相關(guān)技術(shù)研究。

二、設(shè)計(jì)計(jì)算機(jī)視覺系統(tǒng)構(gòu)成

計(jì)算機(jī)視覺處理技術(shù)的應(yīng)用是建立在視覺系統(tǒng)的建立基礎(chǔ)上的。其內(nèi)部主要的構(gòu)成是計(jì)算機(jī)光源、光電轉(zhuǎn)換相關(guān)器件及圖像采集卡等元件。

(一)照明條件的設(shè)計(jì)。在測量物體的表征時(shí),環(huán)境的創(chuàng)設(shè)是圖像分析處理的前提,其主要通過光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開照明條件的選擇。在設(shè)計(jì)照明條件時(shí),我們通常會(huì)視具體而不同處理,不過總的目標(biāo)是一定的,那就是要利于處理圖像及對其進(jìn)行提取分析。在照明條件的設(shè)定中,主動(dòng)視覺系統(tǒng)結(jié)構(gòu)光是較為典型的范例。

(二)數(shù)據(jù)采集的處理。如今電耦合器件(CCD)中,攝像機(jī)及光電傳感器較為常見。它們輸出形成的影像均為模擬化的電子信號(hào)。在此基礎(chǔ)上,A模式與D模式的相互對接更能夠讓信號(hào)進(jìn)入計(jì)算機(jī)并達(dá)到數(shù)字處理標(biāo)準(zhǔn),最后再量化入計(jì)算機(jī)系統(tǒng)處理范圍。客觀物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機(jī)輸入的結(jié)果;彩色圖像則需要彩色相機(jī)來實(shí)現(xiàn)。其過程為:彩色模擬信號(hào)解碼為RGB單獨(dú)信號(hào),并單獨(dú)A/D轉(zhuǎn)換,輸出后借助色彩查找表來顯示相應(yīng)色彩。每幅圖像一旦經(jīng)過數(shù)字處理就會(huì)形成點(diǎn)陣,并將n個(gè)信息濃縮于每點(diǎn)中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來看,彩色的圖像采集分析更為繁復(fù)些。不過黑白跟灰度圖像也基本適應(yīng)于基礎(chǔ)信息的特征分析。相機(jī)數(shù)量及研究技法的角度,則有三個(gè)分類:“單目視覺”、“雙目”及“三目”立體視覺。

三、研究與應(yīng)用計(jì)算機(jī)視覺處理技術(shù)

從對圖像進(jìn)行編輯的過程可以看出,計(jì)算機(jī)視覺處理技術(shù)在物體成像及計(jì)算后會(huì)在灰度陣列中參雜無效信息群,使得信息存在遺失風(fēng)險(xiǎn)。成像的噪聲在一定程度上也對獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預(yù)設(shè)分析,還原圖像本相,從而消去噪音。邊緣增強(qiáng)在特定的圖像變化程度中,其起到的是對特征方法的削減?;诙祷指顖D像才能夠進(jìn)一步開展。對于物體的檢測多借助某個(gè)范圍來達(dá)到目的。識(shí)別和測算物體一般總是靠對特征的甄別來完成的。

四、分析處理三維物體技術(shù)

物體外輪擴(kuò)線及表面對應(yīng)位置的限定下,物體性質(zhì)的外在表現(xiàn)則是其形狀。三維物體從內(nèi)含性質(zhì)上來看也有體現(xiàn),如通過其內(nèi)含性質(zhì)所變現(xiàn)出來的表層構(gòu)造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態(tài)是最常用的處理技術(shù)。檢測三維物體形狀及分析距離從計(jì)算機(jī)視覺技術(shù)角度來看,渠道很多,其原理主要是借助光源特性在圖像輸入時(shí)的顯現(xiàn)來實(shí)現(xiàn)的。其類別有主動(dòng)與被動(dòng)兩類。借助自然光照來對圖像獲取并挖掘深入信息的技術(shù)叫做被動(dòng)測距;主動(dòng)測距的光源條件則是利用人為設(shè)置的,其信息也是圖像在經(jīng)過測算分析時(shí)得到的。被動(dòng)測距的主要用途體現(xiàn)在軍工業(yè)保密及限制環(huán)境中,而普通建筑行業(yè)則主要利用主動(dòng)測距。特別是較小尺寸物體的測算,以及擁有抗干擾及其他非接觸測距環(huán)境。

(一)主動(dòng)測距技術(shù)。主動(dòng)測距,主要是指光源條件是在人為創(chuàng)設(shè)環(huán)境中滿足的,且從景物外像得到相關(guān)點(diǎn)化信息,可以適當(dāng)顯示圖像大概并進(jìn)行初步分析處理,以對計(jì)算適應(yīng)功率及信息測算程度形成水平提高。從技術(shù)種類上說,主動(dòng)測距技術(shù)可分為雷達(dá)取像、幾何光學(xué)聚焦、圖像干擾及衍射等。除了結(jié)構(gòu)光法外的測量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環(huán)境到條件所涉,以結(jié)構(gòu)光法測量作為主要技術(shù)的工程需求較為普遍,其原理為:首先在光源的設(shè)計(jì)上由人為來進(jìn)行環(huán)境考慮測算,再從其中獲取較為全面的離散點(diǎn)化信息。在離散處理后,此類圖像已經(jīng)形成了較多的物體真是特征表象。在此基礎(chǔ)上,信息需要不斷簡化與甄別、壓縮。如果分析整個(gè)物體特征信息鏈,則后期主要體現(xiàn)在對于數(shù)據(jù)的簡化分析。如今人們已經(jīng)把研究的目光轉(zhuǎn)向了結(jié)構(gòu)光測量方法的應(yīng)用,體現(xiàn)在物體形狀檢測等方面。

(二)被動(dòng)測距技術(shù)。被動(dòng)測距,對光照條件的選擇具有局限性,其主要通過對于自然光的覆蓋得以實(shí)現(xiàn)。它在圖像原始信息處理及分析匹配方面技術(shù)指向較為突出。也通過此三維物體之形狀及周圍環(huán)境深度均被顯露。在圖像原始信息基礎(chǔ)上的應(yīng)用計(jì)算,其與結(jié)構(gòu)光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺內(nèi)涵入手,適應(yīng)物體自身特點(diǎn)而存在。不過相對來說獲得圖像特征才是其適應(yīng)匹配的條件保障。點(diǎn)、線、區(qū)域及結(jié)構(gòu)紋理等是物象特征的主體形式。其中物特較為基礎(chǔ)與原始的特征是前兩個(gè)特征,同時(shí)它們也是其他相關(guān)表征的前提。計(jì)算機(jī)系統(tǒng)技術(shù)測量基本原理為對攝像機(jī)進(jìn)行構(gòu)建分析,并對其圖像表征進(jìn)行特征匹配,以得到圖像不同區(qū)間的視覺差異。

五、結(jié)束語

通過對計(jì)算機(jī)視覺技術(shù)的研究,悉知其主要的應(yīng)用領(lǐng)域及技術(shù)組成。在系統(tǒng)使用的基礎(chǔ)上深入設(shè)計(jì),對系統(tǒng)主要構(gòu)成環(huán)節(jié)進(jìn)行分析。從而將三維復(fù)雜形態(tài)原理、算法及測量理論上升到實(shí)際應(yīng)用。隨著社會(huì)對于計(jì)算機(jī)的倚賴程度增加,相信該技術(shù)在建筑或者其他領(lǐng)域會(huì)有更加深入的研究及應(yīng)用。

參考文獻(xiàn):

[1]段里仁.智能交通系境在我國道路空通管理中的應(yīng)用[J].北方工業(yè)時(shí)報(bào),2012(06).

[2]王豐元.計(jì)算機(jī)視覺在建筑區(qū)間的應(yīng)用實(shí)例分析[J].河北電力學(xué)報(bào),2011(04).

第2篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

關(guān)鍵詞:計(jì)算機(jī)視覺;果蔬分類;應(yīng)用;挑戰(zhàn);展望

自“農(nóng)業(yè)4.0”時(shí)代的來臨,以“互聯(lián)網(wǎng)+”為驅(qū)動(dòng)的農(nóng)業(yè)技術(shù)已成為發(fā)展農(nóng)業(yè)強(qiáng)有力的支撐。在果蔬業(yè)中,果蔬分類通常由經(jīng)過訓(xùn)練的人員人工評估農(nóng)產(chǎn)品或農(nóng)作物的質(zhì)量。但是,人工分類會(huì)帶來許多相關(guān)的限制,工作人員需要熟悉果蔬的許多特征,并且高強(qiáng)度的機(jī)械性工作帶來的失誤不可避免,因而分類技術(shù)的提高是農(nóng)產(chǎn)品質(zhì)量提升的關(guān)鍵。計(jì)算機(jī)視覺技術(shù)具有效率高、非接觸、抗干擾能力強(qiáng)等優(yōu)點(diǎn),在多個(gè)領(lǐng)域已經(jīng)廣泛應(yīng)用,能實(shí)現(xiàn)農(nóng)產(chǎn)品快速無損檢測的要求[1]。果蔬分級效率的提升對我國產(chǎn)品質(zhì)量提升、農(nóng)民增產(chǎn)增收具有重要意義。

1圖像處理技術(shù)在果蔬分類領(lǐng)域的應(yīng)用

本文對基于計(jì)算機(jī)視覺技術(shù)的果蔬分類進(jìn)行了比較調(diào)查,發(fā)現(xiàn)研究人員多使用一種或者多種傳感器或者機(jī)器學(xué)習(xí)技術(shù)進(jìn)行農(nóng)產(chǎn)品的分類與分級,但是由于相同水果品種不同造成形狀、大小與顏色的不同,果蔬的分類依然面臨著許多挑戰(zhàn)[2]。為解決這些問題研究人員已經(jīng)進(jìn)行了多種實(shí)驗(yàn),其中結(jié)合機(jī)器學(xué)習(xí)技術(shù)對于系統(tǒng)有明顯提升。通過使用傳感器捕獲水果與蔬菜的特征,使用機(jī)器學(xué)習(xí)對任務(wù)進(jìn)行優(yōu)化,以提高系統(tǒng)整體性能[3]。

2果蔬分類的主要挑戰(zhàn)

雖然已經(jīng)在多個(gè)產(chǎn)業(yè)中實(shí)現(xiàn)目標(biāo)分類,但將果蔬作為對象進(jìn)行分類仍然是一項(xiàng)復(fù)雜的問題。在實(shí)際過程中,環(huán)境、光及空間等因素制約了系統(tǒng)的優(yōu)化,使系統(tǒng)的時(shí)間與準(zhǔn)確性方面受到限制。光照方向及亮度、色溫以及背景所造成的鏡面反射與漫反射都會(huì)制約系統(tǒng)的進(jìn)一步優(yōu)化,并且不同種類果蔬的特征并不相同,這也使果蔬分類系統(tǒng)沒有被廣泛地開發(fā)。

2.1缺乏合適的傳感器

分類任務(wù)的一個(gè)關(guān)鍵步驟就是選擇適合場景的傳感器用于數(shù)據(jù)采集。在果蔬的分類任務(wù)中視覺傳感器與非視覺傳感器已經(jīng)廣泛地應(yīng)用,但是由于各種傳感器性質(zhì)不同其所適用的應(yīng)用場景亦有不同[4-6]。例如超聲波傳感器與觸覺傳感器都不太適合易損的目標(biāo)物[7]。因?yàn)檫@些傳感器需要物理接觸果蔬以獲取數(shù)據(jù)。另外,視覺傳感器對許多因素高度敏感,例如照明條件和背景環(huán)境。這些基本因素是許多復(fù)雜因素的結(jié)合,包括反射、折射、縮放、旋轉(zhuǎn)和平移,這在系統(tǒng)實(shí)際的設(shè)計(jì)中需要深入考慮。傳感器大致分為視覺傳感器和非視覺傳感器。由于每個(gè)傳感器具有一定的局限性,例如視覺傳感器對照明條件和背景顏色高度敏感。高光譜相機(jī)可以得出物體反射特性,檢測具有相似顏色或背景的不同對象的固有特性,其對許多顏色等因素不敏感,并且高光譜信息與水果的其他特征相結(jié)合,可以提高系統(tǒng)性能。最近,熱紅外分析已用于許多領(lǐng)域,例如植物病害檢測、冷藏對果實(shí)的冷害、農(nóng)作物成熟度估算和農(nóng)作物產(chǎn)量估算[8]。然而,由于蔬菜和背景的熱物理性質(zhì)大致相似,并且這種技術(shù)對溫度變化敏感,因而熱紅外分析仍不能很好地完成綠顏色水果和多葉蔬菜的分類任務(wù)。

2.2難以準(zhǔn)確選擇特征

特征是用于與其他物體區(qū)分的物理特征。果蔬具有多種物理特征,例如顏色、質(zhì)地、形狀和大小,這些都是可以用作分類的特征參數(shù),并且果蔬具有類間和類內(nèi)的同異性。類別間的變化是主要變化,即顏色、紋理和形狀的變化,而類別內(nèi)的變化更難以發(fā)現(xiàn),特征更加難以區(qū)分。理想的系統(tǒng)能夠進(jìn)行類間和類內(nèi)分類。研究表明,單個(gè)特征不能有效地對果蔬或物體進(jìn)行有效分類。計(jì)算機(jī)視覺是用于圖像分類和識(shí)別的一種技術(shù),可以設(shè)計(jì)算法通過多種方式對果蔬進(jìn)行分類,通常分類是基于神經(jīng)網(wǎng)絡(luò)完成。在任何機(jī)器學(xué)習(xí)應(yīng)用程序中選擇合適的算法至關(guān)重要,但是由于果蔬的類間相似性,算法優(yōu)化尤為重要。數(shù)字圖像中某些與特性有關(guān)信息的識(shí)別、分類、檢索、重建稱為特征描述,果蔬具有相關(guān)的獨(dú)特視覺特征。果蔬的分類和識(shí)別最常用的特征是顏色、形狀、大小和質(zhì)地,可以根據(jù)整體或局部圖像特征來選擇特征描述是全局或者局部的特征。特別是對于對象識(shí)別,全局圖像特征描述整個(gè)對象,具有良好的不變性,而局部圖像特征則易于實(shí)現(xiàn)快速匹配。因此,通常將局部和全局圖像特征配合使用以提高整體性能。在圖像經(jīng)過去噪、平滑等操作之后,圖像的細(xì)節(jié)將不可避免地丟失,因而需要更加注意特征的選取。這些因素對特征描述的選取造成了一些限制。

3展望

第3篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

 

數(shù)據(jù)挖掘就是從大量的不完全的有噪聲的模糊的隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,抽取隱含在其中的、事先并不知道的、但又是潛在有用的信息和知識(shí)的過程。

 

決策樹算法作為常用的數(shù)據(jù)挖掘技術(shù)之一,其基本思想是將實(shí)例庫中記錄的大量有限的具體事實(shí)數(shù)據(jù)進(jìn)行歸納和分類并建立樹型結(jié)構(gòu),以發(fā)現(xiàn)并形成隱含在大量實(shí)例中的若干形式化的分類判別規(guī)則,典型的決策樹算法方法有ID3方法和IBLE(Information—based Learning from Example)方法。

 

利用決策樹評估教材質(zhì)量的基本思想

 

筆者以高校教學(xué)質(zhì)量建設(shè)中的重頭戲——教材建設(shè)為例來闡釋決策樹算法在教育統(tǒng)計(jì)學(xué)中的應(yīng)用。

 

從教材的教學(xué)水平,科學(xué)水平等兩大要素來對教材的質(zhì)量進(jìn)行合理分類,探索出科學(xué)合理的決策樹的模型,使之成為學(xué)校教材建設(shè)管理的理論方法,并在今后的教材管理中起著一定的指導(dǎo)作用。

 

教學(xué)水平:教材符合人才培養(yǎng)目標(biāo)及本課程教學(xué)的要求:取材合適、深度適宜、份量恰當(dāng);符合認(rèn)知規(guī)律;富有啟發(fā)性;便于學(xué)習(xí)。

 

科學(xué)水平:能反映本學(xué)科國內(nèi)外科學(xué)研究和教學(xué)研究的先進(jìn)成果;能完整地表達(dá)本課程應(yīng)包含的知識(shí);反映其相互聯(lián)系及發(fā)展規(guī)律;結(jié)構(gòu)嚴(yán)謹(jǐn)。

 

構(gòu)建決策樹模型

 

即利用訓(xùn)練集(教材建設(shè)數(shù)據(jù)庫)建立并精化一棵決策樹。該過程可分為建樹和剪枝兩階段。其中,建樹是用每一個(gè)屬性將訓(xùn)練集劃分成一個(gè)或多個(gè)子集,遞歸地調(diào)用該過程,直到每個(gè)子集中的記錄都屬于同一類,最終得到?jīng)Q策樹。剪枝是為提高樹的精度及分類效率,而去掉因訓(xùn)練數(shù)據(jù)中的噪聲和孤立點(diǎn)等引起的不可靠或可能是噪聲的一些枝條。

 

利用決策樹研究影響教材質(zhì)量的因素

 

首先,將學(xué)生問卷調(diào)查數(shù)據(jù)庫和教學(xué)管理部門所掌握的資料結(jié)合起來,分類整理,同時(shí)進(jìn)行規(guī)范化的數(shù)據(jù)清洗,得到創(chuàng)建決策樹模型的訓(xùn)練集,如表1所示。

 

根據(jù)評估預(yù)期的要求,將所有教材的評估結(jié)果分為兩類:

 

Class p:綜合評價(jià)=“優(yōu)秀”

 

Class n:綜合評價(jià)=“一般”

 

從上表顯示的數(shù)據(jù)可知,綜合評價(jià)為“一般”的教材有9種, 綜合評價(jià)為“優(yōu)秀”的教材有6種,從而可以計(jì)算出樣本分類的期望信息:

 

—∑Pi log2(pi)=

 

I(p,n)=I(9,6)= —[(9/15)×log2(9/15)+6/15×log2=(6/15)]

 

=—(—0.444—0.53)=0.974

 

下面以綜合評價(jià)是否為“優(yōu)秀”作為衡量標(biāo)準(zhǔn)分別計(jì)算由各個(gè)屬性劃分子集的信息熵,以及各自的信息增益度。

 

計(jì)算“教學(xué)水平”的信息增加益度

 

從而算出信息熵E(教學(xué)水平)=

 

I(3,1)+I(3,2)+I(0,3)+I(0,3)=0.43

 

再計(jì)算出其信息增益度

 

GainI(p,n)—E(教學(xué)水平)=0.974—0.507=0.467

 

計(jì)算“科學(xué)水平”的信息增益度

 

計(jì)算信息熵E(科學(xué)水平)=I(2,1)+I(3,2)+I(1,6)+I(0,0)—0.783再計(jì)算出其信息增益度GainI(科學(xué)水平)=I(p,n)—E(科學(xué)水平)=0.974—0.783=0.191

 

計(jì)算“教材編者職稱”的信息增益度

 

從而算出信息熵E(教材編者職稱)=I(4,1)+I(2,1)+I(0,4)+I(0,3)=0.424再計(jì)算出其信息增益度GainI(教材編者職稱)—I(p,n)—E(教材編者職稱)=0.974—0.424=0.55

 

計(jì)算“教材編者學(xué)歷”的信息增益度

 

計(jì)算信息熵E(教材編者學(xué)歷)=I(3,1)+I(3,3)+I(0,5)=0.667再計(jì)算出其信息增益度GainI(教材編者學(xué)歷)=(p,n)—(教材編者學(xué)歷)=0.974—0.667=0.307

 

由此可以得知“教材編者職稱”的信息增益度最大,它是最能區(qū)別訓(xùn)練集實(shí)例中教材質(zhì)量的屬性,應(yīng)作為決策樹的根節(jié)點(diǎn)。根據(jù)各個(gè)屬性的信息增益度的大小,可以構(gòu)建該訓(xùn)練集實(shí)例的決策樹如下圖1所示:

 

由該決策樹可以得出諸如以下結(jié)論:

第4篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

 

1 計(jì)算機(jī)視覺定義

 

人類天生具有五感,視覺便是其中之一,而計(jì)算機(jī)視覺,就是讓計(jì)算機(jī)網(wǎng)絡(luò)能夠睜開眼看世界。讓計(jì)算機(jī)有一定的視覺能力,可以從各個(gè)方面幫助人們進(jìn)行監(jiān)督、檢驗(yàn)檢測。利用計(jì)算機(jī)視覺科學(xué)可以使工作變得更加簡便。計(jì)算機(jī)視覺主要應(yīng)用于對二維碼、條形碼、照片、視頻資料如片段等進(jìn)行智能處理。

 

2 計(jì)算機(jī)視覺研究在醫(yī)療、交通中的作用

 

隨著醫(yī)學(xué)成像技術(shù)的發(fā)展與進(jìn)步,圖像處理在醫(yī)學(xué)研究與臨床醫(yī)學(xué)中的應(yīng)用越來越廣泛。最常見的有癌細(xì)胞顯微圖像分割與識(shí)別、基于多特征融合的血紅細(xì)胞識(shí)別和乳腺癌細(xì)胞計(jì)算機(jī)的自動(dòng)識(shí)別等。計(jì)算機(jī)視覺技術(shù)的迅猛發(fā)展,為醫(yī)療診斷帶來了很大的方便,同時(shí)促進(jìn)了臨床醫(yī)學(xué)的發(fā)展。另外,在各大綜合醫(yī)院慢慢發(fā)展起的體檢體系中,計(jì)算機(jī)視覺技術(shù)起到了決定性因素。隨著體檢的人數(shù)上升,對醫(yī)院體檢的管理、速度、準(zhǔn)確性都提出了更高的要求。視覺識(shí)別輕而易舉的解決了這個(gè)問題,只需要去識(shí)別體檢人員的身份證,就可以將體檢人員對號(hào)入座,檢查過的項(xiàng)目,沒有檢查的項(xiàng)目一目了然。理化指標(biāo)的檢驗(yàn),只需要在采血試管或采尿瓶上粘貼與體檢者對應(yīng)的條形碼即可,利用視覺技術(shù)對號(hào)入座,方便而準(zhǔn)確的確定每一位體檢人員的血樣及尿樣。及提高了醫(yī)院的工作效率,又將錯(cuò)誤率降到最低。

 

計(jì)算機(jī)視覺在交通上同樣得到了廣泛的應(yīng)用及發(fā)展。交通安全是交通運(yùn)輸中的重大問題,隨著近年來機(jī)動(dòng)汽車數(shù)量的迅猛增長,交通事故的發(fā)生也隨之越來越頻繁,給人類社會(huì)帶來的危害也日趨嚴(yán)重,使很多的家庭失去親人,甚至家破人亡。全國一線城市例如:北京、上海、廣州、深圳等交通道路供需的矛盾日趨嚴(yán)重,交通安全、交通堵塞及環(huán)境污染已成為困擾我國交通領(lǐng)域的三大難題?;趫D像處理的計(jì)算機(jī)視覺技術(shù)是通過攝像機(jī)獲取場景圖像,并借助于計(jì)算機(jī)軟件構(gòu)建一個(gè)自動(dòng)化或半自動(dòng)化的圖像、視頻理解和分析系統(tǒng),并提供及時(shí)準(zhǔn)確的圖像、視頻處理結(jié)果,以模仿人的視覺功能。主要功能如下:

 

一是基于計(jì)算機(jī)視覺技術(shù)的車輛牌照自動(dòng)識(shí)別: 車輛牌照是車輛的唯一身份,對車輛牌照的有效檢測與識(shí)別在車輛違章檢測、停車場管理、不停車收費(fèi)、被盜車輛稽查等方面有著重要的應(yīng)用價(jià)值。盡管針對車牌識(shí)別技術(shù)的研究相對成熟,然而在實(shí)際的應(yīng)用場景中,受到天氣、光照、拍攝視角、車牌扭曲等因素的影響,車牌識(shí)別技術(shù)仍然有一定的改善空間。

 

二是基于計(jì)算機(jī)視覺技術(shù)的車輛檢測與流量統(tǒng)計(jì):目前城市交通路口的紅路燈間隔時(shí)間是固定的,而不同路段、不同時(shí)間段交通流量是隨機(jī)變化的。若能根據(jù)各個(gè)交通路口的交通狀況輔以計(jì)算機(jī)進(jìn)行自動(dòng)分析,并判斷與預(yù)測交通流量,無疑為交通警察出警,紅綠燈時(shí)間間隔的動(dòng)態(tài)設(shè)置等提供技術(shù)支持。

 

三是基于計(jì)算機(jī)視覺技術(shù)的公交專用道路非法占道抓拍:公共交通是每個(gè)城市交通的重中之重,城市的公共交通為老百姓提供了便捷的出行方式。公共交通的發(fā)展,有利于城市的節(jié)能減排,有利于降低城市的空氣污染指數(shù)。由于城市公共交通具有運(yùn)量大、相對投資少、人均占有道路少等優(yōu)點(diǎn),解決城市交通問題必須優(yōu)先發(fā)展城市公共交通。然而目前擁擠、緩慢的公交出行方式已成詬病,因此發(fā)展“快速公交”將是未來公交的一種運(yùn)行模式。道路暢通則是發(fā)展“快速公交”的前提,相應(yīng)地,公交專用車道的設(shè)定必不可少。為防止其他社會(huì)車輛的駛?cè)耄`規(guī)駛?cè)氲钠渌鐣?huì)違規(guī)車輛進(jìn)行抓拍與懲罰是保證公交車道公交車專駛的一種重要手段。因此在公交車前部裝置攝像頭并輔以其他處理設(shè)備,從而可以使得每一輛公交車成為了一個(gè)流動(dòng)的監(jiān)控設(shè)備。

 

3 計(jì)算機(jī)視覺在條形碼檢測中的應(yīng)用

 

條形碼是將寬度不等的多個(gè)黑條和空白,按照一定的編碼規(guī)則排列,用以表達(dá)一組信息的圖形標(biāo)識(shí)符。在中國,由中國物品編碼中心賦予制造廠商代碼。那么最常見的計(jì)算機(jī)視覺應(yīng)用與條形碼檢測就是在超市中。超市中每樣產(chǎn)品都有自己的條形碼,當(dāng)人們選擇了自己需要的物品后,來到收銀臺(tái)進(jìn)行結(jié)賬,我們會(huì)看見收銀人員會(huì)用掃碼器對物品的條形碼進(jìn)行掃描,掃描后就會(huì)出現(xiàn)產(chǎn)品的信息及價(jià)錢。記錄以及掃描條形碼的技術(shù)就是計(jì)算機(jī)視覺技術(shù)。

 

4 計(jì)算機(jī)視覺重要技術(shù)——智能識(shí)別

 

近年來,基于生物特征的鑒別技術(shù)得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關(guān)。指紋、人臉功能已經(jīng)大范圍在生活中應(yīng)用,其中很多單位的打卡制度就是依據(jù)面部識(shí)別、指紋識(shí)別來實(shí)現(xiàn)的。社會(huì)飛速發(fā)展的今天,很多的單位都實(shí)行了上下班打卡制度,這一制度已經(jīng)被作為單位管理制度中的重要一條。購買的打卡機(jī)就是采用計(jì)算機(jī)視覺的重要技術(shù)——智能識(shí)別來實(shí)現(xiàn)的。利用打卡機(jī)的儲(chǔ)存功能,記錄每個(gè)職工的指紋或面部容貌,規(guī)定在某一個(gè)時(shí)間范圍內(nèi)對應(yīng)識(shí)別指紋或面部容貌,視為打卡。在上下班打卡的過程中,員工將面部或指紋對應(yīng)在打卡機(jī)的制定位置上,讓打卡機(jī)進(jìn)行識(shí)別,當(dāng)識(shí)別的結(jié)果與存儲(chǔ)結(jié)果相同時(shí),打卡成功。這樣看起來十分簡單的打卡機(jī)可以使單位的工作有序化,制度化,而實(shí)現(xiàn)這個(gè)功能的技術(shù)就是計(jì)算機(jī)視覺技術(shù)中的重要技術(shù)之一:智能識(shí)別。

 

5 計(jì)算機(jī)視覺技術(shù)的發(fā)展過程及未來

 

計(jì)算機(jī)視覺技術(shù)研究經(jīng)歷了近40年的過程,20世紀(jì)50年代的統(tǒng)計(jì)模式識(shí)別、60年代的Roberts的三圍積木世界、70年代的Marr為代表的計(jì)算理論、80年代的主動(dòng)視覺,但是仍然面臨許多的問題。主要由于計(jì)算機(jī)視覺是一個(gè)逆問題,視覺信息多種多樣,視覺知識(shí)的表達(dá)很困難,圖像數(shù)據(jù)量巨大,信息存儲(chǔ)于檢索困難,對生物學(xué)、神經(jīng)生物學(xué)等的研究有待深入。

 

計(jì)算機(jī)視覺技術(shù)的未來必定會(huì)朝著高科技發(fā)展,航空遙感測控地形地貌、電影特效制作、工業(yè)生產(chǎn)自動(dòng)化檢測、醫(yī)學(xué)影像檢測,再到天文領(lǐng)域等,在這些科學(xué)領(lǐng)域中計(jì)算機(jī)視覺將無法取代,成為主流的技術(shù)之一。

 

作者簡介

第5篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

【關(guān)鍵詞】精密測量 計(jì)算機(jī)視覺圖像 關(guān)鍵技術(shù)

在現(xiàn)代城市的建設(shè)中離不開測量的運(yùn)用,對于測量而言需要精確的數(shù)值來表達(dá)建筑物、地形地貌等特征及高度。在以往的測量中無法精準(zhǔn)的進(jìn)行計(jì)算及在施工中無法精準(zhǔn)的達(dá)到設(shè)計(jì)要求。本文就計(jì)算機(jī)視覺圖像精密測量進(jìn)行分析,并對其關(guān)鍵技術(shù)做以簡析。

1 概論

1.1 什么是計(jì)算機(jī)視覺圖像精密測量

計(jì)算機(jī)視覺精密測量從定義上來講是一種新型的、非接觸性測量。它是集計(jì)算機(jī)視覺技術(shù)、圖像處理技術(shù)及測量技術(shù)于一體的高精度測量技術(shù),且將光學(xué)測量的技術(shù)融入當(dāng)中。這樣讓它具備了快速、精準(zhǔn)、智能等方面的優(yōu)勢及特性。這種測量方法在現(xiàn)代測量中被廣泛使用。

1.2 計(jì)算機(jī)視覺圖像精密測量的工作原理

計(jì)算機(jī)視覺圖像精密測量的工作原理類似于測量儀器中的全站儀。它們具有相同的特點(diǎn)及特性,主要還是通過微電腦進(jìn)行快速的計(jì)算處理得到使用者需要的測量數(shù)據(jù)。其原理簡單分為以下幾步:

(1)對被測量物體進(jìn)行圖像掃描,在對圖像進(jìn)行掃描時(shí)需注意外借環(huán)境及光線因素,特別注意光線對于儀器掃描的影響。

(2)形成比例的原始圖,在對于物體進(jìn)行掃描后得到與現(xiàn)實(shí)原狀相同的圖像,在個(gè)步驟與相機(jī)的拍照原理幾乎相同。

(3)提取特征,通過微電子計(jì)算機(jī)對掃描形成的原始圖進(jìn)行特征的提取,在設(shè)置程序后,儀器會(huì)自動(dòng)進(jìn)行相應(yīng)特征部分的關(guān)鍵提取。

(4)分類整理,對圖像特征進(jìn)行有效的分類整理,主要對于操作人員所需求的數(shù)據(jù)進(jìn)行整理分類。

(5)形成數(shù)據(jù)文件,在完成以上四個(gè)步驟后微計(jì)算機(jī)會(huì)對于整理分類出的特征進(jìn)行數(shù)據(jù)分析存儲(chǔ)。對于計(jì)算機(jī)視覺圖像精密測量的工作原理就進(jìn)行以上分析。

1.3 主要影響

從施工測量及測繪角度分析,對于計(jì)算機(jī)視覺圖像精密測量的影響在于環(huán)境的影響。其主要分為地形影響和氣候影響。地形影響對于計(jì)算機(jī)視覺圖像精密測量是有限的,基本對于計(jì)算機(jī)視覺圖像精密測量的影響不是很大,但還是存在一定的影響。主要體現(xiàn)在遮擋物對于掃描成像的影響,如果掃描成像質(zhì)量較差,會(huì)直接影響到對于特征物的提取及數(shù)據(jù)的準(zhǔn)確性。還存在氣候影響,氣候影響的因素主要在于大風(fēng)及光線影響。大風(fēng)對于掃描儀器的穩(wěn)定性具有一定的考驗(yàn),如有稍微抖動(dòng)就會(huì)出現(xiàn)誤差不能準(zhǔn)確的進(jìn)行精密測量。光線的影響在于光照的強(qiáng)度上,主要還是表現(xiàn)在基礎(chǔ)的成像,成像結(jié)果會(huì)直接導(dǎo)致數(shù)據(jù)結(jié)果的準(zhǔn)確性。

2 計(jì)算機(jī)視覺圖像精密測量下的關(guān)鍵技術(shù)

計(jì)算機(jī)視覺圖像精密測量下的關(guān)鍵技術(shù)主要分為以下幾種:

2.1 自動(dòng)進(jìn)行數(shù)據(jù)存儲(chǔ)

在對計(jì)算機(jī)視覺圖像精密測量的原理分析,參照計(jì)算機(jī)視覺圖像精密測量的工作原理,對設(shè)備的質(zhì)量要求很高,計(jì)算機(jī)視覺圖像精密測量儀器主要還是通過計(jì)算機(jī)來進(jìn)行數(shù)據(jù)的計(jì)算處理,如果遇到計(jì)算機(jī)系統(tǒng)老舊或處理數(shù)據(jù)量較大,會(huì)導(dǎo)致計(jì)算機(jī)系統(tǒng)崩潰,導(dǎo)致計(jì)算結(jié)果無法進(jìn)行正常的存儲(chǔ)。為了避免這種情況的發(fā)生,需要對于測量成果技術(shù)進(jìn)行有效的存儲(chǔ)。將測量數(shù)據(jù)成果存儲(chǔ)在固定、安全的存儲(chǔ)媒介中,保證數(shù)據(jù)的安全性。如果遇到計(jì)算機(jī)系統(tǒng)崩潰等無法正常運(yùn)行的情況時(shí),應(yīng)及時(shí)將數(shù)據(jù)進(jìn)行備份存儲(chǔ),快速還原數(shù)據(jù)。在對于前期測量數(shù)據(jù)再次進(jìn)行測量或多次測量,系統(tǒng)會(huì)對于這些數(shù)據(jù)進(jìn)行統(tǒng)一對比,如果出現(xiàn)多次測量結(jié)果有所出入,系統(tǒng)會(huì)進(jìn)行提示。這樣就可以避免數(shù)據(jù)存在較大的誤差。

2.2 減小誤差概率

在進(jìn)行計(jì)算機(jī)視覺圖像精密測量時(shí)往往會(huì)出現(xiàn)誤差,而導(dǎo)致這些誤差的原因主要存在于操作人員與機(jī)器系統(tǒng)故障,在進(jìn)行操作前操作員應(yīng)對于儀器進(jìn)行系統(tǒng)性的檢查,再次使用儀器中的自檢系統(tǒng),保證儀器的硬件與軟件的正常運(yùn)行,如果硬軟件出現(xiàn)問題會(huì)導(dǎo)致測量精度的誤差,從而影響工作的進(jìn)度。人員操作也會(huì)導(dǎo)致誤差,人員操作的誤差在某些方面來說是不可避免的。這主要是對操作人員工作的熟練程度的一種考驗(yàn),主要是對于儀器的架設(shè)及觀測的方式。減少人員操作中的誤差,就要做好人員的技術(shù)技能培訓(xùn)工作。讓操作人員有過硬過強(qiáng)的操作技術(shù),在這些基礎(chǔ)上再建立完善的體制制度。利用多方面進(jìn)行全面控制誤差。

2.3 方便便攜

在科學(xué)技術(shù)發(fā)展的今天我們在生活當(dāng)中運(yùn)用到東西逐漸在形狀、外觀上發(fā)生巨大的變大。近年來,對于各種儀器設(shè)備的便攜性提出了很高的要求,在計(jì)算機(jī)視覺圖像精密測量中對設(shè)備的外形體積要求、系統(tǒng)要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進(jìn)行測量,不受環(huán)境等特殊情況的限制。

3 計(jì)算機(jī)視覺圖像精密測量發(fā)展趨勢

目前我國國民經(jīng)濟(jì)快速發(fā)展,我們對于精密測量的要求越來越來高,特別是近年我國科技技術(shù)的快速發(fā)展及需要,很多工程及工業(yè)方面已經(jīng)超出我們所能測試的范圍。在這樣的前景下,我們對于計(jì)算機(jī)視覺圖像精密測量的發(fā)展趨勢進(jìn)行一個(gè)預(yù)估,其主要發(fā)展趨勢有以下幾方面:

3.1 測量精度

在我們?nèi)粘I钪校覀兂S玫拈L度單位基本在毫米級別,但在現(xiàn)在生活中,毫米級別已經(jīng)不能滿足工業(yè)方面的要求,如航天航空方面。所以提高測量精度也是計(jì)算機(jī)視覺圖像精密測量發(fā)展趨勢的重要方向,主要在于提高測量精度,在向微米級及納米級別發(fā)展,同時(shí)提高成像圖像方面的分辨率,進(jìn)而達(dá)到我們預(yù)測的目的。

3.2 圖像技術(shù)

計(jì)算機(jī)的普遍對于各行各業(yè)的發(fā)展都具有時(shí)代性的意義,在計(jì)算機(jī)視覺圖像精密測量中運(yùn)用圖像技術(shù)也是非常重要的,在提高圖像處理技術(shù)做以提高。同時(shí)工程方面遙感測量的技術(shù)也是對于精密測量的一種推廣。

4 結(jié)束語

在科技發(fā)展的現(xiàn)在,測量是生活中不可缺少的一部分,測量同時(shí)也影響著我們的衣食住行,在測量技術(shù)中加入計(jì)算機(jī)視覺圖像技術(shù)是對測量技術(shù)的一種革新。在融入這種技術(shù)后,我相信在未來的工業(yè)及航天事業(yè)中計(jì)算機(jī)視覺圖像技g能發(fā)揮出最大限度的作用,為改變?nèi)藗兊纳钭龀鼋艹龅呢暙I(xiàn)。

參考文獻(xiàn)

[1]湯劍.周芳芹.楊繼隆.計(jì)算機(jī)視覺圖像系統(tǒng)的技術(shù)改造[J].機(jī)電產(chǎn)品開發(fā)與創(chuàng)新周刊,2015,14(18):33-36.

[2]馬玉真.程殿彬.范文兵,計(jì)算機(jī)視覺檢測技術(shù)的發(fā)展及應(yīng)用研究[J].濟(jì)南大學(xué)學(xué)報(bào),2014,18(23):222-227.

[3]李華.基于計(jì)算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)分析[J].電腦知識(shí)與技術(shù),2013(05):1211-1212.

第6篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

1計(jì)算機(jī)視覺概述

1.1計(jì)算機(jī)視覺學(xué)概述

從某種意義上說,計(jì)算機(jī)視覺學(xué)是一門在20世紀(jì)60年代興起的新學(xué)科。它是一門邊緣學(xué)科,融入了很多學(xué)科的特點(diǎn),具有很強(qiáng)的工程性特征。比如,圖像處理、應(yīng)用數(shù)學(xué)、光電技術(shù)。換個(gè)角度來說,計(jì)算機(jī)視覺同屬于工程領(lǐng)域、科學(xué)領(lǐng)域。

1.2計(jì)算機(jī)視覺的應(yīng)用

計(jì)算機(jī)視覺的應(yīng)用能夠使計(jì)算機(jī)具有和人一樣的視覺功能。在生活和生產(chǎn)過程中,照片資料、視頻資料的處理是計(jì)算機(jī)視覺應(yīng)用的主要方面。比如,在航空事業(yè)方面,對衛(wèi)星照片的翻譯;在醫(yī)學(xué)領(lǐng)域中,主要用于輔方面的診斷;在工業(yè)生產(chǎn)方面,由于各種復(fù)雜因素的影響,計(jì)算機(jī)視覺在這方面的應(yīng)用顯得特別簡單,有利于相關(guān)系統(tǒng)的實(shí)際構(gòu)成。

2目標(biāo)圖像檢索存在的問題

從某種角度來說,目標(biāo)圖像檢索需要分為特征匹配、特征提取兩個(gè)方面。它們表達(dá)了不同的含義。對于特征提取來說,它是圖像進(jìn)行檢索的第一步,其提取結(jié)果會(huì)對進(jìn)一步的研究造成直接的影響。而對于特征匹配來說,其匹配的準(zhǔn)確度會(huì)直接影響圖像檢索系統(tǒng)的返回結(jié)果。但在目標(biāo)圖像檢索完善的過程中,遇到一些問題阻礙了這兩個(gè)方面的完善。因此,本文作者對其中的一些予以了相關(guān)的探討。

2.1環(huán)境因素不斷變化

對于目標(biāo)圖像來說,環(huán)境因素是影響其準(zhǔn)確率的重要因素。同時(shí),在復(fù)雜混亂的環(huán)境中,由于受到眾多干擾物的影響,加上部分目標(biāo)圖像區(qū)域被遮蓋,致使目標(biāo)圖像信息不夠全面,使目標(biāo)物體特征的提取難度進(jìn)一步加大。

2.2圖像噪聲的影響

子為了更好地模仿生活中的圖像檢索,數(shù)據(jù)庫中的圖像也會(huì)隨之發(fā)生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會(huì)使目標(biāo)物體的外觀發(fā)生對應(yīng)的變化。在此基礎(chǔ)上,嚴(yán)重降低了目標(biāo)圖像信息獲取的準(zhǔn)確度。

2.3目標(biāo)圖像檢索訓(xùn)練數(shù)據(jù)的自動(dòng)標(biāo)注

由于處于網(wǎng)絡(luò)中的圖像資源信息過于繁多,需要采用手工的方式對它們進(jìn)行標(biāo)注。但這種方法非常浪費(fèi)時(shí)間,準(zhǔn)確率也比較低。很顯然,這就需要目標(biāo)檢索圖像能夠具有自動(dòng)標(biāo)注的能力。實(shí)際上,圖像檢索方法過分依賴人工標(biāo)注信息。而這些信息很多收到來自各方面因素的影響。比如,認(rèn)識(shí)差異因素、個(gè)人經(jīng)驗(yàn)。以至于對圖像產(chǎn)生誤解。

3基于計(jì)算機(jī)視覺下的目標(biāo)圖像檢索技術(shù)

3.1以多尺度視覺為紐帶的目標(biāo)圖像檢索方法

該種目標(biāo)檢索技術(shù)的應(yīng)用主要是為了提高目標(biāo)圖像檢索的準(zhǔn)確率,能夠?qū)崿F(xiàn)目標(biāo)圖像訓(xùn)練數(shù)據(jù)的自動(dòng)化標(biāo)注。該類技術(shù)主要是用于那些沒有遮擋,不需要進(jìn)行監(jiān)督的目標(biāo)圖像檢索方面。具體來說,它需要經(jīng)過一系列的訓(xùn)練。在訓(xùn)練的過程中,以統(tǒng)計(jì)學(xué)習(xí)為紐帶,對相應(yīng)多尺度的目標(biāo)檢測模型進(jìn)行適當(dāng)?shù)挠?xùn)練。在此基礎(chǔ)上,以該模型為基點(diǎn),對圖像中那些顯著性的區(qū)域進(jìn)行合理地提取。比如,該區(qū)域的亮度、顏色。最后,需要對用于該實(shí)驗(yàn)研究中的概率潛在語義分析模型進(jìn)行合理地利用??傊?,利用這種檢索方法可以對圖像中那些顯著目標(biāo)所處的區(qū)域自動(dòng)進(jìn)行檢測。同時(shí),對其中目標(biāo)圖像的顯著性進(jìn)行合理地排序,能夠提高檢索引擎所返回圖像結(jié)果的準(zhǔn)確度。

3.2以彩色LBP局部紋理特點(diǎn)為媒介的目標(biāo)圖像檢索方法

這種目標(biāo)圖像檢索方法能夠有效地解決圖像信息采集過程圖像噪聲以及其它相關(guān)因素對所提取紋理特征的影響,提高了圖像目標(biāo)的準(zhǔn)確率。對于這種圖像目標(biāo)檢索方法來說,它把圖像彩色空間特征和簡化的LBP特征有機(jī)地相融合。在此基礎(chǔ)上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉(zhuǎn)特點(diǎn)。在提高圖像檢索速度方面,主要是利用原來的LBP特征來丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時(shí),這種目標(biāo)圖像檢索方法的應(yīng)用可以使對應(yīng)計(jì)算方法的難度得以降低,還能對角度等變化狀態(tài)下的目標(biāo)圖像進(jìn)行準(zhǔn)確地識(shí)別以及檢索。

3.3以視覺一致性為橋梁的目標(biāo)圖像檢索方法

從某個(gè)角度來說,它的應(yīng)用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對搜索引擎返回結(jié)果的目標(biāo)顯著圖予以準(zhǔn)確的計(jì)算。此外,還要對其中的目標(biāo)顯著系數(shù)進(jìn)行適當(dāng)?shù)剡^濾。二是:以所有圖像為基點(diǎn),以顯著目標(biāo)為導(dǎo)向,采取視覺一致性的模式。三是:以視覺一致性為基礎(chǔ),對其中的不同目標(biāo)圖像信息進(jìn)行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結(jié)果的準(zhǔn)確率。更重要的是,在提高圖像搜索引擎檢索性能的同時(shí),能夠及時(shí)為用戶選出最優(yōu)的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關(guān)。

4結(jié)語

第7篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

關(guān)鍵詞:三目攝像機(jī);標(biāo)定;立體視覺;外部參數(shù)

一、緒論

1.1研究的背景及意義

計(jì)算機(jī)視覺是當(dāng)今極為重要的學(xué)科之一,它在具有很強(qiáng)的挑戰(zhàn)性的同時(shí)又擁有廣泛的應(yīng)用前景和實(shí)用價(jià)值。計(jì)算機(jī)視覺以視覺理論為中心,以圖像處理、模式識(shí)別、計(jì)算機(jī)技術(shù)和生理學(xué)、心理學(xué)為基礎(chǔ),研究內(nèi)容主要有兩個(gè)方面:一是開發(fā)從輸入圖像數(shù)據(jù)自動(dòng)構(gòu)造場景描述的圖像處理系統(tǒng);二是理解人類視覺機(jī)理,用機(jī)器代替人去做人類難以達(dá)到或根本無法達(dá)到的工作[1]。

計(jì)算機(jī)視覺應(yīng)用的廣泛性體現(xiàn)在其不僅用于文字、指紋、面部、商標(biāo)以及圖像數(shù)據(jù)庫、檢測集成電路芯片、多媒體技術(shù)這些圖像方面,還應(yīng)用到機(jī)器人導(dǎo)航、工業(yè)檢測和產(chǎn)品的自動(dòng)裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識(shí)別以及重建上。現(xiàn)如今,計(jì)算機(jī)視覺已經(jīng)應(yīng)用到機(jī)器人、地理、醫(yī)學(xué)、物理、化學(xué)、天文等各大的研究領(lǐng)域。

作為多個(gè)學(xué)科交叉與融合中心的計(jì)算機(jī)視覺,攝像機(jī)是其研究的重要工具,而攝像機(jī)標(biāo)定又是計(jì)算機(jī)視覺研究的一個(gè)關(guān)鍵問題,故攝像機(jī)的標(biāo)定越來越受到廣泛的重視。攝像機(jī)標(biāo)定是通過物體空間上的點(diǎn)與圖像中的對應(yīng)點(diǎn)的幾何關(guān)系,來確定攝像機(jī)的內(nèi)外參數(shù)的過程。標(biāo)定結(jié)果是否準(zhǔn)確影響著三維測量的精度和三維重建的結(jié)果,而且實(shí)時(shí)的標(biāo)定更能滿足自動(dòng)導(dǎo)航機(jī)器視覺的需要[2]。

伴隨著應(yīng)用的發(fā)展,攝像機(jī)廣泛地被應(yīng)用于三維立體的測量、視覺檢測、運(yùn)動(dòng)檢測等領(lǐng)域。由此,對攝像機(jī)標(biāo)定的精度要求也日益增加。攝像機(jī)標(biāo)定結(jié)果的優(yōu)劣影響了計(jì)算機(jī)視覺在各領(lǐng)域的應(yīng)用。攝像機(jī)標(biāo)定的準(zhǔn)確與否,對能否提高計(jì)算機(jī)視覺在各領(lǐng)域測量的準(zhǔn)確度有重要影響[3]。因此,研究攝像機(jī)標(biāo)定方法具有重要的理論研究意義和實(shí)際應(yīng)用價(jià)值。

1.2攝像機(jī)標(biāo)定技術(shù)研究的發(fā)展及現(xiàn)狀

攝像機(jī)有一個(gè)圖像平面和提供三維空間到圖像平面轉(zhuǎn)換的鏡頭。由于鏡頭會(huì)產(chǎn)生畸變,不能把這個(gè)轉(zhuǎn)化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實(shí)數(shù)據(jù),而其精確性則依靠于建立的模型及模型參數(shù)的準(zhǔn)確性。

首先進(jìn)行攝像機(jī)標(biāo)定工作的是加拿大的Deville,他于1910年建立實(shí)驗(yàn)室,使用多個(gè)瞄準(zhǔn)儀對他的“測量攝像機(jī)”(surveying camera)進(jìn)行標(biāo)定[4]。上個(gè)世紀(jì)三十年代后期,美國標(biāo)準(zhǔn)局發(fā)明了一種精確鏡頭,用來檢測攝像機(jī),同時(shí)將它用在攝像機(jī)標(biāo)定上。四十年代后期,該項(xiàng)工作得到進(jìn)一步加深,有了更多對高精度的需求和對易操作設(shè)備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會(huì)各界對攝像機(jī)標(biāo)定的關(guān)注。二戰(zhàn)時(shí)期,隨著飛機(jī)的大規(guī)模使用,航空攝影與制圖興起,為得到更加精確的測量結(jié)果,對攝像機(jī)鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術(shù)發(fā)展最為迅速的時(shí)間段。在這期間,各種鏡頭像差的表達(dá)式逐步被提出并且得到普遍認(rèn)同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻(xiàn),他們導(dǎo)出了近焦距情況下給定位置處徑向畸變表達(dá)式并證明了近焦距情況下測量出鏡頭兩個(gè)位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達(dá)式成為后來各攝像機(jī)的標(biāo)定非線性模型的基礎(chǔ)。這段時(shí)間里,研究的重點(diǎn)是如何校正鏡頭與用何種方法補(bǔ)償鏡頭像差,這些研究對促進(jìn)各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機(jī)標(biāo)定方法,該方法介于傳統(tǒng)標(biāo)定和自標(biāo)定之間,操作方便靈活,能夠得到不錯(cuò)的精度,滿足了眾多擁有桌面視覺系統(tǒng)的用戶在攝像機(jī)標(biāo)定方面的需求。

1.3本文的主要研究內(nèi)容

本文的主要研究多個(gè)攝像機(jī)的標(biāo)定問題。標(biāo)定主要是對攝像機(jī)內(nèi)外參的測量計(jì)算,利用這些參數(shù)對多個(gè)攝像機(jī)識(shí)別的物體尺寸進(jìn)行衡量并建立起多攝像機(jī)系統(tǒng)的數(shù)字環(huán)境。

論文的內(nèi)容包括:

第一章為緒論,介紹攝像機(jī)標(biāo)定相關(guān)的研究背景、國內(nèi)外研究現(xiàn)狀。

第二章為攝像機(jī)標(biāo)定理論基礎(chǔ):主要介紹標(biāo)定的坐標(biāo)系與待標(biāo)定的參數(shù)。

第三章提出本文的多攝像機(jī)標(biāo)定方法與實(shí)驗(yàn)過程。

第四章進(jìn)行全文的總結(jié)。

二、攝像機(jī)標(biāo)定方法研究

2.1攝像機(jī)標(biāo)定原理

攝像機(jī)通過透鏡將三維物體投影到--維圖像平面上,這個(gè)成像變換的過程稱為攝像機(jī)成像模型。攝像機(jī)成像模型有多種,最常用的為小孔成像模型。由于實(shí)際的攝像機(jī)鏡頭會(huì)發(fā)生一定的畸變,使得空間點(diǎn)所成的像不在線性模型描述的位置而會(huì)發(fā)生一定的偏移,為了能準(zhǔn)確的標(biāo)定攝像機(jī)參數(shù),標(biāo)定的過程中要考慮非線性畸變因子。

一般來說,得到標(biāo)定結(jié)果后要對其精度進(jìn)行評估,然而很難得到準(zhǔn)確的攝像機(jī)標(biāo)定參數(shù)真值作為參考,其中基于圖像坐標(biāo)和世界坐標(biāo)的絕對和相對誤差的評價(jià)方法應(yīng)用廣泛,本文將對這些方法的原理進(jìn)行探討。

2.2攝像機(jī)標(biāo)定坐標(biāo)系建立

首先定義了四個(gè)坐標(biāo)系,如圖1所示,圖像坐標(biāo)系的坐標(biāo)原點(diǎn)為O0,列與行由坐標(biāo)軸u和v表示;成像平面坐標(biāo)系的原點(diǎn)是攝像機(jī)光軸與圖像坐標(biāo)系的交點(diǎn)0l,x、y 軸分別與u、v 軸平行;在攝像機(jī)坐標(biāo)系中,坐標(biāo)原點(diǎn)0c即為在攝像機(jī)的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機(jī)光軸作為Zc軸,0c0l為攝像機(jī)焦距f;世界坐標(biāo)系是假想的參考坐標(biāo)系,可固定于場景中某物體上,用于描述攝像機(jī)的位置,由Xw,Yw,Zw軸組成。

圖(1)

2.3攝像機(jī)外部參數(shù)構(gòu)成

主動(dòng)視覺傳感器從在笛卡爾直角坐標(biāo)系中的運(yùn)動(dòng)表現(xiàn)為相應(yīng)的旋轉(zhuǎn)矩陣和平移矩陣,故攝像機(jī)外部參數(shù)表現(xiàn)為旋轉(zhuǎn)矩陣R和平移矩陣T,則攝像機(jī)坐標(biāo)系與世界坐標(biāo)系的轉(zhuǎn)化關(guān)系可以表示成:

上式中(Xc,Yc,Zc)表示空間點(diǎn)在攝像機(jī)坐標(biāo)系下的坐標(biāo),(Xw,Yw,Zw)表示空間點(diǎn)在世界坐標(biāo)系下的坐標(biāo)。根據(jù)靶標(biāo)點(diǎn)在像空間坐標(biāo)系和物方空間坐標(biāo)系中的坐標(biāo),通過分解旋轉(zhuǎn)矩陣線性計(jì)算像空間坐標(biāo)系與物方空間坐標(biāo)之間的轉(zhuǎn)換參數(shù),即外方位元素(攝站參數(shù))[6]。

2.4各攝像機(jī)相對位置確定

三目攝像機(jī)擁有三個(gè)視覺傳感器,而三個(gè)傳感器之間的相對位置可通過已獲得的外部參數(shù)進(jìn)行確定。將三個(gè)攝像機(jī)坐標(biāo)系設(shè)置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內(nèi)容可知,這三個(gè)攝像機(jī)坐標(biāo)系與世界坐標(biāo)系的關(guān)系為:

i=(1,2,3)

由此我們可以得到任意兩個(gè)攝像機(jī)i,j的坐標(biāo)系轉(zhuǎn)換關(guān)系:

其中: = = i,j=1,2,3

三、攝像機(jī)標(biāo)定實(shí)驗(yàn)過程及結(jié)果

3.1實(shí)驗(yàn)系統(tǒng)介紹

實(shí)驗(yàn)中被用來標(biāo)定的是一個(gè)多攝像機(jī)系統(tǒng),攝像機(jī)標(biāo)定有關(guān)的基本參數(shù)、系統(tǒng)組成和開發(fā)環(huán)境如下:

(1)硬件環(huán)境

標(biāo)定板、三目攝像機(jī)和圖像采集卡等。

(2)軟件環(huán)境

OpenCV開源視覺庫,它僅由一系列C函數(shù)和少量C++類構(gòu)成,為Python、MATLAB等語言提供了接口,在圖像處理和計(jì)算機(jī)視覺方面實(shí)現(xiàn)了很多通用算法。

3.2實(shí)驗(yàn)過程

本系統(tǒng)以棋盤格模板作為標(biāo)定模板。采用激光打印機(jī)打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標(biāo)定模板,如圖(2)。安裝三目攝像機(jī)系統(tǒng),調(diào)節(jié)固定好個(gè)攝像機(jī)位置,如圖(3)。手持標(biāo)定板在三目攝像機(jī)前方各個(gè)位置拍攝5組共15張各姿態(tài)的照片,利用Canny算子進(jìn)行像點(diǎn)灰度中心提取、同名像點(diǎn)匹配并解算出三個(gè)攝像機(jī)在標(biāo)定板坐標(biāo)系中的外部參數(shù)值。

3.3標(biāo)定結(jié)果

攝像機(jī)1:

R= T=

攝像機(jī)2:

R= T=

攝像機(jī)3:

R= T=

四、總結(jié)

隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,計(jì)算機(jī)視覺成為當(dāng)今熱門的研究課題,受到了廣泛關(guān)注。本文就如何在機(jī)器視覺的理論基礎(chǔ)上對三目視覺系統(tǒng)進(jìn)行標(biāo)定進(jìn)行了研究,討論了計(jì)算機(jī)視覺理論知識(shí),分析攝像機(jī)標(biāo)定原理以及標(biāo)定坐標(biāo)系的建立。同時(shí)通過計(jì)算機(jī)視覺知識(shí)的分析討論了基于三目視覺系統(tǒng)的攝像機(jī)標(biāo)定技術(shù),完成了三目視覺系統(tǒng)的外部參數(shù)標(biāo)定實(shí)驗(yàn)。三目攝像機(jī)測量系統(tǒng)外部參數(shù)的標(biāo)定能夠解決測量作業(yè)現(xiàn)場、測量控制場建立難的問題,為快速地建立簡單實(shí)用的控制場提供了方案,有一定的實(shí)用價(jià)值。

參考文獻(xiàn)

[1] 荊麗秋.雙目視覺系統(tǒng)標(biāo)定與匹配的研究與實(shí)現(xiàn)[D].哈爾濱工程大學(xué),2009.DOI:10.7666/d.y1489086.

[2] 馬頌德.計(jì)算機(jī)視覺―計(jì)算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,1998.

[3] 王榮一.攝像機(jī)標(biāo)定及關(guān)鍵技術(shù)研究[D].哈爾濱理工大學(xué),2011.DOI:10.7666/d.y2012483.

[4] Clarke T A,F(xiàn)ryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66

[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.

[6] 范亞兵,黃桂平,高寶華等.三目立體工業(yè)攝影測量系統(tǒng)外部參數(shù)的快速標(biāo)定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013

第8篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

關(guān)鍵詞 模式分析 計(jì)算機(jī)視覺 教學(xué)改革

中圖分類號(hào):G643.2 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/ki.kjdkz.2016.03.015

Research and Practice on Course Group of Pattern Analysis and

Visual Processing for Graduated Students

SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi

(College of Computer Science and Technology, Nanjing University of

Aeronautics and Astronautics, Nanjing, Jiangsu 210016)

Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.

Key words pattern analysis; computer vision; teaching reform

1 背景

我校模式分析與智能計(jì)算研究所師資團(tuán)隊(duì)是江蘇省“青藍(lán)工程”創(chuàng)新團(tuán)隊(duì),主要研究領(lǐng)域包括智能數(shù)據(jù)分析、圖像處理和機(jī)器視覺等方向,承擔(dān)研究生和本科生的模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計(jì)算機(jī)視覺等課程的教學(xué)任務(wù)。以往的教學(xué)過程中雖然積累了豐富的教學(xué)經(jīng)驗(yàn),但當(dāng)前新知識(shí)不斷涌現(xiàn)、新技術(shù)發(fā)展迅猛,對模式分析與視覺處理課程群的知識(shí)體系、實(shí)踐體系改進(jìn)提出了新的挑戰(zhàn)。

近年來,國內(nèi)外高校在該類課程教學(xué)上,已涌現(xiàn)出眾多新理念、新方法。Coursera聯(lián)合創(chuàng)始人Andrew Ng推出的機(jī)器學(xué)習(xí)課程,開啟了教育領(lǐng)域的MOOC時(shí)代,引領(lǐng)了教育教學(xué)方法的新革命。①深圳大學(xué)、②江蘇科技大學(xué)③分別進(jìn)行了基于CDIO工程教育理念的計(jì)算機(jī)視覺課程教學(xué)改革實(shí)踐,實(shí)現(xiàn)多層次項(xiàng)目設(shè)計(jì)的教學(xué)模式改革,講座式、討論式、實(shí)踐式教學(xué)方法的探索。國防科技大學(xué)④在計(jì)算機(jī)視覺課程中引入研討式教學(xué)模式,通過案例教學(xué)、小組研討的方式來替代傳統(tǒng)的教學(xué)方式。華中科技大學(xué)⑤從教學(xué)內(nèi)容國際化、教學(xué)方式國際化、教學(xué)成果國際化三個(gè)方面開展了計(jì)算機(jī)視覺課程的國際化建設(shè)。另外,也有高校進(jìn)行了圖像工程課程群建設(shè),⑥基于圖像分析與計(jì)算機(jī)視覺應(yīng)用課程結(jié)合的項(xiàng)目協(xié)同創(chuàng)新能力培養(yǎng)實(shí)踐。⑦

在分析上述國內(nèi)外高校該類課程改革的基礎(chǔ)上,我們重點(diǎn)以模式分析與視覺處理課程群的實(shí)踐教學(xué)體系改革為切入點(diǎn),優(yōu)化師資隊(duì)伍結(jié)構(gòu),梳理課程群知識(shí)體系,優(yōu)化課程授課模式,完善課程群實(shí)踐體系,改革實(shí)踐考核模式,實(shí)現(xiàn)學(xué)生國際化視野、理論聯(lián)系實(shí)際、工程實(shí)踐和創(chuàng)新能力全面提升的目標(biāo)。

2 模式分析與視覺處理課程群特點(diǎn)

模式分析與視覺處理課程群涵蓋了模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、數(shù)字圖像處理、計(jì)算機(jī)視覺等多門課程。該類課程存在以下特點(diǎn)。

(1)該類課程屬于多學(xué)科交叉,涉及的知識(shí)面既廣又深。由于該方向涉及計(jì)算機(jī)科學(xué)與技術(shù)、應(yīng)用數(shù)學(xué)、自動(dòng)化、電子科學(xué)與技術(shù)、信息工程等多學(xué)科內(nèi)容,而學(xué)生在大學(xué)本科階段很難學(xué)習(xí)和了解如此多的知識(shí)模塊,這對研究生階段學(xué)習(xí)來說,具有相當(dāng)大的挑戰(zhàn)。同時(shí),對于每個(gè)知識(shí)模塊,所要求的數(shù)學(xué)基礎(chǔ)較高,理論具有相當(dāng)?shù)纳疃龋斫夂驼莆詹蝗菀住?/p>

(2)該類課程既重視扎實(shí)的基礎(chǔ)理論,也強(qiáng)調(diào)良好的工程實(shí)踐能力。該類課程的基礎(chǔ)理論教學(xué)一直受到各高校的重視。隨著近年來產(chǎn)業(yè)界的迅猛發(fā)展,計(jì)算機(jī)視覺應(yīng)用層出不窮,對學(xué)生的工程實(shí)踐也提出了更高要求,需要能夠在系統(tǒng)層次上有整體認(rèn)知,同時(shí)要能對各功能模塊進(jìn)行優(yōu)化,提升系統(tǒng)的整體性能。

(3)該類課程所面向的選修學(xué)生面廣。該類課程既是多學(xué)科交叉,也面向計(jì)算機(jī)應(yīng)用、電子科學(xué)與技術(shù)、自動(dòng)化、應(yīng)用數(shù)學(xué)等不同研究方向、不同水平層次的研究生開設(shè)。這對課堂教學(xué)和實(shí)驗(yàn)實(shí)踐也帶來更大挑戰(zhàn)。

3 模式分析與視覺處理課程群改革舉措

針對上述分析的課程群特點(diǎn),我們重點(diǎn)以實(shí)踐體系改革為突破口,通過優(yōu)化師資隊(duì)伍結(jié)構(gòu),梳理課程群知識(shí)體系,優(yōu)化課程授課模式,完善課程群實(shí)踐體系,改革實(shí)踐考核模式等舉措,實(shí)現(xiàn)學(xué)生國際化視野、理論聯(lián)系實(shí)際、工程實(shí)踐和創(chuàng)新能力全面提升的目標(biāo)。

3.1 師資隊(duì)伍結(jié)構(gòu)優(yōu)化

為了學(xué)生能夠適應(yīng)模式分析與視覺處理產(chǎn)業(yè)的快速發(fā)展,在課程群建設(shè)過程中更強(qiáng)調(diào)學(xué)生的工程實(shí)踐和創(chuàng)新能力培養(yǎng)。這首先對師資隊(duì)伍結(jié)構(gòu)提出了新的要求。

近年來,課程教學(xué)團(tuán)隊(duì)引進(jìn)海內(nèi)外具有深厚理論功底和較強(qiáng)工程能力的高水平師資4名,大大充實(shí)了機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、圖像處理等課程的教學(xué)力量。對于現(xiàn)有教師隊(duì)伍,鼓勵(lì)教師跟產(chǎn)業(yè)一線企業(yè)廣泛合作,目前已與華為、中興等企業(yè)在視頻檢索、智能交通視覺處理等方面開展了實(shí)質(zhì)合作。這些來源于產(chǎn)業(yè)界的高質(zhì)量課題對科研和教學(xué)起到了良好的促進(jìn)作用。

與此同時(shí),通過研究生工作站、企業(yè)短期實(shí)習(xí)等渠道,鼓勵(lì)企業(yè)高級研發(fā)人員參與到學(xué)生實(shí)踐能力培養(yǎng)環(huán)節(jié)中,將實(shí)際項(xiàng)目進(jìn)行適當(dāng)切分或提煉,實(shí)現(xiàn)該類課程實(shí)踐環(huán)節(jié)的模塊化、專題化訓(xùn)練。

綜上,通過引培并舉,優(yōu)化校內(nèi)師資隊(duì)伍結(jié)構(gòu);通過校企合作,積極吸引企業(yè)師資參與。良好的師資隊(duì)伍為該類課程的實(shí)踐體系改革提供了有力支撐。

3.2 課程群知識(shí)體系梳理與授課模式改革

模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計(jì)算機(jī)視覺等課程既有一定的邏輯關(guān)系,也存在相互交叉的混雜關(guān)系。一般認(rèn)為,模式識(shí)別、機(jī)器學(xué)習(xí)是模式分析與視覺處理領(lǐng)域的基礎(chǔ)理論課程,數(shù)據(jù)挖掘是建立在模式識(shí)別、機(jī)器學(xué)習(xí)和數(shù)據(jù)庫基礎(chǔ)上的應(yīng)用類課程,智能信息檢索則是數(shù)據(jù)挖掘基礎(chǔ)上更為具體的應(yīng)用實(shí)現(xiàn)。數(shù)字圖像處理為計(jì)算機(jī)視覺課程提供了基礎(chǔ)支撐,計(jì)算機(jī)視覺則是在綜合利用模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)字圖像處理、數(shù)據(jù)挖掘等知識(shí)模塊基礎(chǔ)上面向應(yīng)用的系統(tǒng)實(shí)現(xiàn)。但是,這些課程也存在著知識(shí)點(diǎn)的交叉或重復(fù)。例如,模式識(shí)別和機(jī)器學(xué)習(xí)中都有貝葉斯參數(shù)估計(jì)、支持向量機(jī)模型等知識(shí)點(diǎn),但視角和側(cè)重點(diǎn)有所不同;圖像處理、計(jì)算機(jī)視覺中都有顏色模型、成像模型等知識(shí)點(diǎn),也同時(shí)存在與模式識(shí)別、機(jī)器學(xué)習(xí)交叉的知識(shí)點(diǎn)。

我們針對來自不同研究領(lǐng)域的學(xué)生群體,對該課程群的知識(shí)點(diǎn)進(jìn)行系統(tǒng)梳理,既避免知識(shí)點(diǎn)的重復(fù)講授,也防止重要知識(shí)點(diǎn)的缺漏。課程教師集體討論,形成每門課程的核心知識(shí)集,和針對不同研究領(lǐng)域的選講知識(shí)集。學(xué)生在學(xué)習(xí)課程時(shí),在掌握核心知識(shí)集的基礎(chǔ)上,結(jié)合自己的研究方向選擇相關(guān)的選講知識(shí)集學(xué)習(xí)。

在課程教材和參考書的選擇上,注重挑選國際上有影響力的教材。例如,模式識(shí)別的參考書為Richard O. Duda等人編著的Pattern Classification;機(jī)器學(xué)習(xí)的參考書為Tom M. Mitchell編著的Machine Learning和Christopher M. Bishop編著的Pattern Recognition and Machine Learning;數(shù)據(jù)挖掘的參考書為Jiawei Han等人編著的Data Mining:Concepts and Techniques;數(shù)字圖像處理的參考書為K. R. Castleman編著的Digital Image Processing;計(jì)算機(jī)視覺的參考書為D. A. Foryth編著的Computer Vision: A Modern Approach和Richard Szeliski編著的Computer Vision: Alogrithms and Applications。這些教材已被國內(nèi)外著名大學(xué)普遍采用。同時(shí),每門課程都提供相關(guān)的國內(nèi)外頂級會(huì)議和期刊的列表,供學(xué)生課后追蹤研究領(lǐng)域的熱點(diǎn)問題。

在課堂授課環(huán)節(jié)上,注意采用靈活多樣的授課方式。對于核心基礎(chǔ)知識(shí)模塊,以教師講授為主,同時(shí)提供國內(nèi)外該類課程的熱門MOOC網(wǎng)址給學(xué)生參考。對于選講知識(shí)模塊,鼓勵(lì)學(xué)生事先結(jié)合各自研究方向有目的自學(xué),在學(xué)生報(bào)告的基礎(chǔ)上進(jìn)行課堂討論方式進(jìn)行。充分發(fā)揮學(xué)生學(xué)習(xí)的主體作用,也便于教師了解學(xué)生的水平和學(xué)習(xí)狀況。

除此以外,不定期邀請國內(nèi)外著名學(xué)者來校做學(xué)術(shù)報(bào)告,讓學(xué)生充分了解該研究領(lǐng)域的最新前沿動(dòng)態(tài),并就熱點(diǎn)問題進(jìn)行專題討論。

3.3 課程群實(shí)踐體系完善與考核方式改革

工程實(shí)踐和創(chuàng)新能力的培養(yǎng)是該課程群改革的重要目標(biāo)。我們在上述師資隊(duì)伍結(jié)構(gòu)優(yōu)化、課程群知識(shí)體系梳理與授課模式改革的基礎(chǔ)上,著力進(jìn)行課程群實(shí)踐體系的改革與完善。我們通過多層次菜單式的實(shí)驗(yàn)項(xiàng)目選擇、項(xiàng)目牽引的創(chuàng)新能力訓(xùn)練、學(xué)生綜合研究能力的全面考查等方面來實(shí)現(xiàn)。

首先,整合和優(yōu)化課程群實(shí)踐內(nèi)容,實(shí)現(xiàn)多層次菜單式靈活選擇。根據(jù)各研究領(lǐng)域的要求進(jìn)行靈活搭配,根據(jù)學(xué)生個(gè)體的能力與水平選擇適當(dāng)規(guī)模和難度的實(shí)踐內(nèi)容,通過課程內(nèi)的基礎(chǔ)實(shí)驗(yàn)、課程間的綜合實(shí)驗(yàn)、課程群的創(chuàng)新實(shí)驗(yàn)來選擇和組合,如圖1所示。

圖1 多層次菜單式實(shí)驗(yàn)內(nèi)容示意圖

基礎(chǔ)型實(shí)驗(yàn)內(nèi)容主要是各課程核心知識(shí)點(diǎn)的實(shí)驗(yàn)驗(yàn)證,主要包括模式識(shí)別,機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,圖像處理與分析,計(jì)算機(jī)視覺等課程的實(shí)驗(yàn)。要求選課學(xué)生對這些基礎(chǔ)實(shí)驗(yàn)必做,打下良好的研究基礎(chǔ)。

綜合探索型實(shí)驗(yàn)在基礎(chǔ)型實(shí)驗(yàn)基礎(chǔ)上,既有單門課程內(nèi)總的綜合實(shí)驗(yàn),也有課程間知識(shí)的綜合應(yīng)用。主要分為兩大塊,包括模式分析與機(jī)器學(xué)習(xí)方向的綜合實(shí)驗(yàn),以及圖像處理與機(jī)器視覺方向的綜合實(shí)驗(yàn)。實(shí)驗(yàn)?zāi)康闹饕轻槍@兩大塊方向重點(diǎn)知識(shí)的綜合分析和比較,能夠熟練掌握和靈活應(yīng)用。例如模式分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方向都用到的線性判別分析、支持向量機(jī)、均值聚類等內(nèi)容;圖像處理與機(jī)器視覺中的圖像特征抽取、視覺系統(tǒng)選型、目標(biāo)檢測、特定平臺(tái)的算法優(yōu)化等內(nèi)容。學(xué)生可根據(jù)各自研究方向有目的的選擇兩塊綜合實(shí)驗(yàn)的大部分內(nèi)容。

在綜合型實(shí)驗(yàn)基礎(chǔ)上,該課程群通過若干創(chuàng)新型實(shí)驗(yàn)來檢驗(yàn)學(xué)生理論知識(shí)掌握程度和實(shí)踐方法應(yīng)用能力,為后續(xù)的研究課題開展打下良好的科研素養(yǎng)。主要內(nèi)容包括人臉識(shí)別、二維條碼識(shí)別、車輛屬性識(shí)別、智能視覺監(jiān)控、以及企業(yè)來源的關(guān)鍵技術(shù)等。這些項(xiàng)目實(shí)踐既涉及用到圖像處理與機(jī)器視覺的內(nèi)容,也涉及模式分析與機(jī)器學(xué)習(xí)方向的知識(shí)。并且需要學(xué)生在綜合運(yùn)用相關(guān)知識(shí)的基礎(chǔ)上有創(chuàng)新能力。

其次,重視各類項(xiàng)目牽引的創(chuàng)新能力訓(xùn)練。一方面,鼓勵(lì)教師從國家自然科學(xué)基金、企業(yè)合作項(xiàng)目等研究中提煉出問題規(guī)模和難度適中的訓(xùn)練項(xiàng)目,作為課程群的綜合能力訓(xùn)練項(xiàng)目。另一方面,鼓勵(lì)學(xué)生參加挑戰(zhàn)杯、全國研究生智慧城市技術(shù)與創(chuàng)意設(shè)計(jì)大賽等各類具有挑戰(zhàn)性的競賽項(xiàng)目,以賽代練,提升學(xué)生的工程實(shí)踐和創(chuàng)新能力。同時(shí),也鼓勵(lì)學(xué)生利用百度、微軟等相關(guān)研究領(lǐng)域的企業(yè)實(shí)習(xí)機(jī)會(huì),參與產(chǎn)品一線的工程實(shí)踐能力訓(xùn)練。

再次,注重考核環(huán)節(jié),實(shí)現(xiàn)科研素養(yǎng)和實(shí)踐能力的全面考查。只有嚴(yán)格、公平、公正的考核,才能保證實(shí)驗(yàn)實(shí)踐的質(zhì)量和水平,才能提升學(xué)生的科研素養(yǎng)和實(shí)踐能力。我們主要在手段、方式方法上進(jìn)行了改進(jìn)。在題目選擇上,根據(jù)學(xué)生個(gè)體水平和研究領(lǐng)域要求的差異,在選題上有適當(dāng)?shù)碾y易區(qū)分度,讓每位學(xué)生都有鍛煉和提升的機(jī)會(huì);在考核方式上,采用結(jié)題書面報(bào)告來檢驗(yàn)學(xué)術(shù)論文的寫作能力,采用程序演示檢驗(yàn)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)水平,采用上臺(tái)匯報(bào)的方式檢驗(yàn)學(xué)生的表達(dá)能力,多管齊下全面檢查學(xué)生的綜合科研素養(yǎng);在考核成績評定上,采用現(xiàn)場教師和學(xué)生共同評分的方式,公平合理;最后,通過網(wǎng)站展示、發(fā)表學(xué)術(shù)小論文、專利、軟件著作權(quán)等方式展示和公開優(yōu)秀成果,激發(fā)學(xué)生的學(xué)習(xí)熱情,并由此形成積累,有利于學(xué)生實(shí)驗(yàn)實(shí)踐氛圍的傳承。

4 結(jié)語

本文在分析國內(nèi)外高校模式分析與視覺處理類課程群改革現(xiàn)狀的基礎(chǔ)上,以學(xué)生國際化視野、理論聯(lián)系實(shí)際、工程實(shí)踐和創(chuàng)新能力全面提升為目標(biāo),重點(diǎn)開展了師資隊(duì)伍結(jié)構(gòu)優(yōu)化、課程群知識(shí)體系梳理、課程授課模式改革、課程群實(shí)踐體系完善和實(shí)踐考核模式改革等工作,取得了良好的效果,并為校內(nèi)其他課程群的教學(xué)改革作為示范推廣。

注釋

① https:///learn/machine-learning/

② 郭小勤,曹廣忠.計(jì)算機(jī)視覺課程的CDIO教學(xué)改革實(shí)踐.理工高教研究,2010.29(5):98-100,148.

③ 史金龍,白素琴,龐林斌,錢強(qiáng).研究生機(jī)器視覺課程的CDIO教學(xué)改革實(shí)踐.計(jì)算機(jī)教育,2013.9:40-43.

④ 陳芳林,劉亞東,沈輝.在《計(jì)算機(jī)視覺》課程中引入研討式教學(xué)模式.當(dāng)代教育理論與實(shí)踐,2013.5(7):112-114.

⑤ 王岳環(huán),桑農(nóng),高常鑫.計(jì)算機(jī)視覺課程的國際化教學(xué)模式.計(jì)算機(jī)教育,2014.19:101-103.

第9篇:計(jì)算機(jī)視覺技術(shù)應(yīng)用范文

生活中,每個(gè)人都問過別人“這件衣服是從哪買的?”“這雙鞋是什么牌子的?”這一問題很快會(huì)被AI技術(shù)解決,只需要拿出手機(jī)對著物品拍照,就會(huì)得到商品的各種信息,并且能一鍵買買買。這就是美國著名圖片社交網(wǎng)站Pinterest(拼趣)即將推出的應(yīng)用圖片識(shí)別購買業(yè)務(wù)。

Pinterest總裁Tim Kendall表示,“Pinterest可以即刻在存儲(chǔ)750多億張圖片的巨大網(wǎng)絡(luò)空間內(nèi)進(jìn)行搜索,從而為用戶找到與所拍攝照片相似的配對圖片,以及查找到哪些地方能夠買到他們所需的商品。”

目前,Pinterest的估值已經(jīng)達(dá)到了110億美元,該公司的專注點(diǎn)正在向營收增長和創(chuàng)收方面轉(zhuǎn)變。相比Facebook、Twiter等社交網(wǎng)站,Pinterest已經(jīng)率先找到了一條清晰的創(chuàng)收道路。

從興趣到產(chǎn)品

亞里士多德曾經(jīng)說過,古往今來人們開始探索,都應(yīng)起源于對自然萬物的驚異??萍嫉倪M(jìn)步也是如此,就像微軟研發(fā)主管和項(xiàng)目負(fù)責(zé)人Mitch Goldberg所說:“我們想通過該應(yīng)用向人們展示識(shí)別技術(shù)的無限魅力?!?/p>

今年2月,微軟旗下的Garage實(shí)驗(yàn)室了一款名為“Fetch!”的應(yīng)用,它可通過機(jī)器學(xué)習(xí)系統(tǒng)識(shí)別照片中寵物狗的品種并用文字對該品種進(jìn)行簡單的介紹。

隨著計(jì)算機(jī)視覺領(lǐng)域開始利用深層神經(jīng)網(wǎng)絡(luò)這種模仿人類大腦生物過程的系統(tǒng)來從事機(jī)器學(xué)習(xí),識(shí)別的精確度實(shí)現(xiàn)了巨大飛躍。也就是說通過機(jī)器學(xué)習(xí)技術(shù),F(xiàn)etch!識(shí)別的準(zhǔn)確度會(huì)越來越高,隨著大量圖片的涌入,F(xiàn)etch! 可以自我修復(fù)錯(cuò)誤,從而更加精確地識(shí)別每一只狗的樣貌、形態(tài)、動(dòng)作。除了測試狗類品種以外,你還可以把朋友的照片上傳至平臺(tái),看看他們能夠?qū)?yīng)出哪種寵物。

微軟的這款產(chǎn)品基于目前最為熱門的一種圖像識(shí)別技術(shù)――“深度神經(jīng)網(wǎng)絡(luò)”,同樣基于這種技術(shù),微軟還有另一款有趣的產(chǎn)品:。去年5月,有超過5.75億圖片被提交到,超過8500萬來自世界各地的使用者訪問了這個(gè)網(wǎng)站,只為尋找一個(gè)簡單問題的答案――顏齡機(jī)器人認(rèn)為我看起來像幾歲?如果是合照,并且顏齡機(jī)器人識(shí)別出的自己比周圍人年齡小,則更能引發(fā)用戶的興趣,這種“損人利己”的識(shí)別應(yīng)用著實(shí)在社交媒體上火了一把。

另一讓計(jì)算機(jī)視覺研究技術(shù)人員特別感興趣的領(lǐng)域是生物識(shí)別,當(dāng)下最為火爆的莫過于人臉識(shí)別技術(shù)了。早期的人臉識(shí)別技術(shù)多為安防領(lǐng)域,如海關(guān)識(shí)別走私犯、商店識(shí)別小偷等。近年來,深度學(xué)習(xí)的研究與應(yīng)用使得人臉識(shí)別和人工智能的核心技術(shù)得到了極大的提升,攝像頭等圖像硬件的發(fā)展為人臉識(shí)別提供了很好的圖像基礎(chǔ),如今人臉識(shí)別技術(shù)應(yīng)用更加廣泛,比如公司可以使用刷臉打卡來杜絕代人打卡簽到現(xiàn)象。

其實(shí)早在2012年,谷歌就開發(fā)出了安卓系統(tǒng)的“刷臉解鎖”技術(shù),但因安全問題未解決,該技術(shù)一直未能得到普及。

而今年3月,電商巨頭亞馬遜提交了一項(xiàng)針購物付費(fèi)的專利技術(shù),即消費(fèi)者在亞馬遜網(wǎng)站購物時(shí)可以通過自拍或者視頻來進(jìn)行付費(fèi),無須再輸入賬號(hào)密碼。在消費(fèi)時(shí)系統(tǒng)會(huì)提示用戶表現(xiàn)出特定的行為、情緒或手勢來證明消費(fèi)者就是本人,而不是拿著照片的冒名頂替者。

亞馬遜表示,這項(xiàng)技術(shù)能使消費(fèi)者更加安全地進(jìn)行網(wǎng)上購物,因?yàn)楹芏嘤脩魹榱耸∈聲?huì)把所有賬戶都用同一個(gè)密碼,或者把密碼記在手機(jī)里,一旦遭遇“撞庫”或者手機(jī)被盜,后果不堪設(shè)想,而刷臉技術(shù)則沒有這個(gè)風(fēng)險(xiǎn)。

除了識(shí)別人臉,在識(shí)別其他生物方面也有了突破性進(jìn)展,比如識(shí)別寄生蟲。瘧疾,是一種由瘧原蟲造成的全球性急性寄生蟲傳染病,據(jù)統(tǒng)計(jì),2015年有大約有2.14億人受瘧疾的影響。

一直以來,醫(yī)療工作者是通過肉眼觀察采樣玻片來確定采樣對象是否被瘧原蟲感染,這不但是對醫(yī)療工作者經(jīng)驗(yàn)的考驗(yàn),而且工作效率也十分低下,而貧困地區(qū)一直都缺乏有經(jīng)驗(yàn)的醫(yī)療工作者。

今年2月,根據(jù)MIT Technology Review報(bào)道,Intellectual Ventures Laboratory(智能事業(yè)實(shí)驗(yàn)室)開發(fā)出了能夠檢測和評估瘧疾感染的便攜式顯微鏡。這種顯微鏡采用的是一個(gè)名為“Autoscope”的系統(tǒng),通過計(jì)算機(jī)視覺和深度神經(jīng)網(wǎng)絡(luò)技術(shù),采用深度學(xué)習(xí)算法來鑒別瘧原蟲。這款便攜式顯微鏡今年在泰國實(shí)地測試,成功鑒別出了 170塊玻片中的瘧原蟲如果這項(xiàng)技術(shù)得到普及之后,只要診所有一臺(tái)Autoscope顯微鏡和一些載玻片,就可解決瘧疾的診斷問題,這將使瘧疾診斷不再依賴于有限的專業(yè)醫(yī)療人員。

技術(shù)轉(zhuǎn)化為產(chǎn)品

新技術(shù)的出現(xiàn),讓計(jì)算機(jī)不但“看見”這個(gè)世界,更能“看懂”這個(gè)世界,可以代替人眼甚至超越人眼。

人的視野是有限的,并且會(huì)受到周邊條件的影響,駕駛員在開車時(shí)會(huì)有視野盲區(qū),還會(huì)受到光線的影響,并且大霧、暴雨等極端天氣也會(huì)嚴(yán)重影響駕駛員的視線。而計(jì)算機(jī)視覺技術(shù)就不一樣了,視野會(huì)更開闊,受限制更小。根據(jù)汽車媒體《Leftlane》報(bào)道,福特公司最新的無人駕駛汽車研究計(jì)劃是由激光感應(yīng)(LiDAR)和雷達(dá)、攝像頭形成一張周圍環(huán)境的高清3D地圖,不但讓無人駕駛汽車看到攝像頭視野范圍之外的物體,而且并不受光線限制。在夜間試駕后,福特工程師Wayne Williams說:“坐在汽車?yán)铮夷芨械剿谧?,但是我往車外看,只能看到一片漆黑。結(jié)果令人驚喜,車輛準(zhǔn)確地沿著蜿蜒的道路行駛。”

識(shí)別場景這一領(lǐng)域技術(shù)的發(fā)展,使得計(jì)算機(jī)不但能當(dāng)機(jī)器的眼睛,還能變成人類的眼睛。

對于雙目失明的人來說,能親自感知這個(gè)世界是夢寐以求的事,而微軟2016 Build開發(fā)者大會(huì)上Seeing AI項(xiàng)目正是要幫助盲人實(shí)現(xiàn)這一愿望。

Seeing AI項(xiàng)目是通過計(jì)算機(jī)視覺和自然語言去形容一個(gè)人的周圍環(huán)境、朗讀文本、回答問題以及識(shí)別人的面部表情,可以在手機(jī)上使用,也可以在Pivothead的智能眼鏡上使用。如果投入使用,將有助于為視障人士營造更公平的環(huán)境,是一款能夠真正改變?nèi)藗兩畹漠a(chǎn)品,就像此項(xiàng)目的高級項(xiàng)目經(jīng)理Anne Taylor所說的,這是“為真正重要的場景尋求解決方案”。也許不久微軟能開發(fā)出一種仿生眼,直接發(fā)送視覺信號(hào)到大腦,讓盲人真正看到這個(gè)世界。