前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺運用主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞 計算機;視覺技術;應用研究
中圖分類號:TP212 文獻標識碼:A 文章編號:1671-7597(2013)16-0114-01
計算機視覺技術自20世紀70年代產生以來就得到了全世界的廣泛關注。作為一種多學科綜合應用下的新技術,隨著專家對其研究會的不斷深入,其應用領域也越來越廣,給人們的生產生活帶來了極大方便。
1 計算機視覺技術
計算機視覺技術是在計算機技術應用下發(fā)展起來的一種新技術,主要用來研究計算機模擬生物的宏觀或外顯功能。該技術在應用過程中會涉及到計算機科學、神經生物學、人工智能、模式識別以及圖像處理等多個學科,多學科技術的綜合運用使得計算機具有了“感知”周圍世界的能力,這也正是該技術發(fā)揮作用的核心所在。計算機視覺技術的特點就在于,首先,它能在不接觸被測者的前提下完成對被測者的檢測;其次,該技術應用的領域和檢測的對象非常廣,能在敏感器件的應用下,完成對人類難以觀察到的超聲波、微波和紅外線等的檢測;最后,該技術還突破了人在視覺觀察上長時間工作的限制,能對檢測對象進行長時間觀察。
2 計算機視覺技術在各領域的應用分析
隨著計算機視覺技術研究的不斷加深,該技術的應用領域也越來越廣,下面,本文就選取工業(yè)、農業(yè)、林業(yè)、農產品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面對計算機視覺技術的應用進行簡要分析。
2.1 在工業(yè)領域中的應用
工業(yè)生產對產品的質量要求極高,計算機視覺技術在工業(yè)上的應用主要集中在以下3方面:1)產品形狀和尺寸的檢測上。對制造業(yè)而言,產品的形狀和尺寸是否合格直接影響到產品在實際應用過程中作用的發(fā)揮。計算機視覺技術的應用能對產品進行二維和三維等幾何特征的檢測,如產品的圓度、位置及形狀等。2)產品零部件缺失情況的檢測。在生產線運行過程中,計算機視覺技術能準確檢測出產品在生產過程中是否存在鉚釘、螺絲釘等零部件的缺失以及產品內部是否在生產過程中摻進雜質等。3)產品表面質量的檢測。為了從各個方面保證產品的合格性,對其進行表面質量的檢測也是一個極其重要的環(huán)節(jié)。計算機視覺技術實現了對產品表面的紋理、粗糙度、劃痕、裂紋等各方面的有效檢測。
2.2 在農業(yè)生產領域中的應用
該技術在農業(yè)領域的應用主要集中在以下兩方面:1)對病蟲害的預測預報。預測預報作用發(fā)揮的關鍵環(huán)節(jié)是建立起計算機視覺技術對所有昆蟲的識別體系。對昆蟲圖像識別系統(tǒng)進行數字化建模所使用的方法主要以下2種,一種是運用數學形態(tài)學的方法對害蟲的邊緣進行檢測,進而提取害蟲的特征;第二種是從昆蟲的二值化圖像中提取出昆蟲的周長、面積和復雜度等基本信息,并對這些信息建立害蟲的模板庫以實現對昆蟲的模糊決策分析。2)對農作物生長的監(jiān)測。常用的方法就是運用計算機視覺技術下的非接觸式監(jiān)測系統(tǒng)對農作物生長環(huán)境下的光照、溫度、濕度、風速、營養(yǎng)液濃度等相關因素進行連續(xù)地監(jiān)測,進而判斷出農作物長勢。
2.3 在林業(yè)生產中的應用
該技術在林業(yè)生產中的應用主要集中在農藥噴灑和林木球果采集這兩方面。就林業(yè)的農藥噴灑而言,常規(guī)的農藥噴灑方式易造成農藥的大量流失,不僅達不到防止林業(yè)有害生物的目的,還浪費了大量的人力、物力和財力。計算機視覺技術的應用能通過對施藥目標圖像進行實時分析,得出具體的施藥量和準確的施藥位置,該技術指導下的施藥工作極大發(fā)揮了農藥的效果。就林木球果采集而言,該采集工作的操作難度一直都很大,我國當前使用的方法主要是人工使用專業(yè)工具下的采集以及機械設備運用下的高空作業(yè)車采集和搖振采種機采集,這兩種方式都存在一定的安全性和效率問題。計算機視覺技術的應用能通過對需要進行采集的林木球果進行圖像采集來得出球果所處的具置,再結合專業(yè)機械手的使用完成球果采集。該技術不僅節(jié)省了大量勞動力,還極大提高了采摘效率。
2.4 在農產品檢測中的應用
農產品在生產過程中受自然環(huán)境的影響比較大,所以農產品不僅會產生質量上的差異,還會造成顏色、大小、形狀等外觀上的極大不同。由于農產品在出售時大多要進行產品等級的劃分,所以將計算機視覺技術運用到對其顏色和外形尺寸的檢測上,有效達到了對農產品進行檢測的目的。通過對外觀大小尺寸的檢測,不僅提高了對農產品進行分門別類地等級劃分的效率,還在很大程度上減少了對產品的損壞;通過對西瓜等農產品進行顏色上的檢測,能準確判斷其是否成熟,有效避免了人工操作下的失誤。
2.5 在電力系統(tǒng)自動化中的應用
計算機視覺技術在電力系統(tǒng)自動化應用的表現當前主要表現在以下2個方面:1)在人機界面中的應用。人機界面在運行過程中更加強調人的主體地位,實現了用戶對各種效應通道和感覺通道的運用。具體來講,計算機視覺技術在用戶向計算機的輸入方面,效應通道實現了手動為主向手、足、口、身體等的轉變;在計算機向用戶的輸出方面,感覺通道實現了視覺為主向觸覺、嗅覺、聽覺等的轉變。2)在電廠煤粉鍋爐火焰檢測中的應用。對煤粉鍋爐火焰的檢測既能有效判斷鍋爐的運行狀況,又能在很大程度上實現電廠的安全性運營。由于煤的負荷變化和種類變化會在使著火位置發(fā)生移動,所以為了保證爐膛火焰檢測的準確性,必須彌補之前單純應用火焰檢測器只能判斷有無火焰開關量信號的弊端。計算機視覺技術的應用,就在彌補火焰檢測器應用弊端的基礎上,實現了對火焰形狀的進一步檢測。
2.6 在圖書館工作中的應用
隨著當前數字圖書館和自動化管理系統(tǒng)的建立,計算機技術在圖書館方面的應用越來越廣泛。當前計算機視覺技術在圖書館方面的應用主要集中在古籍修補和書刊剔舊這兩方面。就古籍修補而言,古籍圖書等在收藏的過程中,受溫度、濕度、光照等的影響,極易導致紙張變黃、變脆以及蟲洞等現象的出現。在進行修補時,依靠計算機視覺技術開展具體的修補工作,能在很大程度上提高修補工作的效率。就書刊剔舊而言,由于圖書館藏書眾多,對那些使用率低且較為陳舊的文獻資料進行及時地剔除,能實現圖書資源的及時更新。計算機視覺技術在該方面的應用,極大地保證了工作的準確性和效率性。
3 結束語
通過以上對計算機視覺技術在工業(yè)、農業(yè)、林業(yè)、農產品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面的研究可以看出,隨著計算機技術的進一步發(fā)展以及計算機與各專業(yè)學科的不斷滲透,該技術的發(fā)展前景和應用領域都將更加廣闊。
參考文獻
(1)課程內容方面:工程應用價值較小的內容居多;具備工程應用價值的方法,如基于結構光的3D信息獲取,在課程內容中卻極少出現。
(2)課程定位方面:現有課程體系中未能體現最新研究成果,而掌握世界最新工程應用成果是卓越工程師的基本要求之一。
(3)教學形式方面:傳統(tǒng)計算機視覺課程側重基本原理,盡管范例教學被引入到課堂教學中,在一定程度上幫助學生理解,但卓越工程師培養(yǎng)目標是培養(yǎng)學生解決實際工程問題的能力。針對卓越工程師培養(yǎng)目標,以及目前計算機視覺課程中存在的問題,本文提出工程應用導向型的課程內容、面向最新成果的課程定位、理論實例化與工程實踐化的教學形式,以培養(yǎng)具有扎實理論基礎及工程實踐能力的卓越工程師。
1工程應用導向型的課程內容傳統(tǒng)計算機視覺課程圍繞Marr理論框架展開教學,其中部分原理僅在理想狀態(tài)或若干假設下成立,不能直接運用到工程實踐中。近年來已具備工程應用基礎的原理及方法,在傳統(tǒng)課程內容中較少出現,如已在工業(yè)測量、視頻監(jiān)控、游戲娛樂等領域中應用的主動式三維數據獲取方法等。我們對工程應用價值高的課程內容,增加課時,充分講解其原理及算法,并進行工程實例分析;對工程應用價值較低內容,壓縮課時,以介紹方法原理為主。例如,在教授3D信息獲取部分時,課時主要投入到工程應用價值較大的內容,如立體視覺、運動恢復結構、基于結構光的3D信息獲取等;而對于基于陰影的景物恢復等缺乏應用基礎的內容主要介紹其基本原理,并引導學生進行其工程應用的可行性分析,培養(yǎng)學生縝密的思維習慣,訓練學生辯證的分析能力。
2面向最新成果的課程定位計算機視覺近十年來發(fā)展迅速,新方法和新理論層出不窮,在現有課程體系中未能得以體現。跟進世界最新成果是卓越工程師的基本要求之一,因此計算機視覺課程定位應當面向國際最新成果。為實現這一目標,我們主要從以下兩方面入手。
(1)選用涵蓋最新成果的教材。我們在教學中加入國際最新科研成果及應用范例,在教材選取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作為參考教材。該書是RichardSzeliski教授在多年MIT執(zhí)教經驗及微軟多年計算機視覺領域工作經驗基礎上所著,涵蓋計算機視覺領域的主要科研成果及應用范例,參考文獻最新引用至2010年。這是目前最新的計算機視覺著作之一,條理清晰,深入淺出,特點在于對計算機視覺的基本原理介紹非常詳盡,算法應用緊跟國際前沿。
(2)強化學生調研及自學能力。“授之以魚”,不如“授之以漁”。在教授學生的同時,更重要的是培養(yǎng)學生調研、跟蹤、學習并分析國際最新科研及工程應用成果的能力。為強化學生的知識結構,培養(yǎng)學生跟蹤國際前沿的能力,我們在教學中加入10%的課外學時,指導每位學生完成最近三年本領域的國際最新文獻調研及工程應用新技術調研,并撰寫相關調研論文。同時,設置2學時課內學時,讓每位學生介紹調研成果,并進行課堂討論。在調研基礎上,選擇相關算法進行了實驗證明,進一步強化學習成果。實踐證明,由于學生能夠根據自己的興趣,選擇本領域感興趣的課題進行深入調研,極大地調動了學生的積極性,強化了學生調研、跟蹤、學習并分析國際最新科研及工程應用成果的能力。
3工程實踐化的教學形式我們在教學中提出工程實踐化的教學形式,即以人類視覺功能為背景,由相應工程實例引出相關理論,并最終將理論運用到工程實例中的算法和方法傳授給學生。
關鍵詞:農業(yè)機械;新技術;發(fā)展
1.農業(yè)機械新技術的應用和發(fā)展的重要性
我國是一個農業(yè)大國,農業(yè)是我國國民經濟的基礎,農業(yè)機械新技術的應用和發(fā)展具有重要的意義。
第一,提高機械的運作效率。目前在農業(yè)機械的使用方面,有的機械在使用過程中不能清晰地識別農作物的位置,比如,在收割小麥的過程中,有的小麥受到大風影響產生倒伏,對這些倒伏區(qū)域,機械在收割過程中很容易漏掉。所以在農業(yè)機械中使用新技術有利于彌補農業(yè)機械的漏洞,提高機械的運作效率。
第二,解放勞動力,促進經濟發(fā)展。農業(yè)是一個需要大量年輕勞動力的行業(yè),農業(yè)機械新技術的應用有利于實現農業(yè)種植、收割的自動化,解放勞動力。這些年輕的勞動力投入到其他的領域,有利于促進我國經濟的發(fā)展。
2.農業(yè)機械新技術的應用
21世紀是個科技迅速翻新的時代,目前農業(yè)機械領域的新技術也層出不窮,下面介紹幾種最新出現的農業(yè)機械新技術。
(1)計算機視覺技術。計算機視覺技術出現于20世紀70年代末,主要利用計算機視覺技術進行農產品品質和農產品等級的檢查。計算機視覺是一種以圖像處理為基礎而興起的學科,主要對視覺信息處理的計算理論、表達與計算方法進行研究。[1]隨著計算機視覺技術應用領域的不斷擴展,目前在農業(yè)機械生產方面,計算機視覺技術不僅能夠用于檢查農產品品質和分級,還可以用于播種和收割。但是由于計算機視覺技術在農業(yè)機械方面的使用時間比較短,一些技術難題還沒有得到解決,所以計算機視覺技術在農業(yè)機械方面的應用還需要繼續(xù)研究。
(2)人工智能技術。隨著智能化的發(fā)展,智能技術在農業(yè)機械方面的應用也得以實現。美國運用人工智能技術發(fā)明了激光拖拉機,不僅可以控制拖拉機的行進方向,還能夠對拖拉機進行具體的定位。[2]通過人工智能技術,人們建立了一個龐大的數據庫,通過這個數據庫可以對土地的具體情況進行掌握,以設計出具體的農業(yè)生產所需的化肥、種子、農藥、水等原料的用量。
(3)機器人技術。比智能化更進步的就是機器人技術,機器人技術在農業(yè)機械中的應用,這是計算機信息網絡和計算機視覺技術以及自動化控制等技術的結合的產物。目前研發(fā)出了除草機器人、播種機器人、澆水機器人、施肥機器人等,利用機器人進行農業(yè)生產活動,可以節(jié)省人工費用,解放勞動力,避免有些農業(yè)生產活動,對人體產生危害。
(4)自動控制技術。在農業(yè)機械中運用自動控制技術,可以幫助操作者降低操作難度,同時可以根據地勢的高低和秸稈的長短來調節(jié)高度,保證機械使用過程中的安全性,提高農業(yè)機械使用的可靠性,提高農業(yè)生產效率。
3.農業(yè)機械新技術的發(fā)展
農業(yè)機械新技術的應用和發(fā)展都是為了提高農業(yè)的生產率服務的,所以農業(yè)機械新技術的發(fā)展主要表現為以下幾點:
第一,加速新技術的使用和推廣??茖W技術是第一生產力,加速計算機視覺技術、自動控制技術、智能化技術等新技術在農業(yè)機械中的使用,同時引進國外先進的機械新技術,對推動我國農業(yè)的發(fā)展,提高農業(yè)的生產效率具有重大的意義。
第二,政府補貼。新型機械的購買都是生產個體自行組織的,資金壓力大,使得機械新技術難以推廣,所以對于農業(yè)機械新技術的推廣使用,政府要在物質上予以補貼,拓展新機械的使用范圍。
第三,提高農業(yè)資源利用效率。機械使用的目的就是為了提高農業(yè)的生產效率,提高農業(yè)資源的利用率。例如,在傳統(tǒng)的農業(yè)生產過程中,對農作物秸稈的處理方式,絕大多數情況就是焚燒,不僅浪費資源,而且污染空氣。但是農業(yè)機械新技術的使用通過將農作物的秸稈進行粉碎處理,將農作物秸稈轉化為肥料,不僅提高了農作物資源的使用效率,也減小了空氣的污染程度。
4.結語
隨著科技的發(fā)展,計算機視覺技術、自動控制技術、智能化技術等新技術在農業(yè)機械方面的應用越來越廣,農業(yè)機械新技術的應用和推廣將大大提高我國農業(yè)的生產效率,提高農業(yè)資源的利用率,促進國民經濟的發(fā)展。
參考文獻:
[1]田 靜.探討農業(yè)機械新技術的應用與發(fā)展[J].中國農資,2013(36): 74.
關鍵詞:OpenCV;人臉檢測;實時
中圖分類號:TP391.41
人臉檢測(Face Detection)是指對于給定的圖像或視頻,采用一定的策略對其進行搜索以確定其中是否含有人臉,如果是則返回一臉的位置、大小和姿態(tài)。人臉檢測是人臉識別的重要環(huán)節(jié),運用攝像機或攝像頭采集含有人臉的視頻流,并進行實時的人臉檢測是目前主流的應用。
OpenCV(Open Source Computer Vision Library)是開源的計算機視覺代碼庫,它輕量級而且高效,由一系列C函數和少量C++類構成,實現了圖像處理和計算機視覺的接口,實現了圖像處理和計算機視覺方面的很多通用算法[1]。
1 系統(tǒng)設計
本系統(tǒng)采用了OpenCV的基于boost篩選式級聯Haar分類器,該分類器是通過成千上萬的物體各個角度的訓練圖像訓練出來的,它先對圖像進行直方圖均衡化處理,并將圖像歸一化到同樣大小,然后標記是否包含要檢測的物體,在人臉檢測方面比較擅長。系統(tǒng)加載分類器后,利用OpenCV的視頻捕獲函數實時捕獲連接在電腦上的攝像頭讀入的視頻流,并將抓取的視頻幀轉換為圖像,然后對圖像進行人臉檢測和標定,具體流程圖如圖1所示:
圖1 系統(tǒng)流程圖
2 系統(tǒng)實現
本系統(tǒng)在WindowsXP操作系統(tǒng)下使用VC++6.0基于OpenCV1.0進行開發(fā)。系統(tǒng)具體實現如下:
(1)初始化聲明。通過CvMemStorage*captureFaceStorage=cvCreateMemStorage(0);語句創(chuàng)建一個內存存儲器,來統(tǒng)一管理各種動態(tài)對象的內存,參數為0時創(chuàng)建的內存塊默認大小為64k。然后分別聲明分類器對象、圖像對象級聯名稱及識別函數等成員:
Static CvHaar Classifier Cascade* cascade=0;
Ipl Image *frame,*frame_copy=0;
Char* capture Face Cascade_name=haarcascade_frontalface_alt2.xml;
(2)加載分類器。通過cvLoad函數,加載調用CvHaarClassifierCascade類的分類器文件“haarcascade_frontalface_alt2.xml”:
cascade=(CvHaarClassifierCascade*)cvLoad(captureFaceCascade_name,0,0,0);
(3)捕獲視頻。通過cvCreateCameraCapture函數捕獲攝像頭,捕獲視頻后循環(huán)執(zhí)行抓取幀操作cvGrabFrame(cap)和獲取圖像操作cvRetrieveFrame(cap)操作,從而將幀轉換成圖像,以便于處理。
(4)圖像格式轉換。一般從硬盤讀入的圖片或者通過cvCreateImage方法創(chuàng)建的IplImage圖片默認的origin屬性為0,即顯示的時候都是正的。而由攝像頭或者視頻文件獲取的幀圖像origin屬性為1,此時顯示的圖像掃描順序是從下到上,它會將幀圖像的第i行賦值給圖像的第height-i行,因此采集的圖像會出現倒立現象,為此,應將復制的圖像的origin屬性調整為與幀圖像的origin屬性一致。此時需要使用cvFlip(frame,frame_copy,0)函數,實現對幀圖像沿X軸的翻轉。
(5)識別與檢測人臉。本部分主要實現人臉檢測功能,首先將從實時視頻中提取的圖像進行灰度化處理:
然后調整新圖像gray,使它精確匹配目標small_img的大小,并利用cvEqualizeHist函數進行灰度圖像直方圖均衡化處理,最終通過cvHaarDetectObjects函數檢測出人臉:
(6)標定檢出的的人臉。繪制目標圓形區(qū)域,標定出檢測出的人臉:
最后通過cvShowImage("result",img)顯示出檢測后的圖像,如果檢測到人臉,顯示效果圖。
3 結束語
基于的攝像頭實時人臉檢測系統(tǒng)的實現充分說明了OpenCV技術在實現人臉檢測方面的效率高、功能強的特點,OpenCV必將在計算機視覺、圖形圖像處理領域有著廣泛地應用前景。
參考文獻:
[1]Gray Bradski,Adrian Kaebler.Learning OpenCV:Computer Vision with the OpenCV Library[M].USA:O Reilly media,2008.
[2]梁路宏.人臉檢測研究綜述[J].計算機學報,2002(05):449-458.
作者簡介:徐占鵬(1979.01-),男,山東棲霞人,講師,碩士,研究方向:計算機應用、計算機圖形圖像處理和計算機視覺。
關鍵詞:農業(yè)機械;技術手段;應用;發(fā)展前景
我國在國際上的地位正在逐漸提高,這與我國的經濟發(fā)展是分不開的,經濟的發(fā)展需要基礎的支持,農業(yè)就是我國的基礎,我國是農業(yè)大國,農村人口基數大。隨著近幾年我國農業(yè)的發(fā)展,很多高新技術也被運用到農業(yè)的機械設備中,使農機設備向著智能化的方向發(fā)展,有效地提升了農業(yè)生產的整體效率。在農業(yè)的生產中使用高新技術還能夠提高農業(yè)的生產效率,保證農機相關機械的正常運作。
1農業(yè)機械技術的應用分析
1.1計算機技術
這里所說的計算機技術主要指的是計算機視覺技術,這一技術最早被運用在農業(yè)機械上是在20世紀70年代中期,當時主要運用的是計算機技術中的視覺技術,利用這一技術的主要目的是可以對農產品的品質質量進行分級別檢查。計算機視覺技術是以圖像處理為基準,隨著圖像處理以及視覺模擬技術的發(fā)展,計算機視覺技術不僅可以用來檢查農產品的品質,而且還可以用來對農產品進行播種、收割。雖然計算機視覺技術在我國農業(yè)技術領域的應用時間還不是很長,在實際的使用中還有很多的問題出現,但是相信隨著科學技術的不斷發(fā)展,計算機視覺技術必將會改變傳統(tǒng)的農業(yè)作業(yè)模式,為現代化農業(yè)發(fā)展提供技術上的支持。
1.2網絡信息技術
網絡信息技術在我國農業(yè)機械上的應用是非常成功的,信息技術與地理信息系統(tǒng)的有機結合不僅可以為農業(yè)的生產提供高精度的監(jiān)控,而且還能夠對農業(yè)生產中出現病蟲害的情況進行及時的檢測,然后根據定位系統(tǒng)來進行田間作業(yè)。
1.3液壓技術
液壓技術主要依靠的是微電子技術和工業(yè)傳感技術,在數據的采集上,運用液壓技術主要完成的是能量的轉換和匹配,其目的是為了讓農業(yè)機械的效率能夠得到進一步的提高,讓機械設備的相關系統(tǒng)特征可以得到完善,讓機械設備的可靠性能夠得到提升,這也很好地符合了環(huán)境保護的相關標準要求。而大部分的農業(yè)機械都是采用內燃機作為原動力,所以很多時候都會出現工作負荷,一般情況下,我們都是通過電液控制手段來完成負載與原動力之間的匹配情況,盡可能地減少功率傳輸過程中出現的損失,從而提高農業(yè)機械系統(tǒng)的工作效率。
1.4人工智能技術
隨著信息全球化的不斷深入,高端技術不僅在大型的企事業(yè)單位中被運用,在農業(yè)中也得到了廣泛的應用,比較有成果的就是美國利用人工智能技術研發(fā)出激光拖拉機、機械的內部導航裝置,等等,這些裝置可以對拖拉機的運行方向及所處位置進行實時的測定,在了解地區(qū)土地信息之后,再制定合理的土地種植方案、農藥及種子的數量,等等。
2農業(yè)機械技術的發(fā)展趨勢
2.1推廣農業(yè)機械產品的技術發(fā)展
目前在我國的農業(yè)機械發(fā)展上,已經開始運用機電智能化技術和計算機技術,這使得農業(yè)機械化設備的科技含量有了極大的提高,不僅有效地提高了農業(yè)機械的作業(yè)效率,而且也提升了農業(yè)的生產效率。
2.2農業(yè)資源的利用率得到了提升
只有提高了農業(yè)資源的開發(fā)利用率,才能夠確保農業(yè)實現可持續(xù)發(fā)展,同時也為保護生態(tài)環(huán)境奠定基礎,如回收農業(yè)生產的廢棄物,普及無害化的處理設備,運用無害化技術來處理廢水可以有效地達到保護環(huán)境的作用。而在農業(yè)種植的過程中,使用有機肥料還可以進一步提高農業(yè)資源的利用效率。除此之外,大力發(fā)展節(jié)能型動力機械設備可以有效地避免出現資源浪費,從而提高農業(yè)資源的整體利用效率。
2.3提高農業(yè)機械產品的質量監(jiān)督水平
要想提升農業(yè)的機械化水平,還要從規(guī)范設計的基本要求出發(fā),全面提高農業(yè)產品的質量。在質量提升的過程中,還要注重農業(yè)產品的整體造型和外觀,農機設備的耐久性也要經得起考驗。選用與農機設備相配套的發(fā)電機及元件,能夠最大程度上提高農業(yè)機械產品的質量。在農業(yè)機械設備完成安裝之后,還要對其進行試運行,只有保證了設備各項指標都正常的基礎上,才能夠真正的投入使用,這也是提高農業(yè)機械產品可靠性的前提。
2.4加大政府的補貼力度
各級地方政府要加大農業(yè)機械的技術推廣,做好農業(yè)機械的培訓工作。國家還要將拖拉機、插秧機等農機具作為農具購置補貼的關鍵,普及農業(yè)機械知識。這樣也能夠更好地提高農業(yè)機械化的發(fā)展進程。
2.5確保農業(yè)機械技術的安全生產
關注安全監(jiān)督管理及裝備的創(chuàng)建工作,加大農業(yè)機械的安全投入,以便更好地滿足農業(yè)機械工作安全監(jiān)督管理的需求。除此之外,最重要的是,要將農業(yè)機械的安全檢驗工作納入到各級縣市政府的財政預算當中。
3結語
隨著科學技術的飛速發(fā)展,一些高新技術正在逐漸地被運用到農業(yè)的機械設備中,這些機械設備的出現不僅提高了農業(yè)的整體生產水平,而且還進一步提升了農業(yè)的生產效率,很好地實現了農業(yè)的可持續(xù)發(fā)展。在今后的農業(yè)發(fā)展過程中,農業(yè)機械也必定是智能化的,所以要求操作人員要不斷地提高自己的專業(yè)素養(yǎng),全面推廣農業(yè)機械新技術,只有這樣才能夠真正意義上實現我國農業(yè)機械的智能化。
作者:徐家亮 劉曉鵬 單位:黑龍江省克東縣農機安全監(jiān)理站
參考文獻:
[1]陶樂然.長春星宇小區(qū)新技術應用[C]//增強自主創(chuàng)新能力促進吉林經濟發(fā)展———啟明杯•吉林省第四屆科學技術學術年會論文集(下冊).2006.
[2]劉蒙之.傳播新技術與國家發(fā)展———一種政治經濟學的觀察[C]//中國傳播學會成立大會暨第九次全國傳播學研討會論文集.2006.
[3]張仁江,田莉.制造業(yè)企業(yè)新技術采納:動因、路徑及障礙分析———基于T公司的縱向案例研究[C]//第六屆(2011)中國管理學年會———技術與創(chuàng)新管理分會場論文集.2011.
[4]胡札進,姚尚斌,徐七三“.雙低”儲藏與四項儲糧新技術的綜合應用[C]//全面建設小康社會:中國科技工作者的歷史責任———中國科協(xié)2003年學術年會論文集(上).2003.
[5]柳旭.淺析電視空間新技術對審美體驗的影響[C]//2009中國電影電視技術學會影視技術文集.2010.
關鍵詞:視覺注視;移動端;數據集;行為推測
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2017)01-0254-03
Abstract: With the development of computer vision application technology, the behavior prediction of eye gaze has been widely concerned by many scholars at home and abroad, and also has important research significance in the field of biological information recognition. In the era of smart phone tablet popularity to improve human-computer interaction and accurate prediction of the mobile side of the user gaze behavior becomes particularly important. Based on the existing research on visual technology, this paper proposes a scheme to solve the gaze behavior of mobile users by using large data combined with machine learning and convolution neural network knowledge, and analyzes the importance of large-scale data sets in visual application.
Key words: visual gaze; mobile end; data set; behavior conjecture
1 概述
伴S著計算機軟硬件性能和互聯網技術的迅猛發(fā)展,大規(guī)模的并行計算技術突飛猛進,不斷地發(fā)展使各種現有技術變得越來越成熟,同時機器學習和計算機視覺領域也都得到了飛速發(fā)展。視覺技術的發(fā)展變得越來越重要,并且可以應用到實際生活中的很多方面。人類大量的視覺信息現在可以利用計算機來輔助處理,并完成相關的一些工作。相對于生物信息識別技術這一計算機視覺領域的熱點技術來說,也已廣泛應用于日常生活中[1]。比如指紋識別器,人臉考勤器等平時在許多地方可以經常見到,還有居民家用的攝像頭智能報警系統(tǒng)以及近期炒得火熱的運用支付寶進行刷臉而完成的支付技術等,這些都是運用了生物信息識別技術?,F實中的種種跡象已經表明運用生物信息識別的計算機技術已漸漸的滲透到人們的日常生活中并成為不可或缺的組成部分。時下發(fā)展較快也比較常見的生物特征有視網膜、指紋、人臉和人眼等。這些生物信息比如人臉具有個體差異性和自身穩(wěn)定性特點,從用戶的角度來看該特征具有便攜和低侵入等一些優(yōu)點。而人眼作為人臉中最顯著的特征,又是人們獲取外界信息最直接最方便的途徑。都說眼是心靈的窗戶,因為眼睛中蘊含著表情、意圖等多種信息。因此,眼睛注視的行為預測受到了國內外眾多學者的廣泛關注,同時在生物信息識別領域中也具有重要的研究意義[2]。
2 注視預測問題
2.1 問題的背景
在心理、認知和用戶交互研究中的注視跟蹤最近已朝向移動解決方案發(fā)展,因為它們使得可以直接評估用戶在自然環(huán)境中的視覺注意。 除了注意,注視還可以提供關于用戶的動作和意圖的信息:用戶正在做什么以及接下來將做什么。然而,在自然狀態(tài)下非結構化的任務中注視行為是相當復雜的,并且不能使用在受控的實驗室環(huán)境中創(chuàng)建的模型來得到令人滿意的解釋。自然條件下和實驗室環(huán)境有著很大的不同。為了演化在自然環(huán)境中對注視行為的推斷,需要一種更加整體的方法,將從認知科學到機器學習的許多學科結合在一起[3]。
從人機交互技術到醫(yī)學診斷到心理學研究再到計算機視覺,眼睛注視跟蹤在許多領域都有應用。注視是外部可觀察的人類視覺注意的指標,許多人試圖記錄它。對于眼睛視線方面的研究可以追溯到十八世紀后期。而現如今已經存在各種解決方案(其中許多是商業(yè)化的),但是所有的解決方案都具有以下一個或多個方面的問題:高成本(例如,Tobii X2-60),定制或侵入性硬件(例如,Eye Tribe,Tobii EyeX)。然而在現實中的自然條件下,這些因素對實際的應用會造成一些障礙影響,使得眼睛注視跟蹤不能成為任何具有合理的相機(例如,智能手機或網絡攝像頭)的人應該可以使用的普及技術。如何才能使得這種技術普及并且得到應用,提出了一種解決方案。
2.2問題的提出
研究中首先要解決的就是用戶的約束問題,也就是自然條件下使用過程中所受到的各種限制問題。到目前為止,基于注視數據推斷用戶動作的研究受到許多的限制,特別是在自然環(huán)境中。限制因素可能包括可用的商業(yè)解決方案的昂貴性,其專有性和封閉性以及缺乏實時交互能力等方面。目前的注視跟蹤系統(tǒng),只是盡量在移動設置中設置各種條件進行補救。商業(yè)化定制化的解決方案都有其獨自的閉合性質,因此阻礙了注視跟蹤算法的發(fā)展,并且使得不同方法之間的客觀比較變得不可能[4]。此外,注視是一種復雜的現象,涉及認知過程的相互作用。這些過程在設置計算上的建模是非常困難的,尤其是涉及一些未知因素,使得構建實驗設置成為一個很大的挑戰(zhàn)。此外,來自跟蹤實驗的數據因為其商業(yè)化的原因很少共享,即使共享數據很大部分也是有其獨立的實驗條件。這些方面的問題都阻礙了跨學科方法在分析和利用注視數據和實驗的相關研究與發(fā)展。
2.3 解決問題的研究方向
對基于注視的推斷的個體貢獻通常保持孤立,不能形成更大的整體以促進對注視動作行為的研究。隨著這方面的技術發(fā)展和應用,最近出現了一些開源的解決方案。雖然在不同的應用和用戶界面中使用注視已經相當有限,但是移動注視跟蹤的新穎應用開始出現并得到了很快的發(fā)展。然而使用移動注視跟蹤來推斷用戶動作的問題是高度多學科的,需要深入理解各個研究領域,包括人眼的功能,數學建模,計算機視覺,機器學習,信息技術,認知過程,用戶交互以及心理學。任何一個研究員或甚至任何研究小組都不可能擁有所有研究領域的專家,因此需要相互的協(xié)作共同推進技術的發(fā)展[5]。
目前的研究主要是從以下幾個方面進行:
1)研究移動注視跟蹤的認知方面,例如增強對任務中的注視行為的理解或識別不同任務的特征和階段;
2)開發(fā)用于從注視數據推斷用戶動作的計算方法,諸如應用機器學習用于行為推斷,優(yōu)選地實時地;
3)增強用于改善移動注視跟蹤方法和性能的技術軟件/硬件解決方案,并使得設備更容易訪問;
4)發(fā)現注視數據在自然環(huán)境和虛擬和增強現實應用中的潛在用途,以及定義任務,其中注視可以是用戶動作的有用的預測器。
3 解決方案
首先選擇移動端進行研究,因為目前比較普遍的移動設備比如智能手機、平板電腦都有自己可靠的工作系統(tǒng),且不需要外部附件。移動設備相對于其他平臺具有以下優(yōu)勢:
1)使用的廣泛性。據估計,到2019年,世界上超過三分之一的人口擁有智能手機,遠遠超過臺式機/筆記本電腦用戶;
2)軟硬件技術升級的采用率較高。大部分的移動設備具有允許使用擁有計算復雜數據方法的實時的最新軟硬件;
3)移動設備上相機的大量使用已經導致相機技術的快速開發(fā)和部署;
4)相機相對于屏幕的固定位置減少了未知參數的數量,潛在地允許開發(fā)高精度的校準跟蹤應用。
3.1 注視類型分析
注視估計方法可以分為基于模型或基于外觀[6]?;谀P偷姆椒ㄊ褂醚劬Φ膸缀文P?,并且可以被細分為基于角膜反射和基于形狀的方法。另一方面,基于形狀的方法從觀察到的眼睛形狀觀察注視方向。這些方法傾向于具有低的圖像質量和可變的照明條件?;谕庥^的方法直接使用眼睛作為輸入,并可能在低分辨率圖像上工作。相比基于模型的方法,基于外觀的方法被認為需要更大量的用戶特定的訓練數據。通過使用深度學習和大規(guī)模數據不必依賴于視覺,以實現準確的無校準注視估計。這種方案提出建立一個基于外觀的數據模型,而不使用任何手工設計的功能,例如頭部姿勢或眼球中心位置。
3.2 技術方案
深度學習的最近成功在計算機視覺的各種領域中是顯而易見的,但是它對改善眼睛跟蹤性能的影響還是相當有限。因為深度學習是需要大量的數據作為支持,而視線追蹤這方面的數據集還比較少,普通的研究所得到的稻菁比較有限,最大的數據集通常只是具有50個受試者左右,由于缺乏大規(guī)模數據的可用性,因此發(fā)展比較緩慢。因而提出了使用深度學習進行研究的一套方案,就是構造大規(guī)模的數據集。利用網絡資源構造一個大規(guī)模的基于移動的眼動跟蹤數據集,它包含來自各種背景的大量的受試者,在可變照明條件和不受限制的頭部運動下記錄[7]。運用現有的智能算法得到一個可以進行卷積神經網絡學習端到端的注視預測的后臺決策網絡。不依賴任何預先存在的系統(tǒng),不需要頭部姿態(tài)估計或其他手動設計的特征用于預測。使用只有雙眼和臉部的特征訓練網絡,在這個領域的性能優(yōu)于現有的眼睛跟蹤方法。雖然現在的決策網絡在精度方面實現了很先進的性能,但是數據輸入的大小和參數的數量使得難以在移動設備上實時使用。 為了解決這個問題,需要培養(yǎng)學習得到一個更小更快的網絡,在移動設備上實現實時性能,使得精度損失進一步降低。
3.3 大規(guī)模數據集
為了達到這一方案的預測效果,首先要進行的是數據集的建立。網絡上相關的研究中有許多公開的注視數據集[8]??偨Y對比這些相關的數據集,分析出有些早期的數據集不包含顯著性的頭部姿勢變化或具有粗略的注視點采樣密度。需要對這些數據進行篩選,使得到的數據具有隨機分布特點。雖然一些現代數據集遵循類似的方法,但它們的規(guī)模(尤其是參與者的數量)相當有限。大多數現有的眼動追蹤數據集已經由邀請實驗室參與者的研究人員收集,這一過程導致數據缺乏變化,并且成本高且效率不高。因此需要大量的進行數據收集和篩選分析。大規(guī)模數據可以通過卷積神經網絡有效地識別人臉(他們的眼睛)上的細粒度差異,從而做出準確的預測。
收集眼動跟蹤數據應該注意的方面:
1)可擴展性。數據應該是自然條件下的使得用戶具有靈活性;
2)可靠性。運用現有的智能移動設備真實的應用圖像而非設計處理過的圖像;
3)變異性。盡量使數據具有較大的變異性,使得模型更加穩(wěn)健,適應各種環(huán)境下的操作。
4 結束語
文章介紹了一種針對移動設備的用戶注視行為推測解決方案。首先建立一個大規(guī)模眼動跟蹤數據集,收集大量的注視數據。大型數據集的重要性,以及具有大量各種數據以能夠訓練用于眼睛跟蹤的魯棒模型。然后,訓練得到一個深層卷積神經網絡,用于預測注視。通過仔細的評估,利用深度學習可以魯棒地預測注視,達到一個較好的水平。此外,雖然眼睛跟蹤已經存在了幾個世紀,相信這種新方案的策略可以作為下一代眼動跟蹤解決方案的關鍵基準。希望能通過這方面的研究,使人機交互得到更好的發(fā)展。
參考文獻:
[1] 崔耀 視控人機交互系統(tǒng)技術研究與實現[D].西安,西安電子科技大學,2013.
[2] 遲健男, 王志良, 張闖.視線追蹤[M].北京: 機械工業(yè)出版社, 2011.
[3] Alireza Fathi, Yin Li, and James M Rehg 2012 Learning to recognize daily actions using gaze In Computer VisionCECCV 2012. Springer, 314-327.
[4] Makeroni Labs 2016 Eye of Horus. https://hackaday.io/project/
6638-eye-of-horus-open-source-eye-tracking-assistance (2016) Accessed: 2016-02-26.
[5] Francisco J Parada, Dean Wyatte, Chen Yu, Brandi Emerick, and Thomas Busey,2015.Expert Eyes: Open-source, high-definition eyetracking Behavior research methods ,2015.
[6] 楊彩霞.基于近紅外光源的非接觸式視線跟蹤技術研究 [D].山東:山東大學,2012.
在用常見的手勢進行交流時,人們很容易就能互相理解,在經過學習之后,聾啞人或是正常人都可以運用手語進行交流。不過,想象一下,當你對計算機(或機器)做一個手勢,它就能領會你的意圖會是怎樣的情景呢?如果計算機(或機器)看得懂手語,又意味著什么呢?姑且不管實現這樣的人機交流有何深遠的意義,還是先讓我們來探究一下這樣的可行性吧,想想看得懂手語的計算機(或機器)能有什么用途。
人機交互:從呆板到員活
人類之間的交流往往聲情并茂,既采用自然語言(口語、書面語言),還廣泛采用人體語言(表情、體勢、手勢)。與人類之間的交流相比,人機交互就顯得呆板多了。以計算機的輸入方式為例,人要向計算機下達指令,最常見的方式還是通過鍵盤輸入。當然,手寫輸入也正為許多人所接受和喜愛,語音輸入的研究也進行得熱火朝天,最初單一而呆板的輸入方式已經得到了擴展。然而,科學研究是永無止境的,人體語言這種簡單快捷的信息交流方式得到了很多研究者的關注,他們想,能不能把這種靈活的信息交流方式也引進人機交互中呢?
于是研究人員展開了對人體語言理解的研究。人體語言的感知、人體語言與自然語言的信息融合對提高計算機的人類語言理解水平,加強人機接口的可實用性有著積極的意義。手語(手勢)是人體語言的一個非常重要的組成部分,它是包含信息量最多的一種人體語言,它與語言、書面語等自然語言的表達能力相同。因而完全可以把手語作為人機交互的一種手段,它具有很強的視覺效果,生動、形象、直觀??梢?,將手勢運用于計算機能夠很好地改善人機交互的效率。
計算機怎樣識別手勢?
從不同的角度可以對手勢進行不同的分類。分為交互性手勢和操作性手勢,前者手的運動表示特定的信息(如樂隊指揮),靠視覺來感知,后者不表達任何信息(如彈琴);分為自主性手勢和非自主性手勢,后者需要與語音配合用來加強或補充某些信息(如演講者用手勢描述動作、空間結構等信息),分為離心手勢和向心手勢,前者直接針對說話人,有明確的交流意圖,后者只是反應說話人的情緒和內心的愿望。
手勢的各種組合、運動相當復雜,不過簡單來看,手勢主要有如下的特點:手是彈性物體,因此同一手勢之間差別很大,手有大量冗余信息,由于人識別手勢關鍵是識別手指特征,因此手掌特征是冗余的信息:手的位置是在三維空間,很難定位:手的表面是,非平滑的,容易產生陰影。
了解了手勢的這些特點,就可以在手勢研究中對手勢做適當的分割、假設和約束。例如,可以給出如下約束:如果整個手處于運動狀態(tài),那么手指的運動和狀態(tài)就不重要,如果手勢主要由各手指之間的相對運動構成,那么手就應該處于靜止狀態(tài)。比如鼠標和筆式交互設備就是通過識別手的整體運動來完成人與計算機的交互,但它們不能識別手指的動作,其優(yōu)點是僅利用軟件算法就能實現,適合于一般桌面系統(tǒng)。只有當用鼠標或筆式交互設備的運動或方向變化來傳達信息時,才可將鼠標或筆式交互設備看作手勢表達工具。筆式交互設備發(fā)展很快,它提供了充分的交互信息,如壓力、方向、旋轉和位置信息,但現有交互主要是簡單地替代鼠標。
計算機識別手勢的手段主要有兩種:
1.數據手套。數據手套是虛擬現實系統(tǒng)中廣泛使用的傳感設備,用戶通過數據手套,能做出各種手勢向系統(tǒng)發(fā)出命令,與虛擬世界進行各種交互操作:比如通過一只與數據手套對應的在計算機屏幕上顯示的虛擬手,使用戶成為虛擬世界中的一員:抓取物體,如果手套有力反饋,還能讓用戶感覺到物體的重量和材質等。美國在“洞穴”虛擬系統(tǒng)中就是利用數據手套來研制武器。數據手套的主要優(yōu)點是可以測定手指的姿勢和手勢,但是相對而言代價較為昂貴,并且有時會給用戶帶來不便(如出汗)。
2.計算機視覺。即利用攝像機輸人手勢,其優(yōu)點是不干擾用戶,這是一種很有前途的技術,目前有許多研究者致力于此項工作。但在技術上存在很多困難,目前的計算機視覺技術還難以勝任手勢識別和理解的任務。
目前較為實用的手勢識別是基于數據手套的,因為數據手套不僅可以輸入包括三維空間運動在內的較為全面的手勢信息,而且比基于計算機視覺的手勢在技術上要容易得多。
更好地為人服務
日本三菱電子研究實驗室的研究人員已經使用低成本的視覺系統(tǒng),通過手勢就可以控制一臺電視機。由計算機控制的美國航空航天局虛擬太空站也是采用美國Cybernet公司開發(fā)的手語識別軟件,通過一部架設在頂部的攝像機來追蹤指揮者的手勢。當系統(tǒng)捕捉到揮手等手勢時,就會做出相應的反應,讓指揮者像航天員一樣在計算機虛擬的阿爾法國際太空站上移動(確切地說是飄動)。
Cybemet公司的軟件還能識別一系列的特定手勢,就像工地上的工人或交通警察經常用的那種手語,通過這些手勢你能夠旋轉在虛擬旅行中看到的三維圖像,還可以向上或是向下改變你的視角。美國航空航天局正在考慮把這套系統(tǒng)用于真正的太空站,因為笨重的航天服和微重力環(huán)境使得鼠標和鍵盤都變得難以操縱。也許不久之后,航天員就能用簡單的手語來控制機器人在太空中抓取物體。
手語(手勢)識別系統(tǒng)的研究還有助于改善和提高聾啞人的生活學習和工作條件,為他們提供更好的服務。同時也可以應用于計算機輔助啞語教學、電視節(jié)目雙語播放、虛擬人的研究、電影制作中的特技處理、動畫的制作、醫(yī)療研究、游戲娛樂等諸多方面。另外,手語識別系統(tǒng)的研究涉及到教學、計算機圖形學、機器人運動學、醫(yī)學等多學科。因此,手語識別系統(tǒng)的研究非常有意義。
李飛飛在新澤西讀高中期間,家中難以支付她的教育費用,她只能勤工儉學,自己想辦法掙錢讀書。在初到美國的前兩年里,李飛飛利用課余時間,做過街頭清潔工、餐館收銀員,還做過照看寵物狗的服務員。
不僅生活艱苦,她的英語成績也不好,美國的學生比較勢利,同學不想和她來往。初到美國的幾年里,她基本上沒有朋友。幸運的是,她讀高中時遇到幾位特別善良的老師,在老師們的關懷和鼓勵下,她逐漸祛除了自卑心理,增添了奮斗的勇氣。
臨近高中畢業(yè)時,李飛飛申請了很多大學,也收到不少錄取通知書。只有普林斯頓大學給予李飛飛近乎全額的獎學金,這也讓李飛飛的生活開始發(fā)生改變。
父母依然在困境中掙扎。李飛飛在進入普林斯頓大學讀書時,就決定在課余時間自己去打工掙錢,為父母在帕西帕尼開設一個干洗店,讓他們每個月有穩(wěn)定收入,擺脫窘境。開店的錢最終還是不夠,她只得向高中數學老師借錢。
在老師熱情支持下,干洗店終于開業(yè)。李飛飛從此在學校和店鋪之間奔波,周一到周五在學校攻讀物理學,輔修工程物理專業(yè),周末就回到帕西帕尼,在干洗店里幫忙。盡管干活用去很多時間,不過李飛飛的成績還是相當優(yōu)秀。大學畢業(yè)時,她以最高榮譽取得普林斯頓大學物理學學士學位。
李飛飛大學畢業(yè)時,金融證券市場無比火爆,對來自華爾街的征召,她居然不接受邀請,認為自己應該去,研究藏醫(yī)。在父母耐心勸說下,她才改變想法,打算繼續(xù)深造。
隨后,李飛飛進入加州理工大學攻讀電子工程的碩士、博士學位,開始研究人工智能和計算神經科學。在李飛飛讀研期間,她的母親患癌癥,還有中風癥狀,家庭生活再次陷入困境。這種境遇會壓垮很多人,李飛飛竟然沒有垂頭喪氣,她積極尋找辦法度過難關、完成學業(yè),取得了博士學位。
李飛飛博士一畢業(yè),高盛就投來橄欖枝,愿意給予她高薪工作;麥肯錫等公司也希望她前去工作。這是很大的誘惑,能極大改變家庭的生活狀況??墒?,她并拒絕了,“我?guī)状尉芙^高薪工作,父親都沒有輕易反對。非常感激他們對我追尋夢想的支持。”
“我的研究興趣,集中在視覺研究領域,主要是計算機視覺和視覺心理學。我將利用大數據訓練計算機學習視覺認知、記憶、推理和與環(huán)境互動?!庇脙赡陼r間,李飛飛通過網絡眾包技術,建立起含有1500萬張照片、涵蓋22000種物品的全球最大圖像識別數據庫ImageNet。李飛飛希望研究界能從中受益。
無論數量還是質量,ImageNet都是規(guī)??涨暗臄祿臁K惲械奈锲?,是根據日常英語單詞進行分類組織的。光是貓,就有62000多只,長相各異,姿勢多樣,涵蓋了各種家貓和野貓。李飛飛將數據庫免費提供給全球的研究團體,很快被研究者廣泛運用。
博士畢業(yè)四年后,李飛飛來到斯坦福大學計算機科學系任教。在上課的時候,她娓娓而談,學生們都全神貫注地聆聽。僅用三年時間,李飛飛就晉升為終身教授,并成為斯坦福大學人工智能實驗室及斯坦福大W視覺實驗室的主任。
從1955年起,美國斯隆基金會每年頒發(fā)斯隆研究獎,專門獎勵科學領域最杰出的年輕教授。獲獎者來自美國和加拿大54所高等院校,涵蓋七大科學領域。2011年3月1日,斯隆基金會授予李飛飛“計算機科學獎”,表彰她在這一領域的重要貢獻。
2015年9月4日,斯坦福大學宣布,豐田汽車公司投資2500萬美元,在校園內設立人工智能研究中心,利用人工智能教計算機與現實世界互動,發(fā)展出突破性的技術,普遍運用于日常生活之中。首先展開的研究項目,是教機械人安全地自動駕駛無人車。
李飛飛擔任斯坦福大學人工智能研究中心主管,由她領軍研發(fā)無人車技術。李飛飛覺得無人車自動駕駛,是計算機學習人腦的極佳研究,基本目標是讓計算機學習人腦做決定的方法。研究中心迅速制作出多個計算機系統(tǒng),推進自動駕駛的技術。
2016年11月,李飛飛加盟谷歌云擔任首席人工智能和機器學習科學家。同時,她仍擔任斯坦福大學副教授,負責斯坦福人工智能實驗室和斯坦福視覺實驗室。
摘要:介紹了數據融合技術的基本概念和內容,分析了該技術在森林防火、森林蓄積特征的估計和更新、森林資源調查等方面的應用,提出該技術可應用于木材無損檢測及精確林業(yè)。融合機器視覺、X射線等單一傳感器技術檢測木材及木制品,可以更準確地實時檢測出木材的各種缺陷;集成GPS、GIS、RS及各種實時傳感器信息,利用智能決策支持系統(tǒng)以及可變量技術,能夠實現基于自然界生物及其賴以生存的環(huán)境資源的時空變異性的客觀現實,建立基于信息流融合的精確林業(yè)系統(tǒng)。
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數據可信度和分辨能力,已廣泛應用于軍事、工業(yè)、農業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標跟蹤和慣性導航等領域。筆者在分析數據融合技術概念和內容的基礎上,對該技術在林業(yè)工程中的應用及前景進行了綜述。
一、數據融合
1.1概念的提出
1973年,數據融合技術在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現。70年代末,在公開的技術文獻中開始出現基于多系統(tǒng)的信息整合意義的融合技術。1984年美國國防部數據融合小組(DFS)定義數據融合為:“對多源的數據和信息進行多方的關聯、相關和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數據融合:“數據融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數據,以獲得實際需要的信息”。
Wald定義的數據融合的概念原理中,強調以質量作為數據融合的明確目標,這正是很多關于數據融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經過數據融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等。
1.2基本內容
信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當運用各種現代信息處理方法,通過計算機實現這一功能時,就形成了數據融合技術。
數據融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據某些準則進行組合,以獲得被測對象的一致性解釋或描述。數據融合的內容主要包括:
(1)數據關聯。確定來自多傳感器的數據反映的是否是同源目標。
(2)多傳感器ID/軌跡估計。假設多傳感器的報告反映的是同源目標,對這些數據進行綜合,改進對該目標的估計,或對整個當前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數據融合功能主要包括多傳感器的目標探測、數據關聯、跟蹤與識別、情況評估和預測。
根據融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數據層融合。直接將各傳感器的原始數據進行關聯后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數據之間配準精度較高的圖像處理。
(2)特征層融合。從原始數據中提取特征,進行數據關聯和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數量的原始信息,又實現了一定的數據壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務,然后進行關聯,再送入融合中心處理。這種方法的實質是根據一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數據通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數據融合工作小組提出的數據融合處理模型,當時僅應用于軍事方面,但該模型對人們理解數據融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數據源。包括傳感器及其相關數據(數據庫和人的先驗知識等)。
源數據預處理。進行數據的預篩選和數據分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數據。目標評估。融合目標的位置、速度、身份等參數,以達到對這些參數的精確表達。主要包括數據配準、跟蹤和數據關聯、辨識。
態(tài)勢評估。根據當前的環(huán)境推斷出檢測目標與事件之間的關系,以判斷檢測目標的意圖。威脅評估。結合當前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應同時考慮當前的政治環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數據,進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導和評價、多媒體功能等。
二、多傳感器在林業(yè)中的應用
2.1在森林防火中的應用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數據測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結果不理想。余啟剛運用數據融合技術,在空間分辨率為1000m的熱輻射通道的數據外加入空間分辨率為250m的可見光通道的數據,較好地進行了不同空間分辨率信息的數據融合,大大提高了對火點位置的判斷準確度。為進一步提高衛(wèi)星光譜圖像數據分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網,將其與衛(wèi)星光譜圖像數據融合,可以使計算機獲得GPS接收機輸出的有關信息通過與RS實現高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數據信息,大大提高燃燒區(qū)火點信息準確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數據和CARABAS-IIVHFSAR傳感器的雷達數據進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。
KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛(wèi)星光譜數據、雷達數據融合技術對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數據方法進行誤差分析。試驗表明,融合后的數據作出的估計比單一的衛(wèi)星數據或雷達數據的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數據融合GIS信息更新調查數據
森林資源調查是掌握森林資源現狀與變化的調查方法,一般以地面調查的方法為主,我國5年復查一次。由于森林資源調查的工作量巨大,且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數據融合對應的GIS數據信息實現森林調查數據的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數據需要更新。在直升飛機側面裝上可視的數字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應的GIS數據進行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數據可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應用于偏遠、地形復雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
三、數據融合在林業(yè)中的應用展望
3.1在木材檢測中的應用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質量,并限制了其應用領域。在傳統(tǒng)木制品生產過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產線的生產節(jié)拍。因此必須開發(fā)一種能夠對板材雙面缺陷進行在線識別和自動剔除技術,以解決集成材加工中節(jié)子人工識別誤差大、難以實現雙面識別、剔除機械調整時間長等問題。
3.1.2單一傳感器在木材檢測中的應用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法。超聲技術在木材工業(yè)中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等。
隨著計算機視覺技術的發(fā)展,人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結合力,并動態(tài)地觀察木材纖維在材料中的結合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經產業(yè)化,該軟件利用數碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數據。
美國林產品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測,從而可以通過調整定向鋪裝設備優(yōu)化刨花的排列方向來提高定向刨花板的強度。在制材加工過程中,利用計算機視覺技術在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質量進行分級,實現木材的優(yōu)化使用;在膠合板的生產過程中,利用計算機視覺技術在線實時檢測單板上的各種缺陷,實現單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現自動化生產過程。Wengert等在綜合了大量的板材分類經驗的基礎上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內這方面的研究較少,王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析。
X射線對木材及木質復合材料的性能檢測已得到了廣泛的應用,目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區(qū)大小、纖維的化學結構和性質等進行檢測,并對木材內部的各種缺陷進行檢測。
3.1.3數據融合在木材檢測中的應用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應用,但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術只能檢測部分表面缺陷,而無法檢測到內部缺陷;超聲、微波、核磁共振和X射線技術均能測量密度及內部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應該集成各種傳感技術,才能準確、可靠地檢測到木材的缺陷。
基于多傳感器(機器視覺及X射線等)數據融合技術的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術,更可靠、準確地實時檢測出木材表面的各種缺陷,為實現木材分級自動化、智能化奠定基礎,同時為集裁除鋸、自動調整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數控自動剔除成套設備提供技術支持。
3.2在精確林業(yè)中的應用
美國華盛頓大學研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應用于林業(yè)生產向集成技術轉變。林業(yè)生產系統(tǒng)作為一個多組分的復雜系統(tǒng),是由能量流動、物質循環(huán)、信息流動所推動的具有一定的結構和功能的復合體,各組分間的關系和結合方式影響系統(tǒng)整體的結構和功能。因此應該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數據,解決這些信息在空間和時間上的質的差異及空間數據類型的多樣性,如地理統(tǒng)計數據、柵格數據、點數據等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術)等,使林業(yè)生產成為一個高效、柔性和開放的體系,從而實現林業(yè)生產的標準化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學提出了“精確林業(yè)工程系統(tǒng)”。研究包括精確林業(yè)工程系統(tǒng)的領域體系結構、隨時空變化的數據采集處理與融合技術、精確控制林業(yè)生產的智能決策支持系統(tǒng)、可變量控制技術等,實現基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現實,以最小資源投入、最小環(huán)境危害和最大產出效益為目標,建立關于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻]
[1]高翔,王勇.數據融合技術綜述[J].計算機控制與測量,2002,10(11):706-709.
[2]龔元明,蕭德云,王俊杰.多傳感器數據融合技術(上)[J].冶金自動化,2002(4):4-7.
[3]錢永蘭,楊邦杰,雷廷武.數據融合及其在農情遙感監(jiān)測中的應用與展望[J].農業(yè)工程學報,2004,20(4):286-290.
[4]高德平,黃雪梅.多傳感器和數據融合(一)[J].紅外與激光工程,1999,28(1):1-4.