公務(wù)員期刊網(wǎng) 精選范文 計算機(jī)視覺前沿方向范文

計算機(jī)視覺前沿方向精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)視覺前沿方向主題范文,僅供參考,歡迎閱讀并收藏。

計算機(jī)視覺前沿方向

第1篇:計算機(jī)視覺前沿方向范文

最近幾年,自動駕駛成為當(dāng)下最為熱門的科技領(lǐng)域之一,許多企業(yè)紛紛將目光轉(zhuǎn)向該領(lǐng)域,諸如谷歌、百度、英特爾、Uber、豐田、本田、福特等科技和車企巨頭都在該領(lǐng)域有相關(guān)研究。在國內(nèi),除了高舉無人車大旗的百度,許多創(chuàng)業(yè)公司也在研究自動駕駛技術(shù),圖森互聯(lián)即其中之一。

9月19日,國內(nèi)計算機(jī)視覺與人工智能創(chuàng)業(yè)企業(yè)圖森互聯(lián)宣布,他們研發(fā)的計算機(jī)視覺與深度學(xué)習(xí)算法在全球最權(quán)威、最具影響力的自動駕駛算法公開排行榜KITTI和Cityscapes評測數(shù)據(jù)集上均獲得世界第一。僅KITTI數(shù)據(jù)集中,圖森互聯(lián)獲得目標(biāo)檢測三個單項、目標(biāo)追蹤兩個單項、道路分割四個單項,共計九個單項的全部世界第一。

那么,在當(dāng)前,自動駕駛技術(shù)究竟有哪些等級?市面上的自動駕駛技術(shù)都有哪些陣營?產(chǎn)品落地情況又如何?基于這些問題,《汽車觀察》記者對有著十年并行和分布式運(yùn)算研究經(jīng)歷、曾是淡馬錫國家實驗室研究員、現(xiàn)為圖森互聯(lián)聯(lián)合創(chuàng)始人的南洋理工大學(xué)博士郝佳男進(jìn)行了獨(dú)家采訪。以下為部分采訪實錄:

《汽車觀察》:圖森做自動駕駛技術(shù)項目的初衷是什么,單純就是看到了這塊的市場需求與前景嗎?

郝佳男:首先,圖森是做圖像識別SaaS起家,在技術(shù)上有一定的積累,自動駕駛所用到的計算機(jī)視覺感知技術(shù)和圖像識別SaaS在很多方面是同源的;另外,對于自動駕駛,特別是主要基于視覺傳感器的自動駕駛,有很高的技術(shù)壁壘,圖森能夠很好地發(fā)揮自己的長處;第三,運(yùn)營車輛對自動駕駛和無人駕駛存在較大的需求,因為自動駕駛和無人駕駛可以極大地減少這些運(yùn)營車輛企業(yè)的人力成本和潛在的安全風(fēng)險,而且無人車可以持續(xù)運(yùn)營,這對企業(yè)來說是生產(chǎn)效率的飛躍。

《汽車觀察》:目前,在國際上自動駕駛技術(shù)分為幾個等級?圖森的自動駕駛技術(shù)又是幾級的技術(shù)?在國內(nèi)外算是一個什么水平?

郝佳男:目前自動駕駛有L1-L5五個等級,L5是人們最期待的完全無人駕駛水平,眾人熟知的谷歌無人駕駛在目前只能算是L4級水平。圖森的主要目標(biāo)是通過低成本傳感器實現(xiàn)可靠的L3級別無人駕駛。

目前行業(yè)內(nèi)的標(biāo)桿是以色列的Mobileye。但目前Mobileye量產(chǎn)的芯片依然使用傳統(tǒng)非深度學(xué)習(xí)算法,因此在一些特定場景中(如車側(cè)面、非常見車型等)會出現(xiàn)錯誤。最近Tesla發(fā)生的車毀人亡事故就一個例子。圖森的技術(shù)方案基于深度學(xué)習(xí)構(gòu)建,能夠?qū)崿F(xiàn)更可靠的性能。

《汽車觀察》:目前的自動駕駛技術(shù)有哪幾類?它們的本質(zhì)區(qū)別在哪里?分別有哪些優(yōu)勢?

郝佳男:目前,市面上共有兩種解決方案:一種是計算機(jī)視覺為主、毫米波雷達(dá)為輔的低價解決方案;另一種是激光雷達(dá)為主、以攝像頭為輔的高價解決方案。

以谷歌和百度為代表的是以激光雷達(dá)為主、攝像頭為輔的高價解決方案,成本在50萬以上。比如Google的無人駕駛車輛,在這個技術(shù)路線中,車輛完全由人工智能來駕駛,可以將車輛的方向盤、油門和剎車去掉,同時,為了增加技術(shù)的可靠性,Google無人駕駛汽車以激光雷達(dá)為核心,一個64線的激光雷達(dá)成本在7萬美元左右,整體解決方案較貴。另外,激光雷達(dá)的硬件可靠性一般,也很難達(dá)到車規(guī)需求。但是這兩家上市企業(yè)出于市值管理的考慮,在這方面不計成本。對他們來說,新技術(shù)所能達(dá)到的程度帶來的新聞和公關(guān)效力,會大幅地抬高股價。但這種成本過高的技術(shù),在商業(yè)化應(yīng)用時會比較困難。

而選擇低價解決方案更容易被車廠、受眾所接受。以特斯拉、奔馳、沃爾沃等車廠為代表的漸進(jìn)型自動駕駛,即先從輔助駕駛開始做起,在特定場景、或是特定的封閉結(jié)構(gòu)化路段適用,做出緊急剎車、自適應(yīng)巡航、車道保持、自動泊車等動作,后續(xù)涉入高度自動駕駛,即除了結(jié)構(gòu)化路段外,還能在非結(jié)構(gòu)化道路上自動駕駛。

圖森就屬于低價解決方案,即選擇低成本的硬件(毫米波雷達(dá)、視覺傳感器、高性能SoC),配合計算機(jī)視覺算法來降低總成本。傳感器承擔(dān)的精度要求降下來,那么對算法的要求就比較高了。

《汽車觀察》:目前的自動駕駛技術(shù)是如何實現(xiàn)自動駕駛的?能實現(xiàn)到怎樣程度的自動駕駛?

郝佳男:自動駕駛系統(tǒng)使用了多種傳感器來感知,其中可視為廣義“視覺”的有超聲波雷達(dá)、毫米波雷達(dá)、激光雷達(dá)(LiDAR)和攝像頭等。毫米波雷達(dá)和激光雷達(dá)承擔(dān)了主要的中長距測距和環(huán)境感知,而攝像頭主要用于交通信號燈、車輛、行人等物體的識別。

攝像頭拍到的視頻其實也是由一幀幀圖像形成。拍下來是一回事,通過計算得出圖像里的行人、車輛、信號燈等結(jié)構(gòu)化數(shù)據(jù)則是另一回事。在過去,這被視為不可想象的任務(wù)。但深度學(xué)習(xí)的發(fā)展讓基于視覺的感知技術(shù)獲得了大幅度提升,基于視覺的環(huán)境感知變得可行了。

《汽車觀察》:目前,市面上的自動駕駛技術(shù)在產(chǎn)品化的情況如何?有沒有落地的產(chǎn)品正在運(yùn)營?

郝佳男:對于整個自動駕駛行業(yè)來說,產(chǎn)品化需要漫長的時間,可能需要2-3年的時間。圖森主要還是為主機(jī)廠和Tier1(一級零部件供應(yīng)商)提供以攝像頭為主、配合毫米波雷達(dá)和視覺芯片的、低成本的自動駕駛解決方案。

《汽車觀察》:自長安的無人駕駛路試后,國家開始出臺相關(guān)禁止自動駕駛路試的政策,這樣一來,整個研發(fā)自動駕駛技術(shù)的企業(yè)又該如何測試自己的技術(shù)?如何看待國家有關(guān)自動駕駛這方面的政策?

第2篇:計算機(jī)視覺前沿方向范文

【關(guān)鍵詞】虛擬現(xiàn)實 數(shù)字媒體 藝術(shù)設(shè)計

虛擬現(xiàn)實,英文名為Virtual Reality,簡稱VR技術(shù),也稱靈境技術(shù)或人工環(huán)境。VR技術(shù)領(lǐng)域幾乎是所有發(fā)達(dá)國家都在大力研究的前沿領(lǐng)域,它的發(fā)展速度非常迅速。作為一項尖端科技,虛擬現(xiàn)實集成了計算機(jī)圖形技術(shù)、計算機(jī)仿真技術(shù)、人工智能、傳感技術(shù)、顯示技術(shù)、網(wǎng)絡(luò)并行處理等技術(shù)的最新發(fā)展成果,是一種由計算機(jī)生成的高技術(shù)模擬系統(tǒng)。這種技術(shù)的特點(diǎn)在于計算機(jī)產(chǎn)生一種人為虛擬的環(huán)境,這種虛擬的環(huán)境是通過計算機(jī)圖形構(gòu)成的三維數(shù)字模型,并編制到計算機(jī)中去生成一個以視覺感受為主,也包括聽覺、觸覺的綜合可感知的人工環(huán)境,從而使得在視覺上產(chǎn)生一種沉浸于這個環(huán)境的感覺,可以直接觀察、操作、觸摸、檢測周圍環(huán)境及事物的內(nèi)在變化,并能與之發(fā)生“交互”作用,使人和計算機(jī)很好地“融為一體”,給人一種“身臨其境”的感覺。

一、虛擬現(xiàn)實課程簡介

隨著國內(nèi)寬帶網(wǎng)絡(luò)的普及和多媒體技術(shù)的發(fā)展,虛擬現(xiàn)實技術(shù)逐漸應(yīng)用于信息多媒體展示方面。而三維網(wǎng)絡(luò)展示系統(tǒng)將是虛擬現(xiàn)實技術(shù)未來發(fā)展的重要方向之一,因此全國各高校相繼開設(shè)數(shù)字媒體藝術(shù)設(shè)計專業(yè),其中的虛擬現(xiàn)實技術(shù)的課程成為國內(nèi)外教育技術(shù)學(xué)及媒體傳播領(lǐng)域的研究熱點(diǎn)和發(fā)展趨勢之一,它集成了計算機(jī)圖形學(xué)、多媒體、人工智能、多傳感器、網(wǎng)絡(luò)等技術(shù)的最新成果,以其沉浸性、交互性和構(gòu)想性等無可比擬的優(yōu)點(diǎn)。虛擬現(xiàn)實技術(shù)在各行各業(yè)得到了廣泛的應(yīng)用和重視,比如在教育培訓(xùn)、城市規(guī)劃、文物保護(hù)、游戲娛樂等領(lǐng)域取得了巨大的發(fā)展,市場前景廣闊;同時國家自然科學(xué)基金會、國家高技術(shù)研究發(fā)展計劃和863計劃等都已將虛擬現(xiàn)實技術(shù)列入了研究項目。

虛擬現(xiàn)實課程是以往多個計算機(jī)輔助設(shè)計軟件的一個綜合運(yùn)用,課程主要涉及到多個軟件與課程的結(jié)合,軟件包含有Photoshop、AutoCad、3dsmax、Virtools 等,涉及課程有建筑制圖、建筑場景漫游、景觀綠地設(shè)計等專業(yè)范圍。課程主要運(yùn)用虛擬現(xiàn)實技術(shù)完成一個三維場景的漫游瀏覽系統(tǒng), 使其能夠流暢,完整的再現(xiàn)一個實際的環(huán)境或建筑。其中主要運(yùn)用virtools 這個軟件來實現(xiàn)交互瀏覽的制作, 這一步驟是整個系統(tǒng)實現(xiàn)人機(jī)交互的核心, 最后完成系統(tǒng)的制作并。

二、虛擬現(xiàn)實在國內(nèi)高校的研究現(xiàn)狀

國內(nèi)在VR方面有較多研究成果的其他單位有國防科技大學(xué)、天津大學(xué)、北京理工大學(xué)、中國科學(xué)院自動化研究所、西北大學(xué)、山東大學(xué)、大連海事大學(xué)和香港中文大學(xué)等。

北京航空航天大學(xué)計算機(jī)系是國內(nèi)最早進(jìn)行VR研究的機(jī)構(gòu)之一,他們首先進(jìn)行了一些基礎(chǔ)知識方面的研究,并著重研究了虛擬世界中物體物理特性的表示與處理,在VR中的視覺接口方面開發(fā)出了部分硬件,并提出了有關(guān)算法及實現(xiàn)方法。他們還實現(xiàn)了分布式虛擬世界網(wǎng)絡(luò)設(shè)計,建立了網(wǎng)上VR研究論壇,可以提供實時三維動態(tài)數(shù)據(jù)庫,提供VR演示世界,提供用行員訓(xùn)練的VR系統(tǒng),提供開發(fā)VR系統(tǒng)的開發(fā)平臺,并將要實現(xiàn)與有關(guān)單位的遠(yuǎn)程連接。

清華大學(xué)計算機(jī)科學(xué)和技術(shù)系對VR和臨場感的方面進(jìn)行了研究,他們還針對室內(nèi)環(huán)境中水平特征豐富的特點(diǎn),提出借助圖像變換,使立體視覺圖像中對應(yīng)水平特征呈現(xiàn)形狀一致性,以利于實現(xiàn)特征匹配,并獲取物體三維結(jié)構(gòu)的新穎算法。

西安交通大學(xué)信息工程研究所對VR中的關(guān)鍵技術(shù)——立體顯示技術(shù)——進(jìn)行了研究。他們在分析人類視覺特性的基礎(chǔ)上提出了一種基于JPEG標(biāo)準(zhǔn)壓縮編碼的新方案,并獲得了較高的壓縮比、信噪比以及解壓速度,并且已經(jīng)通過實驗結(jié)果證明了這種方案的優(yōu)越性。

2004年南京大學(xué)成立了南京大學(xué)虛擬現(xiàn)實與數(shù)字媒體研究中心,對VR技術(shù)及應(yīng)用進(jìn)行研究,并把重點(diǎn)放在虛擬體育仿真、數(shù)字文化遺產(chǎn)保護(hù)和自然人機(jī)交互等方面。

三、虛擬現(xiàn)實課程開設(shè)的重要性

虛擬現(xiàn)實技術(shù)是利用計算機(jī)生成一個逼真的三維虛擬環(huán)境,并通過傳感設(shè)備與之交互的新技術(shù)。作為一門新興的學(xué)科,它已經(jīng)被眾多高校納入計算機(jī)科學(xué)與技術(shù)專業(yè)的選修課范疇,但是卻沒有在數(shù)字媒體技術(shù)專業(yè)中普遍開設(shè)。其實無論從技術(shù)特點(diǎn),還是從社會需求來講,虛擬現(xiàn)實技術(shù)都與數(shù)字媒體技術(shù)有著非常密切的關(guān)系,具體體現(xiàn)在如下幾個方面。

1) 虛擬現(xiàn)實是一門典型的交叉學(xué)科,它所涵蓋的知識結(jié)構(gòu)與數(shù)字媒體技術(shù)具有非常大相似性,例如計算機(jī)圖形學(xué)、數(shù)字圖像處理、計算機(jī)視覺、視音頻技術(shù)等。除此之外,它還涉及了仿真技術(shù)、人工智能技術(shù)、計算機(jī)網(wǎng)絡(luò)技術(shù)、多傳感器技術(shù)等內(nèi)容。虛擬現(xiàn)實強(qiáng)調(diào)這些技術(shù)的綜合應(yīng)用。

2) 虛擬現(xiàn)實強(qiáng)調(diào)技術(shù)創(chuàng)新性和應(yīng)用創(chuàng)新性。從技術(shù)上來講,虛擬現(xiàn)實在不同學(xué)科的交叉融合中,能夠不斷產(chǎn)生新思想和新方法,例如近幾年出現(xiàn)的各種人機(jī)交互新方法,各種立體顯示新技術(shù)等;從應(yīng)用上來講,虛擬現(xiàn)實具有強(qiáng)烈的“身臨其境”的沉浸感和發(fā)人想象的刺激性。因此,利用虛擬現(xiàn)實技術(shù),學(xué)生們能夠?qū)⒆约旱娜魏蝿?chuàng)意和想象進(jìn)行實踐,在虛擬場景中進(jìn)行規(guī)劃、設(shè)計和測試,從而激發(fā)出新的創(chuàng)意。

第3篇:計算機(jī)視覺前沿方向范文

【關(guān)鍵詞】OpenCV;智能視頻監(jiān)控;目標(biāo)檢測;目標(biāo)跟蹤

1.引言

近年來,隨著我國職業(yè)院校的不斷發(fā)展,校園建筑面積和規(guī)模逐步擴(kuò)大,校園的流動人口大量增加,治安形勢錯綜復(fù)雜,做好校園的安保工作,僅靠簡單的增加人力和物力,采取常規(guī)的防范措施已經(jīng)很難適應(yīng)新形勢的需要。為了加強(qiáng)校園安全防范整體力量,有效保護(hù)校園與學(xué)生的財產(chǎn)安全,利用先進(jìn)的科技手段建立一套功能完善、覆蓋范圍廣泛的監(jiān)控系統(tǒng)是維護(hù)學(xué)生正常學(xué)習(xí)、生活,創(chuàng)造平安校園的必要條件。

智能視頻監(jiān)控是綜合利用圖像處理、機(jī)器視覺和計算機(jī)視覺知識進(jìn)行研究的一個新興的研究方向和備受關(guān)注的前沿課題。與傳統(tǒng)的模擬監(jiān)控不同,智能監(jiān)控系統(tǒng)能實時的對攝像機(jī)捕捉到的視頻序列進(jìn)行處理和分析,自動完成動態(tài)目標(biāo)的檢測、識別和跟蹤,并在此基礎(chǔ)上可以進(jìn)一步對目標(biāo)的行為進(jìn)行分析和理解。本文構(gòu)建的校園智能視頻監(jiān)控系統(tǒng)利用OpenCV實現(xiàn)了對視頻圖像中動態(tài)目標(biāo)的行為快速有效地進(jìn)行監(jiān)控和分析,并實現(xiàn)了對動態(tài)目標(biāo)的精確跟蹤。

2.OpenCV視覺庫簡介

OpenCV是Intel公司開發(fā)的用于數(shù)字圖像處理和計算機(jī)視覺的函數(shù)庫[1]。它由一系列C函數(shù)和少量C++類構(gòu)成,實現(xiàn)了圖像處理和計算機(jī)視覺方面的很多通用算法。OpenCV其源代碼完全開放,運(yùn)行速度快,由于具有良好的可移植性和統(tǒng)一的結(jié)構(gòu)及其穩(wěn)定性,因此可以縮短系統(tǒng)設(shè)計的開發(fā)周期,使系統(tǒng)運(yùn)行更加穩(wěn)定。

鑒于OpenCV的特點(diǎn),它主要用于對視頻圖像進(jìn)行一些高級處理,如人臉識別、動態(tài)跟蹤、圖像分割及人機(jī)互動等。

3.校園智能視頻監(jiān)控系統(tǒng)的實現(xiàn)

3.1 系統(tǒng)工作流程

當(dāng)動態(tài)目標(biāo)出現(xiàn)在可視范圍內(nèi),首先通過背景差分法將前景圖像與背景圖像分離,再對差值進(jìn)行二值化判斷,利用給定的閾值去除噪聲等干擾后,從場景中檢測出動態(tài)目標(biāo)。與之前檢測出的目標(biāo)做特征比對,如果是新目標(biāo)則加入到跟蹤序列中,如果是舊目標(biāo)則舍棄。目標(biāo)跟蹤階段,對跟蹤序列中的目標(biāo)采用CamShift跟蹤算法,提取目標(biāo)特征信息,并獲得其運(yùn)動軌跡,對目標(biāo)進(jìn)行實時跟蹤。其關(guān)鍵點(diǎn)在于目標(biāo)的特征信息提取和匹配,這是決定目標(biāo)跟蹤效果的重大因素。

3.2 動態(tài)目標(biāo)檢測

動態(tài)目標(biāo)檢測是校園智能視頻監(jiān)控系統(tǒng)的重要組成部分。動態(tài)目標(biāo)檢測的主要目的是從視頻圖像中實時的提取出動態(tài)目標(biāo)并獲得動態(tài)目標(biāo)的特征信息,如色彩、形狀、輪廓等[2]。動態(tài)目標(biāo)提取的過程就是在連續(xù)的視頻圖像序列中尋找差異,并把由于目標(biāo)運(yùn)動和表現(xiàn)出來的差異提取出來。

動態(tài)目標(biāo)檢測常用的有四種常用方法:連續(xù)幀間差分法、背景差分法、光流法和運(yùn)動能量法[3]。由于背景差分法具有實現(xiàn)簡單,運(yùn)算速度快,因此最常用。它通過當(dāng)前幀圖像與背景圖像相減并提取出感興趣區(qū)域來檢測動態(tài)目標(biāo),固定場景下應(yīng)用背景差分法進(jìn)行動態(tài)目標(biāo)檢測,關(guān)鍵在于創(chuàng)建和維護(hù)一個可靠的背景。針對這種情況,背景模型應(yīng)運(yùn)而生。評價一個好的背景模型,應(yīng)該從兩個方面進(jìn)行考慮:第一,背景模型對背景變化的響應(yīng)速度要足夠快;第二,背景模型對運(yùn)動目標(biāo)要有較強(qiáng)的抗干擾能力。

3.2.1 提取前景圖像

假設(shè)環(huán)境溫度不變,視頻圖像的背景也不變,當(dāng)動態(tài)目標(biāo)出現(xiàn)時.圖像相應(yīng)像素點(diǎn)的灰度值會發(fā)生明顯的改變,利用圖像減法就可以得到差分灰度圖像[4]。差分灰度圖像包含了動態(tài)目標(biāo)信息,相對于背景圖像又稱之為前景圖像。相減的結(jié)果中每一像素的值和一個預(yù)先設(shè)定的閾值相比較,若這個像素的值大于閾值,則認(rèn)為這點(diǎn)是前景圖像,否則是背景圖像。假設(shè)利用圖像平均法可得到當(dāng)前背景圖像BK(x,y),當(dāng)前的輸入圖像為CK(x,y),則前景圖像DK(x,y)可以表示為當(dāng)前圖像與背景圖像差的絕對值即:DK(x,y)=|CK(x,y)-BK(x,y)|

3.2.2 差分圖像二值化

選取T為閾值,對差分圖像進(jìn)行二值化[5]:

1,DK(x,y)≥T

EK=

0,DK(x,y)

其中,EK為進(jìn)行二值化后的圖像,當(dāng)差分圖像中像素值大于某一給定的閾值T時,則認(rèn)為該像素為前景像素,即認(rèn)為該像素可能為目標(biāo)上的一點(diǎn),反之則認(rèn)為是背景像素。

在OpenCV中,差分圖像的二值化是由函數(shù)void cvTheshold實現(xiàn)的。

由于背景差分法受外界光線的變化、背景中含有輕微擾動的對象,如樹枝、樹葉的搖動等的影響,因此對前景圖像還要進(jìn)行一系列的圖像處理。包括:平滑處理,形態(tài)學(xué)膨脹、腐蝕,二值化操作,輪廓提取等。但是并不是所有的輪廓都是由目標(biāo)產(chǎn)生的,有些是目標(biāo)的子輪廓或者是噪聲產(chǎn)生的輪廓,因此必須對輪廓進(jìn)行篩選,淘汰偽目標(biāo)的輪廓,把目標(biāo)輪廓篩選出來后加入到跟蹤隊列。

3.3 動態(tài)目標(biāo)跟蹤

在校園智能視頻監(jiān)控系統(tǒng)中,動態(tài)目標(biāo)跟蹤起著承上啟下的作用,它是利用圖像處理和計算機(jī)視覺等相關(guān)技術(shù)對視頻圖像序列進(jìn)行處理和分析,在連續(xù)的圖像序列中找到動態(tài)目標(biāo)的位置和相關(guān)信息,比如動態(tài)目標(biāo)的速度、形狀等。為了實現(xiàn)該功能,本文采用了OpenCV中的CamShift目標(biāo)跟蹤算法。它主要通過視頻圖像中動態(tài)目標(biāo)的顏色信息來達(dá)到跟蹤的目的。

3.3.1 CamShift算法簡介

Gary R.Bradski提出的CamShift算法,是以顏色直方圖為目標(biāo)模式的目標(biāo)跟蹤算法,是對MeanShift算法的改良,可以有效地解決目標(biāo)變形和部分遮擋的問題,而且運(yùn)算效率很高。它的基本思想是將視頻圖像的所有幀做MeanShift運(yùn)算,將上一幀的運(yùn)算信息作為搜索窗口的初始值,并將初始值作為對下一幀圖像運(yùn)算的輸入,進(jìn)行迭代后實現(xiàn)對動態(tài)目標(biāo)在每一幀圖像序列中的連續(xù)跟蹤。由于RGB顏色空間對光照亮度變化比較敏感,為了減少光照亮度變化對跟蹤效果的影響,CamShift算法將圖像由RGB顏色空間轉(zhuǎn)化到HSV顏色模型,方便對動態(tài)目標(biāo)特征的提取。

3.3.2 CamShift算法實現(xiàn)

在OpenCV庫中,CvCamShiftTracker類就是用來實現(xiàn)CamShift算法的,使得進(jìn)行二次開發(fā)變得很簡單[7]。

其中,prob_image為目標(biāo)直方圖的反向投影;Window為初始搜索窗口;criteria為確定窗口搜索停止的準(zhǔn)則;comp為生成的結(jié)果,包含收斂的搜索窗口坐標(biāo)(comprect字段)與窗口內(nèi)部所有像素點(diǎn)的和(comparea字段);box為目標(biāo)的最小矩形。如果非NULL,則包含目標(biāo)的尺寸和方向。

利用該函數(shù),在VC++2010開發(fā)環(huán)境下,就很容易實現(xiàn)CamShift算法跟蹤動態(tài)目標(biāo)。

4.結(jié)束語

本文設(shè)計的基于OpenCV的校園智能視頻監(jiān)控系統(tǒng),由于其較低的計算復(fù)雜度和較高的魯棒性,具有廣闊的應(yīng)用前景。采用了背景差分法作為動態(tài)目標(biāo)檢測的方法。檢測是跟蹤的前提,檢測結(jié)果的精確性直接影響跟蹤的可靠性。利用CamShift跟蹤算法提取每個動態(tài)目標(biāo)的顏色特征信息,實現(xiàn)對多個動態(tài)目標(biāo)的精確跟蹤,最后將動態(tài)目標(biāo)的輪廓和運(yùn)動軌跡描述出來。

該系統(tǒng)平臺簡單,大大縮短工作人員的開發(fā)周期,只需根據(jù)不同的需要進(jìn)行簡單的改進(jìn),就可以實現(xiàn)多種場合的不同應(yīng)用。實驗證明,系統(tǒng)運(yùn)行穩(wěn)定,檢測結(jié)果真實可靠,具有較高的精確度。

參考文獻(xiàn)

[1]Gary Bradski,Adrian Kaehler.學(xué)習(xí)OpenCV[M].北京:清華大學(xué)出版社,2009.

[2]譚歆,武岳.基于OpenCV的運(yùn)動目標(biāo)檢測方法研究與應(yīng)用[J].視頻應(yīng)用與工程,2010,34(S1):184-187.

[3]尹俊超,劉直芳.基于OpenCV的運(yùn)動目標(biāo)檢測與跟蹤[J].計算機(jī)工程與設(shè)計,2011,32(8):2817-2820.

[4]林洪文,姚作,涂丹,李國輝.基于減背景技術(shù)的運(yùn)動目標(biāo)檢測方法研究[J].國防科技大學(xué)學(xué)報,2003, 25(3):66-69.

[5]侯宏錄,李寧烏,劉迪迪,陳杰.智能視頻監(jiān)控中運(yùn)動目標(biāo)檢測的研究[J].計算機(jī)技術(shù)與發(fā)展,2012,22(2):49-52.

第4篇:計算機(jī)視覺前沿方向范文

關(guān)鍵詞:機(jī)器視覺;三維重建;圖像處理

中圖分類號:TP301

文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2014)003-0013-02

作者簡介:羅尤春(1989-),男,華中科技大學(xué)機(jī)械科學(xué)與工程學(xué)院碩士研究生,研究方向為機(jī)器視覺。

1 Marr機(jī)器視覺框架

在漫漫進(jìn)化歷程中,人類和大部分動物通過視覺、聽覺、觸覺等來獲取周圍世界的信息,并通過大腦處理這些信息。而根據(jù)調(diào)查,人類大腦處理的信息有80%是來自視覺,我們通過雙目感受深度信息,通過對不同頻率光信號進(jìn)行判別來獲取顏色信息[1]。通過運(yùn)用攝像機(jī)來達(dá)到模擬人眼的識別和測量功能,機(jī)器視覺成為人工智能研究的重要環(huán)節(jié)。機(jī)器視覺區(qū)別于計算機(jī)視覺,更偏向于應(yīng)用,一個機(jī)器視覺系統(tǒng)一般通過攝像機(jī)之類的光學(xué)儀器以圖像的形式獲取周圍世界的信息,通過計算機(jī)進(jìn)行圖像處理和圖像理解,再根據(jù)相應(yīng)的控制程序和機(jī)械驅(qū)動設(shè)備對智能輸出設(shè)備發(fā)出操作指令,實現(xiàn)智能控制和操作功能。

早期的機(jī)器視覺局限于對二維圖像的分析、識別和理解上[2]。20世紀(jì)80年代初,Marr第一次融合圖像處理、神經(jīng)科學(xué)的相關(guān)研究,提出了里程碑式的視覺系統(tǒng)框架。具體來說,Marr框架包括三個層次:計算理論層次、表達(dá)與算法層次、硬件實現(xiàn)層次。計算理論層次,可以理解為通過對二維圖像的理解來重建三維客觀世界的視覺三維重建理論研究。因為現(xiàn)實世界是復(fù)雜多變的,如何建立一種通過二維圖像來實現(xiàn)三維重建的普適性方法成為機(jī)器視覺系統(tǒng)中最重要也是終極的目的。Marr提出的這一層次是想通過建立某種普適性模型來獲取客觀世界任何物體的形狀、位置以及運(yùn)動的信息;表達(dá)與算法層次低于計算理論層次,是要解決“軟件”的問題,即如何實現(xiàn)機(jī)器視覺系統(tǒng)各個模塊之間信息輸入、輸出和信息表達(dá)的問題,亦即各種算法的實現(xiàn);硬件實現(xiàn)層次可理解為如何組建機(jī)器視覺系統(tǒng)的硬件實體設(shè)備,與表達(dá)與算法層次一起為計算理論層次服務(wù)。

Marr提出的視覺框架中研究最多的是計算理論層次和表達(dá)與算法層次,分別對應(yīng)下節(jié)要介紹的三維重建理論和圖像處理。

2 三維重建

視覺三維重建理論是整個視覺領(lǐng)域研究的重點(diǎn)和前沿。客觀世界的物體都是由基本的幾何要素組成的:點(diǎn)、直線、二次曲線等。因此,要實現(xiàn)對客觀世界的描繪,利用這些最基本的幾何要素來組建客觀世界是可以實現(xiàn)的。在很多研究中,通過大量的點(diǎn)對匹配得到三維世界中物體的三維點(diǎn)云模型,從而模擬出真實物體的形狀。在三維重建研究中,立體視覺或稱雙目(多目)視覺是最重要的手段。仿照人眼的原理,要獲得對周圍三維世界的認(rèn)知,必須知道深度信息,最少需要兩個眼睛。與此同理,立體視覺一般都需要兩個或者多個攝像機(jī)同時工作,才能較好地得到周圍世界的三維信息。

2.1 攝像機(jī)針孔模型

攝像機(jī)的普適模型——針孔模型來源于小孔成像現(xiàn)象。簡單地說,針孔模型是指空間中一點(diǎn)P與攝像機(jī)中一特定點(diǎn)C(稱為光心)的連線交攝像機(jī)的圖像平面于點(diǎn)p,這個點(diǎn)p便是空間點(diǎn)P的成像點(diǎn),蘊(yùn)含了空間點(diǎn)P的幾何信息。從數(shù)學(xué)的觀點(diǎn),攝像機(jī)的成像模型是一個從三維到二維的映射f:Pp,是一個降維映射,丟失掉了深度信息,即處于光心C—空間點(diǎn)P的直線上任意一點(diǎn)Q的投影也都是p。從數(shù)學(xué)上可以證明,至少需要兩幅或以上圖像才能重建出空間點(diǎn)P的深度信息zP。

2.2 空間點(diǎn)三維重建

采用兩個不同的攝像機(jī)位拍攝空間中同一點(diǎn)P的圖像,分別得到P在左右攝像機(jī)圖像平面上的投影點(diǎn)p\-L和p\-R,如果事先知道左右攝像機(jī)的相對位置關(guān)系——稱為雙目攝像機(jī)標(biāo)定,那么就知道了左右攝像機(jī)的光心C\-L和C\-R的位置。簡而言之,雙目視覺系統(tǒng)能夠提供給我們一個坐標(biāo)系(左或者右攝像機(jī)坐標(biāo)系),在這個坐標(biāo)系下通過攝像機(jī)標(biāo)定知道兩個光心C\-L和C\-R的位置以及投影點(diǎn)p\-L和p\-R的位置,直線C\-Lp\-L和C\-Rp\-R的交點(diǎn)就是要重建的空間點(diǎn)P。

2.3 空間直線三維重建

空間直線的重建原理和空間點(diǎn)的重建類似,假如要重建空間直線L,得到L在左右攝像機(jī)圖像平面上的投影直線l\-L和l\-R,那么左攝像機(jī)光心C\-L和左投影l(fā)\-L形成一個平面S\-L,同理右攝像機(jī)光心C\-R和右投影l(fā)\-R形成一個平面S\-R,則空間直線L就是平面S\-L和S\-R的相交直線。

2.4 二次曲線三維重建

實二次曲線一般包括橢圓、雙曲線、拋物線和圓[3]。關(guān)于二次曲線的三維重建,司少華等[4]在1993年提出了一種特征值的方法,其開創(chuàng)性貢獻(xiàn)在于首先將二次曲線視為一個幾何元素來進(jìn)行重建,而非利用二次曲線由其上的若干點(diǎn)(至少5個點(diǎn))決定的原理,更不是利用點(diǎn)云的思想來重建二次曲線。將要重建的對象視作整體而非利用局部元素(點(diǎn))去擬合逼近的思想是視覺理論更進(jìn)一步的發(fā)展。圓作為最常見的二次曲線特征被廣泛應(yīng)用在物體空間定位上[5]。

3 圖像處理

圖像處理是指利用計算機(jī)對圖像進(jìn)行分析,得到需要的信息。所謂圖像,其數(shù)學(xué)模型即一個二元向量函數(shù)f(x,y),其坐標(biāo)(x,y)表示圖像的橫縱坐標(biāo)。對于灰度圖像,這個向量函數(shù)成為一個標(biāo)量函數(shù),f(x,y)表示對應(yīng)平面坐標(biāo)(x,y)的灰度值。對于彩色圖像,一般使用RGB三原色來表征,即f=[R,G,B]\+T。圖像處理的內(nèi)容非常豐富,包括了圖像濾波去噪、邊緣檢測、圖像復(fù)原、形態(tài)學(xué)處理、圖像分割等。其中,為了得到三維重建所必須知道的點(diǎn)、直線、二次曲線等圖像信息,邊緣檢測至關(guān)重要。所謂邊緣檢測,目的是要識別出圖像中灰度值變化明顯的圖像點(diǎn)。圖像中突變的位置一般代表了三維世界中的不同屬性?,F(xiàn)有的邊緣檢測算子包括Canny算子[6]、Sobel算子、Prewitt算子、Roberts Cross算子、羅盤算子、Marr-Hildreth算子等。

A=imread('Beach.jpg');

B=rgb2gray(A);

C=edge(B,'canny',0.1);

imshow(C)

4 機(jī)器視覺應(yīng)用及前景

機(jī)器視覺技術(shù)廣泛應(yīng)用于機(jī)器人、工業(yè)檢測等領(lǐng)域。由于機(jī)器視覺系統(tǒng)是一套光學(xué)系統(tǒng),因此具有非接觸式測量的優(yōu)點(diǎn)。由于計算機(jī)的運(yùn)算速度不斷刷新紀(jì)錄,使得圖像處理效率也不斷提升,運(yùn)用機(jī)器視覺系統(tǒng)能夠為工業(yè)中的不同應(yīng)用提供實時數(shù)據(jù)。加載視覺系統(tǒng)的智能機(jī)器人不僅擁有靈活、快捷的操作手臂,而且配置了靈敏的攝像機(jī)充當(dāng)“眼睛”,還有超強(qiáng)計算能力的計算機(jī)充當(dāng)“大腦”,真正實現(xiàn)了手—眼—腦同體。在工業(yè)檢測以及測量領(lǐng)域,機(jī)器視覺利用自身的獨(dú)特優(yōu)勢在質(zhì)量缺陷、生產(chǎn)監(jiān)控等方面占據(jù)了重要地位。機(jī)器視覺是一種人工智能技術(shù),在未來的智能化時代,視覺技術(shù)必定能成為人機(jī)交互的最重要途徑之一。

參考文獻(xiàn):

[1] 張廣軍.機(jī)器視覺[M].北京:科學(xué)出版社,2005.

[2] 馬頌德,張正友.計算機(jī)視覺:計算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,2003.

[3] 呂林根,許子道.解析幾何[M].北京:高等教育出版社,2006.

[4] 司少華,馬頌德.基于二次曲線的立體視覺[J].自動化學(xué)報,1993,19(4):420-427.

第5篇:計算機(jī)視覺前沿方向范文

關(guān)鍵詞:煙葉數(shù)字圖像;邊緣處理;形態(tài)學(xué)變換;特征抽??;智能識別

1引言

煙葉是煙草工業(yè)的基礎(chǔ)原料, 對煙草工業(yè)生產(chǎn)質(zhì)量和煙草行業(yè)經(jīng)營效益具有舉足輕重的作用。對煙葉生產(chǎn)過程的各個環(huán)節(jié)包括煙葉品質(zhì)的智能識別進(jìn)行技術(shù)創(chuàng)新,提高品質(zhì)和效率,是一個前沿研究方向[1][5]。

當(dāng)前這一方面的研究,主要集中在數(shù)字圖像處理方面,把煙葉品質(zhì)的數(shù)字圖像處理與神經(jīng)網(wǎng)絡(luò)技術(shù)相結(jié)合,實現(xiàn)煙葉品質(zhì)的智能識別,是一個極有價值的工作。以下在此方面作出一個系統(tǒng)的、較為完備的、易于實際操作的研究。

2主要技術(shù)手段

2.1 MAⅡAB圖像處理工具箱

在MATLAB平臺上,借助圖像處理工具箱,可以簡易明快地實現(xiàn)對煙葉數(shù)字圖像的圖像處理。在煙葉生產(chǎn)一線,用數(shù)碼照相機(jī)對各種煙葉樣本進(jìn)行拍照,輸入計算機(jī),用MAT_LAB將它轉(zhuǎn)換為各(.bmp;.jpeg;.gif;.png;.t 圖片以便進(jìn)行圖像處理。成本低,精確度高,宜于普及推廣。獲取各種類型的煙葉數(shù)字圖像以后,經(jīng)閾值使用權(quán)圖像二值化,可以當(dāng)即辨識出這一圖像是否具有何種類型的病蟲害或品質(zhì)異變。利用煙葉數(shù)字圖像的邊緣檢測、輪廓提取等分析命令,獲得待測煙葉的圖像參數(shù)和特征,再由神經(jīng)網(wǎng)絡(luò)技術(shù),完成對煙葉品質(zhì)的智能識別。

2.2神經(jīng)網(wǎng)絡(luò)技術(shù)

神經(jīng)網(wǎng)絡(luò)是一個新的智能識別工具。畢業(yè)論文 經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能夠存儲與過程有關(guān)的信息,能直接從歷史數(shù)據(jù)中學(xué)習(xí),經(jīng)過用各種煙葉樣本訓(xùn)練和學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),能自動地識別出待測煙葉樣本的品質(zhì)類型。而且,神經(jīng)網(wǎng)絡(luò)具有濾除噪聲及在有噪聲情況下得出正確結(jié)論的能力。這一點(diǎn)對于煙葉生產(chǎn)實際中大量存在各種噪聲信息的情況而言,特別重要。它特別適合在線識別。

3應(yīng)用MATLAB圖像處理工具箱和神經(jīng)網(wǎng)絡(luò)技術(shù)對煙葉品質(zhì)智能識別的操作過程

3.1煙葉圖片樣本庫的建立

用數(shù)碼相機(jī)或其它數(shù)字圖像采集工具,采集各種類型的煙葉的標(biāo)準(zhǔn)圖片,分類歸檔,借助MATLAB圖像變換功能,將各種類型的煙葉的標(biāo)準(zhǔn)圖片,轉(zhuǎn)換成各種圖片形式:.bmp;.jpeg;.sir;.png;.tif等,以便隨時調(diào)用。這些煙葉圖片,有不同品質(zhì)的樣本;還有各種病蟲害標(biāo)本和變異標(biāo)本。

3.2用直方圖均衡來實現(xiàn)圖像增強(qiáng)

當(dāng)從生產(chǎn)一線采集的煙葉待測樣本的圖像對比度較低,碩士論文 即灰度直方圖分布區(qū)間較窄時,可用直方圖均衡實現(xiàn)灰度分布區(qū)間展寬而達(dá)到圖像增強(qiáng)的效果。

3.3煙葉圖像的邊緣檢測和特征提取

煙葉圖像的基本特征之一是圖像邊緣。圖像邊緣是圖像周圍像素灰度有階躍性變化或屋頂變化的像素的集合。煙葉的邊緣是由灰度的不連續(xù)性所致,因此考察圖像每個像素在某個鄰域內(nèi)灰度的變化,利用邊緣鄰近一階或二階方向?qū)?shù)變化規(guī)律可以檢測煙葉圖像邊緣。圖像特征反映煙葉的幾何結(jié)構(gòu),如面積、周長、分形分維數(shù)、孔洞數(shù)、歐拉數(shù)等等。圖像特征的選擇是圖像識別的重要環(huán)節(jié)。運(yùn)用二叉分類法在找出判別特征后,對不同的圖像特征由分類閾值按二分的方法進(jìn)行分類;運(yùn)用相似距離分類方法把待判圖像與一個標(biāo)準(zhǔn)圖像相比,標(biāo)準(zhǔn)圖像用樣本圖像特征向量的均值來表示。通過計算待判圖像與標(biāo)準(zhǔn)圖像之問的在相空間中的距離來判別圖像和進(jìn)行分類。這一過程還為用神經(jīng)網(wǎng)絡(luò)技術(shù)實現(xiàn)對煙葉品質(zhì)進(jìn)行智能識別作出必要的準(zhǔn)備。

3.4數(shù)字圖像矩陣數(shù)據(jù)的顯示及其傅立葉

變換這一變換的目的是為提取特征、進(jìn)行神經(jīng)網(wǎng)絡(luò)模式識別等作出必要的準(zhǔn)備。

轉(zhuǎn)貼于 3.5直方圖均勻化

這是使煙葉圖像性質(zhì)更為優(yōu)良而采取的一個技術(shù)操作,源代碼如下:

I=imread ("yangshuo.tif');imshow (I);

figure,imhist(I);

[J,T]=histeq (I,64);

%圖像灰度擴(kuò)展到0-255,但是只有64個灰度級

figure,imshow (J);

figure,imhist(J);

figure,Dlot((0:255)/255,T);%轉(zhuǎn)移函數(shù)的變換曲線

J=histeq (I,32);

figure,imshow 0);

%圖像灰度擴(kuò)展到0~255,但是只有32個灰度級

figure,imhist(J);

3.6采用二維中值濾波函數(shù)對受椒鹽噪聲干擾的圖像濾波

MATLA圖像處理工具箱具有強(qiáng)大的功能,能夠?qū)υ肼暩蓴_的煙葉圖片進(jìn)行消噪處理,模擬源代碼如下:

I=imread ("eight.tif');

imshow (I);

J2=imnoise (I,"salt&pepper ,0.04);

%疊加密度為0.04 的椒鹽噪聲

figure,imshow 02);

I_Filterl=medfdt2 (J2,[3 ,3]);

%窗口大小為3x3

figure.imshow (I Fiher1);

I_Filter 2=medfdt2 (J2,[5, 5]);

%窗口大小為5x5

figure,imshow (I_Filter2);

I_Filter3=medf'dt2 (J2,[7, 7]);

%窗口大小為7x7

figure,imshow (I_Filter3);

3.7用神經(jīng)網(wǎng)絡(luò)技術(shù)對煙葉圖像進(jìn)行智能識別

神經(jīng)網(wǎng)絡(luò)作為一種自適應(yīng)的模式識別技術(shù),并不需要預(yù)選給定有關(guān)模式的經(jīng)驗知識和判別函數(shù),它能通過自身的學(xué)習(xí)機(jī)制自動形成所要求的決策區(qū)域。網(wǎng)絡(luò)的我由其拓樸結(jié)構(gòu)、神經(jīng)元特性、學(xué)習(xí)和訓(xùn)練規(guī)則所決定,它可以充分利用狀態(tài)信息,對不同狀態(tài)一一進(jìn)行訓(xùn)練而獲得某種映射關(guān)系,并且,網(wǎng)絡(luò)可以連續(xù)學(xué)習(xí),即使環(huán)境變異,這咱映射關(guān)系可以自適應(yīng)調(diào)整。在上面各節(jié)獲取煙葉圖像特征基礎(chǔ)之上,可以用神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行圖像模式識別。例如,基于概率神經(jīng)網(wǎng)絡(luò)PNN的煙葉品質(zhì)智能識別,它的主要優(yōu)點(diǎn)是:快速訓(xùn)練,訓(xùn)練時問僅略大于讀取數(shù)據(jù)時間;無論分類多么復(fù)雜,只要有足夠的訓(xùn)練數(shù)據(jù)(而這是煙葉生產(chǎn)一線可以做到的),就可以保證獲得貝斯葉準(zhǔn)則下的最優(yōu)解,允許增加或減少訓(xùn)練數(shù)據(jù)而無需重新進(jìn)行長時間訓(xùn)練。這一神經(jīng)網(wǎng)絡(luò)對于煙葉品質(zhì)的圖像識別,具有重要意義。 4結(jié)論

基于計算機(jī)視覺和神經(jīng)網(wǎng)絡(luò)技術(shù)的煙葉品質(zhì)識別的數(shù)字圖像處理方法,醫(yī)學(xué)論文 是煙葉生產(chǎn)環(huán)節(jié)的一種技術(shù)創(chuàng)新,它可以在煙葉生產(chǎn)一線普及推廣,簡便易行,能夠較大地提高煙葉品質(zhì)檢測的效率和質(zhì)量,以及自動化程度和智能化水平。

參考文獻(xiàn)

[1]于潤偉.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學(xué)報,2007,1:122—124.

第6篇:計算機(jī)視覺前沿方向范文

關(guān)鍵詞 智能視頻監(jiān)控;運(yùn)動目標(biāo)檢測技術(shù)

中圖分類號:TN941 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2014)03-0160-02

智能視頻的監(jiān)控指的是:不需要人為干預(yù)的情況下,利用視頻、數(shù)字圖像處理,分析相關(guān)的技術(shù),對視頻中的活動或者監(jiān)控中實時、現(xiàn)在的目標(biāo),進(jìn)行跟蹤與檢測,可對異常的情況,及時做出的反應(yīng)效果;又可滿足日常的監(jiān)控工作。運(yùn)動目標(biāo)的檢測是:用計算方法的視頻以及數(shù)字圖像的處理,運(yùn)動目標(biāo)的區(qū)域,提取出來的。運(yùn)動目標(biāo),視覺技術(shù)分析的第一個步驟是對運(yùn)動目標(biāo)的檢測、后續(xù)運(yùn)動的目標(biāo)跟蹤、分類、行為分析理解等;作為后續(xù)處理及分析的前提。隨著科技的不斷發(fā)展,社會上一系列安全事件頻繁發(fā)生,視頻監(jiān)控系統(tǒng)無疑是一種安全防范的手段,在諸多方面取得了廣泛應(yīng)用。然而,傳統(tǒng)的模擬和數(shù)字視頻監(jiān)控系統(tǒng)只提供了一個簡單的視頻捕捉、傳輸、存儲、再現(xiàn)等功能。對視頻中的內(nèi)容也只能靠人為判定,不能主動的向監(jiān)控者提供監(jiān)測信息。屬于視頻圖像序列內(nèi)的智能視頻監(jiān)控是從中自動對監(jiān)控目標(biāo)場景進(jìn)行實時同步分析,并且跟蹤與識別其目標(biāo),把信息反饋出來和異?,F(xiàn)象的警報等。所以,在動態(tài)目標(biāo)檢測是視頻監(jiān)控中的視頻序列的首要任務(wù)。一般背景物體的特性應(yīng)在一段時間內(nèi)固定的物體,活動物體應(yīng)該為移動或短時間出現(xiàn)的物體。但是在現(xiàn)實中,由于背景圖像的動態(tài)變化所帶來的諸多影響,運(yùn)動目標(biāo)檢測是一個非常困難的工作。

1 運(yùn)動目標(biāo)的檢測

1.1 運(yùn)動目標(biāo)的檢測是什么

運(yùn)動目標(biāo)檢測是指:變化區(qū)域中的部分圖像,從背景圖像序列中被提取出來,使之成為一個有意義的實體。運(yùn)動目標(biāo)的檢測是智能監(jiān)控中一個基礎(chǔ)但很關(guān)鍵的部分,是實現(xiàn)運(yùn)動目標(biāo)跟蹤、在識別與事件監(jiān)測的前提下,運(yùn)動目標(biāo)的分割、精確檢測都會影響到運(yùn)動目標(biāo)的分類及跟蹤;而目標(biāo)檢測的好壞將決定后續(xù)處理的效果。

1.2 視頻監(jiān)控系統(tǒng)中運(yùn)動目標(biāo)檢測流程

1.2.1 視頻監(jiān)控體系的硬件是怎樣構(gòu)成的

如今已分為,實時監(jiān)控系統(tǒng)和非實時監(jiān)控系統(tǒng)。實時監(jiān)控系統(tǒng)就是:把攝像頭裝在,需監(jiān)控的場所中合適的位置,隨時監(jiān)控該場景的景象,將其傳輸?shù)奖O(jiān)控中心,監(jiān)控中心再對信號進(jìn)行分析、判斷,由于實時的監(jiān)控系統(tǒng)其對計算機(jī)的信息處理速度要求高,故而其不能兼顧準(zhǔn)確性、實時性,所以實際的行業(yè)應(yīng)用還是無法得到大范圍推廣。非實時視頻監(jiān)控系統(tǒng)是指對已經(jīng)存在的“過去時”的視頻進(jìn)行分析和判斷,是目前視頻監(jiān)控實際應(yīng)用中的常用方法。

1.2.2 視頻監(jiān)控系統(tǒng)的處理流程是怎樣的

不管是非實時的還是實時的視頻監(jiān)控系統(tǒng),其關(guān)鍵所在都是計算機(jī)對視頻的處理。視頻監(jiān)控系統(tǒng)對視頻的處理流程主要有5個部分:1)獲取序列圖;2)圖像的預(yù)處理;3)目標(biāo)分割的提?。?)目標(biāo)的匹配跟蹤;5)目標(biāo)的行為分析。對視頻進(jìn)行處理的時,整個系統(tǒng)之基石是如何處理噪聲,處理了噪聲后,將運(yùn)動目標(biāo)從圖像中找到,提取出運(yùn)動目標(biāo)的信息,然后,計算機(jī)通過原目標(biāo)信息,與提取出運(yùn)動目標(biāo)的信息對比,最終,得到目標(biāo)的真實信息,對運(yùn)動目標(biāo)進(jìn)行檢測。

2 運(yùn)動目標(biāo)檢測技術(shù)

作為計算機(jī)視覺領(lǐng)域中,一項很重要而又很高效的研究方向——運(yùn)動目標(biāo)檢測。人們一直都在對運(yùn)動目標(biāo)檢測技術(shù)進(jìn)行研究,希望可以研究出一種適應(yīng)所有普遍場景的運(yùn)動目標(biāo)檢測技術(shù),不過因為有著復(fù)雜、多樣的監(jiān)控背景的運(yùn)動目標(biāo),可用于各行業(yè)各類監(jiān)控場景的運(yùn)動目標(biāo)檢測技術(shù)還能大范圍得到應(yīng)用和推廣。當(dāng)前只能根據(jù)特定的場景和特定少量的運(yùn)動目標(biāo)進(jìn)行智能分析,需要利用不同的檢測方法來進(jìn)行運(yùn)動目標(biāo)檢測。目前,常用的運(yùn)動目標(biāo)檢測技術(shù)有以下幾種。

2.1 光流法

光流是指:空間運(yùn)動著的物體,被觀測面上像素點(diǎn)運(yùn)動的時候,產(chǎn)生瞬時的速度場,其攜帶的信息有:動態(tài)行為及物體表面的結(jié)構(gòu)等。給圖像中各個像素點(diǎn),一個速度矢量就形成了一個圖像運(yùn)動場;其運(yùn)動時用投影將三維物體上的點(diǎn)對應(yīng)圖像上的點(diǎn),根據(jù)各個像素點(diǎn)、動態(tài)分析和速度矢量計算。這便是光流法檢測運(yùn)動目標(biāo)的基本原理。光流計算法由:基于頻域的、匹配的及梯度的光流計算法所組成。

2.1.1 基于頻域的光流計算法

基于頻域的光流計算法是利用速度可調(diào)的濾波組輸出頻率或相應(yīng)的信息,可以獲得高精度的初始光流估計;但其計算非常復(fù)雜也很難進(jìn)行可靠性的評價。

2.1.2 基于匹配的光流計算法

基于匹配的光流計算法又分為基于特征和區(qū)域兩種方法。前者是通過對目標(biāo)的主要特征進(jìn)行實時監(jiān)控,不斷進(jìn)行定位和跟蹤,對大目標(biāo)的運(yùn)動和亮度變化的監(jiān)測具有較好的效果,但由于光流的稀疏性使得對特征的提取和匹配難度較大,精確度不高。基于區(qū)域的方法是指:通過對相似區(qū)域進(jìn)行的定位以及位移計算光流,此法在視頻編碼中有著上佳效果;不過光流稠密性的計算上仍然存在問題。

2.1.3 基于梯度的光流計算法

基于梯度的光流計算法是利用圖像序列的時空微分來計算光流,它的計算方法簡單,而且在早期的試驗中取得較好的效果,因此目前在廣泛的研究中,但由于在選擇計算光流時需要的可調(diào)參數(shù)的人工選取和可靠性評價因子上比較困難,即使基于梯度的計算方法雖然在光流估計上取得好的實驗效果,但在利用其對目標(biāo)進(jìn)行檢測與自動跟蹤上仍存在問題。

基于光流場,分析的運(yùn)動目標(biāo)之檢測方法是根據(jù):各個光流矢量中所包含的各個像素之動態(tài)的信息,精確的計算出運(yùn)動目標(biāo)之速度,且還能檢測出,運(yùn)動目標(biāo)運(yùn)動。不過噪聲會影響到光流矢量。所以光流不是單一的,且此法采用的是計算量很大的求解計算,要實時檢測運(yùn)動目標(biāo),需有特殊的硬件支持。所以其多適用于目標(biāo)運(yùn)動速度和圖像噪聲均較小的場合。

2.2 背景差值的方法

背景差值的方法是指:常用的運(yùn)動目標(biāo)檢測法,運(yùn)用于靜態(tài)背景下的運(yùn)動目標(biāo)檢測。背景差值法的原理是將前幀圖像和已有的背景模型圖像做差,得到的不同部分就作為運(yùn)動目標(biāo)的信息。此法的基礎(chǔ)是構(gòu)造背景模型,常用的背景建模算法是高斯背景建模算法,而且這種算法還可以進(jìn)行實時更新。背景差值法的優(yōu)點(diǎn)是可以提取出運(yùn)動目標(biāo)的完整信息;但視頻監(jiān)控中的場景是真實的場景,會受到很多外在因素環(huán)節(jié)的影響,比如天氣影響、以及噪聲影響等等,這些因素都會影響到運(yùn)動目標(biāo)的信息提取,有時甚至?xí)划?dāng)成運(yùn)動目標(biāo)的信息被提取出來,所以當(dāng)使用此法時需二次處理才能適用于視頻監(jiān)控系統(tǒng)當(dāng)中,從而確能保證檢測的效果。

2.3 幀間差分法

幀間差分法是通過對連續(xù)兩幀或多幀的視頻圖像進(jìn)行相減來得到差分圖像,在差分圖像上檢測運(yùn)動變化的區(qū)域,再用區(qū)域上的灰度信息恢復(fù)之前的運(yùn)動目標(biāo)。此法是,在運(yùn)動目標(biāo)的檢測中,用得最多的算法之一。計算簡單、檢測目標(biāo)速度快、自適應(yīng)性較強(qiáng)、易于實現(xiàn),是幀間差分法,在檢測運(yùn)動目標(biāo)中的優(yōu)點(diǎn)。但缺點(diǎn)是不能檢測到完整的目標(biāo),不能對目標(biāo)進(jìn)行深入分析和識別,增加后續(xù)處理的難度,容易空洞運(yùn)動實體內(nèi)部所產(chǎn)生的現(xiàn)象。

2.4 運(yùn)動的能量法

運(yùn)動的能量法是指:把連續(xù)圖像看成三維空間并計算空時梯度。運(yùn)動的對象經(jīng)過的位置像素空時梯度的一致性越高,梯度的能量就越大;因此可用來檢測運(yùn)動目標(biāo)。此法可以突出相同方向運(yùn)動的對象,從而有效消除振動、非需的像素點(diǎn),適合于復(fù)雜監(jiān)控環(huán)境。不過此法不能準(zhǔn)確分割對象,方法非常復(fù)雜,實現(xiàn)難度很大。

2.5 人工的神經(jīng)網(wǎng)絡(luò)

當(dāng)前,在運(yùn)動目標(biāo)的檢測中,基于發(fā)展很快的是人工神經(jīng)網(wǎng)絡(luò)的方法,這種方法通過將每幀圖像分成圖像塊,預(yù)處理圖像塊后將影像投到線性濾波器組,得到圖像模式,再把圖像分類,最后判斷運(yùn)動目標(biāo)是哪個圖像模式中的,這種方法可以識別出尺度和旋轉(zhuǎn)變形的目標(biāo),獲得的效果較好。

3 結(jié)束語

智能視頻監(jiān)控中的運(yùn)動目標(biāo)檢測是智能視頻監(jiān)控技術(shù)中的一項核心技術(shù),而隨著社會生活和生產(chǎn)的進(jìn)步和發(fā)展,人們對視頻監(jiān)控將會提出更高的要求,智能視頻監(jiān)控將會在人們的生產(chǎn)和生活中運(yùn)用的越來越廣泛,作為核心技術(shù)之一的運(yùn)動目標(biāo)檢測技術(shù)將會得到越來越多的關(guān)注。因此,應(yīng)加強(qiáng)對運(yùn)動目標(biāo)檢測技術(shù)的研究和運(yùn)用,促進(jìn)其技術(shù)的完善和發(fā)展,從而推動智能視頻監(jiān)控的廣泛運(yùn)用,推動社會和諧和生活品質(zhì)的提高。

參考文獻(xiàn)

[1]張正友,馬頌德.計算機(jī)視覺[M].北京:科學(xué)出版社,2001:53-59.

[2]代科學(xué),李國輝,涂丹,袁見.監(jiān)控視頻運(yùn)動目標(biāo)檢測背景技術(shù)的究現(xiàn)狀和展望[J].中國圖像圖形學(xué)報,2006,11(7):919,927.

[3]李宏,楊延梧,任樸舟,等.基于光流技術(shù)的復(fù)雜背景下運(yùn)動目標(biāo)跟蹤[J].光電工程,2006(10):13-17.

[4]萬衛(wèi)兵,霍宏,趙宇明.智能視頻監(jiān)控中目標(biāo)檢測與識別[M].上海:上海交通大學(xué)出版社,2009.

第7篇:計算機(jī)視覺前沿方向范文

[關(guān)鍵詞]物聯(lián)網(wǎng) 智能視頻技術(shù) 現(xiàn)狀和分析

中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-914X(2016)05-0358-01

引言

視頻監(jiān)控是物聯(lián)網(wǎng)中的重要組成部分。在以往的安防行業(yè)中視頻監(jiān)控只是其一個重要的應(yīng)用領(lǐng)域,并沒有將系統(tǒng)、互聯(lián)網(wǎng)這些概念摻雜其中。而隨著我國經(jīng)濟(jì)的不斷發(fā)展,越來越多的領(lǐng)域需要視頻監(jiān)控,從而也將視頻監(jiān)控原本只是安防行業(yè)的傳統(tǒng)狹窄領(lǐng)域給打破,越來越多的新需求也在物聯(lián)網(wǎng)的背景下被人們所提出來。信息的采集點(diǎn)是攝像頭的本質(zhì),而編碼設(shè)備的本質(zhì)則在于數(shù)字信息化的變化,而將攝像頭和編碼設(shè)備進(jìn)行有效的結(jié)合,也就形成的第一步功能的物聯(lián)網(wǎng)。而隨著第一步功能的完成接下來就是全面的IT化互聯(lián)網(wǎng)化,也就是對架構(gòu)、系統(tǒng)以及技術(shù)的IP化[1]。在當(dāng)下物聯(lián)網(wǎng)的趨勢和背景下,有效的結(jié)合IT和安防是必須要做的工作,因此,聯(lián)網(wǎng)對于監(jiān)控來說也是必不可少的。

1.物聯(lián)網(wǎng)中智能視頻的作用和發(fā)展現(xiàn)狀

1.1 智能視頻的發(fā)展作用

隨著我國科技的不斷發(fā)展,全數(shù)字化時代已經(jīng)在視頻監(jiān)控中得到全面使用,也就是當(dāng)下視頻監(jiān)控系統(tǒng)的網(wǎng)絡(luò)化,它是通過標(biāo)準(zhǔn)的TCP/IP協(xié)議而建立的,因此它又叫做IP監(jiān)控系統(tǒng),是在2001年被發(fā)明并使用的。視頻監(jiān)控的數(shù)字化的優(yōu)點(diǎn)就在于可以使模擬閉路電視監(jiān)控的局限性得到很好的解決,例如可以在計算機(jī)網(wǎng)絡(luò)上不受距離限制的傳輸數(shù)字化視頻的圖像數(shù)據(jù),而且也不會干擾到傳輸信號,使圖像的品質(zhì)和穩(wěn)定性得到大幅度的提升;視頻監(jiān)控的數(shù)字化可以很好的運(yùn)用計算機(jī)網(wǎng)絡(luò)進(jìn)行聯(lián)網(wǎng),可以重復(fù)使用網(wǎng)絡(luò)寬帶,而且對于網(wǎng)線的布置上也可以不用重新布置;數(shù)字化存儲功能也得以實現(xiàn),通過對視頻數(shù)據(jù)的壓縮處理,使其可以有效的在磁盤陣列中得到存儲或者在光盤中得以保存,從而更加方便快捷的進(jìn)行數(shù)據(jù)查詢[2]。

在智能化方面,目前的視頻監(jiān)控系統(tǒng)都試圖對攝像機(jī)采集的視頻信息上運(yùn)用計算機(jī)視覺技術(shù)來進(jìn)行理解、分析和處理,過濾和排除掉一些無關(guān)緊要的信息,報告給監(jiān)控人員處理的都是一些提取出的有用信息,從而讓預(yù)警、防范以及主動監(jiān)測等功能得到實現(xiàn),進(jìn)而使代替人來進(jìn)行監(jiān)控任務(wù)的目的得以實現(xiàn)。

1.2 智能視頻技術(shù)的應(yīng)用領(lǐng)域

目前,智能視頻技術(shù)已經(jīng)得到了廣泛的應(yīng)用,很多行業(yè)都開始依賴智能視頻技術(shù)來促進(jìn)行業(yè)的發(fā)展。例如,(1)高級視頻的移動偵測:在雨雪或者大風(fēng)、大霧等復(fù)雜環(huán)境中,可以對一個或者多個物體的動作方向、運(yùn)動特征等一系列的運(yùn)動情況做到精準(zhǔn)的偵測和識別。(2)物體追蹤:在對移動物體偵測到后,可以結(jié)合物體的運(yùn)動狀況自動的進(jìn)行控制指令的發(fā)送,從而使的攝像機(jī)可以對物體進(jìn)行自動跟蹤,而當(dāng)跟蹤物體超出跟蹤范圍后還能自動的對物體所在區(qū)域的攝像機(jī)發(fā)出通知,從而讓物體區(qū)域的攝像機(jī)進(jìn)行再次跟蹤和監(jiān)控。(3)識別任務(wù)的面部:通過對任務(wù)的面部特征進(jìn)行識別,將人物的面部特征和數(shù)據(jù)庫進(jìn)行對比,從而對人物的身份進(jìn)行識別和驗證。這種面部識別主要分為兩種,一種是需要人物在攝像機(jī)面前停留一段時間,在一些門禁系統(tǒng)中比較普遍,還有一種是在一群人中對一些特定的個體進(jìn)行識別,這種在機(jī)場、火車站等安防工作中的運(yùn)用比較普遍。除此之外還有很多地方都得到了廣泛的應(yīng)用,如通過對車輛的形狀等信息進(jìn)行識別、對交通流量進(jìn)行控制等[3]。

2.智能視頻監(jiān)控技術(shù)的技術(shù)介紹

所謂的運(yùn)動目標(biāo)檢測是從視頻序列的圖像中將目標(biāo)物體所在區(qū)域給分離出來。在對目標(biāo)物體進(jìn)行正確檢測盒識別的基礎(chǔ)上進(jìn)行后續(xù)工作中的運(yùn)動目標(biāo)提取、跟蹤以及行為理解??梢哉f視頻監(jiān)控中運(yùn)動目標(biāo)的檢測是前導(dǎo)工作。在運(yùn)動目標(biāo)的檢測中主要分為兩種檢測,分別是背景檢測和目標(biāo)檢測。

當(dāng)下的背景檢測方法主要有四種:背景模型法、背景統(tǒng)計法、卡爾曼濾波法以及Surendra背景更新算法。背景模型法是建立各個像素點(diǎn)的統(tǒng)計模型,通過對像素點(diǎn)的灰度分別來找出最為符合的概率分布,例如非參數(shù)化模型。背景統(tǒng)計法是對像素點(diǎn)的灰度進(jìn)行統(tǒng)計,在結(jié)合其平均值估計背景點(diǎn)的灰度,對劇烈變化的部分進(jìn)行過濾??柭鼮V波法是通過將灰度的時間序列看成具有噪音的觀測值,結(jié)合時域遞歸低通濾波對緩變的實際圖像進(jìn)行估計[4]。Surendra背景更新算法是對偵察圖像進(jìn)行計算,得出物體運(yùn)動的區(qū)域,保持區(qū)域的背景的不變,更新非運(yùn)動區(qū)域,從而估計背景圖像。

目標(biāo)檢測算法中光流法、幀間差分法以及背景減法最為常用。光流法是對運(yùn)動目標(biāo)的光流特點(diǎn),通過對光流場進(jìn)行計算,從而進(jìn)行運(yùn)動目標(biāo)的提取。這種方法在計算上較為復(fù)雜,且耗時比較長,對一些實時性檢測很難滿足。幀間差分法對相鄰兩個圖像灰度值存在的差異進(jìn)行對比進(jìn)行運(yùn)動目標(biāo)的提取。這種方法在計算上較為簡單,也能很好的感應(yīng)到運(yùn)動物體區(qū)域的變化,但是會拉伸檢測出的物體運(yùn)動方向,不能明確的確定運(yùn)動目標(biāo)位置,還會去除掉部分運(yùn)動目標(biāo)的信息數(shù)據(jù),使得運(yùn)動目標(biāo)不能被完整的提取出來。背景減法對當(dāng)前的幀圖像與背景圖像之間的數(shù)據(jù)進(jìn)行相減,若某個像素點(diǎn)比域值要大,則這個點(diǎn)出現(xiàn)在運(yùn)動目標(biāo)上,目標(biāo)的位置、形狀以及大小等信息都通過相減的結(jié)果而確定。這種方法可以很好的估計和更新出背景,卻對運(yùn)動物體的定位也非常的精準(zhǔn),但是對一些變化的光照以及環(huán)境非常的敏感[5]。

3.總結(jié)

總而言之,物聯(lián)網(wǎng)實現(xiàn)智能交通、智能安防、智能監(jiān)控以及一些其他智能化控制的方法就是物體和物體之間相連的龐大網(wǎng)絡(luò)。在物聯(lián)網(wǎng)中最早得到應(yīng)用的重要技術(shù)之一就是智能視頻監(jiān)控。因此,物聯(lián)網(wǎng)能夠直接影響到職能視頻監(jiān)控的發(fā)展。智能視覺監(jiān)控技術(shù)所涉及到的諸多領(lǐng)域的研究,屬于綜合性跨學(xué)科問題,是非常具有挑戰(zhàn)性的一種前沿課題。當(dāng)下,對智能視頻技術(shù)的相關(guān)研究依舊還存在于探索和研究的一個階段,需要大量的工作才能真正的使監(jiān)控技術(shù)的智能化得以實現(xiàn)。

參考文獻(xiàn)

[1] 李萬才.物聯(lián)網(wǎng)中智能視頻技術(shù)的現(xiàn)狀與分析[J].警察技術(shù),2010,06:8-10.

[2] 沈沛意,楊剛,張亮,肖瀟,張小平,常啟鵬,于公.物聯(lián)網(wǎng)的智能視頻接入終端――高清晰智能相機(jī)的研制與應(yīng)用[J].物聯(lián)網(wǎng)技術(shù),2011,03:41-45.

[3] 朱方,吳莉,陳飛凌,袁衛(wèi)忠.智能視頻監(jiān)控終端在物聯(lián)網(wǎng)中的應(yīng)用和發(fā)展研究[J].中國電子科學(xué)研究院學(xué)報,2011,06:561-566.

[4] 奚吉,蔣銀忠.基于物聯(lián)網(wǎng)和視頻分析技術(shù)的監(jiān)獄智能監(jiān)控系統(tǒng)[J].電子器件,2014,06:1183-1188.

[5] 雷玉堂.淺析幾種視頻異常事件的智能視頻分析技術(shù)與方法[J].中國公共安全,2013,12:129-132+134-136+138+140.

第8篇:計算機(jī)視覺前沿方向范文

關(guān)鍵詞: 自動化; 發(fā)展; 應(yīng)用

Abstract: The emergence, development and application of automation technology in mechanical manufacture design, the introduction of artificial intelligence technology is introduced in this paper.

Key words: automation; development; application

中圖分類號: TP317 文獻(xiàn)標(biāo)識碼: A文章編號:

1 自動化的基本概念

何謂“自動化”? 簡單地說,自動化就是在無人的情況下,用各種傳感器執(zhí)行控制功能。它始于人們用機(jī)器實現(xiàn)按固定程序自動進(jìn)行的各種操作,把人類從笨重、單調(diào)、重復(fù)性的勞動中解放出來。但僅僅如此是不夠的,要進(jìn)一步解放人力就要求機(jī)器不斷提高在不確定或變化的環(huán)境中自動保持必要的功能以達(dá)到預(yù)定目標(biāo)的能力。因此,自動化系統(tǒng)必須是開放和可控的,不斷從外界環(huán)境中獲取信息并進(jìn)行必要的分析、處理、判斷、決策、調(diào)整和控制。自動化技術(shù)研究的是如何通過各種技術(shù)工具和系統(tǒng)( 包括計算機(jī)) 延伸人的信息獲取、處理和決策控制的功能,從而更好地進(jìn)行生產(chǎn)和生活,以提高勞動生產(chǎn)率和生活質(zhì)量。

2 自動化技術(shù)的發(fā)展

具有低層次“自動化”功能的裝置古已有之。我國古代的木牛流馬、指南車、銅壺滴漏,歐洲的鐘表報時裝置和一些手工機(jī)械,無一不反映出人類追求自動化的聰明才智。但真正刻意設(shè)計出來取代或增強(qiáng)人的智能,從而能在不確定的條件下保證實現(xiàn)預(yù)定目標(biāo)的自動裝置最早應(yīng)屬木制水輪灌溉系統(tǒng)。其后瓦特發(fā)明的蒸汽機(jī)的離心調(diào)速器,也自覺地運(yùn)用了自動原理,從而能在鍋爐壓力和負(fù)荷變化的條件下把轉(zhuǎn)速保持在一定的范圍。20 世紀(jì)20 年代,電子信息技術(shù)的發(fā)展提供了信息反饋和隨機(jī)處理的各種強(qiáng)有力手段,使得自動控制和信息處理技術(shù)有了質(zhì)的飛躍,并逐漸形成了一門新興學(xué)科- 自動化。到了五六十年代,數(shù)字計算機(jī)廣泛的應(yīng)用大大提高了進(jìn)行復(fù)雜數(shù)值計算和簡單邏輯判斷的能力,使得自動化技術(shù)真正應(yīng)用于從工業(yè)生產(chǎn)到航空航天的各個領(lǐng)域。錢學(xué)森的“控制論”在此基礎(chǔ)上應(yīng)運(yùn)而生,從而為人類自覺地實現(xiàn)自動化奠定了理論基礎(chǔ)。但由于當(dāng)時的“老式”計算機(jī)體積龐大功能不全,所以一些較為復(fù)雜的問題,仍然不能得到很好的解決。七八十年代以來,芯片集成技術(shù)飛速提升,使計算機(jī)擁有了更加全面的功能: 可以高速地對圖象、聲音等各種信息進(jìn)行存取和運(yùn)算,可以對數(shù)據(jù)和符號進(jìn)行定性、模糊的推理和判斷,可以容許局部出現(xiàn)錯誤或故障而保持整體的優(yōu)良性能。人們可以在這些計算機(jī)中存入“專家知識”,使它更善于處理未曾遇到過的問題,例如火星探測車,從而滿足人類無法身臨其境實現(xiàn)的更高要求。總之,自動化進(jìn)一步深入發(fā)展和其它一些學(xué)科發(fā)展的相互作用,將徹底改變?nèi)祟惖纳a(chǎn)結(jié)構(gòu)體系和生活質(zhì)量體系,成為影響未來社會進(jìn)程最具影響力的

前沿科學(xué)。

3 自動化技術(shù)的內(nèi)容及應(yīng)用

自動化技術(shù)的內(nèi)容按其理論歸納、技術(shù)手段和處理對象的不同,可以大致劃分為控制理論、工程系統(tǒng)與控制、系統(tǒng)科學(xué)與系統(tǒng)工程、模式信息處理、智能系統(tǒng)與知識工程,以及機(jī)器人學(xué)和機(jī)器人技術(shù)六大部分。

3. 1 控制理論

控制理論研究的是根據(jù)被控對象和所處環(huán)境的特性,能動地運(yùn)用信息施加控制作用而使系統(tǒng)正常運(yùn)行并達(dá)到預(yù)定的功能??刂评碚摓榻鉀Q當(dāng)今社會的許多挑戰(zhàn)性問題發(fā)揮了重大作用,提供了科學(xué)的思想方法論,這是人類實現(xiàn)自動化的理論基礎(chǔ)。

3. 2 工程系統(tǒng)與控制

工程系統(tǒng)與控制技術(shù)是研究各種工程系統(tǒng)控制和設(shè)計的問題。從單一的自動控制裝置到一個生產(chǎn)( 生活) 過程的自動化,直到整個工廠、企業(yè)的控制、管理和經(jīng)營決策一體化,都是其研究的內(nèi)容。工程系統(tǒng)與控制技術(shù)廣泛應(yīng)用于生產(chǎn)的各個領(lǐng)域。其中最具影響力的、發(fā)展前景最為可觀的當(dāng)屬現(xiàn)代集成運(yùn)行系統(tǒng)。從最廣的意義說,可以包括從企業(yè)長遠(yuǎn)規(guī)劃、市場分析、研發(fā)策略、產(chǎn)品規(guī)劃、設(shè)計投產(chǎn)、資源分配,到全系統(tǒng)的具體計劃調(diào)度、生產(chǎn)活動的全程監(jiān)控、質(zhì)量控制、產(chǎn)品檢驗,直到銷售服務(wù)、市場反饋等整個企業(yè)經(jīng)營的全過程。這樣一種全盤、綜合自動化的生產(chǎn)過程可以使企業(yè)以更高效高質(zhì)的服務(wù)更好地滿足市場需求,提高企業(yè)效益,增強(qiáng)企業(yè)的市場競爭力。航天工程和具有世界先進(jìn)水平的中國高速鐵路運(yùn)行客車是這一現(xiàn)代集成運(yùn)行系統(tǒng)的最好典范。

3. 3 系統(tǒng)科學(xué)與系統(tǒng)工程

系統(tǒng)科學(xué)研究的是在最一般意義下,由相互作用、相互聯(lián)系的事物按一定結(jié)構(gòu)組成并具有某種總體功能的各種系統(tǒng)的運(yùn)動規(guī)律、行為特征以及如何進(jìn)行設(shè)計和控制的問題。它主要應(yīng)用了運(yùn)籌學(xué)、控制論、信息論等多個學(xué)科分支,成為自動化學(xué)科的一個重要研究領(lǐng)域并得到蓬勃的發(fā)展。數(shù)控機(jī)床、無人飛機(jī)、探測月球、火星的工程車是這一工程的杰出代表。

3. 4 模式信息處理

模式識別,亦稱模式信息處理,其本來意義是研究用計算機(jī)對一般由人類感覺器官接受的圖象、文字、語音等模式信息進(jìn)行處理、描述和分類的學(xué)科。模式識別也可泛指任何對一般事物抽取概念特征進(jìn)行判斷和分類的過程。模式識別的應(yīng)用方向包括計算機(jī)視覺,文字、文本識別,語音識別和理解等多個領(lǐng)域。中國在模式識別領(lǐng)域正處于世界領(lǐng)先地位,許多中國學(xué)者都為此做出了重要貢獻(xiàn)。自動翻譯系統(tǒng),自動識別系統(tǒng)顯示了這一技術(shù)廣闊發(fā)展遠(yuǎn)景。

3. 5 人工智能

人工智能研究的主要是如何用機(jī)器模仿人類智能活動的某些方面,延伸人腦功能的問題?,F(xiàn)代科學(xué)技術(shù)的迅速發(fā)展和重大進(jìn)步,已經(jīng)對控制和系統(tǒng)科學(xué)提出了新的更高的要求,自動化控制理論正面臨著新的發(fā)展機(jī)遇和嚴(yán)峻挑戰(zhàn)。傳統(tǒng)控制理論在解決一些具有不確定性、難以構(gòu)建精確數(shù)學(xué)模型、復(fù)雜多變的問題上遇到了不少難題。這就需要建造出這樣的機(jī)器,使它在復(fù)雜多變的環(huán)境中,能夠?qū)崟r應(yīng)變,靈活判斷、迅速決策以實現(xiàn)更高層次的自動化系統(tǒng)智能控制。簡單地說,自動控制的最高要求就是實現(xiàn)控制系統(tǒng)的智能化。人工智能作為一個前沿科學(xué),發(fā)展極為迅速,最具影響力的分支有“知識表達(dá)”的專家系統(tǒng)和“簡單處理器的復(fù)雜系統(tǒng)”———人工神經(jīng)元網(wǎng)絡(luò)。這些領(lǐng)域不僅具有深刻的認(rèn)識論意義,而且在自動控制、信息處理以及將計算機(jī)用于判斷決策和問題求解的應(yīng)用領(lǐng)域里都得到了廣泛的應(yīng)用,人、機(jī)象棋對決,而象棋大師屢屢敗北顯示了這一技術(shù)的巨大的生命力。各種自動運(yùn)行中的車輛、農(nóng)業(yè)機(jī)械、飛機(jī)、艦船等都是這一技術(shù)應(yīng)用的主要領(lǐng)域。它也是徹底代替人工完成各種復(fù)雜技能的主要工具。

3. 6 機(jī)器人學(xué)與機(jī)器人技術(shù)

機(jī)器人學(xué)與機(jī)器人技術(shù)是一類特殊的自動化機(jī)器,它具有與人的四肢相比擬的運(yùn)動機(jī)構(gòu),接受視覺、聽覺、觸覺等傳感信息,在中央處理器( 相當(dāng)于人腦) 的指揮下完成各種操作功能。機(jī)器人不僅可以把人類從惡劣條件、繁重單調(diào)的作業(yè)中解放出來,而且在力量、精度和速度,以及在特殊環(huán)境下生存和工作能力各方面都有人類無法替代的優(yōu)點(diǎn)。正因如此,機(jī)器人技術(shù)在工業(yè)、農(nóng)業(yè)、國防和科學(xué)實驗中得到了日益廣泛的應(yīng)用,并且有力地推動了相關(guān)學(xué)科和技術(shù)領(lǐng)域的發(fā)展,從而使它成為現(xiàn)代自動化學(xué)科中一個活躍而富有魅力的研究領(lǐng)域。戰(zhàn)場上的機(jī)器人、惡劣環(huán)境中作業(yè)的機(jī)器人是將人類從各個危險領(lǐng)域中徹底解放出來的主要替代者。

第9篇:計算機(jī)視覺前沿方向范文

【關(guān)鍵詞】智能時代;云計算;安全架構(gòu)

一、前言

當(dāng)今世界,新一輪的科技革命和產(chǎn)業(yè)變革正在持續(xù)深入,工業(yè)互聯(lián)網(wǎng)、智能制造、人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等領(lǐng)域正在加速布局,“智能時代”企業(yè)信息系統(tǒng)最顯著的變化是虛擬化、數(shù)字化一切、軟件定義,促使企業(yè)信息化的不斷發(fā)展,公司信息化資產(chǎn)數(shù)量日趨增多、系統(tǒng)的關(guān)聯(lián)性和復(fù)雜度不斷增強(qiáng),使企業(yè)信息安全形勢日益嚴(yán)峻,信息安全防護(hù)工作面臨前所未有的困難和挑戰(zhàn)。為了更好監(jiān)控和保障信息系統(tǒng)運(yùn)行,及時識別和防范安全風(fēng)險,同時滿足國家和行業(yè)監(jiān)管要求,保證信息安全管理工作的依法合規(guī),企業(yè)亟需建立一個全數(shù)據(jù)、集中管理的企業(yè)安全平臺,做到事前預(yù)警、事中監(jiān)控、事后分析以及響應(yīng),全面的提升信息安全管理與防護(hù)水平。

二、智能時代的變化趨勢

我們正處在一個變革的時刻,“智能”是這個時代最顯著的標(biāo)志。在今年春天首屆世界智能大會上馬云提出,智能時代有三個最主要的要素:互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算;李彥宏也指出,未來30年推動社會進(jìn)步的動力,就是智能科技的進(jìn)步;浪潮董事長孫丕恕表示,智能從實現(xiàn)形式上就是要通過物聯(lián)網(wǎng)、互聯(lián)網(wǎng)將企業(yè)生產(chǎn)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)和企業(yè)自身的管理數(shù)據(jù)全部打通,實現(xiàn)無邊界信息流和大數(shù)據(jù)分析。由此看來,一個企業(yè)走向智能化首先要完成業(yè)務(wù)在線化和流程服務(wù)軟件化,然后完成應(yīng)用軟件的SaaS(Software-as-a-Service)化,從而助企業(yè)實現(xiàn)智能生產(chǎn)、智能維護(hù)、智慧服務(wù)。1.安全技術(shù)的變化基于云計算、虛擬化、大數(shù)據(jù)、智能制造、移動辦公的持續(xù)推進(jìn),都是基于企業(yè)信息基礎(chǔ)架構(gòu)所實施的,開放式計算環(huán)境和更靈活的支持架構(gòu),要求安全技術(shù)隨之匹配發(fā)展,才能適應(yīng)新環(huán)境,新技術(shù)下的安全需求。中國工程院倪光南院士在《云安全的思考》主題演講中指出,云安全一定會呈現(xiàn)出多維度、多層次、跨領(lǐng)域、多學(xué)科技術(shù)交叉等方面的特征。對于云計算的安全保護(hù),需要一個完備體系,從技術(shù)、監(jiān)管、法律三個層面上,形成可感知、可預(yù)防的智能云安全體系。2.企業(yè)智能架構(gòu)從應(yīng)用架構(gòu)上看,未來的應(yīng)用都是角色化、場景化的,可連接互聯(lián)網(wǎng)資源,全員應(yīng)用,實現(xiàn)移動化和智能化。虛擬化、數(shù)字化一切、軟件定義促使企業(yè)信息架構(gòu)的變革,以業(yè)務(wù)為導(dǎo)向和驅(qū)動,在企業(yè)管理、集成等方向上提供基礎(chǔ)共性平臺,為企業(yè)快速構(gòu)建和集成應(yīng)用軟件提供基礎(chǔ)支持,從而實現(xiàn)工程經(jīng)驗?zāi)K化、產(chǎn)品實際協(xié)同化、項目流程一體化結(jié)構(gòu),實現(xiàn)由統(tǒng)一業(yè)務(wù)層、統(tǒng)一界面構(gòu)架層、應(yīng)用系統(tǒng)層、統(tǒng)一工作臺面、大數(shù)據(jù)分析、云計算層組成的一種新模式。在企業(yè)IT系統(tǒng)的業(yè)務(wù)基礎(chǔ)機(jī)構(gòu)層面,引入先進(jìn)的統(tǒng)一軟件平臺,為上層應(yīng)用開發(fā)提供統(tǒng)一標(biāo)準(zhǔn),接口和規(guī)范,同時基于“平臺+組件”的架構(gòu)實現(xiàn)各類應(yīng)用的組合和復(fù)用,助企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型。3.云架構(gòu)在人工智能一日千里的時代,云計算已成為產(chǎn)業(yè)革新的原動力、新型管理的主平臺、人工智能的強(qiáng)載體。在新的云時代,整個社會都在發(fā)生數(shù)字化的迭代。云成為數(shù)字化最重要的基礎(chǔ)架構(gòu)。騰訊董事局主席兼首席執(zhí)行官馬化騰指出:“用云量將成為一個重要的經(jīng)濟(jì)指標(biāo),能夠衡量一個行業(yè)數(shù)字經(jīng)濟(jì)發(fā)展程度。”他還表示:“傳統(tǒng)企業(yè)的未來就是在云端用人工智能處理大數(shù)據(jù)。”“云+AI”是當(dāng)前最主流的方向,其核心包括三項核心能力(計算機(jī)視覺、智能語音識別、自然語言處理)。在計算機(jī)視覺領(lǐng)域?qū)崿F(xiàn)開放OCR識別、人臉核身、圖片處理等多項智能云服務(wù);在智能語音識別領(lǐng)域?qū)崿F(xiàn)語音轉(zhuǎn)文字、語音合成、聲紋識別、情緒識別等功能;在自然語言處理領(lǐng)域,以“數(shù)據(jù)+算法+系統(tǒng)”為核心,提供毫秒級響應(yīng)的個性化服務(wù)。

三、企業(yè)信息安全措施

VMware首席執(zhí)行官帕特•基辛格表示:“抵御安全攻擊,響應(yīng)速度不是核心,而是如何將支離破碎的安全保護(hù)進(jìn)行更有效的整合,實現(xiàn)安全架構(gòu)的簡化,這才是企業(yè)安全轉(zhuǎn)型的關(guān)鍵?!卑踩夹g(shù)在智能時代必須跟上發(fā)展的變化,“智慧安全”的理念正在深入,著力點(diǎn)從網(wǎng)絡(luò)系統(tǒng)安全、數(shù)據(jù)安全深入到業(yè)務(wù)應(yīng)用安全等各個層面,AI防火墻、態(tài)勢感知平臺、云安全產(chǎn)品、企業(yè)移動化信息安全管理平臺、智慧眼監(jiān)控雷達(dá)、業(yè)務(wù)應(yīng)用安全審計平臺成為保護(hù)企業(yè)信息安全的前沿技術(shù)。1.企業(yè)數(shù)據(jù)的安全阿里巴巴董事局主席馬云說:“數(shù)據(jù)是新能源?!彪S著數(shù)據(jù)量的持續(xù)增長,應(yīng)用數(shù)量不斷增加,數(shù)據(jù)將成為社會創(chuàng)新的重要驅(qū)動力。隨著“網(wǎng)絡(luò)強(qiáng)國戰(zhàn)略”、“互聯(lián)網(wǎng)+”行動計劃、大數(shù)據(jù)戰(zhàn)略的推進(jìn),網(wǎng)絡(luò)安全風(fēng)險和威脅也進(jìn)入到企業(yè):非對稱的業(yè)務(wù)流量、定制化的應(yīng)用程序、需要被路由到計算層之外并達(dá)到數(shù)據(jù)中心周邊的高流量數(shù)據(jù)、跨多個虛擬化應(yīng)用,以及地理上分散的移動應(yīng)用,都造成數(shù)據(jù)泄露的機(jī)會,隨著中央網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組的成立,信息安全已上升到國家安全層面。因此數(shù)據(jù)保護(hù)十分重要,最好的選擇是本源的防護(hù),既做到保護(hù)數(shù)據(jù)本源的同時,又能靈活應(yīng)對各種安全環(huán)境的需求。而符合這種要求的安全技術(shù)就是基于專業(yè)的安全分析模型和大數(shù)據(jù)管理工具,可準(zhǔn)確、高效地感知整個網(wǎng)絡(luò)的安全狀態(tài)以及變化趨勢,通過企業(yè)本地部署安全大數(shù)據(jù)分析平臺,打通云端情報與本地設(shè)備的聯(lián)動,形成情報觸發(fā)預(yù)警,預(yù)警觸發(fā)防護(hù)的閉環(huán)。對外部的攻擊與危害行為可以及時的發(fā)現(xiàn),并采取相應(yīng)的響應(yīng)措施,保障企業(yè)信息系統(tǒng)安全。2.企業(yè)網(wǎng)絡(luò)安全2016年,在“4.19講話”中再一次強(qiáng)調(diào)網(wǎng)絡(luò)安全建設(shè)的重要性,并提出:“要樹立正確的網(wǎng)絡(luò)安全觀,加快構(gòu)建關(guān)鍵信息基礎(chǔ)設(shè)施安全保障體系,全天候全方位感知網(wǎng)絡(luò)安全態(tài)勢,增強(qiáng)網(wǎng)絡(luò)安全防御能力和威懾能力,要加快網(wǎng)絡(luò)立法進(jìn)程,完善依法監(jiān)管措施,化解網(wǎng)絡(luò)風(fēng)險。此外根據(jù)網(wǎng)絡(luò)安全法相關(guān)規(guī)定,我們也可以看出,網(wǎng)絡(luò)安全法在原有信息系統(tǒng)安全等級保護(hù)制度的基礎(chǔ)上,創(chuàng)新了網(wǎng)絡(luò)安全等級保護(hù)的工作方法,企業(yè)的信息安全建設(shè)需在原有信息系統(tǒng)安全等級保護(hù)制度建設(shè)的基礎(chǔ)上,將新技術(shù)新應(yīng)用帶來的重要信息系統(tǒng)建設(shè)諸如云計算、移動互聯(lián)、物聯(lián)網(wǎng)、工業(yè)控制、大數(shù)據(jù)等領(lǐng)域的國家關(guān)鍵信息基礎(chǔ)設(shè)施建設(shè)都納入國家安全等級保護(hù)制度進(jìn)行管理,將風(fēng)險評估、安全監(jiān)測、通報預(yù)警、應(yīng)急演練、災(zāi)難備份、自主可控等重點(diǎn)措施也納入了國家網(wǎng)絡(luò)安全等級保護(hù)制度的管理范疇。企業(yè)緊跟網(wǎng)絡(luò)技術(shù)的發(fā)展,以“智慧安全2.0戰(zhàn)略”為指導(dǎo),將“智慧安全”的核心從網(wǎng)絡(luò)系統(tǒng)安全、數(shù)據(jù)安全深入到業(yè)務(wù)應(yīng)用安全等各個層面?,F(xiàn)在已可以采用AI、機(jī)器學(xué)習(xí)、行為分析等技術(shù)手段進(jìn)行動態(tài)分析、靜態(tài)分析、異常檢測、深度解析等手段,更有效地防范未知威脅。3.物聯(lián)網(wǎng)安全預(yù)計到2021年,全球?qū)⒂谐^460億臺設(shè)備,傳感器和執(zhí)行器連接在一起,更廣闊,更強(qiáng)大和更穩(wěn)定的物聯(lián)網(wǎng)時代即將到來,并且最終將給企業(yè)帶來全新業(yè)務(wù)方式。物聯(lián)網(wǎng)(IoT)為企業(yè)創(chuàng)新提供了廣闊的前景。企業(yè)通過監(jiān)控、分析收集來的數(shù)據(jù)量,來確保業(yè)務(wù)的正常發(fā)展。其中數(shù)據(jù)大都是從傳感器、應(yīng)用、門禁系統(tǒng)、配電單元、UPS、發(fā)電機(jī)和太陽能電池板產(chǎn)生的數(shù)據(jù),但隨著這些應(yīng)用的增長,物聯(lián)網(wǎng)帶給企業(yè)的安全風(fēng)險也很大。要應(yīng)對物聯(lián)網(wǎng)的安全挑戰(zhàn),企業(yè)應(yīng)從智能設(shè)備的離線安全、入網(wǎng)安全、在線安全等維度進(jìn)行整體安全檢測與防護(hù),在云端接入大數(shù)據(jù)感知威脅和安全態(tài)勢分析平臺,獲取威脅情報;在本地端通過減少威脅“檢測時間(TTD)”,即減少發(fā)生威脅到發(fā)現(xiàn)威脅的時間差,縮短檢測時間,可有效限制攻擊者的操作空間,和最大限度減少損失。①及時更新基礎(chǔ)設(shè)施和應(yīng)用,讓攻擊者無法利用公開的漏洞;②利用集成防御對抗復(fù)雜性,采取平衡防御與主動應(yīng)對的安全控制;③密切監(jiān)控網(wǎng)絡(luò)流量(這在網(wǎng)絡(luò)流量模式可預(yù)測性非常高的IoT環(huán)境中非常重要);④追蹤物聯(lián)網(wǎng)設(shè)備如何接觸網(wǎng)絡(luò)并與其他設(shè)備進(jìn)行交互(例如,如果物聯(lián)網(wǎng)設(shè)備正在掃描其他設(shè)備,則可能是表示惡意活動的紅色警報)。

四、結(jié)論

神州控股董事局主席郭為對未來的預(yù)測時說:“云計算將成為未來主流IT運(yùn)算模式,大數(shù)據(jù)會成為最重要核心資源;自上而下的創(chuàng)新將是智能時代推動社會進(jìn)步的主流方式,借助云計算、大數(shù)據(jù)這兩項關(guān)鍵技術(shù)實現(xiàn)互聯(lián)網(wǎng)化、協(xié)同化和智能化?!敝悄苁俏覀冞@個時代的標(biāo)志,對于企業(yè)信息化來說,它的路很長,首先要完成核心業(yè)務(wù)在線化和所有的業(yè)務(wù)流程服務(wù)軟件化,然后完成應(yīng)用軟件的SaaS(Soft-as-a-Service)化,當(dāng)企業(yè)的核心業(yè)務(wù)完全建立在互聯(lián)網(wǎng)上,并有軟件SaaS平臺驅(qū)動,企業(yè)才能夠向智能化方向演進(jìn)——低成本積累大數(shù)據(jù),并通過數(shù)據(jù)分析進(jìn)行商業(yè)決策,最終向?qū)崟r數(shù)據(jù)分析、實時智能商業(yè)決策演進(jìn)。由此,企業(yè)信息智能化任重道遠(yuǎn),從現(xiàn)在開始制定適當(dāng)?shù)陌踩呗裕源思涌霫T新趨勢的適應(yīng)能力,在不斷采用新技術(shù)的過程中建立適合企業(yè)的安全管理系統(tǒng),做到覆蓋企業(yè)安全運(yùn)維的所有場景,監(jiān)視安全威脅,預(yù)測安全風(fēng)險。

參考文獻(xiàn)

[1]維克多•邁克熱•舍恩伯格.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].浙江人民出版社.