前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經(jīng)網(wǎng)絡(luò)的意義主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);年齡分類
0引言
人臉作為人類個(gè)體鮮明顯著的生物特征之一,包含著豐富的個(gè)人信息。隨著計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,相關(guān)的人臉識(shí)別等技術(shù)已成為這些項(xiàng)目任務(wù)的熱點(diǎn)課題,并在法醫(yī)、電子化客戶關(guān)系管理、安防、生物識(shí)別和娛樂(lè)影音等諸多領(lǐng)域中得到廣泛應(yīng)用。人臉除了可進(jìn)行身份認(rèn)證和識(shí)別外,還可以提取出性別、種族和年齡等信息,特別是可以將年齡及分布特征用于人機(jī)交互和商業(yè)智能等應(yīng)用中,因此年齡估計(jì)研究具有重要的科學(xué)意義和實(shí)用價(jià)值。
相對(duì)于人臉識(shí)別,人臉?biāo)鼙碚鞯哪挲g信息要受到很多因素的影響,例如不同個(gè)體的基因差異、生活習(xí)慣、環(huán)境、抗壓能力、健康情況和種族差別等有很大的關(guān)系。同時(shí),相同個(gè)體因發(fā)型、化妝和表情的不同也會(huì)影響年齡的估計(jì)。因此,如果要基于傳統(tǒng)的分類算法(如支持向量機(jī))并利用人臉圖像信息來(lái)進(jìn)行年齡分類將很難得到理想的結(jié)果。針對(duì)這些問(wèn)題,目前的研究還相對(duì)不足,如果能有效解決上述問(wèn)題,對(duì)大部分潛在的應(yīng)用領(lǐng)域也都將帶來(lái)深刻的影響。
1相關(guān)工作
年齡分類的主要流程是先根據(jù)人臉圖像獲取特征,再通過(guò)機(jī)器學(xué)習(xí)方法構(gòu)建模型,通過(guò)把年齡分為多個(gè)年齡區(qū)段,即每個(gè)年齡段對(duì)應(yīng)一個(gè)類別(比如未成年或成年人等)。因此可以把年齡分類看成是一個(gè)二分類或者多分類的分類問(wèn)題來(lái)進(jìn)行求解。1994年,Kwon和Lobo則從人臉圖像中獲取年齡分類,把人分為3種不同的類別,也就是兒童、青年人和老年人,強(qiáng)調(diào)重要特征點(diǎn)的選擇。2002年Lanitis等人提出了能自動(dòng)對(duì)年齡實(shí)現(xiàn)估計(jì)的年齡量化方法。而且,王先梅等的綜述中也整體梳理了相關(guān)年齡估計(jì)技術(shù)的研究發(fā)展。王紹宇等人還基于SMV采用生物特征對(duì)人進(jìn)行分類,分為小孩和成人。此外在2016年,董遠(yuǎn)等人更將遷移學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)用于人的年齡和性別分類。
關(guān)鍵詞:筆跡;性別識(shí)別;深度學(xué)習(xí)
0引言
近年來(lái),由于在數(shù)據(jù)挖掘、取證分析、文檔授權(quán)和判斷真實(shí)歷史筆跡等方面的應(yīng)用,筆跡分析變得愈加重要。人類學(xué)習(xí)寫字從模仿他人開(kāi)始并逐漸形成自己的筆跡風(fēng)格,在這個(gè)過(guò)程中,性別的影響是不容忽視的。Beech和Mackintosh研究了激素和筆跡風(fēng)格的關(guān)系,由此發(fā)現(xiàn)產(chǎn)前激素對(duì)女性的筆跡風(fēng)格有很大的影響。Mergl和Tigges的研究表明男性筆跡和女性筆跡存在明顯差異,女性的筆跡更加易讀,更加整潔和有組織性,而男性筆跡更加潦草,會(huì)出現(xiàn)更多的錯(cuò)誤。
目前筆跡性別識(shí)別的方法有:基于梯度的識(shí)別算法GLBP,提取圖像的HOG特征并結(jié)合根據(jù)LBP算子提取的梯度特征來(lái)支持處理識(shí)別,使用SVM進(jìn)行分類,獲得了75.45%的準(zhǔn)確率:基于局部特征的識(shí)別算法,設(shè)計(jì)塊特征計(jì)算密度并提取多種LBP特征和HOG特征加入研發(fā)識(shí)別,使用SVM進(jìn)行分類,獲得了70%的準(zhǔn)確率;基于GMM的識(shí)別算法,將局部特征和全局特征融合進(jìn)行分類,獲得了67.57%的準(zhǔn)確率。雖然現(xiàn)有的方法可以在一定程度上識(shí)別作者性別,但是由于這些特征表達(dá)的筆跡信息不準(zhǔn)確,識(shí)別率一直并不理想。而深度神網(wǎng)絡(luò)能夠自主學(xué)習(xí)特征,并且在人臉識(shí)別、物體的檢測(cè)識(shí)別系統(tǒng)方面取得了堪稱優(yōu)良的效果,因此本文研發(fā)設(shè)計(jì)了一個(gè)深度適中的網(wǎng)絡(luò)對(duì)筆跡進(jìn)行性別分類。
【關(guān)鍵詞】人臉識(shí)別;人臉檢測(cè);方法
Abstract:Face recognition system is one of the most popular current scientific research,In this paper,the process and prospects of face recognition system to do a simple review.The application of the system to do a simple analysis and the main method of face recognition for the corresponding category.For the future development of face recognition systems were mainly discussed.
Key words:Face Recognition;Face Detection;Methods
一、引言
隨著科學(xué)技術(shù)的突飛猛進(jìn),計(jì)算機(jī)及網(wǎng)絡(luò)的高速發(fā)展,信息的安全性、隱蔽性越來(lái)越重要,如何有效、方便的進(jìn)行身份驗(yàn)證和識(shí)別,已經(jīng)成為人們?nèi)找骊P(guān)心的問(wèn)題。生物認(rèn)證的方法,即利用人類自身的特征來(lái)進(jìn)行身份認(rèn)證,具有傳統(tǒng)方法沒(méi)有的有點(diǎn),也解決了身份認(rèn)證技術(shù)所面臨的一大難題。其具有方便、強(qiáng)化安全、不會(huì)丟失、遺忘或轉(zhuǎn)讓等優(yōu)點(diǎn)。現(xiàn)在人體生物識(shí)別技術(shù)的研究主要針對(duì)人臉、指紋、虹膜、手型、聲音等物理或行為特征來(lái)進(jìn)行。本文主要對(duì)人臉識(shí)別技術(shù)的介紹。
人臉識(shí)別是指給定一個(gè)靜止或動(dòng)態(tài)圖像,利用已有的人臉數(shù)據(jù)庫(kù)來(lái)確認(rèn)圖像中的一個(gè)或多個(gè)人。如同人的指紋一樣,人臉也具有唯一性,也可用來(lái)鑒別一個(gè)人的身份?,F(xiàn)在己有實(shí)用的計(jì)算機(jī)自動(dòng)指紋識(shí)別系統(tǒng)面世,并在安檢等部門得到應(yīng)用,但還沒(méi)有通用成熟的人臉自動(dòng)識(shí)別系統(tǒng)出現(xiàn)。人臉圖像的自動(dòng)識(shí)別系統(tǒng)較之指紋識(shí)別系統(tǒng)、DNA鑒定等更具方便性,因?yàn)樗臃奖悖梢圆唤佑|目標(biāo)就進(jìn)行識(shí)別,從而開(kāi)發(fā)研究的實(shí)際意義更大。另一方面,人臉表情的多樣性;以及外在的成像過(guò)程中的光照,圖像尺寸,旋轉(zhuǎn),姿勢(shì)變化等給識(shí)別帶來(lái)很大難度。因此在各種干擾條件下實(shí)現(xiàn)人臉圖像的識(shí)別,也就更具有挑戰(zhàn)性。
二、人臉識(shí)別系統(tǒng)流程
(1)人臉圖像的獲?。簣D像的獲取都是通過(guò)攝像頭攝取,但攝取的圖像可以是真人,也可以是人臉的圖片或者為了相對(duì)簡(jiǎn)單,可以不考慮通過(guò)攝像頭來(lái)攝取頭像,而是直接給定要識(shí)別的圖像。
(2)人臉的檢測(cè):人臉檢測(cè)的任務(wù)是判斷靜態(tài)圖像中是否存在人臉。若存在人臉,給出其在圖像中的坐標(biāo)位置、人臉區(qū)域大小等信息。而人臉跟蹤則需要進(jìn)一步輸出所檢測(cè)到的人臉位置、大小等狀態(tài)隨時(shí)間的連續(xù)變化情況。
圖1 人臉識(shí)別框架
(3)特征提?。和ㄟ^(guò)人臉特征點(diǎn)的檢測(cè)與標(biāo)定可以確定人臉圖像中顯著特征點(diǎn)的位置(如眼睛、眉毛、鼻子、嘴巴等器官),同時(shí)還可以得到這些器官及其面部輪廓的形狀信息的描述。根據(jù)人臉特征點(diǎn)檢測(cè)與標(biāo)定的結(jié)果,通過(guò)某些運(yùn)算得到人臉特征的描述(這些特征包括:全局特征和局部特征,顯式特征和統(tǒng)計(jì)特征等)。
(4)基于人臉圖像比對(duì)的身份識(shí)別:即人臉識(shí)別問(wèn)題。通過(guò)將輸入人臉圖像與人臉數(shù)據(jù)庫(kù)中的所有已知原型人臉圖像計(jì)算相似度并對(duì)其排序來(lái)給出輸入人臉的身份信息。
(5)基于人臉圖像比對(duì)的身份驗(yàn)證:即人臉確認(rèn)問(wèn)題。系統(tǒng)在輸入人臉圖像的同時(shí)輸入一個(gè)用戶宣稱的該人臉的身份信息,系統(tǒng)要對(duì)該輸入人臉圖像的身份與宣稱的身份是否相符作出判斷。
三、人臉識(shí)別技術(shù)現(xiàn)狀及發(fā)展前景
自1995年以來(lái),國(guó)外一些公司看準(zhǔn)了人臉識(shí)別系統(tǒng)廣闊的應(yīng)用前景,動(dòng)用了大量人力和物力,自己獨(dú)立研發(fā)或與高校合作,開(kāi)發(fā)了多個(gè)實(shí)用的人臉識(shí)別系統(tǒng),例如:加拿大Imagis公司的ID-2000面部識(shí)別軟件,美國(guó)Identix公司1的FaceIt人臉識(shí)別系統(tǒng),德國(guó)Human Scan公司的BioID身份識(shí)別系統(tǒng),德國(guó)Cognitec Systems公司的Face VACS人臉識(shí)別系統(tǒng)等;美國(guó)A4vision公司的3D人臉識(shí)別產(chǎn)品;等等。
國(guó)內(nèi)相關(guān)領(lǐng)域較為出名的公司有上海銀晨智能識(shí)別科技有限公司(IS'vision),他們與中科院計(jì)算所聯(lián)合開(kāi)發(fā)了會(huì)議代表身份認(rèn)證/識(shí)別系統(tǒng)、嫌疑人面像比對(duì)系統(tǒng)、面像識(shí)別考勤/門禁系統(tǒng)、出人口黑名單監(jiān)控系統(tǒng)等多種自動(dòng)人臉識(shí)別應(yīng)用系統(tǒng)。2008年,北京奧運(yùn)會(huì)開(kāi)幕式正式使用了中國(guó)自主知識(shí)產(chǎn)權(quán)的人臉識(shí)別比對(duì)系統(tǒng);2010年4月1日起,國(guó)際民航組織(ICAO)已確定其118個(gè)成員國(guó)家和地區(qū)必須使用機(jī)讀護(hù)照,人臉識(shí)別技術(shù)是首推識(shí)別模式,該規(guī)定已經(jīng)成為國(guó)際標(biāo)準(zhǔn);2011年,F(xiàn)ace book初次引入人臉識(shí)別技術(shù),登陸人員可以免信息驗(yàn)證而激活頁(yè)面;2012年3月6日,江蘇省公安廳與南京理工大學(xué)日前簽約共建“社會(huì)公共安全重點(diǎn)實(shí)驗(yàn)室”,開(kāi)展“人臉識(shí)別”技術(shù)相關(guān)領(lǐng)域項(xiàng)目攻關(guān)。
到目前為止,雖然有關(guān)自動(dòng)人臉識(shí)別的研究已經(jīng)取得了一些可喜的成果,但在實(shí)際應(yīng)用環(huán)境下仍面臨著許多難以解決的問(wèn)題:人臉的非剛體,表情、姿態(tài)、發(fā)型和化妝的多樣性以及環(huán)境光照的復(fù)雜性都給正確的人臉識(shí)別帶來(lái)了很大的困難。即使在大量來(lái)自模式識(shí)別、計(jì)算機(jī)視覺(jué)、生理學(xué)、心理學(xué)、神經(jīng)認(rèn)知科學(xué)等領(lǐng)域的研究人員對(duì)自動(dòng)人臉識(shí)別艱苦工作40余年之后,其中不少問(wèn)題至今仍然困繞著研究人員,始終找不到完善的解決辦法。
在人臉識(shí)別市場(chǎng),特別是在中國(guó)的市場(chǎng),正經(jīng)歷著迅速的發(fā)展,而且發(fā)展的腳步也將越來(lái)越快。主要有三大原因:
1.是科技界和社會(huì)各個(gè)領(lǐng)域都認(rèn)識(shí)到人臉識(shí)別技術(shù)的重要性,國(guó)家政策對(duì)人臉識(shí)別技術(shù)研究給予了很大支持,使得我國(guó)人臉識(shí)別技術(shù)取得了很大進(jìn)展。國(guó)際上,美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)局(NIST)舉辦的Face Recognition Vendor Test 2006(FRVT2006)通過(guò)大規(guī)模的人臉數(shù)據(jù)測(cè)試表明,當(dāng)今世界上人臉識(shí)別方法的識(shí)別精度比2002年的FRVT2002至少提高了一個(gè)數(shù)量級(jí)(10倍)。其中一些方法的識(shí)別精度已經(jīng)超過(guò)人類的平均水平。而對(duì)于高清晰、高質(zhì)量人臉圖像識(shí)別,機(jī)器的識(shí)別精度幾乎達(dá)到100%。
2.各種應(yīng)用需求不斷出現(xiàn)。人臉識(shí)別市場(chǎng)的快速發(fā)展一方面歸功于生物識(shí)別需求的多元化,另一方面則是由于人臉識(shí)別技術(shù)的進(jìn)步。從需求上來(lái)說(shuō),除了傳統(tǒng)的公司考勤、門禁等應(yīng)用外,視頻監(jiān)控環(huán)境下的身份識(shí)別正成為一種迫切的需求,即在一個(gè)較復(fù)雜的場(chǎng)景中,在較遠(yuǎn)的距離上識(shí)別出特定人的身份,這顯然是指紋識(shí)別的方法不能滿足的,而人臉識(shí)別卻是一個(gè)極佳的選擇。
3.人口基數(shù)因素。人臉識(shí)別系統(tǒng)的市場(chǎng)大小,很大程度上是和人口的數(shù)量大小相關(guān)的。而我國(guó)有13億人口,這從本質(zhì)上說(shuō)明了我國(guó)是世界上規(guī)模最大的生物識(shí)別市場(chǎng)。
四、常用的人臉識(shí)別方法
人臉識(shí)別技術(shù)和方法可分為兩大類:基于幾何特征的方法和基于模板匹配的方法。基于幾何特征方法的思想是首先檢測(cè)出嘴巴,鼻子,眼睛,眉毛等臉部主要部分的位置和大小,然后利用這些部件的總體幾何分布關(guān)系以及相互之間的參數(shù)比例來(lái)識(shí)別人臉?;谀0宓姆椒ㄊ抢媚0搴驼麄€(gè)人臉圖像的像素值之間的自相關(guān)性進(jìn)行識(shí)別,這種方法也叫做基于表象的方法。
本文主要分析了常用的人臉識(shí)別方法為:幾何特征的方法、模型的方法、神經(jīng)網(wǎng)絡(luò)的方法和多分類器集成方法。
1.幾何特征的方法
最早的人臉識(shí)別方法就是Bledsoe提出的基于幾何特征的方法,這種方法以面部特征點(diǎn)之間的距離和比率作為特征通過(guò)最近鄰方法來(lái)識(shí)別人臉。該方法建立的人臉識(shí)別系統(tǒng)是一個(gè)半自動(dòng)系統(tǒng),其面部特征點(diǎn)必須由人手工定位,也正是由于人工的參與,該系統(tǒng)對(duì)光照變化和姿態(tài)變化不敏感。
Kanade首先計(jì)算眼角、鼻孔、嘴巴、下巴等面部特征之間的距離和它們之間的角度以及其它幾何關(guān)系然后通過(guò)這些幾何關(guān)系進(jìn)行人臉的識(shí)別工作在一個(gè)20人的數(shù)據(jù)庫(kù)上識(shí)別率為45%一75%。
Brunelli和Poggio通過(guò)計(jì)算鼻子的寬度和長(zhǎng)度、嘴巴位置和下巴形狀等進(jìn)行識(shí)別,在一個(gè)47人的人臉庫(kù)上的識(shí)別率為90%.然而,簡(jiǎn)單模板匹配方法在同一人臉庫(kù)上的識(shí)別率為100%。
基于幾何特征的方法比較直觀,識(shí)別速度快,內(nèi)存要求較少,提取的特征在一定程度上對(duì)光照變化不太敏感。但是,當(dāng)人臉具有一定的表情或者姿態(tài)變化時(shí),特征提取不精確,而且由于忽略了整個(gè)圖像的很多細(xì)節(jié)信息且識(shí)別率較低,所以近年來(lái)已經(jīng)很少有新的發(fā)展。
2.模型的方法
隱馬爾可夫模型,是一種常用的模型,原HMM的方法首先被用于聲音識(shí)別等身份識(shí)別上,之后被Nefian和Hayrs引人到人臉識(shí)別領(lǐng)域。它是用于描述信號(hào)統(tǒng)計(jì)特性的一組統(tǒng)計(jì)模型。
在人臉識(shí)別過(guò)程中,首先抽取人臉特征,得到后觀察向量,構(gòu)建HMM人臉模型,然后用EM算法訓(xùn)練利用該模型就可以算出每個(gè)待識(shí)別人臉觀察向量的概率,從而完成識(shí)別,HMM方法的魯棒性較好,對(duì)表情、姿態(tài)變化不太敏感,識(shí)別率高。
3.神經(jīng)網(wǎng)絡(luò)的方法
神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別領(lǐng)域有很長(zhǎng)的應(yīng)用歷史,1994年就出現(xiàn)了神經(jīng)網(wǎng)絡(luò)用于人臉處理的綜述性文章。
動(dòng)態(tài)鏈接結(jié)構(gòu)(DLA)是用于人臉識(shí)別系統(tǒng)中最有影響的神經(jīng)網(wǎng)絡(luò)方法。DLA試圖解決傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中一些概念性問(wèn)題,其中最突出的是網(wǎng)絡(luò)中語(yǔ)法關(guān)系的表達(dá)。DLA利用突觸的可塑性將神經(jīng)元集合劃分成若干個(gè)結(jié)構(gòu),同時(shí)保留了神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)。
自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的混合神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人臉識(shí)別。SOM實(shí)現(xiàn)對(duì)圖像的采樣向量降維,且對(duì)圖像樣本的小幅度變形不敏感。卷積網(wǎng)絡(luò)用來(lái)實(shí)現(xiàn)相鄰像素間的相關(guān)性知識(shí),在一定程度對(duì)圖象的平移、旋轉(zhuǎn)、尺度和局部變形也都不敏感。
神經(jīng)網(wǎng)絡(luò)方法較其他人臉識(shí)別方法有著特有的優(yōu)勢(shì),通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可以獲得其他方法難以實(shí)現(xiàn)的關(guān)于人臉圖像的規(guī)則和特征的隱性表示,避免了復(fù)雜的特征抽取工作,并有利于硬件的實(shí)現(xiàn)。缺點(diǎn)主要在于其方法的可解釋性較弱,且要求多張人臉圖像作為訓(xùn)練集,所以只適合于小型人臉庫(kù)。
4.多分類器集成方法
人臉的表象會(huì)因?yàn)楣庹辗较?、姿態(tài)、表情變化而產(chǎn)生較大的變化,每種特定的識(shí)別器只對(duì)其中一部分變化比較敏感,因此,將可以整合互補(bǔ)信息的多個(gè)分類器集成能夠提高整個(gè)系統(tǒng)的分類準(zhǔn)確率。
Gutta等人提出將集成的RBF與決策樹(shù)結(jié)合起來(lái)進(jìn)行人臉識(shí)別。結(jié)合了全局的模板匹配和離散特征的優(yōu)點(diǎn),在一個(gè)350人的人臉庫(kù)上測(cè)試,取得了較好的實(shí)驗(yàn)結(jié)果。
五、總結(jié)及展望
隨著圖像處理、模式識(shí)別、人工智能以及生物心理學(xué)的研究進(jìn)展,人臉識(shí)別技術(shù)也將會(huì)獲得更大的發(fā)展。面對(duì)這種高新技術(shù),人臉識(shí)別技術(shù)有著不可代替的優(yōu)點(diǎn)。近幾年對(duì)三維模型的人臉識(shí)別研究以成為一個(gè)熱點(diǎn)。從二維模型到三維模型是一個(gè)階躍性的發(fā)展,中間必須克服三維模型的開(kāi)銷大,所占空間大等因素。因此如何增強(qiáng)這類系統(tǒng)的保密性將是人臉識(shí)別系統(tǒng)要考慮的問(wèn)題,它將是這種識(shí)別系統(tǒng)投入使用后人們最關(guān)心的問(wèn)題,同時(shí)也是人臉識(shí)別領(lǐng)域需要研究的新課題。我們期待在不久的將來(lái),人們將告別鑰匙,迎來(lái)人臉開(kāi)門的新時(shí)代。
參考文獻(xiàn)
[1]李武軍,王崇駿,張煒,等.人臉識(shí)別研究綜述[J].模擬識(shí)別與人工智能,2006,19(1):58-65.
[2]李子青.人臉識(shí)別技術(shù)應(yīng)用及市場(chǎng)分析[J].中國(guó)安防,2007,8:42-46.
[3]柴秀娟,山世光,卿來(lái)云,等.基于3D人臉重建的光照、姿態(tài)不變?nèi)四樧R(shí)別[J] .軟件學(xué)報(bào),2006,17(3):525-534.
關(guān)鍵詞:圖像分割 閾值分割 遺傳算法 小波變換
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1002-2422(2010)02-0001-03
圖像分割是按照一定的規(guī)則把圖像劃分成若干個(gè)互不相交、具有一定性質(zhì)的區(qū)域,把人們關(guān)注的部分從圖像中提取出來(lái),進(jìn)一步加以研究分析和處理。圖像分割的結(jié)果是圖像特征提取和識(shí)別等圖像理解的基礎(chǔ),對(duì)圖像分割的研究一直是數(shù)字圖像處理技術(shù)研究中的熱點(diǎn)和焦點(diǎn)。圖像分割使得其后的圖像分析,識(shí)別等高級(jí)處理階段所要處理的數(shù)據(jù)量大大減少,同時(shí)又保留有關(guān)圖像結(jié)構(gòu)特征的信息。圖像分割在不同的領(lǐng)域也有其它名稱,如目標(biāo)輪廓技術(shù)、目標(biāo)檢測(cè)技術(shù)、閾值化技術(shù)、目標(biāo)跟蹤技術(shù)等,這些技術(shù)本身或其核心實(shí)際上也就是圖像分割技術(shù)。
1 經(jīng)典圖像分割方法
1,1閾值分割方法
閾值分割是常見(jiàn)的直接對(duì)圖像進(jìn)行分割的算法,根據(jù)圖像像素的灰度值的不同而定。對(duì)應(yīng)單一目標(biāo)圖像,只需選取一個(gè)閾值,即可將圖像分為目標(biāo)和背景兩大類,這個(gè)稱為單閾值分割:如果目標(biāo)圖像復(fù)雜,選取多個(gè)閾值,才能將圖像中的目標(biāo)區(qū)域和背景被分割成多個(gè),這個(gè)稱為多閾值分割,此時(shí)還需要區(qū)分檢測(cè)結(jié)果中的圖像目標(biāo),對(duì)各個(gè)圖像目標(biāo)區(qū)域進(jìn)行唯一的標(biāo)識(shí)進(jìn)行區(qū)分。閾值分割的顯著優(yōu)點(diǎn),成本低廉,實(shí)現(xiàn)簡(jiǎn)單。當(dāng)目標(biāo)和背景區(qū)域的像素灰度值或其它特征存在明顯差異的情況下,該算法能非常有效地實(shí)現(xiàn)對(duì)圖像的分割。閩值分割方法的關(guān)鍵是如何取得一個(gè)合適的閾值,近年來(lái)的方法有:用最大相關(guān)性原則選擇閾值的方法、基于圖像拓?fù)浞€(wěn)定狀態(tài)的方法、灰度共生矩陣方法、最大熵法和谷值分析法等,更多的情況下,閾值的選擇會(huì)綜合運(yùn)用兩種或兩種以上的方法,這也是圖像分割發(fā)展的一個(gè)趨勢(shì)。
1,2基于邊緣的圖像分割方法
邊緣總是以強(qiáng)度突變的形式出現(xiàn),可以定義為圖像局部特性的不連續(xù)性,如灰度的突變、紋理結(jié)構(gòu)的突變等。邊緣常常意味著一個(gè)區(qū)域的終結(jié)和另一個(gè)區(qū)域的開(kāi)始。對(duì)于邊緣的檢測(cè)常常借助空間微分算子進(jìn)行,通過(guò)將其模板與圖像卷積完成。兩個(gè)具有不同灰度值的相鄰區(qū)域之間總存在灰度邊緣,而這正是灰度值不連續(xù)的結(jié)果,這種不連續(xù)可以利用求一階和二階導(dǎo)數(shù)檢測(cè)到。當(dāng)今的邊緣檢測(cè)方法中,主要有一次微分、二次微分和模板操作等。這些邊緣檢測(cè)器對(duì)邊緣灰度值過(guò)渡比較尖銳且噪聲較小等不太復(fù)雜的圖像可以取得較好的效果。但對(duì)于邊緣復(fù)雜的圖像效果不太理想,如邊緣模糊、邊緣丟失、邊緣不連續(xù)等。噪聲的存在使基于導(dǎo)數(shù)的邊緣檢測(cè)方法效果明顯降低,在噪聲較大的情況下所用的邊緣檢測(cè)算子通常都是先對(duì)圖像進(jìn)行適當(dāng)?shù)钠交种圃肼?,然后求?dǎo)數(shù),或者對(duì)圖像進(jìn)行局部擬合,再用擬合光滑函數(shù)的導(dǎo)數(shù)來(lái)代替直接的數(shù)值導(dǎo)數(shù),如Mart算子、canny算子等。在未來(lái)的研究中,用于提取初始邊緣點(diǎn)的自適應(yīng)閾值選取、用于圖像層次分割的更大區(qū)域的選取以及如何確認(rèn)重要邊緣以去除假邊緣將變的非常重要。
1,3基于函數(shù)優(yōu)化的分割方法
此方法是圖像分割中另一大類常用的方法。其基本思路是給出一個(gè)目標(biāo)函數(shù),通過(guò)該目標(biāo)函數(shù)的極大化或極小化來(lái)分割圖像。GA.Hewer等人提出了一個(gè)具有廣泛意義的目標(biāo)函數(shù)。統(tǒng)計(jì)學(xué)分割方法、結(jié)合區(qū)域與邊緣信息的方法、基于貝葉斯公式的分割方法等是目前幾種活躍的函數(shù)優(yōu)化方法。
統(tǒng)計(jì)學(xué)分割方法是把圖像中各個(gè)像素點(diǎn)的灰度值看作是具有一定概率分布的隨機(jī)變量,且觀察到的實(shí)際物體是作了某種變換并加入噪聲的結(jié)果。統(tǒng)計(jì)學(xué)分割方法包括基于馬爾科夫隨機(jī)場(chǎng)方法、標(biāo)號(hào)法、混合分布法等。
區(qū)域增長(zhǎng)法和分裂合并法是基于區(qū)域信息的圖像分割的主要方法。區(qū)域增長(zhǎng)有兩種方式,一種是先將圖像分割成很多的一致性較強(qiáng)的小區(qū)域,再按一定的規(guī)則將小區(qū)域融合成大區(qū)域,達(dá)到分割圖像的目的。另一種實(shí)現(xiàn)是給定圖像中要分割目標(biāo)的一個(gè)種子區(qū)域,再在種子區(qū)域基礎(chǔ)上將周圍的像素點(diǎn)以一定的規(guī)則加入其中,最終達(dá)到目標(biāo)與背景分離的目的;分裂合并法對(duì)圖像的分割是按區(qū)域生長(zhǎng)法沿相反方向進(jìn)行的,無(wú)需設(shè)置種子點(diǎn)。其基本思想是給定相似測(cè)度和同質(zhì)測(cè)度。從整幅圖像開(kāi)始,如果區(qū)域不滿足同質(zhì)測(cè)度,則分裂成任意大小的不重疊子區(qū)域,如果兩個(gè)鄰域的子區(qū)域滿足相似測(cè)度則合并。
2 結(jié)合特定工具的圖像分割算法
雖然圖像分割目前尚無(wú)通用的理論,但是近年來(lái)大量學(xué)者致力于將新概念、新方法應(yīng)用于圖像分割,結(jié)合特定理論的圖像分割方法在圖像分割方面取得了較好的應(yīng)用效果。如小波分析和小波變換、神經(jīng)網(wǎng)絡(luò)、遺傳算法等數(shù)學(xué)工具的利用,有效地改善了分割效果。
2,1基于遺傳算法的圖像分割
遺傳算法是模擬自然界生物進(jìn)化過(guò)程與機(jī)制求解問(wèn)題的一類自組織與自適應(yīng)的人工智能技術(shù)。對(duì)此,科學(xué)家們進(jìn)行了大量的研究工作,并成功地運(yùn)用于各種類型的優(yōu)化問(wèn)題,在分割復(fù)雜的圖像時(shí),人們往往采用多參量進(jìn)行信息融合,在多參量參與的最優(yōu)值求取過(guò)程中,優(yōu)化計(jì)算是最重要的,把自然進(jìn)化的特征應(yīng)用到計(jì)算機(jī)算法中,將能解決很多問(wèn)題。遺傳算法的出現(xiàn)為解決這類問(wèn)題提供了新而有效的方法,不僅可以得到全局最優(yōu)解,而且大量縮短了計(jì)算時(shí)間。王月蘭等人提出的基于信息融合技術(shù)的彩色圖像分割方法,該方法應(yīng)用剝殼技術(shù)將問(wèn)題的復(fù)雜度降低,然后將信息融合技術(shù)應(yīng)用到彩色圖像分割中,為彩色分割在不同領(lǐng)域中的應(yīng)用提供了一種新的思路與解決辦法。
2,2基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的圖像分割
基于神經(jīng)網(wǎng)絡(luò)的分割方法的基本思想是先通過(guò)訓(xùn)練多層感知器來(lái)得到線性決策函數(shù),然后用決策函數(shù)對(duì)像素進(jìn)行分類來(lái)達(dá)到分割的目的。近年來(lái),隨著神經(jīng)學(xué)的研究和進(jìn)展,第三代脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN)作為一種新型人工神經(jīng)網(wǎng)絡(luò)模型,其獨(dú)特處理方式為圖像分割提供了新的思路。脈沖耦合神經(jīng)網(wǎng)絡(luò)具有捕獲特性,會(huì)產(chǎn)生點(diǎn)火脈沖傳播,對(duì)輸入圖像具有時(shí)空整合作用,相鄰的具有相似輸入的神經(jīng)元傾向于同時(shí)點(diǎn)火。因此對(duì)于灰度圖象,PCNN具有天然的分割能力,與輸入圖像中不同目標(biāo)區(qū)域?qū)?yīng)的神經(jīng)元在不同的時(shí)刻點(diǎn)火,從而將不同區(qū)域分割開(kāi)來(lái)。如果目標(biāo)區(qū)域灰度分布有重疊,由于PCNN的時(shí)空整合作用,如果灰度分布符合某種規(guī)律,PCNN也能克服灰度分布重疊所帶來(lái)的不利影響,從而實(shí)現(xiàn)較完美的分割。這是其一個(gè)突出的優(yōu)點(diǎn),而這恰恰是其他的分割方法所欠缺的,其在未來(lái)的圖像分割中將起主導(dǎo)作用。
2,3基于小波分析和變換的圖像分割
近年來(lái),小波理論得到了迅速的發(fā)展,而且由于其具有良好的時(shí)頻局部化特性和多分辨率分析能力,在圖像處理等領(lǐng)域得到了廣泛的應(yīng)用。小波變換是一種多尺度多通道分析工具,比較適合對(duì)圖像進(jìn)行多尺度的邊緣檢測(cè)。從圖像處理角度看,小波變換具有“變焦”特性,在低頻段可用高頻率分辨率和低時(shí)間分辨率,在高頻段可用低頻率分辨率和高時(shí)間分辨率,小波變換在實(shí)現(xiàn)上有快速算法具有多分辨率,也叫多尺度的特點(diǎn),可以由粗及精地逐步觀察信號(hào)等優(yōu)點(diǎn)。近年來(lái)多進(jìn)制小波也開(kāi)始用于邊緣檢測(cè)。另外,把小波變換和其它方法結(jié)合起來(lái)的圖像分割技術(shù)也是現(xiàn)在研究的熱點(diǎn)。
3 圖像分割的應(yīng)用現(xiàn)狀
在圖像處理中,圖像分割是一種重要的技術(shù),是圖像分析的基礎(chǔ)。隨著圖像分割技術(shù)研究的深入,其應(yīng)用日趨廣泛,幾乎出現(xiàn)在有關(guān)圖像處理的所有領(lǐng)域,并涉及各種類型的圖像。凡屬需要對(duì)圖像目標(biāo)進(jìn)行提取、測(cè)量的工作都離不開(kāi)圖像分割。通常,圖像分割是為了進(jìn)一步對(duì)圖像進(jìn)行分析、識(shí)別、壓縮、編碼等,圖像分割的準(zhǔn)確性將直接影響后繼的工作,因此,分割的方法和精確程度是至關(guān)重要的。目前,圖像分割在圖像工程中占據(jù)非常重要的位置,圖像分割已在交通、醫(yī)學(xué)、遙感、通信、軍事和工業(yè)自動(dòng)化等諸多領(lǐng)域得到廣泛應(yīng)用。表1是應(yīng)用領(lǐng)域表。
關(guān)鍵詞:人工智能;引擎;大數(shù)據(jù);CPU;FPGA
DOI:10.3969/j.jssn.1005-5517-2017-2.006
1 2016年人工智能迎來(lái)了春天
2016年人工智能(A1)進(jìn)入了第三個(gè)。2016年3月9-15日,谷歌AlphaGo(阿爾法狗)以4:1的成績(jī)擊敗世界圍棋冠軍李世石職業(yè)九段,意義非常重大。因?yàn)檫^(guò)去機(jī)器主要做感知,現(xiàn)在出現(xiàn)了認(rèn)知,這是人工智能的關(guān)鍵所在。
8個(gè)月后,2016年12月29日~2017年1月4日,AlphaGo的升級(jí)版――谷歌Master(大師)在30秒快棋網(wǎng)測(cè)中,以60勝0負(fù)1和的成績(jī),橫掃柯潔、古力、聶衛(wèi)平、樸廷桓、井山裕太等數(shù)十位中日韓世界冠軍與頂級(jí)高手。從此以后,也許人類以后就沒(méi)有和Master進(jìn)行圍棋比賽的機(jī)會(huì)了!除了圍棋,人工智能下一步將在國(guó)際象棋、中國(guó)象棋等棋類方面發(fā)展。
撲克牌方面,專家水平的人工智能首次戰(zhàn)勝一對(duì)一無(wú)限注德州撲克人類職業(yè)玩家,而且DeepStack讓機(jī)器擁有知覺(jué)。
人工智能還能玩游戲。其意義很重大,平時(shí)環(huán)境中很難得到一些數(shù)據(jù),因?yàn)橛螒蛳喈?dāng)于虛擬社會(huì),例如“星際爭(zhēng)霸2”是復(fù)雜的虛擬社會(huì),如果人工智能在這個(gè)虛擬社會(huì)中能戰(zhàn)勝人,這將是非常了不起的,未來(lái)可涉及到高級(jí)決策,在軍事上很有用處。2016年11月5日,谷歌DeepMind宣布與暴雪合作開(kāi)發(fā)人工智能,挑戰(zhàn)實(shí)時(shí)戰(zhàn)略視頻游戲“星際爭(zhēng)霸2”。這件事情的意義非常重大。下一步可以用于軍事上的高級(jí)戰(zhàn)略決策。
無(wú)人駕駛方面,2016年11月15日,“在第三屆世界互聯(lián)網(wǎng)大會(huì)”期間,18輛百度“云驍”亮相烏鎮(zhèn)子夜路,在3.16公里的開(kāi)放城區(qū)道路上自主行駛。2016年特斯拉Autopilot 2.0問(wèn)世,該軟件只需要八千美元,就可讓軟件駕駛汽車。所有特斯拉新車將安裝“具有完全自動(dòng)駕駛功能”的該硬件系統(tǒng),并可通過(guò)OTA(空中下載技術(shù))進(jìn)行軟件升級(jí);自動(dòng)駕駛功能從L2(二級(jí),半無(wú)人駕駛)直接跳躍到L4/L5();2017年底之前,特斯拉車將以完全自動(dòng)駕駛模式從洛杉磯開(kāi)往紐約。Uber提出在城區(qū)大范圍無(wú)人駕駛出租車試運(yùn)行,Uber 2016年9月14日在美國(guó)匹茲堡市推出城區(qū)大范圍無(wú)人駕駛出租車免費(fèi)載客服務(wù)并試運(yùn)行,先期已測(cè)試近2年,說(shuō)明無(wú)人駕駛真正落地了。
為何無(wú)人駕駛很重要?因?yàn)槿斯ぶ悄苁菬o(wú)人駕駛的核心。除了百度、特斯拉、Uber,谷歌Waymo也在做自動(dòng)駕駛測(cè)試。此外,沃爾沃、福特、寶馬、百度、英特爾等全球約20多家企業(yè)公開(kāi)宣布,4年以后的2021年將會(huì)是無(wú)人駕駛/自動(dòng)駕駛元年,部分5AE L4車將會(huì)實(shí)現(xiàn)量產(chǎn)。
計(jì)算機(jī)視覺(jué)
針對(duì)ImageNet ILSVRC測(cè)試比賽的1 000種物體識(shí)別,Deep CNN超過(guò)了人類的識(shí)別能力。人是5.1%(如圖1),2016年2月23日谷歌人工識(shí)別的評(píng)測(cè)是3.08%。ImageNetILSVRC中有1000種物體,例如猴子、馬、飛機(jī)、坦克等約1500萬(wàn)張照片、包含2.2萬(wàn)類種不同物體。深度學(xué)習(xí)一般能做到52層,極深度學(xué)習(xí)(very deep lea rning)現(xiàn)在已經(jīng)做到1000層。
在ILSVRC 2016國(guó)際評(píng)測(cè)中,包括視覺(jué)物體檢測(cè)、視覺(jué)物體定位、視頻物體檢測(cè)、場(chǎng)景分類、場(chǎng)景解析等性能均有提高。值得一提的是,在此次大會(huì)上,中國(guó)團(tuán)隊(duì)大放異彩,幾乎包攬了各個(gè)項(xiàng)目的冠軍(圖2)。
人工智能語(yǔ)義分割
基于全卷積神經(jīng)網(wǎng)絡(luò)FCN的路面/場(chǎng)景像素級(jí)語(yǔ)義分割取得重要進(jìn)展。為此,我們可以分割大部分道路。
人工智能唇語(yǔ)專家
看電視時(shí)把聲音關(guān)掉,靠嘴唇說(shuō)話的變化來(lái)識(shí)別談話內(nèi)容,這種能力機(jī)器識(shí)別率已經(jīng)超過(guò)人類。例如2016年12月,英國(guó)牛津大學(xué)與谷歌DeepMind等研發(fā)的自動(dòng)唇讀系統(tǒng)LipNet,對(duì)GRID語(yǔ)料庫(kù)實(shí)現(xiàn)了95.2%的準(zhǔn)確率;對(duì)BBC電視節(jié)目嘉賓進(jìn)行唇語(yǔ)解讀,準(zhǔn)確率為46.8%,遠(yuǎn)遠(yuǎn)超過(guò)專業(yè)的人類唇語(yǔ)專家(僅為12.4%)。
人工智能人臉識(shí)別
人臉識(shí)別可以達(dá)到產(chǎn)品級(jí)別,例如支付寶的刷臉成功率超過(guò)了人類。如圖3,人的水平為97.40,百度為99.77。因此可以進(jìn)行產(chǎn)品體驗(yàn)。2017年1月6日,百度人工智能機(jī)器人“小度”利用其超強(qiáng)人類識(shí)別能力,以3:2險(xiǎn)勝人類最強(qiáng)大腦代表王峰。
語(yǔ)音識(shí)別
目前的社交新媒體和互動(dòng)平臺(tái)中,Al虛擬助手和Al聊天機(jī)器人正在崛起。一天,美國(guó)GIT(佐治亞理工大學(xué))的一個(gè)課堂上來(lái)了一位助教,教師講完課后說(shuō):“大家有問(wèn)題就問(wèn)助教吧”。這位助教原來(lái)是個(gè)會(huì)眨眼睛的機(jī)器人!這時(shí)學(xué)生們才知道每天網(wǎng)上給他們答疑解惑的是人工智能,此前學(xué)生們也感到很吃驚,這位助教非常敬業(yè),晚上還在發(fā)Email。
人工智能語(yǔ)音合成
指從文本聲音到真實(shí)聲音,可以自動(dòng)翻譯成英文。2016年9月19日,谷歌DeepMind推出WaveNet,實(shí)現(xiàn)文本到美式英語(yǔ)或中國(guó)普通話的真實(shí)感語(yǔ)音合成。
人工智能速記員
包括語(yǔ)音識(shí)別和NLP(自然語(yǔ)言處理)。2016年10月17日,微軟的語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)了5.9%的詞錯(cuò)率(WER),媲美人類專業(yè)速記員,且錯(cuò)誤率更低;中國(guó)科大訊飛也有語(yǔ)音輸入法。
人工智能翻譯
中國(guó)人往往從小學(xué)到讀博士都在學(xué)英語(yǔ)?,F(xiàn)在,谷歌、微軟和百度等公司在做人工智能翻譯。以谷歌為例,2016年9月27日,谷歌的神經(jīng)機(jī)器翻譯系統(tǒng)(GNMT)實(shí)現(xiàn)了多語(yǔ)種翻譯,較之傳統(tǒng)方法,英譯西班牙翻譯錯(cuò)誤率下降了87%,英譯漢下降了58%,漢譯英下降了60%,已接近人工翻譯的水平。也許今后學(xué)外語(yǔ)沒(méi)那么重要了,人們可戴著耳機(jī),耳機(jī)能直接翻譯成各語(yǔ)言。
人工智能對(duì)抗訓(xùn)練
Goodfellow(2014)提出的生成式對(duì)抗網(wǎng)絡(luò)(GAN),為半監(jiān)督學(xué)習(xí)/舉一反三式的學(xué)習(xí)發(fā)展提供新思路,2016年發(fā)展迅速。目前是監(jiān)督式學(xué)習(xí),需要依靠大數(shù)據(jù),因此大數(shù)據(jù)需要非常完備。而人是舉一反三式的學(xué)習(xí)。例如人沒(méi)有見(jiàn)過(guò)飛機(jī),看過(guò)幾張照片就可以把世界上所有飛機(jī)都認(rèn)出;目前的大數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)方式,是把世界上所有飛機(jī)照片都看過(guò)才行?,F(xiàn)在進(jìn)行舉一反三的半監(jiān)督或無(wú)監(jiān)督式學(xué)習(xí),思路是采用對(duì)抗的方法,一個(gè)網(wǎng)絡(luò)造假,另一網(wǎng)絡(luò)鑒別照片是真是假,通過(guò)對(duì)抗式的學(xué)習(xí)來(lái)共同進(jìn)步(如圖4)。
人工智能引擎
芯片三巨頭
英特爾、英偉達(dá)和高通全部轉(zhuǎn)到了人工智能上。為此英偉達(dá)的股票漲了幾倍。英特爾也在大搞人工智能。高通為了進(jìn)入人工智能領(lǐng)域,收購(gòu)了恩智浦,恩智浦此前收購(gòu)了飛思卡爾。
現(xiàn)在出現(xiàn)了基于超級(jí)GPU/TPU集群的離線訓(xùn)練,采用超級(jí)GPU/TPu集群服務(wù)器,例如英偉達(dá)的深度學(xué)習(xí)芯片Tesla P100及DGX-1深度學(xué)習(xí)計(jì)算機(jī),谷歌數(shù)據(jù)中心的TPU。
終端應(yīng)用采用GPU/FPGA-based DPU,例如英特爾Apollo Lake A3900的“智能互聯(lián)駕駛艙平臺(tái)”,高通驍龍的820A處理器。
通用人工智能與認(rèn)知智能
1997年,lBM的超級(jí)電腦程序“深藍(lán)”擊敗國(guó)際象棋大師加里?卡斯帕羅夫;2011年2月,IBM的自動(dòng)問(wèn)答系統(tǒng)在美國(guó)最受歡迎的智力競(jìng)答電視節(jié)目“危險(xiǎn)邊緣”中戰(zhàn)勝了人類冠軍:IBM的沃森醫(yī)生在某些細(xì)分疾病領(lǐng)域已能提供頂級(jí)醫(yī)生的醫(yī)療診斷水平,例如胃癌診斷。
可見(jiàn),1.AlphaGo和Master等已可橫掃人類圍棋職業(yè)頂尖高手,下一步,將能下中國(guó)象棋等所有棋類,此外還可以打牌、炒股等,即什么都可以干,是強(qiáng)人工智能。2.人工智能已成為無(wú)人駕駛汽車商業(yè)落地的關(guān)鍵。3.視覺(jué)物體識(shí)別、人臉識(shí)別、唇語(yǔ)識(shí)別等在許多國(guó)際公開(kāi)評(píng)測(cè)中,達(dá)到或超過(guò)人類的水平;4.速記等語(yǔ)音識(shí)別已可媲美人類;5.包括神經(jīng)機(jī)器翻譯在內(nèi)的自然語(yǔ)言處理,性能也大幅度提升;6.生成式對(duì)抗網(wǎng)絡(luò)得到極大關(guān)注。
目前,發(fā)展通用人工智能成為普遍共識(shí)。
2 社會(huì)極大關(guān)注
未來(lái),可能很多工作就會(huì)消失了。
人工智能引起社會(huì)的極大關(guān)注和熱議,人工智能發(fā)展很快;而且人工智能的學(xué)習(xí)速度快,很勤奮,未來(lái)可以達(dá)到人類所有的智能,這時(shí)到達(dá)了從強(qiáng)人工智能到超越人工智能的奇點(diǎn);人工智能有超越人類智能的可能;理論上,人工智能還可以永生。
這也引起了很多人們的擔(dān)憂。奇點(diǎn)到來(lái)、強(qiáng)人工智能、超人工智能、意識(shí)永生、人類滅絕等聳人聽(tīng)聞的觀點(diǎn)出現(xiàn),引起包括霍金、蓋茨和馬斯克等在內(nèi)的世界名人對(duì)人工智能發(fā)展的擔(dān)憂。在每年的世界人工智能大會(huì)上,專門有一個(gè)論壇探討人工智能與法律、倫理及人類未來(lái)的會(huì)場(chǎng)。
現(xiàn)在,人工智能工業(yè)的OpenAI成立。
2016年全社會(huì)對(duì)人工智能的極大關(guān)注,可能是2016年AI的最大進(jìn)展!
在半監(jiān)督/無(wú)監(jiān)督學(xué)習(xí)、通用人工智能方面,人工智能具有舉一反三,并有常識(shí)、經(jīng)驗(yàn)、記憶、知識(shí)學(xué)習(xí)、推理、規(guī)劃、決策,甚至還有動(dòng)機(jī)。這最后一點(diǎn)有點(diǎn)恐怖,人是有意識(shí)和動(dòng)機(jī)的,機(jī)器做事也有動(dòng)機(jī),太可怕了。
智能學(xué)習(xí)進(jìn)步很快,AIpha Go八個(gè)月后就可以戰(zhàn)勝所有圍棋手,因?yàn)樗苊刻?4小時(shí)學(xué)習(xí)、不吃不喝地學(xué)習(xí),比人強(qiáng)多了。
因此,在經(jīng)歷了60年“三起兩落”的發(fā)展后,以深度學(xué)習(xí)為主要標(biāo)志的人工智能正迎來(lái)第3次偉大復(fù)興,這次引起社會(huì)尤其是產(chǎn)業(yè)界高強(qiáng)度的關(guān)注。因?yàn)樯鲜兰o(jì)60年代和80年代,人工智能沒(méi)有達(dá)到這樣的水平。
硅谷精神教父、預(yù)言家凱文?凱利說(shuō),未來(lái)人工智能會(huì)成為一種如同電力一樣的基礎(chǔ)服務(wù)。斯坦福大學(xué)推出了“人工智能百年研究”首份報(bào)告――《2030年的人工智能與生活》。
3人工智能上升為國(guó)家發(fā)展戰(zhàn)略
有人認(rèn)為第四次工業(yè)革命即將由人工智能與機(jī)器人等引爆。英國(guó)政府認(rèn)為,人工智能有望像19世紀(jì)的蒸汽機(jī)革命那樣徹底改變我們的生活,甚至人工智能給人類社會(huì)帶來(lái)的變革與影響,有可能遠(yuǎn)遠(yuǎn)超過(guò)蒸汽機(jī)、電力和互聯(lián)網(wǎng)帶來(lái)的前三次工業(yè)革命。
智能制造、無(wú)人駕駛汽車、消費(fèi)類智能機(jī)器人、虛擬助手、聊天機(jī)器人、智能金融、智能醫(yī)療、智能新聞寫作、智能律師、智慧城市等可能被人工智能代替。人工智能將無(wú)處不在,可望替換人類的部分腦力勞動(dòng),一些職業(yè)會(huì)被取代或補(bǔ)充,一些新的行業(yè)又會(huì)誕生,例如18世紀(jì)出現(xiàn)了紡織工人,之后汽車代替了馬車等。因此,我們將經(jīng)歷從“互聯(lián)網(wǎng)+”到“人工智能+”。
中國(guó)“互聯(lián)網(wǎng)+”與“中國(guó)制造2025”國(guó)家發(fā)展戰(zhàn)略的實(shí)施,對(duì)人工智能的巨大需求在迅速增長(zhǎng)。未來(lái)2-5年,人工智能應(yīng)用與產(chǎn)業(yè)發(fā)展將迎來(lái)爆發(fā)期。
中國(guó)政府在《“互聯(lián)網(wǎng)+”人工智能3年行動(dòng)實(shí)施方案》提出:計(jì)劃在2018年形成千億級(jí)人工智能產(chǎn)業(yè)應(yīng)用規(guī)模。201 7年1月10日,科技部部長(zhǎng)萬(wàn)鋼稱,將編制完成人工智能專項(xiàng)規(guī)劃,加快推進(jìn)人工智能等重大項(xiàng)目的立項(xiàng)論證。
美國(guó)政府在2016年10月13日出臺(tái)了《為人工智能的未來(lái)做好準(zhǔn)備》的報(bào)告,提出了23條建議措施。同一天,美國(guó)政府又出臺(tái)了《國(guó)家人工智能研發(fā)戰(zhàn)略規(guī)劃》,提出了7大重點(diǎn)戰(zhàn)略方向。美國(guó)參議院于2016年11月30日召開(kāi)了關(guān)于人工智能的首次國(guó)會(huì)聽(tīng)證會(huì),主題是“人工智能的黎明”,認(rèn)為中國(guó)是對(duì)美國(guó)人工智能全球領(lǐng)導(dǎo)地位的一個(gè)真正威脅。在2016年12月20日美國(guó)白宮了《人工智能、自動(dòng)化與經(jīng)濟(jì)》報(bào)告,考察了人工智能驅(qū)動(dòng)的自動(dòng)化將會(huì)給經(jīng)濟(jì)帶來(lái)的影響,并提出了國(guó)家的三大應(yīng)對(duì)策略方向??梢?jiàn),奧巴馬把人工智能看作其政治遺產(chǎn)之一(注:另一個(gè)是Cyber空間)。
英國(guó)政府2016年12月了《人工智能:未來(lái)決策的機(jī)遇與影響》的報(bào)告,關(guān)注人工智能對(duì)社會(huì)創(chuàng)新與生產(chǎn)力的促進(jìn)作用,論述如何利用英國(guó)人工智能的獨(dú)特優(yōu)勢(shì),增強(qiáng)英國(guó)國(guó)力。
日本政府2017年開(kāi)始,要讓人工智能與機(jī)器人推動(dòng)第四次工業(yè)革命。
4 我國(guó)對(duì)策
應(yīng)以深度卷積神經(jīng)網(wǎng)絡(luò)為核心,全面開(kāi)展計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和自然語(yǔ)言等人工智能產(chǎn)品的開(kāi)發(fā)與大規(guī)模產(chǎn)業(yè)化應(yīng)用。這需要大數(shù)據(jù)、計(jì)算平臺(tái)/計(jì)算引擎、人工智能算法、應(yīng)用場(chǎng)景等飛速發(fā)展,另外還需要資源、資金、人才。在方法上,選定垂直細(xì)分領(lǐng)域最重要。
面向若干細(xì)分垂直領(lǐng)域,建立大數(shù)據(jù)中心。實(shí)現(xiàn)大數(shù)據(jù)采集、清洗、標(biāo)簽、存儲(chǔ)、管理與交易,建立大數(shù)據(jù)源公共基礎(chǔ)設(shè)施與垂直領(lǐng)域知識(shí)庫(kù)。專有大數(shù)據(jù)是人工智能產(chǎn)業(yè)制勝的關(guān)鍵和法寶。中國(guó)企業(yè)必須開(kāi)始特別關(guān)注大數(shù)據(jù)的采集與利用。其重要性如同原油―樣,跨國(guó)企業(yè)視之為戰(zhàn)略資源!
強(qiáng)力開(kāi)展人工智能芯片與硬件平臺(tái)的研發(fā)。包括基于FPGA的深度學(xué)習(xí)芯片;類腦芯片與憶阻器件;建立國(guó)家級(jí)人工智能超算中心。
關(guān)鍵詞:發(fā)展趨勢(shì);研究應(yīng)用;人工智能
DOI:10.16640/ki.37-1222/t.2017.07.119
0 簡(jiǎn)介
人工智能((Artificial Intelligence)),它是一門新的技術(shù)科學(xué),主要用于模擬、延伸以及擴(kuò)展人類的智能的方法、理論、技術(shù)以及應(yīng)用系統(tǒng)。人工智能主要就是對(duì)人類的思維、意識(shí)的信息過(guò)程的合理化的模擬。人工智能它并不是人的智能,但是,它卻能像人那樣的思考,而且也可能會(huì)超過(guò)人類的智能??偟恼f(shuō)來(lái),人工智能研究的一個(gè)主要目標(biāo)是使機(jī)器能夠勝任一些復(fù)雜工作。
1 人工智能的運(yùn)用現(xiàn)狀
目前,在很多方面人工智能有著運(yùn)用,其中一個(gè)主要表現(xiàn)就是全球人工智能公司數(shù)量在急劇的增加,專家系統(tǒng)在目前來(lái)看是在人工智能各領(lǐng)域中最為活躍,且最為有成效的一個(gè)領(lǐng)域。它是一類基于知識(shí)的系統(tǒng),并可以解決那些一般僅有專家才能夠解決的復(fù)雜問(wèn)題。我們這樣定義專家系統(tǒng):專家系統(tǒng)是一種具有特定領(lǐng)域內(nèi)大量知識(shí)與經(jīng)驗(yàn)的程序系統(tǒng),它是基于程序系統(tǒng)依靠人工智能技術(shù),來(lái)模擬人類專家求解復(fù)雜問(wèn)題的過(guò)程,大多情況下,專家系統(tǒng)的水平甚至可以超過(guò)人類專家。專家系統(tǒng)的基本結(jié)構(gòu)圖如下圖所示:
2 人工智能的影響
人工智能對(duì)經(jīng)濟(jì)的影響:人工智能的的確確會(huì)影響到社會(huì)、生活、文化的方方面面,特別是對(duì)于實(shí)體經(jīng)濟(jì)將來(lái)會(huì)有巨大的影響。以后,每個(gè)行業(yè)幾乎都會(huì)產(chǎn)生顛覆性的變化。在人工智能的研究上,中國(guó)并不落后,將來(lái)的中國(guó)一定可以從中獲得非常大的收益。一成功的專家系統(tǒng)可以為它的用戶帶來(lái)很明顯的經(jīng)濟(jì)效益。用比較經(jīng)濟(jì)的辦法執(zhí)行任務(wù)而不需要具有經(jīng)驗(yàn)的專家,從而極大地減少開(kāi)支。專家系統(tǒng)深入各行各業(yè),帶來(lái)巨大的宏觀效益,促進(jìn)了IT網(wǎng)絡(luò)工業(yè)的發(fā)展。
人工智能對(duì)文化的影響:在人工智能原理的基礎(chǔ)上,人們通常情況下會(huì)應(yīng)用人工智能的概念來(lái)描述他們的日常狀態(tài)和求解問(wèn)題的過(guò)程。人工智能可以擴(kuò)大人們知識(shí)交流的概念集合,描述我們所見(jiàn)所聞的方法以及描述我們信念的新方法;人工智能技術(shù)為人類的文化生活提供了巨大的便利。如圖像處理技術(shù)必將會(huì)對(duì)圖形藝術(shù)和社會(huì)教育部門等產(chǎn)生深遠(yuǎn)影響。比如現(xiàn)有的智力游戲機(jī)將會(huì)發(fā)展成具有更高智能的一種文化娛樂(lè)手段。隨著技術(shù)的進(jìn)步,這種影響會(huì)越來(lái)越明顯地表現(xiàn)出來(lái)。當(dāng)然,還有一些影響可能是我們目前難以預(yù)測(cè)的。但可以肯定,人工智能將對(duì)人類的物質(zhì)文明以及精神文明產(chǎn)生更大的影響。
人工智能對(duì)社會(huì)的的影響:一方面,AI為人類文化生活提供了一種新的模式。現(xiàn)有的游戲?qū)⒅鸩桨l(fā)展為更高智能的交互式文化娛樂(lè)手段,今天,游戲中的人工智能應(yīng)用已經(jīng)深入到各大游戲制造商的開(kāi)發(fā)中。另一方面,人工智能能夠代替人類進(jìn)行各種腦力勞動(dòng),所以,從某種意義上來(lái)講,這將會(huì)使一部分人失去發(fā)展的機(jī)遇,甚至可能失業(yè)。由于人工智能在科技以及工程中的應(yīng)用,一部分人可能會(huì)失去介入信息處理活動(dòng)的機(jī)會(huì),甚至不得已而改變自己的工作方式;人工智能還可能會(huì)威脅到人類的精神。一般人們覺(jué)得人類與機(jī)器的區(qū)別就是人類具有感知精神,但如果有一天,這些相信只有人才具有感知精神的人也開(kāi)始相信機(jī)器能夠思維和創(chuàng)作,那他們就會(huì)感到失望,甚至于感到威脅。他們會(huì)擔(dān)心:有朝一日,智能機(jī)器的人工智能可能會(huì)超過(guò)人類的自然智能,從而使人類淪為智能機(jī)器的奴隸。
3 人工智能的發(fā)展趨勢(shì)
有機(jī)構(gòu)預(yù)測(cè),2017年人工智能投資將同比增長(zhǎng)300%以上,在技術(shù)上將會(huì)更迅猛發(fā)展,工控自動(dòng)化商城的智能語(yǔ)音、智能圖像、自然語(yǔ)言以及深度學(xué)習(xí)等技術(shù)越來(lái)越成熟,就像空氣和水一樣將會(huì)逐步地滲透到我們的日常生活。行業(yè)專家關(guān)于2017年人工智能的發(fā)展方向主要有以下幾點(diǎn):(1)機(jī)器學(xué)習(xí)目前正在被應(yīng)用在更復(fù)雜的任務(wù)以及更多領(lǐng)域中,且被更多的人作為挖掘數(shù)據(jù)的方式。無(wú)監(jiān)督的學(xué)習(xí)會(huì)取得更多進(jìn)展,但也存在很大的挑戰(zhàn),故在這一方面離人類的能力還是差得很遠(yuǎn)的。計(jì)算機(jī)在理解和生成自然語(yǔ)言方面,預(yù)計(jì)最先會(huì)在聊天機(jī)器人和其他對(duì)話系統(tǒng)上落地。 (2)深度學(xué)習(xí)、其他的機(jī)器學(xué)習(xí)、人工智能技術(shù)的混用,是成熟技術(shù)的典型標(biāo)志。將深度學(xué)習(xí)應(yīng)用到醫(yī)療領(lǐng)域中(醫(yī)療圖像、臨床數(shù)據(jù)、基因組數(shù)據(jù)等),各種類型數(shù)據(jù)上的研究以及成果將會(huì)大大的增加。 (3)聊天機(jī)器人和自動(dòng)駕駛汽車可能會(huì)取得較大的進(jìn)展,預(yù)計(jì)更多人類基準(zhǔn)將會(huì)被打破,特別是那些基于視覺(jué)以及適合卷積神經(jīng)網(wǎng)絡(luò)的挑戰(zhàn)。而非視覺(jué)特征創(chuàng)建和時(shí)間感知方法將會(huì)變得更加頻繁、更加富有成果。
4 結(jié)論
人工智能是人類長(zhǎng)久以來(lái)的夢(mèng)想,同時(shí)也是一門富有挑戰(zhàn)性的學(xué)科。盡管人工智能帶來(lái)很多問(wèn)題,但當(dāng)人類堅(jiān)持把人工智能只用于造福人類,人工智能推動(dòng)人類社會(huì)文明進(jìn)步將毋庸置疑。就像所有的學(xué)科一樣,人工智能也會(huì)經(jīng)歷各種挫折,但只要我們有信心、 有毅力,人工智能終將成為現(xiàn)實(shí),融入到我們生活的方方面面,為我們的生活帶來(lái)更大的改變。
參考文獻(xiàn):
[1]朱祝武.人工智能發(fā)展綜述[J].中國(guó)西部科技,2011,10(17):8-10.
[2]肖斌.對(duì)人工智能發(fā)展新方向的思考[J].信息技術(shù),2009,37(12):166-169.
【關(guān)鍵詞】圖像復(fù)原;正則化;GMRES;約束最小二乘
1 國(guó)內(nèi)外研究現(xiàn)狀
用迭代方法處理各種反問(wèn)題已有悠久的歷史。但是研究表明,使用迭代方法求解反問(wèn)題,有時(shí)會(huì)出現(xiàn)所謂的“半收斂”現(xiàn)象,即在迭代的早期階段,近似解可穩(wěn)定地得到改進(jìn),展現(xiàn)出“自正則化”效應(yīng),但當(dāng)?shù)螖?shù)超過(guò)某個(gè)閾值后便會(huì)趨向于發(fā)散。因而,使用迭代法求解的關(guān)鍵是要尋找一個(gè)恰當(dāng)?shù)慕K止原則,在迭代次數(shù)和原始數(shù)據(jù)誤差水平之間找到平衡值。研究表明,迭代指數(shù),即迭代步數(shù)正好起到正則化參數(shù)的作用,而這個(gè)終止準(zhǔn)則對(duì)應(yīng)著正則化參數(shù)的某種選擇方法。并且使用迭代方法求解還有很多優(yōu)點(diǎn),因此,在正則化問(wèn)題求解中通常選用迭代的方法,常用的迭代方法有:Landweber迭代法、VanCittert迭代方法、最速下降方法和迭代Tikhonov正則化的求解方法,以及正則化方法的快速數(shù)值實(shí)現(xiàn)。
2 基于解空間分解的GMRES 算法及圖像復(fù)原應(yīng)用
2.1 正則化模型與圖像復(fù)原
設(shè)F和U分別表示度量空間,度量為ργ和ρμ,算子A:F到U映F到U,則該問(wèn)題變?yōu)榫€性反問(wèn)題(當(dāng)A為線性算子時(shí)),或非線性反問(wèn)題(當(dāng)A為非線性算子時(shí))。“不適定性”(病態(tài)性)是所有反問(wèn)題所具有的一個(gè)共同的特性。一般情況下,不適定性是反問(wèn)題本身的固有特征:如果問(wèn)題的先驗(yàn)信息是未知的,那么就無(wú)法得到理想的結(jié)果。因此,我們應(yīng)該盡可能多的收集先驗(yàn)信息,最大限度的復(fù)原原問(wèn)題。通常,人們將求解反問(wèn)題(不適定問(wèn)題)的理論和方法稱為正則化方法。對(duì)于圖像處理問(wèn)題,由于涉及到大規(guī)模的方程組求解,法方程的維數(shù)太大,此時(shí)再應(yīng)用代數(shù)方法求解就會(huì)遇到一些難以實(shí)現(xiàn)的技術(shù)問(wèn)題,而選用正則化方法不但可以克服上述缺點(diǎn),還具有某些優(yōu)點(diǎn),當(dāng)問(wèn)題從無(wú)窮維度變到有限維度時(shí),迭代求解不會(huì)影響系數(shù)結(jié)構(gòu),而且能夠起到節(jié)約運(yùn)算空間的效果。這些優(yōu)勢(shì)在大規(guī)模計(jì)算中非常有利。
對(duì)于圖像恢復(fù)的病態(tài)性問(wèn)題,利用正則化思想進(jìn)行圖像復(fù)原時(shí),需要利用先驗(yàn)信息,構(gòu)造某種約束條件,使用數(shù)理統(tǒng)計(jì)方法,將圖像復(fù)原這一不適定問(wèn)題轉(zhuǎn)變成適定問(wèn)題,進(jìn)而使得近似解滿足適定性的三項(xiàng)約束,這也是正則化方法的優(yōu)勢(shì)所在。
2.2 解空間分解的廣義極小殘量算法
在對(duì)線性方程組Ax=b,A緊算子,進(jìn)行求解時(shí),為了盡可能減少存儲(chǔ)空間和計(jì)算開(kāi)銷,Krylov子空間迭代法是求行之有效的方法。當(dāng)系數(shù)矩陣A對(duì)稱正定,共扼梯度法(CG)或預(yù)共轆梯度法(PCG)可快速準(zhǔn)確求解該方程組的近似解;當(dāng)A對(duì)稱但不正定時(shí),極小殘量法或預(yù)極小殘量法則能有效求解方程組。對(duì)于一般的非對(duì)稱矩陣,常采用廣義極小殘量法、共扼梯度法來(lái)求解。GMRES算法利用Arnold過(guò)程產(chǎn)生Krylov子空間Kj的正交基,Arnold過(guò)程中每次迭代運(yùn)算,都要調(diào)用所有前面的迭代所產(chǎn)生的正交基來(lái)生成下一個(gè)正交基。
2.3 光學(xué)圖像復(fù)原結(jié)果
對(duì)于方程Ax=b,利用基于解空間分解的加速GMRES 算法迭代求解。計(jì)算步驟如下:
Step1.置初始值x0=0,并令δ=10-8;
Step2.用解空間分解的加速GMRES 算法迭代求解式Ax=b,在第j步的值為xj;
Step3.若■≤σ,終止迭代;否則置 j=j+1,繼續(xù)進(jìn)行Step2。在迭代運(yùn)算中,正則化參數(shù)αj=15,■隨著迭代的進(jìn)行自動(dòng)更新。
圖像復(fù)原實(shí)驗(yàn)中處理的是256*256尺寸的0-255灰度級(jí)的liftingbody圖像。用改進(jìn)信噪比來(lái)衡量算法的復(fù)原性能。從復(fù)原之后的對(duì)比效果看,共扼梯度法(CG)并不能有效的抑制模糊退化,復(fù)原結(jié)果仍然比較模糊,圖像邊緣有振鈴波紋出現(xiàn)。解空間分解的加速GMRES算法復(fù)原結(jié)果的邊界紋路比較清晰,很好的顯示出原圖像邊緣細(xì)節(jié)部分,與此同時(shí),振鈴波紋因?yàn)榧哟疤幚淼玫接行б种?,整體視覺(jué)效果很好。
3 線性代數(shù)方法與圖像復(fù)原應(yīng)用
在涉及到復(fù)雜矩陣和向量的離散圖像復(fù)原模型中,可以從線性代數(shù)方法中得到一種效率較高的求解方法,常用的方法是約束最小二乘法。對(duì)約束最小二乘法進(jìn)行改進(jìn),根據(jù)先驗(yàn)信息,把正則化思想和約束最小二乘法等有機(jī)結(jié)合在一起,并將其運(yùn)用到離散圖像復(fù)原中,得到的約束最小二乘的空域迭代法可以出色的抑制噪聲,而且在噪聲很強(qiáng)是也可以得到很好地復(fù)原結(jié)果。
將正則化思想與約束最小二乘法相結(jié)合,繼而復(fù)原退化圖像。通過(guò)對(duì)噪聲能量的限制來(lái)使用正則化理論,運(yùn)用空域迭代時(shí)很好的抑制了噪聲放大現(xiàn)象,同時(shí)克服了病態(tài)性,而且計(jì)算速度得到了提升。實(shí)驗(yàn)數(shù)據(jù)表明,本方法更適合復(fù)原污染程度較大的圖像,但不適合復(fù)原模糊程度較大的圖像。
4 總結(jié)與展望
圖像復(fù)原近年來(lái)受到了越來(lái)越廣泛的關(guān)注,正則化方法理論的發(fā)展也越來(lái)越得到完善,許多學(xué)者從模型上、理論上、應(yīng)用上分別展開(kāi)了對(duì)于正則化的圖像復(fù)原的深入研究,本文的研究雖然力求有較強(qiáng)的實(shí)用性,但是由于受到多方面的限制,在理論和工程應(yīng)用等方面仍存在很多的待豐富和改進(jìn)之處,需要在以后的工作中繼續(xù)深入研究。
首先,要加深對(duì)觀測(cè)圖像的先驗(yàn)信息的挖掘,因?yàn)槿绻軌蛴行Ю孟闰?yàn)信息,就能極大的改善估計(jì)精度以及問(wèn)題的病態(tài)性。要充分的利用各種先驗(yàn)知識(shí),構(gòu)造更加精確地目標(biāo)泛函,設(shè)計(jì)出更加優(yōu)良的算法,同時(shí)要充分分析現(xiàn)有正則化參數(shù)的選擇方法,結(jié)合各個(gè)方法的優(yōu)缺點(diǎn),構(gòu)造出更加高效的正則化算子;要注意噪聲擴(kuò)大與圖像復(fù)原的平衡,充分利用成像時(shí)的分段平滑性質(zhì),去除圖像邊緣模糊和振鈴現(xiàn)象。其次,要注重正則化圖像復(fù)原方法與其他圖像復(fù)原方法的有機(jī)結(jié)合?,F(xiàn)階段,神經(jīng)網(wǎng)絡(luò)、小波分析和遺傳算法等新式的算法在圖像復(fù)原方面取得了極大的進(jìn)展,如果能夠?qū)⑦@些理論結(jié)合在一起,形成優(yōu)勢(shì)互補(bǔ),一定能得到性能更好的圖像處理算法。
【參考文獻(xiàn)】
[1]肖庭延,于慎根,王延飛.反問(wèn)題的數(shù)值解法[M].北京:科學(xué)出版社,2003.
[2]鄒謀炎.反卷積和信號(hào)復(fù)原[M].北京:國(guó)防工業(yè)出版社,2001.
關(guān)鍵詞:指紋識(shí)別;中值濾波;加權(quán)自適應(yīng);最小二乘支持向量機(jī)
0 引言
現(xiàn)代社會(huì)中,身份鑒定技術(shù)具有非常重要的應(yīng)用價(jià)值。人類指紋的不變性和唯一性使得指紋識(shí)別技術(shù)成為目前應(yīng)用最廣泛、最可靠的身份驗(yàn)證技術(shù)。指紋識(shí)別[1]算法理論的研究,以及計(jì)算機(jī)硬件的高集成、低成本,使得利用指紋來(lái)完成身份鑒別和識(shí)別任務(wù)的系統(tǒng)得到大規(guī)模應(yīng)用。典型的指紋識(shí)別系統(tǒng)主要由指紋圖像采集、指紋圖像預(yù)處理、指紋圖像特征提取、指紋圖像比對(duì)這4個(gè)部分組成。
圖像去噪增強(qiáng)是指紋圖像預(yù)處理中的一項(xiàng)重要環(huán)節(jié)。中值濾波[2]是一種去除噪聲的非線性處理方法。中值濾波方法不但具有低通特性可以去除噪聲,而且又可以保護(hù)圖像邊緣,保留細(xì)節(jié)部分。中值濾波方法在去噪復(fù)原中得到了較好的效果。
目前指紋分類方法大致有:語(yǔ)義分析法、幾何法、隨機(jī)法、神經(jīng)網(wǎng)絡(luò)方法和支持向量機(jī)(SVM)方法。支持向量機(jī)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展出來(lái)的一種非常有效地新機(jī)器學(xué)習(xí)方法,它很好的解決了小樣本、非線性、過(guò)學(xué)習(xí)、高維數(shù)、局部極小點(diǎn)等問(wèn)題,并具有很強(qiáng)的泛化能力。學(xué)者不斷對(duì)支持向量機(jī)進(jìn)行深入研究,涌現(xiàn)出許多有效地改進(jìn)算法,如C-SVM算法、v-SVM算法、加權(quán)支持向量機(jī)(WSVM)、最小二乘SVM算法(LS-SVM)等[3]。
本文研究了指紋圖像的中值濾波方法,以及基于最小二乘支持向量機(jī)的圖像分類識(shí)別。首先對(duì)指紋圖像進(jìn)行濾波預(yù)處理,然后提取特征,最后,采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練分類識(shí)別。
1 指紋識(shí)別系統(tǒng)原理
指紋識(shí)別系統(tǒng)可分為兩大模塊:一是系統(tǒng)學(xué)習(xí)模塊;二是指紋識(shí)別模塊。學(xué)習(xí)模塊包括采集指紋圖像,對(duì)指紋圖像進(jìn)行預(yù)處理,把提取出的特征編碼存入樣本數(shù)據(jù)庫(kù)。識(shí)別模塊包括將待識(shí)別的指紋圖像進(jìn)行預(yù)處理,在提取特征后與數(shù)據(jù)庫(kù)中的指紋模版進(jìn)行匹配,判斷是否匹配,得出結(jié)論。
2 噪聲
2.1 指紋圖像中噪聲的來(lái)源
指紋圖像中的噪聲主要來(lái)源于指紋圖像的獲?。〝?shù)字化過(guò)程)和傳輸過(guò)程。圖像傳感的工作情況受各種因素的影響,如圖像獲取中的環(huán)境條件和傳感元器件自身的質(zhì)量。例如,使用CCD指紋傳感器獲取圖像,光照程度和傳感器溫度是生成圖像中產(chǎn)生大量噪聲的主要因素。圖像在傳輸過(guò)程中主要由于所用的傳輸信道的干擾受到的噪聲。比如通過(guò)無(wú)線電網(wǎng)絡(luò)傳輸?shù)膱D像可能會(huì)因?yàn)楣饣蚱渌髿庖蛩氐母蓴_而被污染[4]。
常見(jiàn)噪聲主要有高斯噪聲,均值噪聲,椒鹽噪聲,指數(shù)噪聲,對(duì)數(shù)噪聲等。
2.2 指紋圖像去噪的意義
噪聲在指紋圖像預(yù)處理中是一個(gè)非常重要的問(wèn)題,它對(duì)指紋圖像的輸入、采集、處理的各個(gè)環(huán)節(jié)以及最終的輸出結(jié)果都會(huì)產(chǎn)生一定的影響。特別是在圖像的輸入、采集過(guò)程中,噪聲是個(gè)十分關(guān)鍵的問(wèn)題,若輸入伴有較大噪聲,必然影響之后的處理以及最終的處理效果。因此,去噪處理已成為指紋圖像預(yù)處理中極其重要的步驟。
3 平滑濾波器
3.1 高斯濾波器
高斯平滑濾波是讓原圖像同高斯函數(shù)進(jìn)行卷積,從而達(dá)到抑制噪聲、平滑圖像的目的。假設(shè)原圖像為 ,經(jīng)過(guò)高斯平滑濾波后的圖像為 , 和 表示圖像行、列坐標(biāo),則
式中: 表示高斯函數(shù)的方差。
3.2 中值濾波
指紋圖像在經(jīng)過(guò)高斯平滑處理后,大多數(shù)噪聲被去除了,但仍可能存在少數(shù)孤立的噪聲點(diǎn),為進(jìn)一步去除這些噪聲,有必要圖像進(jìn)行中值濾波處理。中值濾波是基于排序統(tǒng)計(jì)理論的一種能有效抑制噪聲的非線性濾波器,它對(duì)消除椒鹽噪聲[5]非常有效,所以常被用來(lái)保留需要的圖像結(jié)構(gòu)的同時(shí)消除椒鹽噪聲。
3.2.1 標(biāo)準(zhǔn)中值濾波
標(biāo)準(zhǔn)中值濾波是一種基于快速排序的非線性濾波算法,不僅能去除或者減少隨機(jī)噪聲和脈沖干擾,還能較好地保留圖像邊緣的信息。
算法具體實(shí)現(xiàn)步驟[6-7]如下:
1)將模板在圖中遍歷,并將模板中心圖中某個(gè)像素位置重合;
2)將模板下各對(duì)應(yīng)像素的灰度值讀取出來(lái);
3)把這些灰度值從小到大排成一列;
4)找出值的中間值作為最終的輸出結(jié)果;
5)將中間值賦給對(duì)應(yīng)模板中心位置的像素。
通過(guò)以上的實(shí)現(xiàn)步驟,我們可以用一下公式來(lái)表示中值濾波:
式中: 表示坐標(biāo)點(diǎn) 處的灰度值, 表示以為
中心濾波窗口中的所有坐標(biāo)點(diǎn), 表示進(jìn)行中值處理,
表示濾波輸出。
標(biāo)準(zhǔn)中值濾波需要進(jìn)行大量的排序工作,計(jì)算量很大,同時(shí)去除脈沖噪聲的性能受濾波窗口尺寸的影響較大,窗口越大,去噪效果越好,但圖像變得越模糊,即在抑制圖像噪聲和保護(hù)細(xì)節(jié)方面存在一定的矛盾。
3.2.2 加權(quán)自適應(yīng)中值濾波算法
為了改進(jìn)現(xiàn)有中值濾波算法對(duì)于高密度噪聲圖像以及紋理細(xì)膩圖像的邊緣處理能力欠佳的缺陷,加權(quán)自適應(yīng)中值濾波算法采用了通過(guò)擴(kuò)大窗口來(lái)相對(duì)地減少?zèng)_激噪聲空間密度這一策略。
算法的基本思想是:設(shè) 表示中心像素點(diǎn) 在濾波時(shí)所對(duì)應(yīng)的掩膜窗口,窗口大小為 ,令 為 中的最小灰度值, 為 中的最大灰度值, 為 中的灰度中值, 為坐標(biāo) 處的灰度值, 為 允許的最大窗口尺寸, 為閾值。
若滿足 ,則轉(zhuǎn)向5);
計(jì)算窗口內(nèi)標(biāo)準(zhǔn)中值濾波結(jié)果記為SM,若滿足
則轉(zhuǎn)向4);
增大窗口尺寸 ,若 ,則重復(fù)1),否則轉(zhuǎn)向4);
計(jì)算像素點(diǎn)與另外 個(gè)像素點(diǎn)灰度值差值的均值
若 ,則轉(zhuǎn)向5),否則轉(zhuǎn)向6);
若滿足 ,則輸出 ,否則轉(zhuǎn)向6);
輸出 。
其中 的計(jì)算方法結(jié)合了均值思想,把排序得到的中值與窗口中所有像素點(diǎn)的均值加權(quán)得到灰度中值,中值的權(quán)重為0.6,均值的權(quán)重為0.4。
含噪聲圖 標(biāo)準(zhǔn)中值濾波圖 加權(quán)自適應(yīng)中值濾波圖
經(jīng)過(guò)比較,可見(jiàn)這兩種處理方法的效果差異,加權(quán)自適應(yīng)中值濾波比標(biāo)準(zhǔn)中值濾波處理的效果好,噪聲去除干凈,且指紋圖像中的細(xì)節(jié)保留較好。
4 最小二乘支持向量機(jī)
Suykens等提出的最小二乘支持向量機(jī)(LS-SVM),基本思想是對(duì)估計(jì)函數(shù)進(jìn)行分段估計(jì),然后再組合到一起以減小算法復(fù)雜度;構(gòu)建新的核函數(shù),使之能降低優(yōu)化問(wèn)題的維數(shù)。最小二乘支持向量機(jī)創(chuàng)造性地把標(biāo)準(zhǔn)SVM的線性不等式約束轉(zhuǎn)化成等式約束,從而使得SVM的訓(xùn)練等價(jià)于一組線性方程組的求解。
LS-SVM類似于傳統(tǒng)SVM,也是通過(guò)構(gòu)造最優(yōu)分類超平面實(shí)現(xiàn)分類的。但LS-SVM不同于SVM的是:SVM將每一個(gè)樣本點(diǎn) 都添加了一個(gè)誤差量,我們假設(shè)給定 個(gè)樣本數(shù)據(jù)為
其中 為輸入向量, 為輸出變量,且
為待估計(jì)的未知函數(shù)。作輸入空間到
維特征空間的內(nèi)映射: , 是非線性的,且 的取值無(wú)上界,則被估計(jì)函數(shù) ,其中 為空間
中的權(quán)向量, 為偏置。于是求解優(yōu)化問(wèn)題就變成一下問(wèn)題:
若選取核函數(shù)
5 實(shí)驗(yàn)
指紋圖像預(yù)處理過(guò)程包括:
圖像歸一化處理。將圖像的平均灰度和對(duì)比度調(diào)整到一個(gè)固定的級(jí)別上,以消除傳感器本身噪聲或手指壓力不同以及其它原因造成的灰度差異,使圖像具有預(yù)定的均值與方差,為后續(xù)處理提供一個(gè)較為統(tǒng)一的圖像規(guī)格。
圖像分割。把圖像的前景區(qū)域和背景區(qū)域分割開(kāi)來(lái),去除背景區(qū)域。這樣一方面減少了后續(xù)處理步驟的數(shù)據(jù)量,另一方面也避免了因?yàn)椴糠謭D像區(qū)域不可靠而導(dǎo)致偽特征的產(chǎn)生。
圖像濾波增強(qiáng)。在此分別采用標(biāo)準(zhǔn)中值濾波和加權(quán)自適應(yīng)中值濾波算法,并對(duì)最后識(shí)別結(jié)果做出比較。
圖像二值化[8]。將原始灰度圖像轉(zhuǎn)化為只有黑白兩種灰度等級(jí)的二值圖像,突出了圖像特征,便于進(jìn)行特征提取。
實(shí)驗(yàn)采用自建的組合指紋庫(kù),40個(gè)人,每人2張共80張指紋圖片。每人取1張共40張圖片作為實(shí)驗(yàn)的訓(xùn)練集,取另外1張共40張圖片作為實(shí)驗(yàn)的測(cè)試集。分別把預(yù)處理階段采用標(biāo)準(zhǔn)中值濾波算法和加權(quán)自適應(yīng)中值濾波算法處理的指紋圖像,做指紋識(shí)別實(shí)驗(yàn)。特征提取時(shí),為使目標(biāo)圖像具有平移、旋轉(zhuǎn)和比例不變性,用矩算法提取不變矩特征。采用最小二乘支持向量機(jī)對(duì)特征向量進(jìn)行分類,選取樣本點(diǎn)進(jìn)行訓(xùn)練。
6 結(jié)束語(yǔ)
本文采用平滑濾波與最小二乘支持向量機(jī)方法,研究了指紋的圖像識(shí)別。建立了一個(gè)完整的指紋識(shí)別系統(tǒng),分為指紋圖像預(yù)處理、特征提取、分類識(shí)別3個(gè)主要階段,對(duì)經(jīng)過(guò)預(yù)處理的指紋圖像提取圖像特征,通過(guò)實(shí)驗(yàn)實(shí)現(xiàn)了指紋識(shí)別。
從識(shí)別結(jié)果來(lái)看,預(yù)處理過(guò)程對(duì)識(shí)別效果影響很大,采用不同的濾波方法,圖像的增強(qiáng)效果不同,最終在指紋識(shí)別率上體現(xiàn)出來(lái)。采用加權(quán)自適應(yīng)中值濾波算法對(duì)圖像進(jìn)行去噪增強(qiáng),效果比標(biāo)準(zhǔn)中值濾波好,識(shí)別率也高。
參考文獻(xiàn):
[1]陳陽(yáng)、譚思云,基于DSP的指紋識(shí)別系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)測(cè)量與控制,2005.13(12):1339-1341.
[2]岡薩雷斯,數(shù)字圖像處理MATLAB版[M].北京:電子工業(yè)出版2005.9.
[3]胡學(xué)坤,改進(jìn)支持向量機(jī)算法及其在圖像分割中的應(yīng)用[D].2009.12.
[4]索俊祺,一種新的基于中值濾波的優(yōu)化濾波算法[D].2010.01.
[5]任洪海、紀(jì)玉波、張飛俠等,一種去除椒鹽噪聲中值濾波的改進(jìn)算法[J].電腦開(kāi)發(fā)與應(yīng)用,2005(5).
[6]趙高長(zhǎng)、張磊、武風(fēng)波,改進(jìn)的中值濾波算法在圖像去噪中的應(yīng)用[J].應(yīng)用光學(xué),2011.32(4).