前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計算機視覺中深度學習的應用范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:闡述計算機視覺借助攝影機與計算機取代人眼對事物進行識別、觀察和分析的一種機器視覺,深度學習技術(shù)在很大程度上促進計算機視覺的發(fā)展,探討計算機視覺領域中的深度學習技術(shù)的應用實例。
關(guān)鍵詞:計算機工程;視覺領域;深度學習技術(shù)
引言
計算機視覺簡言之即是依靠電子設備成像來代替生物視覺系統(tǒng),隨后依靠提前寫好的程序?qū)Λ@取的圖像信息實施處理。該技術(shù)的短期應用目的在于完成相對簡單的智能視覺工作,而深度學習技術(shù)在計算機視覺領域的應用,在很大程度上豐富了其功能,提高了識別效率,讓其能夠在更多行業(yè)發(fā)揮出自身價值。
1計算機視覺領域的深度學習技術(shù)
1.1圖像分類中的深度學習技術(shù)
基于深度學習技術(shù),卷積神經(jīng)網(wǎng)絡得到了進一步的發(fā)展,其應用范圍也更為寬泛,例如說在圖像分類中的運用。圖像分析需要對圖像實施掃描分析,隨后對其具體類別予以劃分,更加注重其整體語義。目前相對普遍進行圖像分類的數(shù)據(jù)集為ImageNet,其中囊括了非常豐富的內(nèi)容,存儲了近1500萬個圖像的URL并將圖像劃分為數(shù)萬余個類型。ImageNet每年組織開展的大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)中,圖像分類算法與技術(shù)也不斷創(chuàng)新,圖像分類的準確性也持續(xù)提升。ImageNet數(shù)據(jù)集表現(xiàn)出規(guī)模大、類型多的突出特點,所以更加適用于遷移學習,即是把部分核心技術(shù)或結(jié)構(gòu)拓展應用到各個領域,對于視覺領域的深度模型來說,能夠把模型內(nèi)的網(wǎng)絡結(jié)構(gòu)和參數(shù)直接共享到其他數(shù)據(jù)集,從而對數(shù)據(jù)實施微調(diào)。圖像分類屬于計算機視覺領域最為基礎的環(huán)節(jié),對于圖像分類模型創(chuàng)建和數(shù)據(jù)分析處理經(jīng)驗也能夠遷移應用到其他領域中。
1.2目標檢測中的深度學習技術(shù)
目標檢測相對于圖像分類而言表現(xiàn)出更多的復雜性,主要任務是在囊括多種不同類型物體的圖像內(nèi)精確定位和識別某一物體,恰恰是出于這一目的,深度學習技術(shù)在目標檢測中的應用更為復雜,要實現(xiàn)更加精準的效果也相對更難。近年來針對目標檢測的算法日益更新,如優(yōu)化后的R-CNN算法,是借助于卷積神經(jīng)網(wǎng)絡思想,對物體進行分類,提取物體特征。而SelectiveSearch算法的出現(xiàn)有了進一步的創(chuàng)新和突破,有效促進了檢測準確性的提高,這也給通過卷積神經(jīng)網(wǎng)絡進行目標檢測帶來了更多可能性,隨后的FastR-CNN算法極大地促進了目標檢測效率的提升,該算法對提取候選區(qū)的問題予以優(yōu)化,大大減少了候選區(qū)提取和目標檢測過程的時間。目標檢測網(wǎng)絡以FastR-CNN算法作為支撐,于輸出位置設置滑動窗同時和候選區(qū)域網(wǎng)絡實施連接,目標檢測的關(guān)鍵在于卷積神經(jīng)網(wǎng)絡,依靠它把各個點的特征進行提取,再借助回歸算法獲得對應范圍出現(xiàn)目標的概率[1]。
1.3人臉識別中的深度學習技術(shù)
人臉識別主要是借助相應算法對人臉特征實施提取,因為其建立的人臉模型表現(xiàn)出一定的不穩(wěn)定性,因此模型建立往往也表現(xiàn)出一定的難度,相對于建立剛體模型而言更為困難。人臉識別通常來說涉及人臉檢測定位以及特征提取兩個方面,人臉檢測定位是基于背景圖像中將人臉目標分割出來,實施歸一化處理,而人臉特征提取算法不變。前者存在的技術(shù)難點是人臉目標具有多樣性以及背景圖像具有復雜性,所以對背景情境實施合理假設并予以簡化是十分關(guān)鍵的。與此同時,高維空間人臉模型的建立較為復雜,精確度估算難度較大,人臉特征提取的技術(shù)難度是因為人臉屬于彈性模型,其難度超過剛體模型。一般來說,較為常見對人臉特征實施提取與識別的方法有幾何特征法、特征臉算法以及彈性模型法,CNN算法和過去的特征提取算法比起來表現(xiàn)出更高的穩(wěn)定性和適用性,同時能夠有效抵抗外部干擾,促進人臉識別技術(shù)的推廣應用。
2應用實例
2.1安防領域的應用
深度學習技術(shù)在計算機視覺領域中的應用可以為安防行業(yè)提供更佳的解決方案,比如說人臉識別技術(shù)的應用,很多大型企業(yè)如Facebook、騰訊、阿里巴巴等都將非常關(guān)注和重視。作為深度學習技術(shù)在計算機視覺領域應用的重要內(nèi)容,人臉識別在安檢以及反恐等領域中也能夠發(fā)揮出很好的效果。與此同時,對行人角度的REID技術(shù)實施研究,依托于深度學習強化目標檢測,對目標特征實施提取和刻畫,能夠為異常行為監(jiān)控和跟蹤帶來支持[2]。
2.2無人駕駛領域的應用
對于無人駕駛領域來說,選擇激光或雷達這類傳感器的成本更高,基于深度學習的計算機視覺技術(shù)也能夠提供新的解決方案。依靠攝像機對視頻畫面進行采集,對獲取到的圖像實施分析,提供類似于前車碰撞預警等功能。在這一過程中,計算機視覺技術(shù)可以實現(xiàn)對目標的檢測識別、對目標車輛的跟蹤分析、對車道線是否偏離進行檢測等?;谏疃葘W習技術(shù)的檢測識別表現(xiàn)出更加強大的優(yōu)勢,現(xiàn)階段深度學習芯片日益增多,對于無人駕駛技術(shù)的發(fā)展也帶來了更加有力的支持。
2.3智能家居領域的應用
過去的很多智能家居產(chǎn)品一般都是依靠智能手機藍牙或者WiFi等途徑來實現(xiàn)對家居產(chǎn)品的控制,這一方案即便能夠做到家居智能化,但其水平依舊有待提高?;谏疃葘W習技術(shù),能夠有效促進智能家居行業(yè)的更新發(fā)展,除開語言、語音識別之外,還能夠利用計算機視覺技術(shù)實現(xiàn)人際交流與互動,比如說手勢識別控制。2.4教育領域和圖片搜索領域的應用基于深度學習的計算機視覺技術(shù)也能夠在智慧教育中得以普及應用,如近年來很多新的拍照解題App,使用者只需要利用手機相機拍照上傳即可獲得相關(guān)題目的分析解答,促進學習者學習效率的提升。此時視覺技術(shù)包括了對文字的檢測與識別,另外針對個人簡歷識別、文檔識別等方面也能夠進行拓展應用。同時計算機視覺技術(shù)還可以在圖片搜索領域中得以應用,使用者通過拍攝上傳相應的圖片,即可從數(shù)據(jù)庫中找出與原圖相似的圖片,深度學習屬于一種非常高效的技術(shù)手段,能夠提供更加快速高效的圖像檢測功能,結(jié)合圖像搜索引擎,為用戶帶來更加便捷的服務[3-5]。
2.5醫(yī)療影像數(shù)據(jù)中的應用
醫(yī)學影像直接關(guān)系到對患者疾病診斷的準確性,對于放射科的醫(yī)務人員來說,依靠醫(yī)學影像能夠促進診斷效率的提升?,F(xiàn)階段國內(nèi)外諸多醫(yī)學專家隊伍,在心血管、腫瘤、神經(jīng)內(nèi)科以及五官科等都建立了精準深度學習模型,極大地推動醫(yī)療水平的提升,為廣大患者帶來了更加便捷和高效的醫(yī)療服務?;谏疃葘W習技術(shù)的計算機視覺在醫(yī)療影像數(shù)據(jù)中的應用主要集中在如下幾個方面:(1)能夠提供臨床診斷輔助等醫(yī)療服務;(2)依靠數(shù)據(jù)分析技術(shù),能夠在很大程度上促進醫(yī)療機構(gòu)經(jīng)營管理水平的提升;(3)在醫(yī)學影像中的應用,能夠讓醫(yī)務工作者更加直觀便捷地獲取患者影像;(4)深度學習技術(shù)能夠為醫(yī)療大數(shù)據(jù)的可視化帶來便利;(5)在藥企研發(fā)工作中的應用,可以處理好過去一直以來藥物研發(fā)周期長和成本居高不下的問題;(6)在健康管理領域中的應用,借助于可穿戴設備來對個人健康數(shù)據(jù)實施監(jiān)測,進而對疾病風險予以提前預測。
3結(jié)語
深度學習技術(shù)在計算機視覺領域中應用的終極目標是為了讓機器可以和人類一樣,觀察并讀懂世界。近年來AI技術(shù)的不斷發(fā)展與普及應用,深度學習技術(shù)必然會在計算機視覺領域中發(fā)揮出更大的價值,為現(xiàn)代人的生活和工作帶來更多便利。
參考文獻
[1]尹黎明,魯屹華.基于深度學習的監(jiān)控視頻圖像增強方法[J].湖北科技學院學報,2019,39(05):123-125+130.
[2]林成創(chuàng),單純,趙淦森,楊志榮,彭璟,陳少潔,黃潤樺,李壯偉,易序晟,杜嘉華,李雙印,羅浩宇,樊小毛,陳冰川.機器視覺應用中的圖像數(shù)據(jù)增廣綜述[J].計算機科學與探索,2021,15(04):583-611.
[3]白翔,龐彥偉,章國鋒.計算機視覺中的深度學習專題(2020)簡介[J].中國科學:信息科學,2020,50(02):303-304.
[4]馬元元,李向偉,劉艷飛.海量監(jiān)控視頻分級摘要生成系統(tǒng)研究[J].現(xiàn)代電子技術(shù),2017,40(13):34-37.
[5]陳昭,趙蘇艷.盲環(huán)境下稀疏編碼監(jiān)控視頻圖像降噪仿真[J].計算機仿真,2020,37(03):368-371.
作者:徐衛(wèi)軍 單位:河北大學