前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計算機生成式對抗網(wǎng)絡研究進展與展望范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:生成對抗網(wǎng)絡(GAN)作為一種深層次的計算機學習模型,已經成為近年來神經網(wǎng)絡領域中非常具有發(fā)展前景的一項技術模型,本文通過對相關文獻的整理和查閱,首先簡述了原始的生成對抗網(wǎng)絡的組成以及其相關特征,隨后基于原始網(wǎng)絡的一些嚴重缺陷介紹了相關的改進網(wǎng)絡的優(yōu)化方法,最終對整篇論文進行總結,并對未來的發(fā)展進行了展望。
關鍵詞:計算機;生成式對抗網(wǎng)絡;圖像處理;研究進展
1緒論
Goodfellow基于博弈論中零和談判的觀點于2014年提出了“生成式對抗網(wǎng)絡”這一概念,這一方法是用深度學習網(wǎng)以及相關模型絡來驗證圖像真?zhèn)螐亩蓴?shù)據(jù)樣本的。生成對抗網(wǎng)絡目前以及成為計算機領域以及圖像識別領域非常重要的方法之一,具有非常廣闊的發(fā)展前景,GAN網(wǎng)絡是不斷的通過生成模型以及判別模型兩者之間的競爭得到所需的數(shù)據(jù)樣本的。GAN學習模型可適用多種不同情況下的數(shù)據(jù)處理分析[1]。
2原始生成式對抗網(wǎng)絡模型
2.1GAN網(wǎng)絡結構
模型分為生成模型(GenerativeModel)和判別模型(Dis-criminativeModel)。下圖1就是GAN模型的結構組成。
2.2生成網(wǎng)絡
生成器本質上是一個可微分函數(shù),生成器接收隨機變量z的輸入,經生成假樣本。在GAN中,生成器對輸入變量z基本沒有限制,z通常是一個100維的隨機編碼向量,z可以是隨機噪聲或者符合某種分布的變量。生成器理論上可以逐漸學習任何概率分布,經訓練后的生成網(wǎng)絡可以生成不和真實圖像完全一樣的逼真圖像,實際上是生成網(wǎng)絡學習了訓練數(shù)據(jù)的一個分布,從而形成了相關的近似分布,這在數(shù)據(jù)增強應用領域方面非常的重要[2]。
2.3判別網(wǎng)絡
判別器實際上本質與生成器是一樣的都是一種可以微分的函數(shù),在生成對抗網(wǎng)絡中,其實判別器的作用同它的名字一樣就是判別輸入的樣本是否為真實樣本,并在此基礎上通過循環(huán)來指導生成器進行下一步的訓練與合成。
3改進的生成式對抗網(wǎng)絡模型
生成對抗網(wǎng)絡含有多種優(yōu)點如具有更強大的預測能力;與強化學習相比,對抗式學習更接近人類的學習機理。但他也存在致命的缺點,即網(wǎng)絡難以收斂。本文通過對文獻的梳理,整理出幾個被廣泛認可的改進模型如下:
3.1條件生成對抗網(wǎng)絡
基本GAN系統(tǒng)的圖像生成過程比較沒有約束,所以越大的圖像,用基本的GAN系統(tǒng)越難以控制。為了對這個情況進行改進以及研究,Mirza[3]等提出條件生成對抗模型(ConditionalGAN)。該模型除了像原始網(wǎng)絡一樣輸入之外,還會再輸入一個條件變量c,CGAN結構如圖2。比如一段描述句子,鑲嵌到與之對應的圖片中,經過訓練,模型可以“看圖說話”;c同樣可以是對應的目標圖片,這樣GAN可以有目標地去學習。
3.2深度卷積生成對抗網(wǎng)絡
該卷積模型相較于全連接模型更加適用于處理分析比較復雜的圖像數(shù)據(jù)。所以Radford等[4]研究者提出了深度卷積GAN(deepconvolutionalGAN,DC-GAN)它是把原始GAN中的兩個生成與判別模型改進換成了兩個深度CNN。使用步幅卷積和微步幅卷積有效地保留了特征信息[5],從而能對較復雜的問題以及圖像處理的更加完美。
3.3Wasserstein生成對抗網(wǎng)絡
原始GAN訓練出現(xiàn)梯度消失和模式崩潰的主要原因是使用JS距離來衡量兩個分布。
3.4基于能量的生成對抗網(wǎng)絡
文獻[6]從能量模型的角度改進了原始網(wǎng)絡,研究出來了基于能量的生成對抗網(wǎng)絡(EnergyBasedGAN,EB-GAN)模型。因為它的判別器D主要由自編碼器(auto-encoder)構成,這就使得它判別輸入圖像的真假是通過重新構建圖像的像素質量高低來決定的。EB-GAN的實驗表明,在實驗過程中其表現(xiàn)確實比原始GAN網(wǎng)絡更好,圖像更穩(wěn)定同時分辨率更高,對于整體起到了優(yōu)化的作用。
4結語
GAN目前是一個較為全新的領域,各個專家學者也在這個領域不斷的創(chuàng)新研究提出各種各樣的想法以及改進措施,本文主要總結了原始生成對抗網(wǎng)絡的基本構成以及特征,以及近些年來一些經典的改進網(wǎng)絡及其實現(xiàn)過程,在整理的過程中受益匪淺,學到了許多,也更加深入的了解了這一塊的內容,日后也希望能更多的通過對生成網(wǎng)絡的了解,來發(fā)現(xiàn)更具有價值的改進模型??萍疾粩嗟陌l(fā)展進步,越來越智能的時代即將來臨,讓我們帶著創(chuàng)新上路,不斷學習進步!
參考文獻:
[1]朱秀昌,唐貴進.生成對抗網(wǎng)絡圖像處理綜述[J].南京郵電大學學報(自然科學版),2019,39(3):1673-1682.
[2]梁俊杰,韋艦晶,蔣正鋒,等.生成對抗網(wǎng)絡GAN綜述[J].計算機科學與探索,2019,14(1):1-17.
[4]朱虹,李千目,李德強.基于單個卷積神經網(wǎng)絡的面部多特征點定位[J].計算機科學,2018,45(4):273-279.
[5]曹仰杰,賈麗麗,陳永霞,等.生成式對抗網(wǎng)絡及其計算機視覺應用研究綜述[J].中國圖像圖形學報,2018,14(1):1-17.
作者:段風磊 單位:安徽省淮南市廣播電視臺