公務(wù)員期刊網(wǎng) 精選范文 卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

卷積神經(jīng)網(wǎng)絡(luò)的基本思想精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經(jīng)網(wǎng)絡(luò)的基本思想主題范文,僅供參考,歡迎閱讀并收藏。

卷積神經(jīng)網(wǎng)絡(luò)的基本思想

第1篇:卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

【關(guān)鍵詞】:高速公路 防逃 人臉識(shí)別 高清視

中圖分類號(hào):U412.36+6 文獻(xiàn)標(biāo)識(shí)碼:A

人臉識(shí)別的分類與概述

人臉識(shí)別就是通過計(jì)算機(jī)提取人臉的特征,并根據(jù)這些特征進(jìn)行身份驗(yàn)證。人臉與人體的其他生物特征(指紋、虹膜等)一樣與生俱來,它們所具有的唯一性和不易被復(fù)制的良好特性為身份鑒別提供了必要的前提;同其他生物特征識(shí)別技術(shù)相比,人臉識(shí)別技術(shù)具有操作簡(jiǎn)單、結(jié)果直觀、隱蔽性好的優(yōu)越性。人臉識(shí)別一般包括三個(gè)步驟:人臉檢測(cè)、人臉特征提取和人臉的識(shí)別與驗(yàn)證。其處理流程如圖

輸入圖像 人臉圖像人臉特征輸出結(jié)果

人臉識(shí)別的一般步驟

人臉識(shí)別方法繁多,早期研究較多的方法有基于幾何特征的人臉識(shí)別方法和基于模板匹配的人臉識(shí)別方法。目前人臉識(shí)別方法主要研究及應(yīng)用的是基于統(tǒng)計(jì)的識(shí)別方法、基于連接機(jī)制的識(shí)別方法以及其它一些綜合方法。下面是這幾類方法的基本介紹:[2]

(1)基于幾何特征的人臉識(shí)別方法

幾何特征矢量是以人臉器官如眼睛、鼻子、嘴巴等的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包括人臉指定兩點(diǎn)間距離、曲率、角度等。早期的研究者Brunelli[3]等人采用改進(jìn)的積分投影法提取出用歐式距離表征的35維人臉特征矢量用于人臉識(shí)別。Huang Chung Lin等人[4]采用動(dòng)態(tài)模板[5,6,7]與活動(dòng)輪廓模型提取出人臉器官的輪廓[8,9,10]?;趲缀翁卣鞯娜四樧R(shí)別方法有如下優(yōu)點(diǎn):符合人類識(shí)別人臉的機(jī)理,易于理解;對(duì)每幅圖像只需要存儲(chǔ)一個(gè)特征矢量,存儲(chǔ)量小;對(duì)光照變化不敏感。但這種方法同樣存在一些問題,如從圖像中提取這些特征比較困難;對(duì)強(qiáng)烈的表情變化和姿態(tài)變化的魯棒性差等。

(2)基于模板匹配的人臉識(shí)別方法

模板匹配大都采用歸一化相關(guān),直接計(jì)算兩幅圖之間的匹配程度。最簡(jiǎn)單的人臉模板就是將人臉看成一個(gè)橢圓[10,11]。另一種方法就是將人臉用一組獨(dú)立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板等,采用彈性模板方法提取這些模板特征[12]。Brunelli等人專門比較了基于幾何特征的人臉識(shí)別方法和基于模板匹配的人臉識(shí)別方法,他們得出的結(jié)論是:基于幾何特征的人臉識(shí)別方法具有識(shí)別速度快和內(nèi)存要求小等優(yōu)點(diǎn),但基于模板匹配的識(shí)別率要高于基于幾何特征的識(shí)別率。

(3)基于統(tǒng)計(jì)的人臉識(shí)別方法

基于統(tǒng)計(jì)特征的識(shí)別方法包括基于特征臉的方法和基于隱馬爾可夫模型的方法。特征臉(Eigenface)方法[13]是從主成分分析導(dǎo)出的一種人臉識(shí)別和描述技術(shù)。主成分分析實(shí)質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實(shí)現(xiàn),K-L變換是圖像壓縮中的一種最優(yōu)正交變換,其生成矩陣一般為訓(xùn)練樣本的總體散布矩陣。特征臉方法就是將包含人臉的圖像區(qū)域看作是一種隨機(jī)向量,因此可以采用K-L變換獲得其正交K-L基底。對(duì)應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此又稱之為特征臉。

隱馬爾可夫模型(HMM)是用于描述信號(hào)統(tǒng)計(jì)特性的一組統(tǒng)計(jì)模型?;谌四槒纳系较隆淖蟮接业慕Y(jié)構(gòu)特征,Samaria等人[14]首先將1-D HMM和2-D Pseudo HMM用于人臉識(shí)別。Kohir等[15]采用1-D HMM將低頻DCT系數(shù)作為觀察矢量獲得了好的識(shí)別效果。Eickeler等[16]采用2-DPseudo HMM識(shí)別DCT壓縮的JPEG圖像中的人臉圖像。Nefian等[17]采用嵌入式HMM識(shí)別人臉。

(4)基于連接機(jī)制的人臉識(shí)別方法(神經(jīng)網(wǎng)絡(luò)彈性圖匹配)

基于連接機(jī)制的識(shí)別方法,包括一般的神經(jīng)網(wǎng)絡(luò)方法和彈性圖匹配(Elastic Graph Matching)方法。神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別應(yīng)用中有很長(zhǎng)的歷史[18]。Demers 等[19]提出采用PCA方法提取人臉圖像特征,用自相關(guān)神經(jīng)網(wǎng)絡(luò)進(jìn)一步壓縮特征,最后采用一個(gè)多層處理器來實(shí)現(xiàn)人臉識(shí)別。Laurence等[20]通過一個(gè)多級(jí)的SOM實(shí)現(xiàn)樣本的聚類,將卷積神經(jīng)網(wǎng)絡(luò)(CNN)用于人臉識(shí)別。Lin等[21]采用基于概率決策的神經(jīng)網(wǎng)絡(luò)(PDBNN)方法。最近,徑向基函數(shù)RBF神經(jīng)網(wǎng)絡(luò)因具有逼近性好、空間描述緊湊和訓(xùn)練速度快等特點(diǎn)而被用于人臉識(shí)別。Gutta等[22]提出了將RBF與樹分類器結(jié)合起來進(jìn)行人臉識(shí)別的混合分類器結(jié)構(gòu),后來他們用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行了針對(duì)部分人臉的識(shí)別研究[23],他們的研究表明利用部分人臉也可以有效地識(shí)別人臉。Er等[24]采用PCA進(jìn)行維數(shù)壓縮,再用LDA抽取特征,然后基于RBF進(jìn)行人臉識(shí)別。Haddadnia 等[25]基于PZMI(Pseudo Zernike Moment Invariant)特征,并采用混合學(xué)習(xí)算法的RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識(shí)別。此外,Lucas 等采用連續(xù)的n-tuple網(wǎng)絡(luò)識(shí)別人臉。

彈性圖匹配方法是一種基于動(dòng)態(tài)鏈接結(jié)構(gòu)的方法[26]。在人臉圖像上放置一組矩形網(wǎng)格節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)的特征用該節(jié)點(diǎn)處的多尺度Gabor幅度特征描述,各節(jié)點(diǎn)之間的連接關(guān)系用幾何距離表示,從而構(gòu)成基于二維拓?fù)鋱D的人臉描述。根據(jù)兩個(gè)圖像中各節(jié)點(diǎn)和連接之間的相似性可以進(jìn)行人臉識(shí)別。Wiskott等[27]將人臉特征上的一些點(diǎn)作為基準(zhǔn)點(diǎn),強(qiáng)調(diào)了人臉特征的重要性。他們采用每個(gè)基準(zhǔn)點(diǎn)存儲(chǔ)一串具有代表性的特征矢量,大大減少了系統(tǒng)的存儲(chǔ)量。Würtz 等[28]只使用人臉面部的特征,進(jìn)一步消除了結(jié)構(gòu)中的冗余信息和背景信息,并使用一個(gè)多層的分級(jí)結(jié)構(gòu)。Grudin等[29]也采用分級(jí)結(jié)構(gòu)的彈性圖,通過去除了一些冗余節(jié)點(diǎn),形成稀疏的人臉描述結(jié)構(gòu)。Nastar等[30]提出將人臉圖像I(x,y)表示為可變形的3D網(wǎng)格表面(x, y, I(x,y)),將人臉匹配問題轉(zhuǎn)換為曲面匹配問題,利用有限元分析的方法進(jìn)行曲面變形,根據(jù)兩幅圖像之間變形匹配的程度識(shí)別人臉。

(5)基于形變模型的方法

基于形變模型的方法是一個(gè)受到重視的方法。通過合成新的視覺圖像,可以處理姿態(tài)變化的問題。Lanitis等[31]通過在人臉特征邊沿選擇一些稀疏的基準(zhǔn)點(diǎn)描述人臉的形狀特征,然后將形狀變形到所有人臉圖像的平均形狀,再根據(jù)變形后的形狀進(jìn)行紋理(灰度)變形,形成與形狀無關(guān)的人臉圖像。然后分別對(duì)形狀和灰度進(jìn)行PCA變換,根據(jù)形狀和紋理的相關(guān)性,用PCA對(duì)各自的結(jié)果進(jìn)一步分析,最終得到描述人臉的AAM(Active Appearance Model)模型。通過改變這些參數(shù)可得到不同變化的人臉圖像,模型參數(shù)能夠用于人臉識(shí)別。Romdhani 等[32]采用激光掃描儀獲得人臉的3D數(shù)據(jù),分別對(duì)一些基準(zhǔn)點(diǎn)構(gòu)成的形狀和基準(zhǔn)點(diǎn)的灰度(或彩色)完成PCA,得到3D人臉形狀和灰度(彩色)基圖像,通過變化參數(shù)就可獲得不同的3D人臉模型。通過施加一些先驗(yàn)約束可以避免合成不真實(shí)的人臉圖像。利用線性形狀和紋理誤差,通過3D模型向2D輸入圖像的自動(dòng)匹配實(shí)現(xiàn)人臉識(shí)別。

項(xiàng)目采用的識(shí)別算法

人臉自動(dòng)識(shí)別技術(shù)經(jīng)過多年來的研究已經(jīng)積累了大量研究成果。但是仍然面臨很多問題,尤其是在非約束環(huán)境下的人臉識(shí)別。結(jié)合本研究項(xiàng)目及應(yīng)用環(huán)境綜合考慮,采用特征臉方法對(duì)視屏資料中的司機(jī)臉部進(jìn)行提取識(shí)別。

特征臉方法是90年代初期由Turk和Pentland提出算法,具有簡(jiǎn)單有效的特點(diǎn), 也稱為基于主成分分析(principal component analysis,簡(jiǎn)稱PCA)的人臉識(shí)別方法。把人臉圖像空間線性投影到一個(gè)低維的特征空間。PCA實(shí)質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實(shí)現(xiàn)。K-L變換是圖像壓縮技術(shù)中的一種最優(yōu)正交變換。人們將它用于統(tǒng)計(jì)特征提取。從而形成子空間法模式識(shí)別的基礎(chǔ)。若將K-L變換用于人臉識(shí)別,則需假設(shè)人臉處于低維線性空間。由高維圖像空間K-L變換后,可得到一組新的正交基,由此可以通過保留部分正交基獲得正交K-L基底。如將子空間對(duì)應(yīng)特征值較大的基底按照?qǐng)D像陣列排列,則可以看出這些正交基呈現(xiàn)出人臉的形狀。因此這些正交基也稱為特征臉,這種人臉的識(shí)別方法也叫特征臉法。

特征子臉技術(shù)的基本思想是:從統(tǒng)計(jì)的觀點(diǎn),尋找人臉圖像分布的基本元素,即人臉圖像樣本集協(xié)方差矩陣的特征向量,以此近似地表征人臉圖像。這些特征向量稱為特征臉(Eigenface)。

利用這些基底的線性組合可以描述、表達(dá)和逼近人臉圖像,因此可以進(jìn)行人臉識(shí)別與合成。識(shí)別過程就是將人臉圖像映射到由特征臉張成的子空間上,比較其與已知人臉在特征臉空間中的位置,具體步驟如下:[33]

(1)初始化,獲得人臉圖像的訓(xùn)練集并計(jì)算特征臉,定義為人臉空間;

(2)輸入待識(shí)別人臉圖像,將其映射到特征臉空間,得到一組權(quán)值;

(3)通過檢查圖像與人臉空間的距離判斷它是否為人臉;

(4)若為人臉,根據(jù)權(quán)值模式判斷它是否為數(shù)據(jù)庫中的某個(gè)人。

1. 計(jì)算特征臉

假設(shè)人臉圖像包含個(gè)像素,因此可以用維向量Γ表示。如人臉訓(xùn)練集由幅人臉圖像構(gòu)成,則可以用表示人臉訓(xùn)練集。

其均值為:

(2-1)

每幅圖像與均值的差為:

(2-2)

構(gòu)造人臉訓(xùn)練集的協(xié)方差矩陣:

(2-3)

其中 。

協(xié)方差矩陣的正交分解向量即為人臉空間的基向量,也即特征臉。

一般比較大(通常大于1000),所以對(duì)矩陣直接求解特征向量是不可能的,為此引出下列定理:

SVD定理:設(shè)是一秩為的維矩陣,則存在兩個(gè)正交矩陣:

(2-4)

(2-5)

以及對(duì)角陣:

(2-6)

滿足

其中:為矩陣和的非零特征值,和分別為和對(duì)應(yīng)于的特征矢量。上述分解成為矩陣的奇異值分解(SVD),為的奇異值。

推論:

(2-7)

由上述定理可知:

人臉訓(xùn)練集所包含的圖像一般要比圖像的像素?cái)?shù)小的多,因此可以轉(zhuǎn)求矩陣

(2-8)

的特征向量,M為人臉訓(xùn)練集圖像總數(shù)。

矩陣的特征向量由差值圖像與線性組合得到:

=(2-9)

實(shí)際上,m(m

(2-10)

識(shí)別

基于特征臉的人臉識(shí)別過程由訓(xùn)練階段和識(shí)別階段兩個(gè)階段組成。在訓(xùn)練階段,每個(gè)己知人臉映射由特征臉張成的子空間上,得到m維向量:

(2-11)

距離閾值定義如下:

(2-12)

在識(shí)別階段,首先把待識(shí)別的圖像映射到特征臉空間,得到向量

(2-13)

與每個(gè)人臉集的距離定義為

(2-14)

為了區(qū)分人臉和非人臉,還需計(jì)算原始圖像與其由特征臉空間重建的圖像之間的距離:

(2-15)

其中:

(2-16)

采用最小距離法對(duì)人臉進(jìn)行分類,分類規(guī)則如下:

(1)若,則輸入圖像不是人臉圖像;

(2)若,則輸入圖像包含未知人臉;

(3)若,則輸入圖像為庫中的某個(gè)人臉。

實(shí)際上,特征臉反映了隱含在人臉樣本集合內(nèi)部的信息和人臉的結(jié)構(gòu)關(guān)系。將眼睛、面頰、下頜的樣本集協(xié)方差矩陣的特征向量稱為特征眼、特征頜和特征唇,統(tǒng)稱特征子臉。特征子臉在相應(yīng)的圖像空間中生成子空間,稱為子臉空間。計(jì)算出測(cè)試圖像窗口在子臉空間的投影距離,若窗口圖像滿足閾值比較條件,則判斷其為人臉。

基于特征分析的方法,也就是將人臉基準(zhǔn)點(diǎn)的相對(duì)比率和其它描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識(shí)別特征向量,這種基于整體臉的識(shí)別不僅保留了人臉部件之間的拓?fù)潢P(guān)系,而且也保留了各部件本身的信息,而基于部件的識(shí)別則是通過提取出局部輪廓信息及灰度信息來設(shè)計(jì)具體識(shí)別算法。現(xiàn)在Eigenface(PCA)算法已經(jīng)與經(jīng)典的模板匹配算法一起成為測(cè)試人臉識(shí)別系統(tǒng)性能的基準(zhǔn)算法;而自1991年特征臉技術(shù)誕生以來,研究者對(duì)其進(jìn)行了各種各樣的實(shí)驗(yàn)和理論分析,F(xiàn)ERET測(cè)試結(jié)果也表明,改進(jìn)的特征臉?biāo)惴ㄊ侵髁鞯娜四樧R(shí)別技術(shù),也是具有最好性能的識(shí)別方法之一。

該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計(jì)算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實(shí)際為"局部人體特征分析"和"圖形/神經(jīng)識(shí)別算法。"這種算法是利用人體面部各器官及特征部位的方法。如對(duì)應(yīng)幾何關(guān)系多數(shù)據(jù)形成識(shí)別參數(shù)與數(shù)據(jù)庫中所有的原始參數(shù)進(jìn)行比較、判斷與確認(rèn)。Turk和Pentland提出特征臉的方法,它根據(jù)一組人臉訓(xùn)練圖像構(gòu)造主元子空間,由于主元具有臉的形狀,也稱為特征臉,識(shí)別時(shí)將測(cè)試圖像投影到主元子空間上,得到一組投影系數(shù),和各個(gè)已知人的人臉圖像比較進(jìn)行識(shí)別。

結(jié)束語

從目前國(guó)情來講,在一段時(shí)間內(nèi)高速公路收費(fèi)還會(huì)繼續(xù)存在,某些司機(jī)逃費(fèi)的僥幸心也同樣會(huì)有。通過帶路徑識(shí)別功能的 RFID 復(fù)合卡作為通行卡,利用 RFID 卡的信息對(duì)車輛進(jìn)行跟蹤,在不增加硬件投入的情況下,直接可以給車道收費(fèi)系統(tǒng)提供抓拍高清圖像,以及其它報(bào)警聯(lián)動(dòng)系統(tǒng)提供圖像等,可有效解決高速公路沖卡逃費(fèi)問題,可廣泛應(yīng)用于封閉式管理的公路收費(fèi)系統(tǒng)。

參考文獻(xiàn):

[1]江艷霞. 視頻人臉跟蹤識(shí)別算法研究. 上海交通大學(xué)博士學(xué)位論文,2007.

[2]Brunelli R and Poggio T., Feature Recognition: Features Versus Templates. IEEE Transactions on

PAMI, 1993, 15(10):1042 -1052.

[3]李剛. 基于特征臉法的正面人臉識(shí)別研究. 國(guó)防科學(xué)技術(shù)大學(xué)碩士學(xué)位論文,2002.11

[4]JOHN CANNY. A Computational Approach to Edge Detection. IEEE TRANSACTIONS ON PATTERN

ANALYSIS AND MACHINE INTELLIGENCE, VOL.PAMI-8, NO.6, NOVEMBER 1986.

[5]張建飛、陳樹越等. 基于支持向量基的交通視頻人車識(shí)別研究[J]. 電視技術(shù),2011

[6]肖波、樊友平等. 復(fù)雜背景下基于運(yùn)動(dòng)特征的人面定位[J]. 重慶大學(xué)學(xué)報(bào),2002

[7] 《中華人民共和國(guó)交通部公路聯(lián)網(wǎng)收費(fèi)技術(shù)要求》,交通部

[8] 《廣東省高速公路聯(lián)網(wǎng)收費(fèi)系統(tǒng)》,DB44 127-2003,廣東省質(zhì)量技術(shù)監(jiān)督局

[9] 《視頻安防監(jiān)控?cái)?shù)字錄像設(shè)備》,GB 20815-2006

[10]《安全防范工程技術(shù)規(guī)范》,GB 50348-2004

第2篇:卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

論文摘要:當(dāng)點(diǎn)擴(kuò)展函數(shù)未知或不確知的情況下,從觀察到的退化圖像中恢復(fù)原始圖像的過程稱為圖像盲復(fù)原。近年來,圖像盲復(fù)原算法得到了廣泛的研究。本文在介紹了盲圖像恢復(fù)算法的現(xiàn)狀的基礎(chǔ)上進(jìn)一步研究其的發(fā)展方向。

一、引言

圖像恢復(fù)是圖像處理中的一大領(lǐng)域,有著廣泛的應(yīng)用,正成為當(dāng)前研究的熱點(diǎn)。圖像恢復(fù)的主要目的是使退化圖像經(jīng)過一定的加工處理,去掉退化因素,以最大的保真度恢復(fù)成原來的圖像。傳統(tǒng)的圖像恢復(fù)假設(shè)圖像的降質(zhì)模型是己知的。而許多情況下,圖像的降質(zhì)模型未知或具有較少的先驗(yàn)知識(shí),必須進(jìn)行所謂的盲恢復(fù)。其重要性和艱巨性而成為一個(gè)研究熱點(diǎn)。目前所能獲取的觀測(cè)圖像是真實(shí)圖像經(jīng)過觀測(cè)系統(tǒng)成像的結(jié)果。由于觀測(cè)系統(tǒng)本身物理特性的限制,同時(shí)受觀測(cè)環(huán)境的影響,觀測(cè)圖像和真實(shí)圖像之間不可避免地存在著偏差和失真,稱觀測(cè)系統(tǒng)對(duì)真實(shí)圖像產(chǎn)生了降質(zhì)。圖像恢復(fù)的目的就是根據(jù)降質(zhì)的觀測(cè)圖像分析和計(jì)算得出真實(shí)圖像。

二、圖像盲恢復(fù)算法的現(xiàn)狀

總體來說,圖像盲復(fù)原方法主要分為以下兩類:一是首先利用真實(shí)圖像的特別特征估計(jì)PSF,然后借助估計(jì)得到的PSF,采用經(jīng)典的圖像復(fù)原方法進(jìn)行圖像的復(fù)原。這類方法將PSF的估計(jì)與圖像的復(fù)原過程分為2個(gè)不同的過程,因而具有較少計(jì)算量的特點(diǎn);二是PSF辨識(shí)和真實(shí)圖像估計(jì)相結(jié)合,同時(shí)辨識(shí)PSF和真實(shí)圖像。這類算法較為復(fù)雜,計(jì)算量較大。另外,對(duì)于點(diǎn)擴(kuò)展函數(shù)也考慮了空間變化的復(fù)雜情況。針對(duì)目前的盲復(fù)原算法的現(xiàn)狀,根據(jù)退化模型的特點(diǎn),重新將算法分為空間不變的單通道盲復(fù)原算法、空間不變多通道盲復(fù)原算法和空間變化圖像盲復(fù)原算法3類。

(一)單通道空間不變圖像盲復(fù)原算法

在這類算法中,最為常用的是參數(shù)法和迭代法。

1)參數(shù)法。所謂參數(shù)法,即模型參數(shù)法,就是將PSF和真實(shí)圖像用某一類模型加以描述,但模型的參數(shù)需要進(jìn)行辨識(shí)。在參數(shù)法中,典型的有先驗(yàn)?zāi):孀R(shí)法和ARMA參數(shù)估計(jì)法,前者先辨識(shí)PSF的模型參數(shù),后辨識(shí)真實(shí)圖像,屬于第1種類型的圖像盲復(fù)原算法,因而計(jì)算量較小;后者同時(shí)辨識(shí)PSF和真實(shí)圖像模型參數(shù),屬于第2種類型圖像盲復(fù)原算法。

2)迭代法。所謂的迭代法,不是通過建立模型而是通過算法的迭代過程,加上有關(guān)真實(shí)圖像和PSF的約束來同時(shí)辨識(shí)PSF和真實(shí)圖像的方法。迭代法是單通道

圖像盲復(fù)原算法中應(yīng)用最廣泛的一類算法,它不需建立模型,也不要求PSF為最小相位系統(tǒng),因而跟實(shí)際更為接近。在這類算法中,迭代盲復(fù)原算法(IBD),基于非負(fù)性和決策域的遞歸逆濾波器算法(NAR2RIF),基于高階統(tǒng)計(jì)特性的最小

熵算法等最為典型。

(二)多通道二維圖像盲復(fù)原

多通道二維圖像盲復(fù)原,這類方法將數(shù)字通訊領(lǐng)域應(yīng)用的一維多通道盲原分離算法擴(kuò)展到二維情況并用于圖像的盲恢復(fù)。這類算法中有兩種代數(shù)方法,一種是先辨識(shí)模糊函數(shù),再采用常規(guī)的恢復(fù)算法進(jìn)行復(fù)原;另一種是直接對(duì)逆濾波器進(jìn)行估計(jì)。此類算法的優(yōu)點(diǎn)在于不需對(duì)初始圖像進(jìn)行估計(jì),也不存在穩(wěn)定性和收斂性問題,對(duì)圖像以及模糊函數(shù)的約束是松弛的,算法具有一般性。但是第1種算法要求采用復(fù)原算法具有收斂性;第2種算法對(duì)噪聲敏感。

(三)空間改變的圖像盲復(fù)原方法

在許多實(shí)際的應(yīng)用中,模糊往往是空間變化的,但由于處理工作的難度,目前的研究較少,基本有相關(guān)轉(zhuǎn)換恢復(fù)和直接法兩類。

相關(guān)轉(zhuǎn)換恢復(fù)的基本思想是區(qū)域分割,即將整幅圖像分為若干局部區(qū)域,然后假設(shè)在各個(gè)局部區(qū)域模糊是空間不變的,利用空間不變的圖像復(fù)原有關(guān)算法進(jìn)行復(fù)原。這類方法都是基于窗口的模糊辨識(shí)技術(shù),圖像的估計(jì)取決于窗口的大小,由于模糊參數(shù)是連續(xù)變化的,在范圍較大時(shí)空間不變的假設(shè)是不成立的,因而模糊的估計(jì)精度較差,而且這種方法只能針對(duì)部分空間變化的模糊進(jìn)行處理,缺乏通用性;其次在區(qū)域的邊上存在振鈴現(xiàn)象。

直接法的基本思想是直接對(duì)圖像進(jìn)行處理。如采用簡(jiǎn)化的二維遞推卡爾曼濾波器進(jìn)行圖像模型和模糊模型的直接轉(zhuǎn)換方法,其缺點(diǎn)是只能針對(duì)有限的模型,而且模型數(shù)增加,計(jì)算量會(huì)顯著增大;采用共軛梯度迭代算法,但只見到一個(gè)31×31的文本圖像處理的結(jié)果報(bào)道,對(duì)于大圖像處理效果尚需進(jìn)一步的研究;將空間變化圖像系統(tǒng)建立成馬爾苛夫隨機(jī)模型,對(duì)復(fù)原過程,采用模擬退火算法進(jìn)行最大后驗(yàn)估計(jì)的方法,這種方法避免了圖像的窗口化,并能克服模糊參數(shù)不連續(xù)性造成的影響,但這種方法只能局限于將模糊過程建立成單參數(shù)的馬爾苛夫隨機(jī)模型的情況,而且計(jì)算量也較大。

三、圖像盲恢復(fù)的應(yīng)用前景

(1)現(xiàn)有算法的改進(jìn)以及新的算法研究?,F(xiàn)有各種算法還存在許多不足,有必要對(duì)算法進(jìn)一步改進(jìn)。如IBD算法中,如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復(fù)的質(zhì)量;如何選擇濾波器中的噪聲參數(shù)才能減少噪聲的影響。又如NAR2RIF算法中,如何進(jìn)一步解決噪聲敏感問題,支持域的確定以及如何將算法擴(kuò)展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復(fù)原問題,也是今后研究的熱點(diǎn)。

(2)基于非線性退化模型的圖像盲復(fù)原算法。在實(shí)際應(yīng)用中,嚴(yán)格來講,所有的退化模型都是非線性的。對(duì)模型采用線性化的方法進(jìn)行近似處理,雖然算法簡(jiǎn)單,但對(duì)非線性嚴(yán)重的情況處理效果并不理想?;诙囗?xiàng)式以及神經(jīng)網(wǎng)絡(luò)兩種參數(shù)模型處理非線性信號(hào)盲分離算法,算法擴(kuò)展到二維圖像情況需要進(jìn)一步研究。研究基于非線性退化模型的圖像盲復(fù)原算法也是下一步研究方向之一。

(3)去噪處理算法研究。加性噪聲的存在,使圖像的復(fù)原問題變成了一個(gè)病態(tài)問題,而且由于一般假設(shè)只知道噪聲的統(tǒng)計(jì)特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復(fù)的效果并不理想,結(jié)合降噪的圖像盲恢復(fù)的算法研究有很現(xiàn)實(shí)的意義,這方面也進(jìn)行了部分工作。為克服噪聲的影響,一般采用先進(jìn)行降噪,后進(jìn)行復(fù)原;二是將降噪和復(fù)原同時(shí)進(jìn)行這兩類方法。目前,大多數(shù)算法中將噪聲描述成高斯噪聲進(jìn)行研究,在實(shí)際應(yīng)用時(shí)有較大局限性。對(duì)于非高斯情況的研究采用基于噪聲的高階統(tǒng)計(jì)特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進(jìn)行降噪,利用自組織映射的非線性獨(dú)立組件分析方法進(jìn)行圖像降噪處理算法。

(4)實(shí)時(shí)處理算法。算法的的復(fù)雜性是制約算法應(yīng)用的一個(gè)重要方面??刹捎谜齽t化的離散周期Radon變換的方法將二維的卷積轉(zhuǎn)化為一維進(jìn)行處理,以提高算法的速度;也可采用神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)處理算法。算法的實(shí)時(shí)性是算法實(shí)際應(yīng)用的先決條件。

(5)應(yīng)用研究。算法的應(yīng)用是推動(dòng)算法研究的動(dòng)力。雖然圖像盲復(fù)原算法在天文學(xué)、醫(yī)學(xué)、遙感等方面獲得了較大的應(yīng)用,但將算法應(yīng)用到一般的工業(yè)圖像實(shí)時(shí)檢測(cè)、機(jī)器視覺、網(wǎng)絡(luò)環(huán)境下的圖像傳輸恢復(fù)、刑事偵破等方面還有大量的工作要做。

參考文獻(xiàn):

[1]薛梅,楊綠溪.用于含噪二值圖像的改進(jìn)NAS-RIF圖像盲復(fù)原算[J].數(shù)據(jù)處理.2006.17.(2).

第3篇:卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

關(guān)鍵詞:消費(fèi)意圖識(shí)別;查詢商業(yè)意圖識(shí)別;消費(fèi)意圖模板;社會(huì)媒體

中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):2095-2163(2015)04-

Consumption Intent Recognition for Social Media: Task, Challenge and Opportunity

FU Bo, LIU Ting

(Research Center for Social Computing and Information Retrieval, Harbin Institute of Technology, Harbin 150001,China)

Abstract: Social media is the platform where people freely share with each other information such as comments, experiences, and an opinion. Among the large amount of posts, some may reveal the users' underlying commercial intention (CI). The consumption intent is a desire or hope for something to purchase. For instance, a post like “Please recommend for me a Nokia mobile phone about 2,000 RMB” may indicate an immediate or future purchase. Such information is valuable for better advertisement services. The paper introduces the problems this task try to resolve, the main challenges of this task, representative emerging work related to this task. After that, the paper proposes several directions that are worth exploring in future.

Keywords: Consumption Intent; Query Commercial Intent; Consumption Intent Pattern; Social Media

0 研究背景

近年來,網(wǎng)絡(luò)數(shù)據(jù)資源呈現(xiàn)幾何式、爆炸式增長(zhǎng),巨量的網(wǎng)絡(luò)數(shù)據(jù)中蘊(yùn)含著大量的用戶的,對(duì)諸如產(chǎn)品購買等有價(jià)值的行為信息及個(gè)性化需求信息,這些關(guān)于產(chǎn)品類的信息需求表達(dá)了人們的各種消費(fèi)意愿和消費(fèi)需求。例如,Google、Baidu等搜索引擎查詢?nèi)罩居涗浟巳藗儚幕ヂ?lián)網(wǎng)搜索所需產(chǎn)品的信息;Twitter、新浪微博等社會(huì)化媒體平臺(tái)的時(shí)尚性、廣泛性和互動(dòng)性能幫助人們即時(shí)所需產(chǎn)品的信息;京東商城、淘寶網(wǎng)等電商網(wǎng)站記錄了用戶瀏覽和購買行為。只有充分了解利用用戶的信息和需求,才能做到有的放矢?;ヂ?lián)網(wǎng)各種不同的媒體上存儲(chǔ)了大量用戶資料、用戶之間的社交關(guān)系以及用戶的行為數(shù)據(jù),如表1所示。

可以看出,各種不同媒體中所積累的海量用戶信息為構(gòu)建新的社會(huì)化應(yīng)用,以及理解人們當(dāng)前和潛在的消費(fèi)需求帶來了前所未有的新機(jī)遇。在如此龐大用戶基數(shù)的支撐下,互聯(lián)網(wǎng)的巨大潛力正日益體現(xiàn),與現(xiàn)實(shí)社會(huì)的互動(dòng)滲透更加緊密深入?;ヂ?lián)網(wǎng)上出現(xiàn)的不同媒體在商業(yè)、生活、政治等各方面,也正發(fā)揮著源自其強(qiáng)大信息傳播的重要作用。截至2014年12月底,我國(guó)網(wǎng)絡(luò)購物用戶規(guī)模達(dá)到3.61億,較2013年底增加5 953萬人,增長(zhǎng)率為19.7%;我國(guó)網(wǎng)民使用網(wǎng)絡(luò)購物的比例從48.9%提升至55.7%。根據(jù)艾瑞咨詢預(yù)測(cè),2017年的網(wǎng)絡(luò)購物交易規(guī)模將達(dá)到56 340億元,占社會(huì)消費(fèi)品零售總額的比例為15.7%,較2010年提升12.8個(gè)百分點(diǎn)。特別是在商業(yè)營(yíng)銷上,約有51%的消費(fèi)者在成為企業(yè)品牌的粉絲后,購買該品牌商品的意愿也會(huì)相應(yīng)提高5個(gè)百分點(diǎn)??梢哉f,互聯(lián)網(wǎng)上用戶對(duì)產(chǎn)品的需求與日俱增,并且形式多種多樣。在經(jīng)濟(jì)全球化和信息網(wǎng)絡(luò)化的今天,主動(dòng)掌握個(gè)體興趣偏好和群體消費(fèi)趨勢(shì)等用戶消費(fèi)需求信息,就可以在市場(chǎng)營(yíng)銷、產(chǎn)品計(jì)劃等實(shí)現(xiàn)智能精準(zhǔn)決策,在此背景下,消費(fèi)意圖(Consumption Intent)識(shí)別的相關(guān)技術(shù)應(yīng)運(yùn)而生。

表1 互聯(lián)網(wǎng)不同媒體數(shù)據(jù)和對(duì)應(yīng)的國(guó)內(nèi)外流行站點(diǎn)

Tab.1 Examples of different media and the corresponding domestic and foreign websites

1 任務(wù)

消費(fèi)意圖,是指用戶表達(dá)出的對(duì)購買產(chǎn)品服務(wù)等一些商業(yè)消費(fèi)需求的意愿[1]。消費(fèi)意圖識(shí)別技術(shù)是對(duì)帶有消費(fèi)需求色彩的互聯(lián)網(wǎng)用戶生成的文本或用戶本身行為數(shù)據(jù)進(jìn)行的分析和整理,通過網(wǎng)絡(luò)的方式挖掘出用戶當(dāng)前或潛在的消費(fèi)需求。

面向社會(huì)媒體的消費(fèi)意圖識(shí)別的任務(wù)可以分為基于內(nèi)容的消費(fèi)意圖識(shí)別和基于用戶的消費(fèi)意圖識(shí)別。其中,基于內(nèi)容的消費(fèi)意圖研究包括消費(fèi)模板的抽取、消費(fèi)意圖識(shí)別以及消費(fèi)意圖中的消費(fèi)對(duì)象抽取等。具體地,基于內(nèi)容的消費(fèi)意圖是指導(dǎo)用戶通過互聯(lián)網(wǎng)與購買需求相關(guān)的信息,如:“我想買一部手機(jī),誰能給推薦一下嗎”,即是一個(gè)顯式消費(fèi)意圖內(nèi)容,這里的“手機(jī)”即為消費(fèi)對(duì)象;而基于用戶的消費(fèi)意圖則是指一條信息沒有明確的表達(dá)購買產(chǎn)品或服務(wù)的意圖,但通過推理可發(fā)現(xiàn)用戶潛在的商業(yè)需求,間接地表明用戶將來會(huì)購買與母嬰用品相關(guān)的產(chǎn)品或服務(wù)。然而到目前為止,關(guān)于消費(fèi)意圖并沒一個(gè)標(biāo)準(zhǔn)的定義及分類體系。通過大量的調(diào)研,即可發(fā)現(xiàn)基于內(nèi)容的消費(fèi)意圖文本中有意義的信息主要有觸發(fā)詞語(如“想買”)、消費(fèi)對(duì)象等,而基于用戶的消費(fèi)意圖也會(huì)包含有一些用戶歷史行為。下面本文將逐一介紹目前顯式消費(fèi)意圖識(shí)別研究中的主要任務(wù)和主要實(shí)現(xiàn)技術(shù)。

最初的消費(fèi)意圖識(shí)別任務(wù)源自前人對(duì)帶有消費(fèi)意圖的詞語或模板的分析,如“想買”即是帶有消費(fèi)意圖的模板。隨著互聯(lián)網(wǎng)上大量的帶有消費(fèi)意圖的文本出現(xiàn),研究者們逐漸從簡(jiǎn)單的消費(fèi)意愿的模板的分析研究過渡到更為復(fù)雜的用戶當(dāng)前需求以及潛在需求的研究。基于此,按照處理角度的不同,可分為基于文本內(nèi)容的消費(fèi)意圖識(shí)別和基于用戶的消費(fèi)意圖識(shí)別。其中,前者處理的文本內(nèi)容包括互聯(lián)網(wǎng)上用戶在搜索引擎輸入的單個(gè)查詢、單條微博文本等用戶的內(nèi)容,如微博消費(fèi)意圖文本“想給兒子買個(gè)電動(dòng)挖掘機(jī)”,表明了用戶的消費(fèi)意愿是想為受眾目標(biāo)“兒子”購買一臺(tái)“電動(dòng)挖掘機(jī)”的消費(fèi)對(duì)象;后者處理的對(duì)象主要是以用戶為中心,如一個(gè)用戶一直對(duì)母嬰用品有消費(fèi)意圖。按時(shí)消費(fèi)意圖的時(shí)效不同,可分為現(xiàn)實(shí)需求和潛在需求?,F(xiàn)實(shí)需求是指已經(jīng)存在用戶當(dāng)前的需求。潛在需求是指消費(fèi)者雖然有明確意識(shí)的欲望,但由于種種原因還沒有明確的顯示出來的需求。

2 挑戰(zhàn)

互聯(lián)網(wǎng)用戶的消費(fèi)意圖識(shí)別存在著各種各樣的挑戰(zhàn)。具體地,可將其劃分為三種?,F(xiàn)給出如下論述:

2.1 網(wǎng)絡(luò)數(shù)據(jù)采集的挑戰(zhàn)

互聯(lián)網(wǎng)數(shù)據(jù)形式多樣化,不同媒體平臺(tái)的用戶和內(nèi)容具有異構(gòu)性,因而針對(duì)網(wǎng)絡(luò)數(shù)據(jù)的采集需要就不同類型的內(nèi)容分別進(jìn)行處理,提取有價(jià)值的內(nèi)容信息和用戶行為信息。例如,在線社區(qū)中的用戶信息大部分以超文本標(biāo)記語言(HTML)的網(wǎng)頁方式展現(xiàn),挖掘基于社區(qū)中的用戶消費(fèi)意圖文本,需要針對(duì)HTML這種非結(jié)構(gòu)化的數(shù)據(jù)精準(zhǔn)地抽取出用戶名、用戶發(fā)貼內(nèi)容等元數(shù)據(jù)信息。而社交媒體網(wǎng)站的數(shù)據(jù)挖掘則需要通過采集記錄內(nèi)部系統(tǒng)日志來實(shí)現(xiàn),如Facebook的Scribe。因而,在進(jìn)行消費(fèi)意圖研究的相關(guān)工作中,都首先需要挖掘出不同媒體中的含有消費(fèi)意圖的內(nèi)容或具體行為。

2.2 數(shù)據(jù)稀疏的挑戰(zhàn)

互聯(lián)網(wǎng)上存在著大量的垃圾信息。例如社會(huì)媒體用戶中有33%左右的用戶微博的是自己的狀態(tài)信息,諸如“好無聊怎么辦”,而僅有8.7%的微博內(nèi)容傳達(dá)了有價(jià)值的信息。由于微博上用戶可以借助個(gè)人習(xí)慣的方式表達(dá)自己的感受,因而在這些有價(jià)值的信息中,微博內(nèi)容信息通常是隨意、零散和有噪聲的。

2.3 跨社區(qū)的挑戰(zhàn)

互聯(lián)網(wǎng)上社會(huì)媒體、論壇、電商網(wǎng)站等迅速發(fā)展,積累了大量的用戶信息,為社會(huì)計(jì)算的相關(guān)研究提供了前所未有的海量數(shù)據(jù)。例如,Ding等人[2]基于微博用戶的消費(fèi)意圖研究電影票房預(yù)測(cè)問題。也有學(xué)者分別研究了用戶評(píng)價(jià)[3]和在線論壇中的用戶[4]消費(fèi)意圖識(shí)別問題。但是這些相關(guān)工作都只關(guān)注面向單個(gè)社區(qū)或社交媒體的消費(fèi)意圖識(shí)別問題,這是因?yàn)椴煌襟w的用戶之間往往沒有顯式的鏈接,就使得一個(gè)媒體中的用戶與其他媒體的用戶之間是無法進(jìn)行關(guān)聯(lián)的。此外,雖然每個(gè)用戶在不同媒體平臺(tái)上擁有不同的用戶信息,但是這些用戶信息在不同的平臺(tái)之間是非共享的。可以觀察到,由于不同媒體平臺(tái)在主題以及功能上的不同,用戶的信息碎片化地分布在不同類型的媒體平臺(tái)中。

3 相關(guān)工作

3.1 消費(fèi)意圖模板的抽取

模板(pattern)是自然語言領(lǐng)域中的常見概念,是指從自然語言實(shí)例(如短語、句子等)中泛化而來的抽象表達(dá)。正因?yàn)槟0遢^之實(shí)例有著更好的概括和泛化能力,因此被廣泛使用于信息抽取、機(jī)器翻譯、自然語言生成等研究中。一個(gè)模板通常包含兩部分,即模板詞(patternwords)和模板槽(pattern slots),其中前者可看作模板的常量部分,后者則是模板的變量部分。例如,對(duì)于模板“想給[x]買個(gè)[y]”,“想給”和“買個(gè)”是模板詞,而“[x]”是模板槽。在模板匹配過程中,模板詞必須嚴(yán)格匹配,而模板槽可匹配任意內(nèi)容。這里,通過在模板槽中填充具體內(nèi)容從而生成模板實(shí)例的過程稱作模板的實(shí)例化(instantiation)。例如,在模板“想買[x]買個(gè)[y]”的前后兩個(gè)槽中分別填充“兒子”和“iPhone6”,便將上述模板實(shí)例化為“想給兒子買個(gè)iPhone6”。顯然,一個(gè)模板可以實(shí)例化為多種不同的實(shí)例。

模板在信息抽取以及自動(dòng)問答中已然獲得十分廣泛的應(yīng)用,因此這兩個(gè)研究方向的許多學(xué)者都曾提出過模板的抽取方法。與這些方向的研究類似,在消費(fèi)意圖類模板抽取的研究中,一部分學(xué)者使用基于規(guī)則的方法抽取模板。規(guī)則的制定通常要基于一系列的語言分析與預(yù)處理,如詞性標(biāo)注、命名實(shí)體識(shí)別和句法分析等。相應(yīng)地,制定的復(fù)述規(guī)則也包括詞序列規(guī)則、詞性規(guī)則以及句法規(guī)則等形式。有學(xué)者[3,5]基于規(guī)則和基于圖的方法分別獲取意圖模板。在基于圖的方法中,通過將意圖模板抽取看作為圖上隨機(jī)游走過程,而且定義的圖節(jié)點(diǎn)將分別為模板節(jié)點(diǎn)和原始內(nèi)容節(jié)點(diǎn),其基本想法是,若模板節(jié)點(diǎn)+原始內(nèi)容節(jié)點(diǎn)仍能出現(xiàn)在原始語料中,則該模板為候選模板,進(jìn)而通過圖迭代的方法獲取最終模板。依據(jù)這一方法抽取得到的愿望模板可如下所示:

可以看到,基于規(guī)則的方法其缺點(diǎn)在于規(guī)則的可擴(kuò)展性差,人工編寫規(guī)則的工作量大,成本較高。具體來講,由于人們?cè)谡Z言表述上具有復(fù)雜性和靈活性,規(guī)則的制定過程費(fèi)時(shí)費(fèi)力且難以覆蓋所有的語言現(xiàn)象。規(guī)則往往依賴于具體語言、領(lǐng)域和文本風(fēng)格,可移植性不好。同時(shí)基于規(guī)則的方法代價(jià)昂貴,且遷移性差,因此越來越多的研究者開始利用基于統(tǒng)計(jì)的方法來識(shí)別消費(fèi)意圖。

有研究者基于種子實(shí)例從產(chǎn)品評(píng)價(jià)中抽取產(chǎn)品受眾者,即上述模板中的“[x]”。例如,Wang等人[6]將抽取產(chǎn)品受眾者的模板用于產(chǎn)品推薦系統(tǒng)的目標(biāo)人物抽取環(huán)節(jié)。研究中首先為其產(chǎn)品推薦系統(tǒng)設(shè)計(jì)了一個(gè)受眾人分類體系,然后針對(duì)該體系人工編寫少量“種子”實(shí)例。比如,對(duì)于“I bought my son this phone.”類型的產(chǎn)品評(píng)論,其編寫的種子實(shí)例為“buy somebody something”。該方法利用種子實(shí)例作為輸入,并使用基于boostrapping的方法從產(chǎn)品評(píng)論中匹配該種子實(shí)例的字符串,進(jìn)而生成模板。依據(jù)此方法抽取得到的受眾者模板如下所示:

3.2基于內(nèi)容的消費(fèi)意圖識(shí)別

Goldberg等[3]首次提出了“buy wish”的概念(即本文定義的顯式消費(fèi)意圖,如:想買一部手機(jī))。研究是從用戶在互聯(lián)網(wǎng)上的愿望清單和產(chǎn)品評(píng)論中的內(nèi)容來識(shí)別其中的消費(fèi)意圖。過程中,即事先人工給定了一些通用的消費(fèi)意圖規(guī)則模板,比如“I wish for”,而后再利用規(guī)則模板去匹配具有消費(fèi)意圖的句子。這種方法較為簡(jiǎn)單,但基于人工制定模板的匹配方法效果不甚理想,特別是系統(tǒng)的召回率很低。進(jìn)而,作者提出了基于二元圖方法自動(dòng)抽取消費(fèi)意圖模板,如此生成的消費(fèi)意圖模板表達(dá)能力更強(qiáng),使得系統(tǒng)識(shí)別的效果的性能也相對(duì)提高,特別是召回率有了顯著的提升。在此基礎(chǔ)上,作者加入了文本中詞匯作為消費(fèi)意圖識(shí)別的特征。盡管采用詞特征比較簡(jiǎn)單,但是通過實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)文本中的詞特征對(duì)于消費(fèi)意圖識(shí)別是非常有效的。

Chen和Hsu[4]也提出過相似的概念“Intention Posts”。研究者基于不同領(lǐng)域間消費(fèi)意圖表達(dá)方式相近的假設(shè),即用于學(xué)習(xí)的訓(xùn)練樣本與新的測(cè)試樣本近似地滿足獨(dú)立同分布的條件。利用這種遷移學(xué)習(xí)(Transfer learning)的思想只需要在一個(gè)領(lǐng)域標(biāo)注數(shù)據(jù),并將其應(yīng)用于一個(gè)新的沒有任何標(biāo)注的目標(biāo)域數(shù)據(jù)。面對(duì)著消費(fèi)意圖文本中表達(dá)意圖的內(nèi)容通常只有一個(gè)或幾個(gè)關(guān)鍵字,同時(shí)數(shù)據(jù)不平衡的問題,作者提出了Co-Class算法 。 首先,利用已有領(lǐng)域的標(biāo)注數(shù)據(jù)構(gòu)建一個(gè)分類器,然后將分類器應(yīng)用到目標(biāo)域的無標(biāo)注數(shù)據(jù)中。這樣,在目標(biāo)數(shù)據(jù)中便可以重新形成特征選擇,進(jìn)而構(gòu)建新的分類器。這兩個(gè)分類器將共同對(duì)目標(biāo)實(shí)施數(shù)據(jù)分類。這一迭代過程運(yùn)行即直至類別標(biāo)簽對(duì)目標(biāo)數(shù)據(jù)標(biāo)注不再改變?yōu)橹?。作者分別在四個(gè)領(lǐng)域的語料上進(jìn)行了遷移學(xué)習(xí)的實(shí)驗(yàn),而通過實(shí)驗(yàn)則證明了提出的Co-class算法對(duì)跨領(lǐng)域遷移學(xué)習(xí)的消費(fèi)意圖識(shí)別任務(wù)是有效的。

Wang等[7]在不同領(lǐng)域的消費(fèi)意圖識(shí)別任務(wù)上展開了相關(guān)研究。研究提出了基于圖的方法來識(shí)別Twitter中表達(dá)用戶意圖的內(nèi)容。具體來說,該方法將要分類的Twitter內(nèi)容和意圖關(guān)鍵詞(如:對(duì)句子“I want to buy an xbox”中“buy an xbox”即為文中定義的意圖關(guān)鍵詞)作為圖上的節(jié)點(diǎn),利用意圖關(guān)鍵詞和Twitter句子之間的關(guān)系形成邊和邊權(quán)重來構(gòu)建圖,繼而使用圖傳播算法來完成在不同領(lǐng)域類別上的消費(fèi)意圖分類。此外,Ding等人[2]提出了基于領(lǐng)域自適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的微博文本消費(fèi)意圖識(shí)別方法,并將此方法應(yīng)用到了電影票房預(yù)測(cè)的任務(wù)上,研究證明,消費(fèi)意圖特征有助于預(yù)測(cè)電影票房,其原因在于用戶對(duì)電影的消費(fèi)意愿能直接反映出用戶購票的活躍度。

3.3基于內(nèi)容的消費(fèi)對(duì)象識(shí)別

相比而言,已有研究主要針對(duì)基于內(nèi)容的消費(fèi)意圖進(jìn)行識(shí)別,很少研究消費(fèi)意圖句中的消費(fèi)對(duì)象識(shí)別。本文定義消費(fèi)對(duì)象是指消費(fèi)者提出所需要購買的對(duì)象,即某段文本內(nèi)容中所論述的對(duì)象。由于廣告商所關(guān)注的正是用戶針對(duì)某一消費(fèi)對(duì)象的消費(fèi)意圖,而也就是這一存在使得消費(fèi)意圖研究更加突顯其現(xiàn)實(shí)重要意義。但目前針對(duì)消費(fèi)意圖對(duì)象的相關(guān)研究較少。Wang等人[6]提出了從微博中挖掘趨勢(shì)相關(guān)產(chǎn)品的問題。相應(yīng)地即將“趨勢(shì)”定義為在微博上被用戶熱烈討論的話題。例如,如果有人在微博上說“最近北京空氣很差”,那么就希望從空氣很差這一趨勢(shì)中,挖掘出空氣凈化器,口罩等與之相關(guān)的產(chǎn)品。

一般而言,現(xiàn)有的研究是從文本內(nèi)容中挖掘產(chǎn)品命名實(shí)體[8-10]或是評(píng)價(jià)對(duì)象[11-14]。這里期望能從產(chǎn)品命名實(shí)體和評(píng)價(jià)對(duì)象抽取的研究中借鑒一些有價(jià)值的和方法,從而對(duì)消費(fèi)對(duì)象抽取研究有所啟發(fā)和促進(jìn)。一方面,事實(shí)上產(chǎn)品命名實(shí)體抽取的研究屬于命名實(shí)體識(shí)別的研究范疇。命名實(shí)體(Named Entity:NE)挖掘,主要是指從文本中挖掘出人名、地名、機(jī)構(gòu)名等。早期命名實(shí)體的研究方法是基于人工規(guī)則的算法。近年來,一些機(jī)器學(xué)習(xí)的方法被應(yīng)用到命名實(shí)體的研究之中。一部分學(xué)者采用基于分布假設(shè)計(jì)算詞義相似度,其基本思想是那些傾向于出現(xiàn)在相似的上下文中的詞意思相近,通過人工給定一組實(shí)體作為種子,其上下文作為模板并使用迭代的方法獲取了給定目標(biāo)類別下的新實(shí)體。以往的產(chǎn)品命名實(shí)體識(shí)別的研究主要是基于有指導(dǎo)的方法,然而這類方法需要標(biāo)注大規(guī)模的訓(xùn)練語料,由于產(chǎn)品命名實(shí)體中詞匯量比較大,新詞頻繁出現(xiàn),經(jīng)常出現(xiàn)縮略語,構(gòu)建足夠訓(xùn)練規(guī)模的產(chǎn)品命名實(shí)體訓(xùn)練集是比較困難的。這個(gè)問題對(duì)于消費(fèi)對(duì)象識(shí)別來說同樣存在,由于社會(huì)媒體中用戶的內(nèi)容隨意,導(dǎo)致消費(fèi)對(duì)象的成分多不完整,通常由縮略語等代替,故而諸如產(chǎn)品型號(hào)類:5s(指iPhone手機(jī)的型號(hào)5s)這種產(chǎn)品型號(hào)邊界未必能夠被識(shí)別出來。

在情感分析中有研究從評(píng)論中挖掘用戶的評(píng)價(jià)對(duì)象。一般而言,現(xiàn)有的方法將評(píng)價(jià)對(duì)象的范圍限定在名詞或名詞短語的范疇內(nèi),當(dāng)然并非所有的名詞或名詞短語都是評(píng)價(jià)對(duì)象,因而需要對(duì)其進(jìn)行識(shí)別。有研究者基于經(jīng)驗(yàn)性的規(guī)則[12]或關(guān)聯(lián)規(guī)則的方法找出頻繁出現(xiàn)的評(píng)價(jià)對(duì)象[13-14],然后基于經(jīng)驗(yàn)性的剪枝方法從中過濾錯(cuò)誤的評(píng)價(jià)對(duì)象實(shí)例。還有學(xué)者將評(píng)價(jià)對(duì)象與產(chǎn)品屬性之間關(guān)聯(lián)起來,即認(rèn)為產(chǎn)品屬性可以作為評(píng)價(jià)對(duì)象的一種表達(dá)方式,如對(duì)一個(gè)手機(jī)來講,“手機(jī)的像素”是手機(jī)的一個(gè)屬性,而“觸屏手機(jī)”是手機(jī)的部件之一。首先,該方法獲取大量的名詞短語作為候選評(píng)價(jià)對(duì)象;繼而采用了某些關(guān)系指示短語(比如“屬性-從性”關(guān)系指示詞:attribute-of)來獲取評(píng)價(jià)對(duì)象,最后利用候選評(píng)價(jià)對(duì)象和關(guān)系指示短語之間的共現(xiàn)關(guān)系,得出該候選評(píng)價(jià)對(duì)象是否是真正的評(píng)價(jià)對(duì)象。

4 未來的研究方向

消費(fèi)意圖識(shí)別作為產(chǎn)品推薦和自然語言處理領(lǐng)域的一個(gè)重要方向,還有許多有意義的問題值得研究,其中熱點(diǎn)的研究方向和問題主要包括:

(1)雖然研究者們已經(jīng)提出了多種方法用于消費(fèi)意圖句的識(shí)別、消費(fèi)意圖模板和消費(fèi)對(duì)象識(shí)別等方法。然而總的來看識(shí)別出的準(zhǔn)確率較低,仍有許多噪聲數(shù)據(jù)無法過濾,特別是隱性消費(fèi)意圖識(shí)別鮮有研究。因此接下來的一個(gè)主要目標(biāo)就是如何找到一種有效的方法對(duì)不同平臺(tái)中的消費(fèi)意圖句進(jìn)行準(zhǔn)確識(shí)別。同時(shí),迫切需要其后的研究者把消費(fèi)意圖識(shí)別的各項(xiàng)任務(wù)做細(xì)、做深。尤其是希望能找到一種對(duì)于各個(gè)平臺(tái)或各個(gè)不同領(lǐng)域都適用的識(shí)別方法。

(2)目前來看,消費(fèi)意圖識(shí)別的大部分工作都集中在顯式消費(fèi)意圖識(shí)別的研究任務(wù)中。然而與顯式消費(fèi)意圖識(shí)別任務(wù)不同,隱式消費(fèi)意圖識(shí)別的研究任務(wù)也是比較有意義的問題。即在一個(gè)用戶表達(dá)的文本中,挖掘出潛在的購買目標(biāo)。這方面的研究工作還比較少且仍未臻深入。此外,相對(duì)于消費(fèi)意圖句的識(shí)別而言,基于用戶消費(fèi)意圖的研究也還未展開,尤其是在跨平臺(tái)上的研究遠(yuǎn)達(dá)到充分和全面。然而總的看來,基于隱式消費(fèi)意圖的研究和基于用戶的消費(fèi)意圖研究方面還有許多的問題有待解決。

(3)消費(fèi)意圖研究中的評(píng)測(cè)問題一直是困擾研究者的一個(gè)主要問題。因此希望廣大研究者們能夠共同努力,推出一套大家都能認(rèn)可和接受的評(píng)測(cè)體系和數(shù)據(jù),這樣定會(huì)極大的促進(jìn)本研究的發(fā)展。本文基于內(nèi)容的消費(fèi)意圖識(shí)別中各類實(shí)驗(yàn)大都采用人工評(píng)測(cè)的方法,基于用戶的消費(fèi)意圖識(shí)別評(píng)價(jià)中采用了自動(dòng)評(píng)價(jià)的方法。由于人工評(píng)測(cè)主觀性強(qiáng)且費(fèi)時(shí)費(fèi)力,因此找到一種消費(fèi)意圖研究的自動(dòng)評(píng)測(cè)方法還是非常有必要的。

(4)消費(fèi)意圖識(shí)別研究在眾多相關(guān)研究中都有很大的應(yīng)用潛力,如有研究是基于消費(fèi)意圖的電影票房預(yù)測(cè)取得了不錯(cuò)的性能。但這方面具體應(yīng)用的例子仍不多。所以在今后的研究中,應(yīng)該積極探索消費(fèi)意圖識(shí)別在各種實(shí)際任務(wù)中的作用,這樣才能更好地推動(dòng)此項(xiàng)研究深入開展。

6 結(jié)束語

社會(huì)媒體是一個(gè)基于用戶關(guān)系的信息分享、傳播以及獲取平臺(tái),并實(shí)現(xiàn)即時(shí)分享。這即使得微博成為一個(gè)嶄新的信息傳播和用戶交互的方式:一方面,人們通過微博各種消費(fèi)需求信息,向家人、朋友、同事等尋求幫助,期望從朋友中獲得產(chǎn)品的信息;另一方面,越來越多的用戶也樂于在微博上分享各種感興趣的話題和愛好進(jìn)行即時(shí)分享。因而,迫切需要了解用戶的消費(fèi)意圖或興趣。消費(fèi)意圖識(shí)別作為產(chǎn)品推薦和自然語言處理領(lǐng)域的一個(gè)重要方向,目前的研究還遠(yuǎn)未足夠。因此就需要在已有工作的基礎(chǔ)上進(jìn)一步鉆研,針對(duì)尚且存在的問題展開攻關(guān)。另外,隨著消費(fèi)意圖識(shí)別方法和技術(shù)的逐漸成熟,相應(yīng)研究成果也將更為廣泛地投入到實(shí)際應(yīng)用中去,以促進(jìn)諸如產(chǎn)品推薦、信息抽取、在線廣告以及市場(chǎng)營(yíng)銷等相關(guān)研究的發(fā)展。

參考文獻(xiàn):

[1] B. Fu, T. LIU. Weakly-supervised Consumption Intent Detection in Microblogs [J]. Journal of Computational Information Systems, 2013, 6(9):2423C2431.

[2] X. Ding, T. Liu, J. Duan, et al. Mining User Consumption Intention from Social Media Using Domain Adaptive Convolutional Neural Network [C]// Proceedings of AAAI 2015, Austin, Texas,USA:AAAI,2015: 2389-2395.

[3] J. Ramanand, K. Bhavsar, N. Pedanekar. Wishful Thinking: Finding Suggestions and ‘buy’ Wishes from Product Reviews. [C]// Proceedings of NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, Los Angeles, California:ACL, 2010:54C61.

[4] A. Goldberg, N. Fillmore, D. Andrzejewski, et al. May all Your Wishes Come True: A Study of Wishes and How to Recognize Them. [C]// Proceedings of NAACL HLT 2009, Boulder, Colorado:ACL, 2009:263C271.

[5] J. Wang, W. X. Zhao, H. Wei, et al. Mining New Business Opportunities: Identifying Trend Related Products by Leveraging Commercial Intents from Microblogs [C]// Proceedings of EMNLP 2013, Seattle, USA:ACL, 2013:1337C1347.

[6] Z. Chen, B. Liu, M. Hsu, et al. Identifying Intention Posts in Discussion Forums [C]// Proceedings of HLT- NAACL2013, Atlanda, GA, USA:ACL, 2013:1041C1050.

[7] J. Wang, G. Cong, X. W. Zhao, et al. Mining User Intents in Twitter: A Semi-supervised Approach to Inferring Intent Categories for Tweets [C]// Proceedings of AAAI 2015, Austin, Texas, USA:AAAI, 2015: 318-324.

[8] 劉非凡, 趙軍, 呂碧波等. 面向商務(wù)信息抽取的產(chǎn)品命名實(shí)體識(shí)別研究[J].中文信息學(xué)報(bào), 2006, 20(1):7C13.

[9] F. Luo, Q. Qiu, Q. Xiong. Introduction to the Product-entity Recognition Task [C]// Proceedings of Web Society (SWS), 2011 3rd Symposium on, Port Elizabeth, South Africa: Web Society,2011:122C126.

[10] F. Luo, H. Xiao, W. Chang. Product Named Entity Recognition Using Conditional Random Fields [C]// Proceedings of Business Intelligence and Financial Engineering (BIFE) 2011, Wuhan,China:[s.n.],2011:86C89.

[11] Y. Zhao, B. Qin, S. Hu, et al. Generalizing Syntactic Structures for Product Attribute Candidate Extraction [C]// Proceedings of NAACL 2010, Los Angeles, CA:ACL, 2010:377C380.

[12] J. Yi, T. Nasukawa, R. Bunescu, et al. Sentiment Analyzer: Extracting Sentiments about a Given Topic Using Natural Language Processing Techniques [C]// Proceedings of ICDM 2003, Melbourne, Florida, USA:ICDM, 2003:427C434.