前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的模式識別主題范文,僅供參考,歡迎閱讀并收藏。
模式識別與智能系統(tǒng)是20世紀(jì)60年代以來在信號處理、人工智能、控制論、計(jì)算機(jī)技術(shù)等學(xué)科基礎(chǔ)上發(fā)展起來的新型學(xué)科。
模式識別與智能系統(tǒng)是控制科學(xué)與工程的二級學(xué)科,以信息處理與模式識別的理論技術(shù)為核心,以數(shù)學(xué)方法與計(jì)算機(jī)為主要工具,研究對各種媒體信息進(jìn)行處理、分類和理解的方法,并在此基礎(chǔ)上構(gòu)造具有某些智能特性的系統(tǒng)。
該學(xué)科以各種傳感器為信息源,以信息處理與模式識別的理論技術(shù)為核心,以數(shù)學(xué)方法與計(jì)算機(jī)為主要工具,探索對各種媒體信息進(jìn)行處理、分類、理解并在此基礎(chǔ)上構(gòu)造具有某些智能特
(來源:文章屋網(wǎng) )
(①濟(jì)南工程職業(yè)技術(shù)學(xué)院,濟(jì)南 250200;②山東建筑大學(xué)信息與電氣工程學(xué)院,濟(jì)南 250101)
(①Ji’nan Engineering Vocational Technical College,Ji’nan 250200,China;
②School of Information and Electrical Engineering,Shandong Jianzhu University,Ji’nan 250101,China)
摘要: 為了準(zhǔn)確提取與識別焊縫射線數(shù)字成像中焊接缺陷,本文提出了一種基于神經(jīng)網(wǎng)絡(luò)的模式識別算法。首先,分析了非線性模式分類的基本原理,通過人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對焊縫內(nèi)存在的焊接缺陷進(jìn)行分類;然后,采用缺陷的幾何特征作為分類算法的輸入數(shù)據(jù),并應(yīng)用神經(jīng)網(wǎng)絡(luò)關(guān)聯(lián)標(biāo)準(zhǔn)理論評估鑒別能力,證明了特征提取的質(zhì)量重要性優(yōu)于數(shù)量;最后,將基于神經(jīng)網(wǎng)絡(luò)的主要非線性鑒別分量的識別算法應(yīng)用于缺陷識別中,并通過大量實(shí)驗(yàn)分析與評價(jià)其分類性能。實(shí)驗(yàn)結(jié)果數(shù)據(jù)證明該算法在焊接缺陷模式識別方面具有較高的效率。
Abstract: In order to extract and recognize welding defects in digital X-ray images, this paper proposes a neural network based on pattern recognition algorithm. Firstly, the fundamental of the nonlinear pattern classification has been analyzed. By means of artificial neural network, the classification of welding defects in welding lines has been realized. Later on, the geometric feature of the welding defect has been adopted for input data. The identification ability was evaluated by neural network association standard theory. It proved that quality was more important than quantity. At last, the neural network based on principal discrimination components has been applied to defect identification and satisfying result has been achieved. The experimental result proved this necognition has high efficiency.
關(guān)鍵詞 : 焊接缺陷;缺陷識別;關(guān)聯(lián)標(biāo)準(zhǔn);非線性模式;神經(jīng)網(wǎng)絡(luò)
Key words: weld defects;defect identification;correlates of standard;nonlinear pattern;neural networks
中圖分類號:O434文獻(xiàn)標(biāo)識碼:A文章編號:1006-4311(2015)25-0115-05
基金項(xiàng)目:國家自然科學(xué)基金(61473176,51207083,61473172);山東省優(yōu)秀中青年科學(xué)家獎勵基金(BS2013DX045); 山東省高校科研發(fā)展計(jì)劃項(xiàng)目(J13LG52);山東建筑大學(xué)博士基金(XNBS1249)。
作者簡介:梁瑋(1980-),女,山東濟(jì)南人,博士研究生,主要研究方向?yàn)閿?shù)字射線無損檢測及優(yōu)化算法。
0 引言
數(shù)字射線檢測較其他方法而言具有較高的圖像精度。目前,在對焊接質(zhì)量進(jìn)行評價(jià)時(shí),尚需采用傳統(tǒng)方法,如檢驗(yàn)員的目測。這種方法對經(jīng)驗(yàn)要求較高,發(fā)生錯誤的概率也較高[1-2]。對于數(shù)字射線檢測缺陷的分類,也有數(shù)字智能化的算法應(yīng)用。其自動檢測步驟大致如下:第一,膠片圖像數(shù)字化或直接進(jìn)行數(shù)字射線圖像生成;第二,圖像的預(yù)處理;第三,焊縫缺陷的識別和分類;最后,檢驗(yàn)結(jié)果的獲取與后處理。
本文使用線性分類算法將神經(jīng)關(guān)聯(lián)的標(biāo)準(zhǔn)用于研究各種缺陷特征,并證明了特征提取的質(zhì)量重要性優(yōu)于數(shù)量,以提高分類成功的概率。主要鑒別分量(PCD:Principal Components of Discrimination)算法在其它研究領(lǐng)域比較常用。采用此算法,通過神經(jīng)網(wǎng)絡(luò)執(zhí)行,用于減少輸入維數(shù),并且對等級分離區(qū)的二維性進(jìn)行可視化。
1 模式識別及分類算法
1.1 缺陷特征的提取
數(shù)字射線圖像的噪聲一般作為隨機(jī)分散的像素出現(xiàn),并且相鄰像素值并沒有耦合特征。低通濾波器一般用于降低噪聲,采用直方圖均衡或拉伸的算法對對比度進(jìn)行優(yōu)化。從而提高圖像的對比度,更容易地檢測到焊縫和缺陷[3-4]。
圖像進(jìn)行預(yù)處理之后,需要提取焊縫的形狀和位置特征。文獻(xiàn)[5]提取了10種特征,開發(fā)了自動焊縫射線照片檢驗(yàn)系統(tǒng)。文獻(xiàn)[6]提出采用10種焊接缺陷特征,將特征用于缺陷識別,需要比分類器圖像像素處理更少的信息。但是需要非常大的輸入空間,計(jì)算較為復(fù)雜。
本文算法采用四種特征形成系列非線性模式分類數(shù)據(jù)輸入,如下:
①位置(P= h/H):缺陷到焊縫中心的距離(h)之間與發(fā)生缺陷的焊縫厚度(H)之比。H用于求焊縫厚度變化的平均值,此類變化經(jīng)常出現(xiàn)在焊縫射線照片中。
②長寬比(a=L/e):小橢圓的長軸(L)與短軸(e)的比率,相當(dāng)于此缺陷的面積。
③比例e/A:短軸(e)與缺陷面積(A)之比。
④渾圓度(p2/4πA):缺陷的周長p的乘方與缺陷面積A的4π倍之比。
采用上述特征,形成用于神經(jīng)網(wǎng)絡(luò)(輸入矢量)的輸入數(shù)據(jù)集。
1.2 基于神經(jīng)網(wǎng)絡(luò)的非線性模式分類及關(guān)聯(lián)標(biāo)準(zhǔn)
本文采用雙層神經(jīng)網(wǎng)絡(luò)模型,分別為中間層和輸出層。通過調(diào)整中間層神經(jīng)元的數(shù)量,跟蹤輸出性能和誤差,確定最佳神經(jīng)元數(shù)量。得到的結(jié)果用神經(jīng)元數(shù)量與誤差分類性能圖進(jìn)行表示。在模式分類的一種網(wǎng)絡(luò)中,輸出層中的神經(jīng)元數(shù)量對應(yīng)進(jìn)行研究的等級數(shù)量。在此情況下,輸出包含四個神經(jīng)元,考慮只有包含一種級別;若輸出包含五個神經(jīng)元,則考慮只有包含兩種級別,并且將此夾渣等級分為兩種等級:線性和非線性夾渣。所有神經(jīng)元在一定范圍內(nèi)都是雙曲正切型。輸入矢量 是一個四維向量,在算法執(zhí)行中,根據(jù)關(guān)聯(lián)標(biāo)準(zhǔn)可降維為3、2或1。
本文采用文獻(xiàn)[7]中所述關(guān)聯(lián)標(biāo)準(zhǔn)得到的新結(jié)果。此標(biāo)準(zhǔn)基于對網(wǎng)絡(luò)回復(fù)中的變化進(jìn)行搜索,此時(shí)使用的特征用其平均值進(jìn)行代替。網(wǎng)絡(luò)回復(fù)之間的差異越大,特征的關(guān)聯(lián)就越大[7-9]。將此標(biāo)準(zhǔn)用于評價(jià)原來采用的六種特征,由于分類器為線性的,并且只通過雙曲正切型神經(jīng)元執(zhí)行。采用方程式對關(guān)聯(lián)的標(biāo)準(zhǔn)進(jìn)行計(jì)算如式(1)所示。
1.3 非線性分類的主要分量分析
主要分量分析(PCA:Principal Components Analysis)是一系列多變量數(shù)據(jù)的有效精簡技術(shù)之一。它將多維數(shù)據(jù)通過線性映射在低維中的一種技術(shù),從而減少信息的損失。但是,由于它是一種線性映射方法,故并不適用于非線性的工程問題中。因此,需要借助于主要非線性分量的分析[10-12]。形成主要分量的方法之一就是采用人工神經(jīng)網(wǎng)絡(luò),可以用于減少表示分量。本文借助主要分量用于非線性鑒別,通過神經(jīng)網(wǎng)絡(luò)執(zhí)行,并且已通過誤差反向傳播算法進(jìn)行開發(fā),步驟如下:
非線性鑒別的第一個分量由在誤差反向傳播中訓(xùn)練三層網(wǎng)絡(luò)中得到。第一層只包括一種線性神經(jīng)元,并且其余層為雙曲正切型神經(jīng)元,如圖2所示。
II類:兩種分量也可以通過同時(shí)訓(xùn)練得到,也就是說,這兩種分量在網(wǎng)絡(luò)訓(xùn)練期間在它們之間進(jìn)行合作。通過類似方式可以對3,4或m分量進(jìn)行相同程序。在此情況下,形成輸入空間減少和優(yōu)化的基礎(chǔ),用于分類。
在有多維度的數(shù)據(jù)中,很難顯示等級分離問題的規(guī)模。但是,通過采用兩種主要非線性鑒別分量,可以對模式等級進(jìn)行較好的區(qū)分。在此方式中,借助獨(dú)立起作用的兩種,查看一起處理的四種和五種等級的分離圖。這些分量通過圖2中的神經(jīng)網(wǎng)絡(luò)得到,并且采用反向傳播誤差、瞬時(shí)和可變的學(xué)習(xí)速率進(jìn)行訓(xùn)練。
將分量p1用作非線性分類器輸入矢量,以便用于評價(jià)性能,同時(shí)也可以采用通過合作行動的兩類訓(xùn)練得到的(p1+p2)獨(dú)立值以及兩個分量。
2 實(shí)驗(yàn)結(jié)果和討論
2.1 非線性模式分類
為了找到用于非線性分類器中間層的最佳神經(jīng)元數(shù)量,采用在此層中逐漸增加神經(jīng)元數(shù)量的經(jīng)驗(yàn)標(biāo)準(zhǔn),然后對分類誤差和性能進(jìn)行觀測。同時(shí)考慮將夾雜等級分為線性夾雜和非線性夾雜(總共五種等級)如圖3(a)所示,若將夾雜只作這一種等級(總共四種等級)如圖3(b)所示。注意在第一種情況中,有五種等級,分類器到達(dá)最高性能(99.2%)和最小誤差,其訓(xùn)練數(shù)據(jù)針對中間層中的17/18種神經(jīng)元。對于四種等級,通過10種神經(jīng)元達(dá)到最佳性能(100.0%)。
結(jié)果表明,只有一件樣品沒有明確分類。因此,所有等級的成功概率都大約為100.0%。咬邊等級得到的分布實(shí)例如圖4所示。
2.2 非線性關(guān)聯(lián)標(biāo)準(zhǔn)
根據(jù)上述結(jié)果,采用這些特征對輸入的不同組合進(jìn)行試驗(yàn)。圖5為針對這些特征組合得到的各種結(jié)果。通過輸入矢量a-e/A-P得到的這些結(jié)果,不考慮特征R,在兩種情況下(四種和五種等級)都等于通過四種特征得到的結(jié)果,從而說明輸入矢量的維度仍然可以減少為3維,而不會影響分類器的性能。也對只采用兩種特征的可能性進(jìn)行研究,如圖5所示,雖然與使用四種或三種特征相比,性能降低,但是使用非線性分類器時(shí),此分類中的成功率仍然高于90%。
2.3 非線性鑒別的主要分量
圖6為獨(dú)立起作用的兩種主要非線性鑒別分量的兩個二維圖。圖6(a)為四種等級的分離,說明咬邊和未焊透等級出現(xiàn)在良好定義的區(qū)域,因此很容易通過非線性分離器進(jìn)行分離。氣孔和夾渣等級在圖中出現(xiàn)混亂區(qū)域,并且夾渣的有些觀測值位于氣孔區(qū)域中。這在以前采用線性分類器時(shí)已檢測到,因?yàn)檎`差分類為這些等級的參考數(shù)據(jù)。在圖6(b)中可以注意到有五種等級,非線性夾渣、線性夾渣與氣孔之間的混亂更大,但是這很容易解釋,因?yàn)閵A渣的兩種等級之間的區(qū)分比較復(fù)雜,這是由于其特征類似[13-16]。
圖7中的圖表表示只采用第一種分量p1作為分類器的輸入矢量時(shí)得到的性能結(jié)果,同時(shí)(p1+p2)為獨(dú)立的分量(二維矢量),并且(p1+p2)為合作的分量(用于兩種類型)。
結(jié)果表面只采用第一種分量時(shí),有四種等級的訓(xùn)練數(shù)據(jù)的成功率達(dá)到92.0%,在邏輯上有五種等級的更復(fù)雜情況的成功率更低(66.4%)。采用兩種分量時(shí),成功率非常接近采用三種或四種特征時(shí)達(dá)到的成功率。這還確定使用的分量類型之間的性能沒有顯著差。這些結(jié)果證明了主要分量減少原始數(shù)據(jù)維度的效率,并且保持分類成功的較高能力。對于進(jìn)行研究的這種情況,沒有對將規(guī)模從三維或四維降低為二維進(jìn)行判定。但是,這些結(jié)果將推動通過更大規(guī)模的系統(tǒng)進(jìn)行類似研究。
3 結(jié)論
本文采用二層神經(jīng)網(wǎng)絡(luò)及主要分量分析法對數(shù)字射線圖像中的焊接缺陷進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明,無論是四種還是五種等級(夾渣是否分為線性和非線性),均取得了較高的分類效率,算法適用性較好,不依賴于大量經(jīng)驗(yàn)數(shù)據(jù),具有較好的應(yīng)用前景。
參考文獻(xiàn):
[1]孔凡琴,路宏年.采用數(shù)字射線DR成像的焊接質(zhì)量檢測[J].無損檢測,2008,30(1):20-22.
[2]梁麗紅,孔凡琴,路宏年.X射線非晶硅面陣探測器B級像質(zhì)的研究[J].無損檢測,2005,27(3):113-116.
[3]張曉光,高頂.射線檢測焊接缺陷的提取和自動識別[M]. 國防工業(yè)出版社,2004.
[4]陶亮,孫同景,李振華,等.基于鄰域?qū)Ρ榷鹊腦射線數(shù)字圖像自適應(yīng)增強(qiáng)法[J].無損檢測,2011,33(1):20- 22.
[5]Kato Y, Okumura T, Matsui S, et al. Development of an automatic weld defect identification system for radiographic testing[J]. Welding Word 1992, 30(7): 182-195.
[6]Aoki K, Suga Y. Application of artificial neural network to discrimination of defect type automatic radiographic testing of welds[J]. ISI International, 1999, 39(10): 1081-1097.
[7]Silva RR, Siqueira MHS, Caloba LP, et al. Radiographics pattern recognition of welding defects using linear classifiers[J]. Insight, 2001, 43(10): 669-674.
[8]Silva RR, Siqueira MHS, Caloba LP, et al. Evaluation of the relevant characteristic parameters of welding defects and probability of correct classification using linear classifiers[J]. Insight, 2002, 44(10): 616-622.
[9]Silva RR, Siqueira MHS, Caloba LP, et al. Contribution to the development of a radiographic inspection automated system[C]. 8th European Conference on Non-destructive Testing, June 17-21, Paris, 2002.
[10]Seixas JM, Caloba LP, Delpino I. Relevance criteria for variance selection in classifier designs[C]. International Conference on Engineering Applications of Neural Networks, April 4-6, London, 1996.
[11]Dong D, McAvoy TJ. Nonlinear principal component analysis-based on principal curves and neural networks[J]. Comput Chem Engng, 1996, 20(1): 65-78.
[12] Ang AHS, Tang WH. Probability concepts in engineering planning and design[J]. Basic principles, 1975, 1(5): 575-579.
[13]Mery D, Silva RR, Caloba LP, et al. Pattern recognition in the automatic inspection of aluminium castings[J]. Insight, 2003, 45(7):1-9.
[14]Mery D, Filbert D. Classification of potential defects in the automatic inspection of aluminium castings using statistical pattern recognition[C]. 8th European Conference on Non-Destructive Testing, June 17-21, Barcelona, 2002.
關(guān)鍵詞:CDIO;工程教育;主動學(xué)習(xí);經(jīng)驗(yàn)學(xué)習(xí)
作者簡介:袁立(1978-),女,河北邢臺人,北京科技大學(xué)自動化學(xué)院,副教授;李曉理(1971-),男,遼寧沈陽人,北京科技大學(xué)自動化學(xué)院,教授,博士生導(dǎo)師。(北京 100083)
基金項(xiàng)目:本文系教育部第五批高等學(xué)校特色專業(yè)建設(shè)項(xiàng)目“自動化CDIO特色專業(yè)建設(shè)”(項(xiàng)目編號:TS2422)的研究成果。
中圖分類號:G642.0 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-0079(2013)04-0051-02
CDIO是由美國麻省理工學(xué)院、瑞典皇家技術(shù)學(xué)院、瑞典查爾姆斯技術(shù)學(xué)院、瑞典林克平大學(xué)等四所大學(xué)從2000年起合作研究探索的一種新型的工程教育模式。CDIO教育模式力圖培養(yǎng)學(xué)生能夠在現(xiàn)代的、基于團(tuán)隊(duì)的環(huán)境下構(gòu)思(Conceive)—設(shè)計(jì)(Design)—實(shí)施(Implement)—運(yùn)行(Operate)復(fù)雜、高附加值的工程產(chǎn)品、過程和系統(tǒng),讓其成為成熟、有責(zé)任感的人。[1]CDIO改革有三個總體目標(biāo),即教育學(xué)生,使他們能夠更深層次地掌握技術(shù)基礎(chǔ)知識,不是通過被動的聽講過程獲取知識,而是讓學(xué)生自己構(gòu)建他們的知識,面對和糾正自身的錯誤理解;教育學(xué)生能夠領(lǐng)導(dǎo)新產(chǎn)品、過程和系統(tǒng)的創(chuàng)造與運(yùn)行,在此過程中培養(yǎng)學(xué)生的個人能力和人際交往能力,個人能力包括工程推理和解決問題的能力、科學(xué)探索、系統(tǒng)思維和批判性及創(chuàng)造性思維,人際交往能力包括交流溝通和團(tuán)隊(duì)工作能力;第三個目標(biāo)是使學(xué)生能夠理解和研究技術(shù)發(fā)展對社會的重要性和戰(zhàn)略影響??梢钥闯?,CDIO模式注重扎實(shí)的工程基礎(chǔ)理論和專業(yè)知識的培養(yǎng),并通過貫穿整個人才培養(yǎng)過程中的團(tuán)隊(duì)設(shè)計(jì)和實(shí)踐環(huán)節(jié)的訓(xùn)練,從而培養(yǎng)既有過硬的專業(yè)技能又有良好綜合素質(zhì)的國際化工程師。[2]
作為高等工程教育的一種新的教育理念,CDIO模式受到越來越多工程學(xué)科的重視。北京科技大學(xué)(以下簡稱“我?!保┳詣踊瘜I(yè)在2009年以自動化專業(yè)工程化、鋼鐵流程自動化為工程背景和專業(yè)特色加入了CDIO項(xiàng)目。“模式識別”課程是模式識別與智能系統(tǒng)學(xué)科的基礎(chǔ)課,是一門基礎(chǔ)理論與工程實(shí)踐相結(jié)合的課程。本課程主要討論統(tǒng)計(jì)模式識別的分類和識別基本原理、方法。要求學(xué)生掌握統(tǒng)計(jì)模式識別的基本概念、基本識別原理和方法,了解其發(fā)展動態(tài),有效地運(yùn)用所學(xué)知識和方法解決實(shí)際問題,為研究新的模式識別的理論和方法打下基礎(chǔ)。[3,4]那么如何在該課程的教學(xué)過程中培養(yǎng)學(xué)生的綜合素質(zhì),滿足學(xué)科學(xué)習(xí)和能力學(xué)習(xí)的雙重目標(biāo),成為需要迫切思考的問題。本文在深入研究和分析“模式識別”課程現(xiàn)有教學(xué)模式的問題和不足的基礎(chǔ)上,探索將CDIO教育理念引入該課程,進(jìn)行教學(xué)設(shè)計(jì)、規(guī)劃教學(xué)方案、確定教學(xué)手段、安排教學(xué)內(nèi)容和考核方式,以促進(jìn)學(xué)生綜合能力的培養(yǎng)。
一、“模式識別”課程傳統(tǒng)教學(xué)模式中存在的問題
“模式識別”課程從應(yīng)用角度來看,屬于人工智能、機(jī)器學(xué)習(xí)的領(lǐng)域,從學(xué)術(shù)內(nèi)涵角度來看是進(jìn)行數(shù)據(jù)處理、信息分析的學(xué)科。該課程在縱向上與概率論、數(shù)理統(tǒng)計(jì)密不可分,在橫向上注重與數(shù)字圖像處理、信號處理、通信原理等專業(yè)課程有關(guān)聯(lián)??梢姡撜n程對于鞏固已學(xué)知識、開展后續(xù)專業(yè)課學(xué)習(xí)及未來工作具有積極的指導(dǎo)意義。
該課程內(nèi)容本身比較抽象性,其概念、原理和方法都隱藏在數(shù)學(xué)符號中,講課過程中學(xué)生往往會感到枯燥、難懂。教師的講解和學(xué)生的學(xué)習(xí)難度都比較大,理論知識學(xué)完后學(xué)生對于其實(shí)際應(yīng)用有時(shí)仍是一頭霧水。傳統(tǒng)教學(xué)模式下存在以下一些問題:在教師的授課環(huán)節(jié)中,往往以教師的授課為中心,而不是以學(xué)生為主體,這種重“教”輕“學(xué)”的模式不利于學(xué)生對基礎(chǔ)知識的掌握;課時(shí)的安排上,總課時(shí)(32學(xué)時(shí))中28學(xué)時(shí)為理論授課,4學(xué)時(shí)為實(shí)驗(yàn)。在實(shí)驗(yàn)環(huán)節(jié)中,學(xué)生上機(jī)動手編程,根據(jù)課上內(nèi)容設(shè)計(jì)相應(yīng)的分類器實(shí)現(xiàn)。這種課時(shí)安排不利于充分開展工程項(xiàng)目實(shí)踐活動,使學(xué)生失去了了解模式識別在工程項(xiàng)目中真實(shí)應(yīng)用的機(jī)會,限制了其對專業(yè)技能的掌握;在實(shí)驗(yàn)環(huán)節(jié)中,實(shí)驗(yàn)內(nèi)容的安排基本上以個體為單位的驗(yàn)證性實(shí)驗(yàn)為主,缺乏多人合作的設(shè)計(jì)性、綜合性及創(chuàng)新性的實(shí)驗(yàn),不利于學(xué)生團(tuán)隊(duì)協(xié)作能力、批判思考能力、綜合解決問題能力及創(chuàng)新能力的綜合培養(yǎng)。
可見,以上重理論輕實(shí)踐、強(qiáng)調(diào)個人學(xué)術(shù)能力而忽視團(tuán)隊(duì)協(xié)作精神、重視知識學(xué)習(xí)而輕視開拓創(chuàng)新的培養(yǎng)模式與CDIO理念還有很大差距。
二、基于CDIO的“模式識別”課程教學(xué)改革探索
針對目前“模式識別”課程教學(xué)中存在的問題對原有的課程體系進(jìn)行改革,以適應(yīng)CDIO教育模式下的人才培養(yǎng)目標(biāo)。我校按照CDIO教學(xué)大綱的標(biāo)準(zhǔn)來進(jìn)行教學(xué)設(shè)計(jì)和教學(xué)活動的安排,進(jìn)行如下一些主要的變革:
第一,從教學(xué)內(nèi)容的安排上進(jìn)行改革。在教學(xué)過程中優(yōu)化、精選教學(xué)內(nèi)容,確保教學(xué)內(nèi)容相對穩(wěn)定而又不斷地更新,保持內(nèi)容的先進(jìn)性。對基礎(chǔ)理論部分如貝葉斯決策理論、線性與非線性判別函數(shù)、近鄰法和集群、聚類分析、特征提取與選擇等知識單元,將主要精力放在精講、訓(xùn)練與總結(jié)這三個環(huán)節(jié),對重點(diǎn)、難點(diǎn)講深講透。此外,還根據(jù)模式識別領(lǐng)域最近的發(fā)展,引入最新科技成果,為學(xué)生適當(dāng)補(bǔ)充統(tǒng)計(jì)理論與支持向量機(jī)、流行學(xué)習(xí)理論和稀疏編碼理論等知識。另外,還從橫向上注重與同一層次相關(guān)課程(如“數(shù)字圖像處理”)的關(guān)聯(lián)性,使學(xué)生把從不同課程上學(xué)到的知識整合起來,為將來從事工程項(xiàng)目活動打下基礎(chǔ)。
第二,從教學(xué)方式上進(jìn)行改革。傳統(tǒng)授課方式的一般模式是:教授、復(fù)述、周作業(yè)、期末一個小的設(shè)計(jì)項(xiàng)目和最終筆試。要改變這種以教師為中心的教學(xué)方式,按照CDIO專業(yè)計(jì)劃中提倡的一體化學(xué)習(xí)的思想來完成教學(xué)任務(wù)。為了考試而死記硬背理論知識會使學(xué)生對學(xué)習(xí)內(nèi)容理解膚淺,缺少長期學(xué)習(xí)的積極性。所以在教學(xué)中采用主動學(xué)習(xí)方式使學(xué)生直接參與思考和解決問題的活動,讓學(xué)生思考概念,特別是新的想法,并要求他們做出明確地反應(yīng),使他們明白學(xué)到了什么和怎樣學(xué)習(xí)的。
主動學(xué)習(xí)方法在課堂教學(xué)中有許多靈活的手段,比如授課疑點(diǎn)卡、概念問題、小組討論等等。授課疑點(diǎn)卡通過收集課堂上的反饋來測定學(xué)生在理解方面的不足。針對學(xué)生提出的問題,教師可以在課程的網(wǎng)頁上回答,也可以在下次課的開始時(shí)回答。對學(xué)生來講,寫下問題的過程有助于他們組織思路并進(jìn)行更有效地學(xué)習(xí);對教師來講,這些疑點(diǎn)卡能及時(shí)糾正學(xué)生的錯誤的理解,并幫助教師改進(jìn)后續(xù)的內(nèi)容。概念問題是一個多項(xiàng)選擇題,用來收集學(xué)生對課堂上的反饋,從而了解學(xué)生是否理解教學(xué)內(nèi)容并糾正學(xué)生的誤解之處。教師在課前把“模式識別”的重要概念以及通??赡艿腻e誤理解準(zhǔn)備成問題,在課堂上適時(shí)提出來,學(xué)生通過舉手來回答即可。根據(jù)回答情況,學(xué)生可進(jìn)行討論或由教師進(jìn)行點(diǎn)評。小組討論:對于一些相對簡單的內(nèi)容,讓學(xué)生提前預(yù)讀,在課上采用分組討論、學(xué)生講解、教師總結(jié)的方式進(jìn)行。
第三,采用經(jīng)驗(yàn)學(xué)習(xí)法為學(xué)生創(chuàng)造建立信心的機(jī)會。工程教育的CDIO教學(xué)模式正是基于經(jīng)驗(yàn)學(xué)習(xí)理論的。經(jīng)驗(yàn)學(xué)習(xí)讓學(xué)生能夠在模擬工程師角色和工程實(shí)踐的環(huán)境中進(jìn)行教學(xué)活動。對大多數(shù)學(xué)生而言,學(xué)習(xí)和理解理論的動力就是應(yīng)用理論并與實(shí)踐相結(jié)合。通過實(shí)踐學(xué)習(xí)能激發(fā)他們更大的積極性,并使他們認(rèn)識到所學(xué)的知識是有用的,學(xué)習(xí)積極性的提高使他們對所學(xué)的知識和即得能力更有信心。其結(jié)果是讓學(xué)生有能力勝任未來工程師的角色。
常用的經(jīng)驗(yàn)學(xué)習(xí)方法就是基于項(xiàng)目的學(xué)習(xí)。在授課過程中增加模式識別應(yīng)用項(xiàng)目的內(nèi)容,如字符識別、車牌識別、人臉識別、膚色分割、圖像檢索等,通過項(xiàng)目講解幫助學(xué)生回顧所學(xué)的知識,并將理論與實(shí)際相結(jié)合,使學(xué)生學(xué)會分析和解決實(shí)際問題的方法。另外,還將教師從事的與“模式識別”相關(guān)的科研項(xiàng)目介紹給學(xué)生,拓展學(xué)生的知識面。從實(shí)際效果來看,有些學(xué)生對實(shí)際工程案例和科研工作很感興趣,主動申請“模式識別”方向的本科創(chuàng)新項(xiàng)目和發(fā)表學(xué)術(shù)論文。
對于一些典型的“模式識別”工程項(xiàng)目,學(xué)生分團(tuán)隊(duì)后選擇某個工程項(xiàng)目,以團(tuán)隊(duì)合作方式收集和整理有關(guān)信息資料,提出解決方案,研究結(jié)束后做出演示系統(tǒng)并在課堂上進(jìn)行講解。
第四,對學(xué)習(xí)效果的評估方法進(jìn)行改革,采用多種方法來收集學(xué)生在課程學(xué)習(xí)期間和學(xué)習(xí)之后等不同時(shí)期的學(xué)習(xí)證據(jù),全面了解學(xué)生的學(xué)習(xí)成績和學(xué)習(xí)態(tài)度有何轉(zhuǎn)變。第一種方式仍然是傳統(tǒng)的筆試。第二種是口試,可以用于概念問題來判定學(xué)生對知識的理解層次??陬^考核能從深層次上反映學(xué)生對概念的理解和應(yīng)用,因?yàn)楝F(xiàn)實(shí)中工程師每天都會應(yīng)用基礎(chǔ)概念進(jìn)行理性表述,這種方式可以評估學(xué)生進(jìn)行理性表達(dá)的能力。第三種是表現(xiàn)評分,通過學(xué)生在口頭演講和團(tuán)隊(duì)工作等特定任務(wù)中的表現(xiàn)情況來進(jìn)行評估。第四種是項(xiàng)目審查,對團(tuán)隊(duì)完成的項(xiàng)目進(jìn)行評估。模式識別項(xiàng)目主要是從分類性能上對學(xué)生完成的項(xiàng)目進(jìn)行評估。
結(jié)合CDIO教育模式,通過以上四方面的改革,能夠創(chuàng)設(shè)積極的學(xué)習(xí)情景,激發(fā)課堂活力,調(diào)動學(xué)生的積極性和主動性。這套新的教學(xué)體系可以用圖1來描述。
三、結(jié)束語
本文在CDIO工程教育模式下,探討了如何對傳統(tǒng)“模式識別”課程教學(xué)方法進(jìn)行改革,提出了一種新的教學(xué)體系。近兩年的授課結(jié)果表明,新授課體系在CDIO模式下對激發(fā)學(xué)生學(xué)習(xí)興趣、明確學(xué)習(xí)方向、轉(zhuǎn)變學(xué)習(xí)態(tài)度、提高專業(yè)基礎(chǔ)水平和團(tuán)隊(duì)合作意識及提高教學(xué)效果等方面發(fā)揮出了明顯的積極作用。
參考文獻(xiàn):
[1]顧佩華,沈民奮,陸小華.重新認(rèn)識工程教育——國際CDIO培養(yǎng)模式與方法[M].北京:高等教育出版社,2009.
[2]陸鑫,任立勇,王雁東.CDIO模式下軟件工程專業(yè)課程的教學(xué)評價(jià)方式[J].計(jì)算機(jī)教育,2011,(16):64-67.
船舶運(yùn)動模式的提取是軌跡數(shù)據(jù)分析的重要任務(wù),它可以為船舶異常行為的檢測提供參考依據(jù),同時(shí)也可以作為航路規(guī)劃和定線制設(shè)計(jì)的技術(shù)指標(biāo).針對現(xiàn)存的聚類算法大多為了追求效率而忽略了運(yùn)動軌跡特征的問題,對聚類算法中的軌跡結(jié)構(gòu)距離進(jìn)行改進(jìn),將其作為軌跡相似度的評價(jià)標(biāo)準(zhǔn).采用無監(jiān)督DBSCAN聚類算法實(shí)現(xiàn)船舶運(yùn)動模式的提取.利用瓊州海峽船舶自動識別系統(tǒng)(AutomaticIdentificationSystem,AIS)數(shù)據(jù),對該水域的船舶運(yùn)動模式進(jìn)行提取,獲得行駛于該水域的船舶運(yùn)動軌跡分布以及各類軌跡中轉(zhuǎn)向區(qū)域的分布,其中船舶運(yùn)動軌跡包括從瓊州海峽東峽口向西航行的船舶軌跡,從瓊州海峽西峽口向東航行的船舶軌跡,從秀英港前往海安港的船舶軌跡,從海安港前往秀英港的船舶軌跡和從瓊州海峽東峽口前往海口港的船舶軌跡.將最終的聚類結(jié)果應(yīng)用于電子海圖顯示與信息系統(tǒng)(ElectronicChartDisplayandInformationSystem,ECDIS)上,實(shí)現(xiàn)了對船舶的動態(tài)監(jiān)控仿真.
關(guān)鍵詞:
船舶自動識別系統(tǒng)(AIS);模式識別;聚類分析;電子海圖顯示與信息系統(tǒng)(ECDIS);瓊州海峽
中圖分類號:U697.33
文獻(xiàn)標(biāo)志碼:A 收稿日期:20150907 修回日期:20151102
0引言
隨著全球船舶自動識別系統(tǒng)(AutomaticIdentificationSystem,AIS)岸站的建立和不斷完善,各地海事主管機(jī)關(guān)時(shí)刻都能接收到大量有關(guān)船舶信息的數(shù)據(jù).對這些數(shù)據(jù)的研究可以幫助我們提取船舶運(yùn)動模式,分析船舶行為,從而進(jìn)一步挖掘不同航線船舶、不同類型船舶的運(yùn)動特點(diǎn).例如:在一些運(yùn)量較大的港口附近,對船舶運(yùn)動軌跡進(jìn)行分類能夠幫助監(jiān)控人員識別異常行為;根據(jù)漁船運(yùn)動的無規(guī)律性和貨船運(yùn)動的周期性,利用聚類結(jié)果區(qū)分船舶種類,判斷運(yùn)動特征是否與船舶類型相符,是否需要進(jìn)一步的監(jiān)控和調(diào)查.此外,船舶運(yùn)動軌跡的聚類分析能夠?yàn)楹铰芬?guī)劃和定線制的設(shè)計(jì)提供理論依據(jù),有利于加強(qiáng)船舶動態(tài)監(jiān)控,提高海事監(jiān)管的效率.
目前國內(nèi)外學(xué)者提出了諸多從目標(biāo)對象的軌跡中獲取運(yùn)動模式的方法.SHU等[1]利用自組織映射網(wǎng)絡(luò)作為預(yù)處理技術(shù)標(biāo)記行人的運(yùn)動特征,然后采用后向算法建立馬爾科夫模型,實(shí)現(xiàn)了對人行為模式的提??;胡宏宇等[2]以改進(jìn)的Hausdorff距離作為相似度標(biāo)準(zhǔn),采用譜聚類算法實(shí)現(xiàn)了對車輛軌跡空間分布的提??;聞佳等[3]利用加權(quán)的Hausdorff距離和周分割算法實(shí)現(xiàn)了車輛軌跡的聚類;RISTIC等[4]基于港口信息,采用核密度估計(jì)的方法對船舶軌跡進(jìn)行分類;ETIENNE等[5]提出了一種基于統(tǒng)計(jì)學(xué)和圖論的軌跡聚類分析方法,該方法將船舶的起訖港作為節(jié)點(diǎn),將相似軌跡歸一化為特定的有向路徑;AARSETHER等[6]采用圖像匹配的方法對船舶軌跡進(jìn)行聚類;GERBEN等[7]對提取船舶運(yùn)動模式的兩種主要的相似度對比的方法進(jìn)行了分析,總結(jié)出二者中更適合于船舶軌跡聚類的方法;ANDERS等[8]將軌跡聚類應(yīng)用于近海監(jiān)控系統(tǒng)來識別船舶的異常行為;LAXHAMMAR等[9]通過高斯混合模型和核密度估計(jì)的方法對船舶運(yùn)動進(jìn)行統(tǒng)計(jì)分析,獲得有異常行為的船舶數(shù)據(jù).此外,神經(jīng)網(wǎng)絡(luò)和以K均值為代表的無監(jiān)督聚類方法也被廣泛應(yīng)用于軌跡聚類,如JONHSON等[10]建立自組織特征映射網(wǎng)絡(luò)學(xué)習(xí)軌跡分布模式,ATEV等[11]則利用K均值算法完成對軌跡的聚類.
海上交通與陸路交通有一定的相似性.道路被劃分為單行道、雙行道等,而航路也被劃分為單向航路和雙向航路.雖然海上交通的航行范圍廣闊,但在某些特定水域(港口、通航分道、狹水道)船舶密度較大,軌跡分布較密集.鑒于此特點(diǎn),應(yīng)用在陸路交通上的一些方法也可以應(yīng)用到海上交通,以提高海上交通的監(jiān)管力度和效率.
1AIS數(shù)據(jù)的預(yù)處理
由船舶交通管理中心(VesselTrafficServicecenter,VTS)提供的AIS數(shù)據(jù)通常具有較高的可信度,但是AIS數(shù)據(jù)中的船舶位置、船舶速度等信息會由于設(shè)備以及信號漂移等原因發(fā)生較大的改變,如AIS數(shù)據(jù)顯示船舶位于陸地上,顯示航速為35kn甚至更高[12].
為保證數(shù)據(jù)的可用,需要對數(shù)據(jù)做預(yù)處理,具體方法如下.
2軌跡聚類
移動目標(biāo)軌跡的聚類能否取得良好的效果,在于軌跡間的相似性度量是否合理.當(dāng)前主要的相似性度量的方法有基于歐氏距離的算法、基于公共子序列的算法、基于動態(tài)時(shí)間彎曲距離的方法和基于Hausdorff距離的方法,其中基于歐氏距離的算法通常用于計(jì)算等長的船舶軌跡相似性,其他的幾種方法可以用于不同長度的船舶軌跡相似性計(jì)算.以上方法都僅從距離方面反映相似度,而基于軌跡結(jié)構(gòu)距離的相似性度量方法的優(yōu)點(diǎn)在于能夠刻畫每條子軌跡變化的趨勢.因此,為便于度量船舶軌跡的變化,需要將整條軌跡劃分成若干條子軌跡.
2.1軌跡分割
船舶軌跡的劃分是通過設(shè)置船舶轉(zhuǎn)向角的閾值實(shí)現(xiàn)的.船舶軌跡轉(zhuǎn)向角是指相鄰兩個子軌跡段的航跡向之差,見圖1.
圖1中,a,b為軌跡中的兩條子軌跡段,其航跡向的夾角為θ1,即為這兩條子軌跡的轉(zhuǎn)向角.鑒于AIS數(shù)據(jù)的位置坐標(biāo)采用的是WGS84坐標(biāo)系,利用恒向線直接反解算法[13]求得兩條子軌跡段的航跡向,根據(jù)其航跡向的差值可以獲得船舶子軌跡間的轉(zhuǎn)向角.
恒向線直接反解算法的步驟如下.
2.2軌跡結(jié)構(gòu)相似性度量
船舶子軌跡段相似性計(jì)算從子軌跡段的航跡向和兩條子軌跡段間的距離兩個方面進(jìn)行.對兩方面的度量結(jié)果賦以一定的權(quán)重求和,形成軌跡的結(jié)構(gòu)距離.
(1)船舶航跡向的比較.
如圖2所示,Li,Lj表示兩條航跡線,θ表示航跡段的方向夾角,J表示Lj相對于Li的偏轉(zhuǎn)程度.
航跡向?qū)Ρ确椒?/p>
通過上式不難發(fā)現(xiàn):當(dāng)夾角為0°時(shí)為最佳狀態(tài),即兩條子軌跡方向完全一致;當(dāng)夾角大于90°時(shí)可以認(rèn)為兩條軌跡基本反向,將兩條軌跡的距離設(shè)置為無窮大,這樣有利于區(qū)分航向相反船舶的軌跡.
(2)位置的比較.
本文在兩條子軌跡段間距離的度量方面所采用的相似性度量方法為基于Hausdorff距離的方法:
式中:P(Li,Lj)為兩軌跡間的位置距離;h(Li,Lj)為兩軌跡間的直接Hausdorff距離;d(a,b)為a與b之間的歐氏距離.
船舶軌跡結(jié)構(gòu)是指船舶軌跡所具有的屬性的集合,這些屬性刻畫了船舶軌跡的特性和狀態(tài).船舶軌跡結(jié)構(gòu)通常包含船舶運(yùn)動信息,如:船舶的航跡向、船舶的位置.同時(shí),在實(shí)際應(yīng)用中還可以加入速度以及波動性的度量.進(jìn)行軌跡相似性的比較時(shí),充分考慮這些因素可以提高聚類的精度[14].依照式(8)和(9)可以求得子軌跡航跡向以及子軌跡間距離相似度.為計(jì)算軌跡結(jié)構(gòu)的相似性,還需設(shè)定他們在軌跡結(jié)構(gòu)中所占的權(quán)重W=(WT,WP),其中WT表示角度距離權(quán)重,WP表示位置距離權(quán)重.各權(quán)重值設(shè)定應(yīng)滿足:權(quán)重值之和應(yīng)為1;各權(quán)重值應(yīng)為非負(fù),同時(shí)不能大于1.通常情況下采用的是將結(jié)構(gòu)距離中的權(quán)重平均分配.式(11)和(12)分別為結(jié)構(gòu)距離和相似度計(jì)算方法.
2.3聚類算法
基于軌跡結(jié)構(gòu)距離的聚類算法是以DBSCAN算法為框架的,即從子軌跡集合中任取一條軌跡并判斷在其鄰域半徑內(nèi)是否包含滿足要求的最小實(shí)體數(shù).如果滿足以上述條件,則認(rèn)為是核實(shí)體,并搜索該實(shí)體的密度可達(dá)對象,標(biāo)記為一類,直至子軌跡集合全部掃描完畢,未被標(biāo)記的子軌跡則是孤立軌跡.具體的實(shí)現(xiàn)方法如下.
步驟1設(shè)定權(quán)重W,轉(zhuǎn)向角閾值ω,近鄰閾值η,近鄰的數(shù)目ε.
步驟2根據(jù)ω將軌跡T分割成若干個子軌跡Ti.
步驟3對子軌跡段Ti,計(jì)算其與未標(biāo)記的子軌跡段的D和N,若滿足D和N條件的軌跡數(shù)目大于ε則將該子軌跡段標(biāo)記為核心子軌跡段.
步驟4將Ti子軌跡段距離范圍D內(nèi)滿足N條件的子軌跡段Tj與Ti聚為一類.
步驟5對Tj重復(fù)步驟3和4,將滿足條件的子軌跡段繼續(xù)歸為一類,如果Tj不再滿足上述條件,則重新從子軌跡集合中選取未被聚類的子軌跡段重復(fù)步驟3和4.直至軌跡集合全部掃描完畢.
3瓊州海峽應(yīng)用實(shí)例與應(yīng)用
瓊州海峽位于雷州半島與海南島之間,寬10~20nmile,長50~60nmile,是廣州港、湛江港等港口與北部灣各港口海上交通的捷徑.瓊州海峽主要可分為3部分,分別為:瓊州海峽東口,包括外羅水道、北水道、中水道和南水道;瓊州海峽西口,包括燈樓角與臨高角聯(lián)線以西、兵馬角所在經(jīng)度線以東水域,該水域是來往于瓊州海峽駛往八所港、三亞港等地的轉(zhuǎn)向點(diǎn),也是往北部灣各港口的轉(zhuǎn)向點(diǎn);瓊州海峽中部,包括山狗吼燈塔經(jīng)度線以西、燈樓角與臨高角聯(lián)線以東水域,該水域的水較深(20~118m),礙航物較少.
算例采用32位WIN7系統(tǒng)、2GRAM,在VS2010編譯條件下提取750條船舶運(yùn)動軌跡進(jìn)行聚類,獲得了5類結(jié)果,見圖3.A類結(jié)果為從瓊州海峽東峽口向西行駛于通航分道內(nèi)的船舶的航行軌跡分布、B類結(jié)果為從瓊州海峽西峽口向東行駛于反向航道的船舶的航行軌跡分布、C類結(jié)果為從海安港到秀英港的船舶的航行軌跡分布、D類結(jié)果為從秀英港到海安港的船舶的航行軌跡分布、E類結(jié)果為瓊州海峽東峽口向西行駛進(jìn)入??诟鄣拇暗暮叫熊壽E分布.
3.1算法分析
為比較算法的優(yōu)劣,將基于軌跡結(jié)構(gòu)距離的DBSCAN算法與傳統(tǒng)的DBSCAN算法進(jìn)行對比,結(jié)果見表2.
表2算法對比結(jié)果
從表2中可以看出,基于軌跡結(jié)構(gòu)距離的DBSCAN算法在運(yùn)行時(shí)間方面劣于傳統(tǒng)的DBSCAN算法,但是在分類結(jié)果和準(zhǔn)確度方面皆優(yōu)于傳統(tǒng)的DBSCAN算法.這是因?yàn)椋夯谲壽E結(jié)構(gòu)距離的DBSCAN算法需要進(jìn)行軌跡的分割、角度的度量、歸一化等操作,增加了計(jì)算復(fù)雜度;該算法以軌跡特征為參考,從多方面計(jì)算軌跡相似度,易發(fā)現(xiàn)比較隱蔽的軌跡群,使其聚類效果優(yōu)于傳統(tǒng)的DBSCAN算法的聚類效果.
3.2聚類應(yīng)用
將上述所獲得的船舶軌跡聚類的結(jié)果應(yīng)用到船舶監(jiān)控、異常檢測上,能夠大幅度提高海上安全保障能力,防止海上交通事故的發(fā)生[15].
3.2.1速度監(jiān)控
速度監(jiān)控是利用監(jiān)控水域的AIS信息,對聚類結(jié)果中的船舶速度進(jìn)行統(tǒng)計(jì),獲得船速分布圖.根據(jù)實(shí)際工作中的經(jīng)驗(yàn)和需要,確定行駛于該監(jiān)控水域的船舶速度監(jiān)控范圍.圖4是對從瓊州海峽東峽口航行至??诟鄣拇八俣冉y(tǒng)計(jì).對于該監(jiān)控水域,本文以80%船舶運(yùn)營速度(9~14kn)為標(biāo)準(zhǔn).
圖5為監(jiān)控系統(tǒng)的速度報(bào)警,可以看出編號為A的船超速,說明該船航速不在監(jiān)控航速范圍內(nèi),予以報(bào)警.
3.2.2位置監(jiān)控
位置監(jiān)控主要是對航行于聚類結(jié)果區(qū)域的船舶進(jìn)行船位的實(shí)時(shí)監(jiān)控,如果船舶偏離監(jiān)控水域,本船和監(jiān)控系統(tǒng)應(yīng)給予報(bào)警和提示,提醒監(jiān)控人員和船舶駕駛員關(guān)注船舶動向.圖6a為本船的位置報(bào)警示意圖,圖6b為監(jiān)控系統(tǒng)的位置報(bào)警示意圖.
3.2.3航向監(jiān)控
航向監(jiān)控主要利用AIS數(shù)據(jù)對聚類結(jié)果中船舶航向進(jìn)行統(tǒng)計(jì),獲得船舶的航向分布,以此作為監(jiān)控依據(jù).圖7a是對從瓊州海峽東峽口到??诟鄣木垲惤Y(jié)果中船舶轉(zhuǎn)向后的航向統(tǒng)計(jì)結(jié)果.圖7b和7c為本船和監(jiān)控系統(tǒng)的航向報(bào)警示意圖.
綜上所述,可以得到船舶監(jiān)控的實(shí)現(xiàn)流程圖(圖8),首先對進(jìn)入監(jiān)控水域的船舶進(jìn)行位置監(jiān)控(若偏離監(jiān)控水域則報(bào)警),然后進(jìn)行速度監(jiān)控(判斷速度是否超出規(guī)定范圍,如果超出則進(jìn)行速度報(bào)警),接著進(jìn)行航向的監(jiān)控直至船舶駛離監(jiān)控水域.
4結(jié)論
本文利用軌跡結(jié)構(gòu)距離作為相似性的度量標(biāo)準(zhǔn),對軌跡段間的相似性進(jìn)行評價(jià),采用無監(jiān)督的DBSCAN算法將相似性接近的船舶軌跡歸為一類,實(shí)現(xiàn)了對船舶運(yùn)動模式的提取.以瓊州海峽為例,利用預(yù)處理過的部分瓊州海峽AIS數(shù)據(jù),將航行于該水域的船舶軌跡分為5類,分別為從瓊州海峽東峽口向西航行的船舶軌跡、從瓊州海峽西峽口向東航行的船舶軌跡、從海安港到秀英港的船舶軌跡、從秀英港到海安港的船舶軌跡以及從瓊州海峽東峽口向西航行進(jìn)入海口港的船舶軌跡.從瓊州海峽東峽口向西航行的船舶軌跡位于(20°14′25″N,110°26′20″E)與(20°09′05″N,110°01′24″E)之間的通航分道內(nèi);從瓊州海峽西峽口向東航行的船舶軌跡分布于(20°13′N,110°26′20″E)與(20°06′45″N,110°01′24″E)之間的通航分道內(nèi);從瓊州海峽東峽口向西航行進(jìn)入??诟鄣拇败壽E,其轉(zhuǎn)向位置大約發(fā)生在以(20°10′16″N,110°14′08″E)為圓心,半徑為0.5nmile的水域范圍內(nèi).將聚類的結(jié)果與ECDIS模擬器相結(jié)合,從船舶位置、速度、航向等3個方面實(shí)現(xiàn)了船舶動態(tài)監(jiān)控的仿真.實(shí)驗(yàn)證明船舶運(yùn)動模式識別能夠有效地應(yīng)用于船舶動態(tài)監(jiān)控,進(jìn)而保障航行安全,增強(qiáng)海上安全保障能力.
參考文獻(xiàn):
[1]SHUHM,KATSU.TraininghiddenMarkovmodelstructurewithgeneticalgorithmforhumanmotionpatternclassification[C]//SCIICASEInternationalJointConference.Busan:IEEEPress,2006:618622.
[2]胡宏宇,王慶年,曲昭偉,等.運(yùn)動目標(biāo)空間模式識別與異常行為檢測[J].吉林大學(xué)學(xué)報(bào),2011,41(6):15981602.
[3]聞佳,崔維.實(shí)時(shí)視頻中的車輛運(yùn)動軌跡的提取和聚類[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(11):155157.
[4]RISTICB,SCALARL.StatisticalanalysisofmotionpatterninAISdata:anomalydetectionandmotionprediciton[C]//11thInternationalConferenceonInformaiton.Fusion,Cologne:IEEEPress,2008:17.
[5]ETIENNEL,DEVOGELET.Similarityanalysisofmobileobjectstrajectoriesfollowingthesameitinerary[J].IngenierieDesSystemesD’information,2009,14(5):85106.
[6]AARSETHERKG,TORGEIRM.EstimatingnavigationpatternsfromAIS[J].JournalofNavigaiton,2009,65(4):587607.
[7]GERBENKDV,MAARTENVS.Ananalysisofalignmentandintegralbasedkernelsformachinelearningfromvesseltrajectoris[J].ExpertSystemswithApplications,2014,41(2):75967607.
[8]ANDERSD,LARSN.Trajectoryclusteringforcoastalsurveillance[C]//10thInternationalConferenceonInformationFusion.Quebec:IEEEPress,2007:18.
[9]LAXHAMMARR,F(xiàn)ALKMANG,SVIESTINSE.AnomalydetectioninseatrafficacomparisionoftheGaussianmixturemodelandthekerneldensityesimator[C]//12thInternationalConferenceonInformaitonFusion.Seattle:IEEEPress,2009:756763.
[10]JOHNSONN,HOGGD.Learningthedistributionofobjecttrajectoriesforeventrecognition[J].ImageandVisionComputing,1996,14(8):609615.
[11]ATEVS,MASOUDO,PAPANIKOLOPOULOSN.Learningtrafficpatternsatintersectionsbyspectralclusteringofmotiontrajectories[C]//IEEEInternationalConferenceonIntelligentRobotsandSystems.Beijing:IEEEPress,2006:48514856.
[12]QUXB,MENGQ,LISY.ShipcollisionriskassessmentfortheSingaporestrait[J].AccidentAnalysisPrevention,2011,43(3):20302036.
[13]史國友,朱公志,賈傳熒,等.恒向線主題直接正反解的高精度算法[J].大連海事大學(xué)學(xué)報(bào),2009,35(2):59.
關(guān)鍵詞:模式識別;語音識別;交互式語音應(yīng)答;司法社區(qū)矯正
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A
Abstract:Systematic research was done on the specific algorithm for speech recognition in using genetic algorithm to train continuous hidden Markov mode. Then the detailed design of Voiceprint Recognition System of Community Correction Objects in the Shenzhen City Bureau of Justice has been done based on the speech recognition technology. The system running results show that the recognition rate of recognition algorithm using genetic algorithm to train continuous hidden Markov model is faster and has a higher rate of recognition. Construction of voiceprint recognition system of judicial community correction objects based on pattern recognition is still in the junior stage in our judicial system, and promotion and the construction of voiceprint recognition system of judicial community correction objects have the important practical significance.
Key words:pattern recognition;speech recognition;interactive voice response;judicial community correction
1 利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的語音識別以及具體算法
作為模式識別重要應(yīng)用之一的語音識別技術(shù)所涉及的領(lǐng)域包括信號處理、模式識別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等。近年來,在生物識別技術(shù)領(lǐng)域中,聲紋識別技術(shù)以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩?yàn)證方式。
隱馬爾柯夫模型(Hidden Markov Model,HMM)方法是二十世紀(jì)70年代引入語音識別理論的,它的出現(xiàn)使得自然語音識別系統(tǒng)取得了實(shí)質(zhì)性的突破,現(xiàn)已成為語音識別的主流技術(shù)[1-4] ,該方法在語音識別時(shí)識別速度較快,也有較高的識別率。目前大多數(shù)大詞匯量、連續(xù)語音的非特定人語音識別系統(tǒng)都是基于HMM模型的。HMM是對語音信號的時(shí)間序列結(jié)構(gòu)建立統(tǒng)計(jì)模型,將之看作一個數(shù)學(xué)上的雙重隨機(jī)過程:一個是用具有有限狀態(tài)數(shù)的Markov鏈來模擬語音信號統(tǒng)計(jì)特性變化的隱含的隨機(jī)過程,另一個是與Markov鏈的每一個狀態(tài)相關(guān)聯(lián)的觀測序列的隨機(jī)過程。前者通過后者表現(xiàn)出來,但前者的具體參數(shù)是不可測的。人的言語過程實(shí)際上就是一個雙重隨機(jī)過程,語音信號本身是一個可觀測的時(shí)變序列,是由大腦根據(jù)語法知識和言語需要(不可觀測的狀態(tài))發(fā)出的音素的參數(shù)流??梢奌MM合理地模仿了這一過程,很好地描述了語音信號的整體非平穩(wěn)性和局部平穩(wěn)性,是較為理想的一種語音模型。
在HMM(隱馬爾柯夫模型)中,分為離散HMM(DHMM)和連續(xù)HMM(CHMM)。由于CHMM直接以幀語音特征向量本身為觀測序列,而不是像DHMM那樣先將語音特征向量經(jīng)矢量量化為觀測符號,因此CHMM有優(yōu)于DHMM的識別精度。然而,由于CHMM參數(shù)多,傳統(tǒng)的訓(xùn)練方法采用迭代法,先假設(shè)初始值,用語音信號的觀測序列對該初始值進(jìn)行訓(xùn)練,也即按照一定的方法對這些估值進(jìn)行提純,對提純了的估值要接著進(jìn)一步的提純,直到再沒有改進(jìn)的余地,達(dá)到某個局部最佳值為止。傳統(tǒng)的訓(xùn)練方法不保證訓(xùn)練得到全域最優(yōu)解,而且訓(xùn)練所需要的時(shí)間非常巨大。
本文側(cè)重地研究了基因算法[5],并按照CHMM的特點(diǎn)構(gòu)造染色體,用基因算法對CHMM進(jìn)行訓(xùn)練。基因算法自身的特點(diǎn)使得訓(xùn)練結(jié)果趨向于全域最優(yōu)解。同時(shí),由于只需要用Viterbi算法計(jì)算語音的觀測序列對某一CHMM模型的相關(guān)概率,用作基因算法的適應(yīng)函數(shù),故該算法可以提高CHMM的訓(xùn)練速度。
基因是生物學(xué)概念,之所以將基因算法引入HMM的訓(xùn)練中,是因?yàn)镠MM的訓(xùn)練過程實(shí)際上是一個在特定范圍內(nèi)將HMM模型進(jìn)行一次次的迭代提純,選擇最優(yōu)模型的過程。將基因算法引入CHMM的訓(xùn)練,就是基于將CHMM看作在特定域的有約束的尋找最佳匹配點(diǎn)的問題。CHMM的狀態(tài)轉(zhuǎn)移矩陣A和輸出概率密度函數(shù)中的混合系數(shù)c矩陣的每一行向量之和為1.0,可看作是優(yōu)化問題的約束條件。如果在選取CHMM的初始值時(shí),不是選取一個初始值,而是選取一組分布于不同區(qū)域的初始值,以某一種特定的訓(xùn)練方法,使其趨向于全域最優(yōu)解,那么最終也同樣可以完成對CHMM的訓(xùn)練。
根據(jù)待優(yōu)化問題的數(shù)學(xué)模型,定義適合函數(shù)F(ai)。其中ai是某一條染色體,則適合函數(shù)F(ai)就是該染色體與目標(biāo)函數(shù)的距離,或是判斷該染色體優(yōu)劣的依據(jù)。對每一代基因,計(jì)算所有染色體的適合函數(shù),進(jìn)行排序選擇一定數(shù)目較優(yōu)秀的染色體,作為生成下一代基因的父代樣本。自然界中染色體成對出現(xiàn),時(shí)一對染色體分離、重組。多點(diǎn)交叉在實(shí)現(xiàn)時(shí),可以設(shè)定交叉概率門限為ρc。染色體的長度為L,對于隨機(jī)數(shù)0≤rj≤1 (j=1,2,…,L),如果rj≥ρc,那么下一個變量屬于另一條基因,否則下一個變量與前一個變量屬于同一條基因。
最佳基因是在一代一代的基因重組和基因突變中形成的,是在選擇的作用下最適應(yīng)的個體?;蛲蛔冇欣趶木植孔罴烟幪觯乐顾惴ǖ倪^早收斂。設(shè)定突變概率門限為ρm,對于隨機(jī)數(shù)0≤rj≤1 (j=1,2,…,L),如果rj≤ρm,那么染色體中第j個變量有突變現(xiàn)象發(fā)生;否則,復(fù)制原染色體的第j個變量。
基因算法的具體實(shí)現(xiàn)步驟參考文獻(xiàn)[5]。
HMM是用一個有限狀態(tài)系統(tǒng)作為語音特征參數(shù)的生成模型,每個狀態(tài)能產(chǎn)生連續(xù)的輸出特征。HMM實(shí)際上是一個特征參數(shù)發(fā)生器,依據(jù)其產(chǎn)生的參數(shù)與觀察到的語音參數(shù)的比較,從而識別語音。在識別時(shí)的判決依據(jù)是HMM模型的生成概率。
在將基因算法引入CHMM訓(xùn)練的過程中,首先要解決的是染色體的構(gòu)造問題。將CHMM模型的所有關(guān)鍵特征參數(shù)排列成一串,構(gòu)成染色體。對于語音識別,采用自左向右的HMM模型,本文中為5狀態(tài)自左向右只含一階跳轉(zhuǎn)的CHMM模型。CHMM模型中參數(shù)由初始狀態(tài)向量π,狀態(tài)轉(zhuǎn)移矩陣A和每個狀態(tài)的輸出概率密度函數(shù)組成。
在CHMM模型中,染色體前一部分的行向量之和均為1。也就要求在產(chǎn)生染色體時(shí),需對其進(jìn)行一定的控制。在生成每一代染色體時(shí),對這一部分行向量所對應(yīng)的每一段染色體進(jìn)行歸一化,則可以滿足CHMM的約束條件。
Viterbi算法在通常的CHMM語音識別中是作為識別算法的,換句話說,使觀測序列與CHMM模型經(jīng)Viterbi算法的運(yùn)算結(jié)果最大即為優(yōu)化目標(biāo)?;谶@樣的思想,基因算法的適合函數(shù)為:所有該CHMM對應(yīng)的觀測序列用Viterbi算法求其觀測概率之和,運(yùn)算結(jié)果越大,則該染色體越優(yōu)秀。
在實(shí)驗(yàn)中染色體的前一部分依概率進(jìn)行二點(diǎn)或多點(diǎn)交叉,而后一部分染色體只進(jìn)行多點(diǎn)交叉,多點(diǎn)交叉概率ρc=0.8。染色體前一段的基因突變概率ρm=0.1;而對于染色體的后一部分,取ρm1=0.01,對應(yīng)于以一個參數(shù)為單位發(fā)生基因突變;ρm2=0.08,以行向量為單位發(fā)生基因突變。經(jīng)基因交叉或基因突變后,對染色體的前一部分需要進(jìn)行各行向量的歸一化處理。每一代基因的數(shù)目為300,從中選出60條優(yōu)秀的染色體作為新的父代基因,經(jīng)基因重組和基因突變生成240條染色體,共同組成新一代染色體。CHMM模型的訓(xùn)練問題現(xiàn)已轉(zhuǎn)化為求其對觀測序列適應(yīng)概率最大值的問題,用基因算法求解。
訓(xùn)練數(shù)據(jù)取自博域通訊一體化呼叫中心平臺產(chǎn)品BYICC2.0的IVR服務(wù)器在實(shí)際商業(yè)運(yùn)行中產(chǎn)生的WAV錄音文件2000個。
2 利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的語音識別技術(shù)在深圳市司法局社區(qū)矯正聲紋識別系統(tǒng)中的應(yīng)用介紹
2.1 司法社區(qū)矯正的需求背景以及存在問題
司法社區(qū)矯正,是指將社區(qū)矯正對象置于社區(qū)內(nèi),由專門的國家機(jī)關(guān)負(fù)責(zé)并組織社會力量對其采取監(jiān)督管理、教育、幫助措施,矯正其犯罪心理和行為惡習(xí),促進(jìn)其順利回歸社會的非監(jiān)禁刑罰執(zhí)行活動。盡管目前我國社區(qū)矯正工作中較普遍地應(yīng)用了信息化管理手段,根據(jù)社區(qū)矯正的刑罰執(zhí)行性質(zhì)和非監(jiān)禁特征,各地積極探索運(yùn)用手機(jī)定位等現(xiàn)代科技手段加強(qiáng)對社區(qū)矯正人員的實(shí)時(shí)監(jiān)管,具體的監(jiān)管手段包含:手機(jī)實(shí)時(shí)定位監(jiān)控、電子地圖越界告警、人機(jī)分離抽查等?,F(xiàn)階段,很多司法社區(qū)矯正工作中應(yīng)用到了諸如手機(jī)實(shí)時(shí)定位監(jiān)控等高科技手段來實(shí)現(xiàn)對社區(qū)矯正人員的監(jiān)控,但在具體操作中仍然存在一些問題和障礙,主要在現(xiàn)有手機(jī)定位監(jiān)控的技術(shù)下,難以有效控制人為出現(xiàn)的“人機(jī)分離”現(xiàn)象。現(xiàn)有“人機(jī)分離”抽查手段主要有:電話抽查、短信抽查、拍照抽查等。雖然一定程度上降低了矯正對象“人機(jī)分離”的風(fēng)險(xiǎn),但這些抽查手段皆無法確保是否為矯正對象本人,有脫管、漏管的可能性。
正是基于以上原因,博域通訊推出的社區(qū)矯正聲紋識別系統(tǒng)的主要功能是通過遠(yuǎn)程電話錄音來對社區(qū)矯正人員進(jìn)行身份認(rèn)證,結(jié)合手機(jī)定位監(jiān)控系統(tǒng),促進(jìn)社區(qū)矯正工作向合理化、人性化、智能化、效率化方向發(fā)展,推動社區(qū)矯正信息化建設(shè),并有效破解移動定位監(jiān)管“人機(jī)分離”的難題。
2.2 深圳市司法局社區(qū)矯正聲紋識別系統(tǒng)設(shè)計(jì)
2.2.1 系統(tǒng)應(yīng)用體系架構(gòu)
社區(qū)矯正聲紋識別方案中,包括聲紋識別系統(tǒng)、IVR自動語音服務(wù)系統(tǒng)并結(jié)合現(xiàn)有的手機(jī)定位系統(tǒng)以及后臺管理系統(tǒng),同時(shí),聲紋識別服務(wù)也涉及到了數(shù)據(jù)庫服務(wù)器之間的數(shù)據(jù)通信。
2.2.2 系統(tǒng)網(wǎng)絡(luò)架構(gòu)
被矯正人員通過撥打固定電話號碼接入社區(qū)矯正聲紋識別系統(tǒng),由內(nèi)置電話語音板卡的IVR服務(wù)器將采集到的客戶語音,并通過調(diào)用聲紋服務(wù)器提供的接口函數(shù)與聲紋識別服務(wù)器進(jìn)行交互。聲紋服務(wù)器將識別的結(jié)果反饋給IVR服務(wù)器以便進(jìn)行相應(yīng)的IVR語音流程控制,同時(shí),社區(qū)矯正聲紋識別系統(tǒng)將被矯正人員的聲紋身份識別結(jié)果反饋給手機(jī)定位系統(tǒng)。其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖如圖3所示。
2.2.3 系統(tǒng)業(yè)務(wù)流程
深圳市司法局社區(qū)矯正聲紋識別系統(tǒng)與現(xiàn)有手機(jī)定位系統(tǒng)結(jié)合后的主要業(yè)務(wù)流程如下圖:
2.2.4 系統(tǒng)運(yùn)行結(jié)果主要指標(biāo)
利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的語音識別的司法社區(qū)矯正聲紋識別系統(tǒng)已于2014年1月在深圳市司法局上線投入運(yùn)行。
聲紋識別技術(shù)在實(shí)際應(yīng)用中,會根據(jù)說話人識別內(nèi)容的不同分為文本相關(guān)驗(yàn)證和文本無關(guān)驗(yàn)證。深圳市司法局社區(qū)矯正聲紋識別系統(tǒng),支持這兩種方式的驗(yàn)證,根據(jù)實(shí)際工作和業(yè)務(wù)的需要,用戶可以選擇適合自己的聲紋驗(yàn)證方式。
同時(shí),與手機(jī)實(shí)時(shí)定位監(jiān)控、電子地圖越界告警、電話抽查、短信抽查等傳統(tǒng)監(jiān)管手段相比較,語音識別技術(shù)有效地控制了司法社區(qū)矯正中人為出現(xiàn)的“人機(jī)分離”現(xiàn)象。
3 結(jié)束語
模式識別從20世紀(jì)20年展至今,人們的一種普遍看法是不存在對所有模式識別問題都適用的單一模型和解決識別問題的單一技術(shù),我們現(xiàn)在擁有的只是一個工具袋,所要做的是結(jié)合具體問題把統(tǒng)計(jì)的和句法的識別結(jié)合起來,把統(tǒng)計(jì)模式識別或句法模式識別與人工智能中的啟發(fā)式搜索結(jié)合起來,把統(tǒng)計(jì)模式識別或句法模式識別與支持向量機(jī)的機(jī)器學(xué)習(xí)結(jié)合起來,把人工神經(jīng)元網(wǎng)絡(luò)與各種已有技術(shù)以及人工智能中的專家系統(tǒng)、不確定推理方法結(jié)合起來,深入掌握各種工具的效能和應(yīng)有的可能性,互相取長補(bǔ)短,開創(chuàng)模式識別應(yīng)用的新局面。基于模式識別技術(shù)的司法社區(qū)矯正聲紋識別系統(tǒng)能夠有效地破解移動定位監(jiān)管“人機(jī)分離”的難題,其建設(shè)工作在我國司法系統(tǒng)目前尚處于起步階段,推廣和建設(shè)司法社區(qū)矯正聲紋識別系統(tǒng)具有重要的現(xiàn)實(shí)意義。
參考文獻(xiàn)
[1] 劉伯高.化工過程推斷估計(jì)的若干問題研究[D].華東理工大學(xué)博士論文.華東理工大學(xué)圖書館,2000.
[2] 王嵐,陳晶,王睿,等.幾種模式識別方法在生物信息中的應(yīng)用[J]. 計(jì)算機(jī)與應(yīng)用化學(xué),2007,(1):8-12.
[3] 楊海峰,張德祥.模式識別理論和技術(shù)在語音識別研究中的應(yīng)用[J].合肥學(xué)院學(xué)報(bào):自然科學(xué)版, 2009,(1):40-46.
本文在分析輸配電線路安全運(yùn)行存在問題的基礎(chǔ)上,分別從在輸配電線路的管理中積極運(yùn)用信息技術(shù);強(qiáng)化輸配電線路的技術(shù)管理等方面對輸配電線路的安全運(yùn)行技術(shù)進(jìn)行了探討。
【關(guān)鍵詞】輸配電線路 安全運(yùn)行 問題 措施
輸配電線路是一種將電力用戶與供電系統(tǒng)連接在一起的電力傳輸設(shè)施,其運(yùn)行安全與否直接決定著電力系統(tǒng)的運(yùn)行質(zhì)量,從而直接影響到我們?yōu)豸斖咛崴Πl(fā)電廠的經(jīng)濟(jì)效益。近年來,隨著輸配電線路事故發(fā)生率節(jié)節(jié)攀升,對人們的生命安全造成嚴(yán)重威脅。因此,為了確保烏魯瓦提水力發(fā)電廠的正常運(yùn)行以及用戶用電的正常,我們必須采取相應(yīng)維護(hù)措施,加強(qiáng)輸配電線路的安全運(yùn)行。結(jié)合多年實(shí)踐經(jīng)驗(yàn),筆者從以下幾個方面對此問題進(jìn)行探究。
1 輸配電線路安全運(yùn)行的問題分析
在實(shí)際運(yùn)行過程中,輸配電線路所處的環(huán)境較為復(fù)雜,影響其安全運(yùn)行的因素(見表1)也較多。筆者結(jié)合自身多年一線實(shí)踐經(jīng)驗(yàn),分析、總結(jié)輸配電網(wǎng)安全運(yùn)行中存在的問題。
2 提高輸配電線路安全運(yùn)行的措施探究
2.1 在輸配電線路的管理中積極運(yùn)用信息技術(shù)
科技是第一生產(chǎn)力,在任何行業(yè)都如此。如果能夠熟練運(yùn)用最新科技產(chǎn)物將給整個輸配電線路的管理工作帶來極大便利。信息技術(shù)在配電網(wǎng)中的應(yīng)用主要在管理設(shè)備、檢測運(yùn)行狀態(tài)、管理用電等方面。安全問題一直都是電力行業(yè)的重點(diǎn),要保證電力設(shè)備的安全狀態(tài)必須對其進(jìn)行實(shí)時(shí)監(jiān)控,對出現(xiàn)的異常及時(shí)的進(jìn)行分析排查。例如我們可以用絕緣系統(tǒng)為例來說明信息技術(shù)對配電網(wǎng)的重要作用。對電力設(shè)備來說,決定其使用年限的重要因素之一就是絕緣材料,它的使用壽命將直接決定設(shè)備的使用壽命。絕緣系統(tǒng)在工作過程長期暴露在電、物理、化學(xué)、自然災(zāi)害等不可抗的損害之下,將不可避免的逐漸老化,嚴(yán)重影響其使用性能。在嚴(yán)重的情況下,甚至?xí)霈F(xiàn)絕緣缺陷的嚴(yán)重問題,一旦這些問題沒有及時(shí)發(fā)現(xiàn)并進(jìn)行有效改進(jìn)措施,將會引起運(yùn)行障礙甚至引發(fā)安全事故。而信息技術(shù)可以自動實(shí)時(shí)監(jiān)控配電網(wǎng)絡(luò)中的各個設(shè)備和線路,一旦參數(shù)出現(xiàn)異常,信息技術(shù)都將可以在第一時(shí)間發(fā)現(xiàn)并排查,以最快的速度恢復(fù)正常。提高供電網(wǎng)絡(luò)的可靠性。對配電網(wǎng)進(jìn)行信息技術(shù)管理可以提供以下管理功能:
(1)輸配電線路內(nèi)出現(xiàn)故障時(shí)可以及時(shí)發(fā)現(xiàn),隔離并排查恢復(fù)。
(2)整個恢復(fù)過程由電腦自動化全程控制。
(3)在輸配電線路進(jìn)行故障維修或維護(hù)時(shí),能自動實(shí)現(xiàn)負(fù)荷平衡的配電網(wǎng)供電過程。
(4)對輸配電線路的監(jiān)控?cái)?shù)據(jù)都顯示在配有街區(qū)線路圖的顯示器上。
(5)可以提供用戶與設(shè)備連接的信息。
(6)各種數(shù)據(jù)顯示結(jié)果與檢測報(bào)告可以紙質(zhì)化。
(7)為進(jìn)一步保證安全配電,可以為相關(guān)工作人員提供比較真實(shí)的培訓(xùn)演練過程。
2.2 強(qiáng)化輸配電線路的技術(shù)管理
輸配電線路的安全管理是一項(xiàng)涉及項(xiàng)目多、技術(shù)要求高、更新速度快的系統(tǒng)工作,在配電網(wǎng)的實(shí)際運(yùn)行維護(hù)階段,工作人員應(yīng)積極引進(jìn)和運(yùn)用先進(jìn)的科學(xué)技術(shù),強(qiáng)化輸配電網(wǎng)的技術(shù)管理。目前,在輸配電網(wǎng)的運(yùn)行過程中往往需要用到以下技術(shù),如表2所示。
3 結(jié)束語
總而言之,維持輸配電線路的安全運(yùn)行是一項(xiàng)長期、系統(tǒng)的工作。輸配電線路的正常運(yùn)行是保證電力系統(tǒng)安全運(yùn)行的關(guān)鍵,也是用戶正常用電的安全保障。因此,對輸配電線路進(jìn)行安全管理是極為重要的。但是當(dāng)前我國在輸配電線路的安全運(yùn)行和管理中還存在一定的不足之處,給輸配電線路的安全運(yùn)營帶來了隱患。這就需要電力工作人員在日常的工作中及時(shí)發(fā)現(xiàn)不足,并采取一定的措施如做好日常安全管理;強(qiáng)化輸配電線路的技術(shù)管理;在輸配電線路的管理中積極運(yùn)用信息技術(shù),全面保證電力系統(tǒng)的安全可靠運(yùn)行,給人們營造一個安全的用電環(huán)境,不斷提高人們的生活品質(zhì)。
參考文獻(xiàn)
[1]吳若愚,彭學(xué)洪,張雷.輸配電線路的安全運(yùn)行問題與對策[J].企業(yè)技術(shù)開發(fā)(下半月),2014(06).
[2]程浩.對輸配電線路安全運(yùn)行的探究[J].中國科技信息,2013(15).
[3]劉達(dá)應(yīng).輸電線路人為因素外力破壞原因分析和應(yīng)對措施探討[J].中國科技博覽, 2011(35).
[關(guān)鍵詞] 牛膽粉;膽汁酸;高效液相色譜;蒸發(fā)光散射檢測器;化學(xué)計(jì)量學(xué)
[Abstract] An HPLC-ELSD method with good specificity and good accuracy was used for the studies of fingerprint and quantification of multi-components for cattle bile powder. The chromatographic analysis was carried out on a Phenomenex Gemini C18 column (4.6 mm×250 mm, 5 μm) with a column temperature of 40 ℃ and a liquid flow-rate of 1.0 mL?min-1using 10 mmol ammonium acetate solution and acetonitrile as the mobile phase with a linear gradient. An ELSD was used with a nitrogen flow-rate of 2.8 L?h-1, at a drift tube temperature of 110 ℃. The average contents of glycocholic acid, glycodeoxycholic acid, taurocholic acid, taurodeoxycholic acid were (25.2±17.0)%, (4.1±3.4)%, (24.5±20.0)% and (5.2±3.8)% respectively, and the total content of the four bile acids was (59.0±26.0)%. Beyond that, the preprocessing and pattern recognition analysis of the chromatographic fingerprints of samples were applied with chemometric method. The results of this chemometric analysis indicated that the samples from market and self-made samples were different signally, and four regions were noteworthy due to their great impact with poor chromatographic signal. All in one, because this HPLC-ELSD method was simple and accurate, it was suitable for the quality assessment and quality control of cattle bile powder and could be the technological base for its standard perfection.
[Key words] cattle bile powder;bile acids;HPLC;ELSD;chemometrics
doi:10.4268/cjcmm20161319
牛膽是牛科動物牛Bos taurus domesticus Gmelin的膽汁,多以牛膽粉入藥使用或儲藏。在宰牛時(shí),取出膽囊,清水洗凈,剪開,取牛膽汁,濾過,干燥,粉碎制得牛膽粉。牛膽的藥用歷史十分悠久,始載于《神農(nóng)本草經(jīng)》,此后在歷代本草學(xué)著作中也多有記載。《名醫(yī)別錄》記載其功效為“除心腹熱、渴、利,口焦燥,益目睛”。在《本草經(jīng)疏》中,繆希雍描述其為“牛食百草,其精華萃于膽,其味苦,其氣大寒,無毒”。《本草綱目》記載其有“除黃殺蟲,治癰腫”的作用。
牛膽汁主要含膽汁酸、膽色素、粘蛋白、脂肪、膽甾醇、卵磷脂及無機(jī)鹽[1]。其中的膽汁酸類成分主要有膽酸、去氧膽酸、鵝去氧膽酸、甘氨膽酸(glycocholic acid,GCA)、甘氨去氧膽酸(glycodeoxycholic acid,GDCA)、甘氨鵝去氧膽酸、?;悄懰幔╰aurocholic acid,TCA)、?;侨パ跄懰幔╰aurodeoxycholic acid,TDCA)、?;蛆Z去氧膽酸等[2]。有研究[3-5]表明,GCA,GDCA,TCA,TDCA是牛膽中的主要化學(xué)成分,甘氨酸結(jié)合型膽汁酸與?;墙Y(jié)合型膽汁酸的總量基本接近。牛膽中游離型膽汁酸含量極低,但是如果牛膽汁原料不新鮮或者加工方法不當(dāng),可能會造成微生物的酵解或分解,致使游離型膽汁酸含量增高,而結(jié)合型膽汁酸含量降低。
現(xiàn)代中醫(yī)臨床常以牛膽作為主藥治療咽炎、氣管炎、上呼吸道炎、消化不良以及黃疸型傳染性肝炎等癥[6]。牛膽還是頗具特色的民族醫(yī)藥品種,蒙醫(yī)常用其作為治療協(xié)日病和配毒癥的重要藥材,而且牛膽還是一些常用蒙成藥中不可或缺的藥材組方[7-8]。此外,它還是人工牛黃的重要原料[9],而人工牛黃在多種成藥中都有使用,其應(yīng)用范圍非常廣泛。
牛膽粉中主要的活性成分即為膽汁酸類,尤以結(jié)合型膽汁酸為主,累計(jì)含量約占牛膽粉的一半,是牛膽粉中重要的成分。本文使用HPLC-ELSD法結(jié)合化學(xué)計(jì)量學(xué)技術(shù)對牛膽粉的指紋圖譜進(jìn)行了較深入的研究,并對牛膽粉中的主要膽汁酸類成分(GCA,GDCA,TCA,TDCA)進(jìn)行了測定,以期從定性和定量2個角度對牛膽粉的質(zhì)量評價(jià)與控制提供技術(shù)參考。
1 材料
Mettler AE240 電子天平(瑞士Mettler-Toledo公司);KQ-300DA型數(shù)控超聲波清洗器(昆山市超聲儀器有限公司);Waters2695高效液相色譜儀(美國Waters公司);Alltech 2000ES蒸發(fā)光散射檢測器(美國Alltech公司)。
乙酸銨(質(zhì)譜級,美國Fisher Scientific公司);乙腈(色譜級,美國Fisher Scientific公司);甲醇為優(yōu)級純,水為Milli-Q超純水。
?;悄懰徕c(TCANa,批號:110815-201309)購自中國食品藥品檢定研究院;?;侨パ跄懰徕c(TDCA,批號:17-ABY-6-1)來自加拿大TRC公司;甘氨膽酸鈉(GCANa,批號:PSMEN-AS)來自日本TCI公司;甘氨去氧膽酸鈉(GDCANa,批號:080M25083V)來自美國SIGMA公司。
測定樣品為13批牛膽粉樣品(編號為ND1至ND10的10批樣品為自制樣品,編號為ND-S-1,ND-S-2,ND-S-3的3批樣品為市售樣品)。
2 方法
2.1 供試品溶液的制備
取樣品粉末約25 mg,精密稱定,置具塞錐形瓶中,精密加入甲醇25 mL,稱定質(zhì)量,超聲(功率300 W,頻率40 kHz)處理20 min,甲醇補(bǔ)足減失質(zhì)量,過濾,即得。
2.2 對照品溶液的制備
精密稱取GCANa對照品適量,加甲醇配成每1 mL含GCANa為0.432 0 mg的對照品母液。逐級用甲醇稀釋成GCANa質(zhì)量濃度為0.021 6,0.043 2,0.086 4,0.129 6,0.172 8,0.216 0,0.259 2,0.345 6,0.432 0 g?L-1的系列GCANa對照品溶液。
精密稱取GDCANa對照品適量,加甲醇配成每1 mL含GDCANa為0.212 0 mg的對照品母液。逐級用甲醇稀釋成GDCANa質(zhì)量濃度為0.010 6,0.021 2,0.031 8,0.042 4,0.053 0,0.063 6,0.074 2,0.084 8,0.095 4,0.106 0,0.127 2,0.169 6,0.212 0 g?L-1的系列GDCANa對照品溶液。
精密稱取TCANa對照品適量,加甲醇配成每1 mL含TCANa為0.524 0 mg的對照品母液。逐級用甲醇稀釋成TCANa質(zhì)量濃度為0.026 2,0.052 4,0.104 8,0.157 2,0.209 6,0.262 0,0.314 4,0.419 2,0.524 0 g?L-1的系列TCANa對照品溶液。
精密稱取TDCANa對照品適量,加甲醇配成每1 mL含TDCANa為0.256 0 mg的對照品母液。逐級用甲醇稀釋成TDCANa質(zhì)量濃度為0.012 8,0.025 6,0.038 4 ,0.051 2,0.064 0,0.076 8,0.089 6,0.102 4,0.115 2,0.128 0,0.153 6,0.204 8,0.256 0 g?L-1的系列TDCANa對照品溶液。
2.3 色譜條件
色譜柱為Phenomenex Gemini C18(4.6 mm×250 mm,5 μm);柱溫40 ;進(jìn)樣量10 μL;ELSD漂移管溫度110℃,ELSD氮?dú)饬髁?.8 L?h-1,增益為1。流動相為10 mmol乙酸銨水溶液(A)-乙腈(B),梯度洗脫為0~8 min,30%~37% B;8~15 min,37%~47% B;15~16 min,47%~70% B;16~20 min,70% B,見圖1。
3 結(jié)果與討論
3.1 方法學(xué)考察
3.1.1 線性關(guān)系考察 分別精密吸取系列GCANa,GDCANa,TCANa,TDCANa對照品溶液各10 μL,注入高效液相色譜儀,測定并記錄各濃度GCANa,GDCANa,TCANa,TDCANa對照品溶液色譜圖的GCANa,GDCANa,TCANa,TDCANa色譜峰的峰面積,分別以GCANa,GDCANa,TCANa,TDCANa的進(jìn)樣量(μg)的對數(shù)值和其對應(yīng)的色譜峰峰面積的對數(shù)值為橫坐標(biāo)和縱坐標(biāo),繪制GCANa,GDCANa,TCANa,TDCANa標(biāo)準(zhǔn)曲線,曲線方程及相關(guān)系數(shù)見表1。
3.1.2 精密度試驗(yàn) 按照上述色譜條件分別連續(xù)進(jìn)樣ND1供試品溶液6次,分別記錄GCANa,GDCANa,TCANa,TDCANa色譜峰的峰面積,并計(jì)算各峰面積的RSD%分別為1.1%,1.3%,0.80%,1.0%,表明儀器精密度良好。
3.1.3 重復(fù)性試驗(yàn) 按照上述供試品溶液制備方法平行制備6份ND1供試品溶液,并按照上述色譜條件分別進(jìn)樣,測定1號牛膽粉樣品中GCA,GDCA,TCA,TDCA(分別由GCANa,GDCANa,TCANa,TDCANa換算可得)的平均質(zhì)量分?jǐn)?shù)分別為26.5%,6.4%,23.4%,7.2%,RSD分別為1.3%,1.2%,1.0%,1.6%,表明方法重復(fù)性結(jié)果良好。
3.1.4 回收率試驗(yàn) 取ND1樣品6份,每份約12.5 mg,精密稱定,分別精密加入GCANa質(zhì)量濃度為0.432 0 g?L-1的對照品溶液6 mL,GDCANa質(zhì)量濃度為0.169 6 g?L-1的對照品溶液4 mL,TCANa質(zhì)量濃度為0.524 0 g?L-1的對照品溶液5 mL,TDCANa質(zhì)量濃度為0.256 0 g?L-1的對照品溶液3 mL,再分別精密加入甲醇7 mL,稱定質(zhì)量,超聲(功率300 W,頻率40 kHz)處理20 min,甲醇補(bǔ)足減失質(zhì)量,過濾,按照上述色譜條件測定計(jì)算GCANa,GDCANa,TCANa,TDCANa的平均回收率(n=6)分別為101.7%,99.00%,102.1%,98.20%,RSD分別為1.6%,1.7%,2.0%,2.1%,結(jié)果表明方法準(zhǔn)確度良好。
3.1.5 穩(wěn)定性試驗(yàn) 取ND1供試品溶液,在0,4,12,24,36,48,60 h進(jìn)樣,分別測定GCANa,GDCANa,TCANa,TDCANa的峰面積,計(jì)算上述成分的峰面積的RSD分別為2.8%,2.6%,2.9%,3.1%,結(jié)果表明供試品溶液60 h內(nèi)穩(wěn)定性良好。
3.1.6 檢測限與定量限的確定 分別將GCANa,GDCANa,TCANa,TDCANa的對照品溶液逐級稀釋至適合的濃度,以信噪比為3∶1時(shí)的進(jìn)樣量(ng)作為檢測限,信噪比為10∶1時(shí)的進(jìn)樣量(ng)作為定量限,測得該法對GCANa,GDCANa,TCANa,TDCANa的檢測限與定量限,見表1。
3.2 指紋圖譜數(shù)據(jù)預(yù)處理及模式識別
3.2.1 指紋圖譜數(shù)據(jù)預(yù)處理 在實(shí)際的色譜試驗(yàn)中,常常會出現(xiàn)一些無法避免的外部條件的改變而對色譜數(shù)據(jù)的采集造成或大或小的影響,比如色譜儀器和色譜柱性能的波動、流動相的改變以及外界溫濕度的變化等。正因?yàn)檫@些不確定性因素的存在,不同批次樣品的色譜圖之間相同成分的色譜峰的保留時(shí)間都不可避免的存在漂移的情況,為了避免這一情況對后續(xù)數(shù)據(jù)分析的影響,必須要對色譜數(shù)據(jù)進(jìn)行保留時(shí)間的校正處理。
本文采用COW算法對各批樣品的色譜圖進(jìn)行保留時(shí)間的校正,參數(shù)segment length和slack size分別設(shè)置為23和9時(shí),效果最佳。各批樣品的色譜校正前與校正后的情況,見圖2,可以很明顯的看出校正前的各批樣品色譜圖的色譜峰均有十分明顯的漂移情況出現(xiàn),盡管這種情況對定量分析影響不大,但是對于色譜的全輪廓化學(xué)計(jì)量學(xué)定性分析來說,必定會對分析結(jié)果產(chǎn)生影響。經(jīng)過COW算法校正之后,色譜峰的漂移情況得到十分明顯的改善,并且色譜峰的峰形也沒有發(fā)生明顯變化。
3.2.2 系統(tǒng)聚類分析 對樣品經(jīng)過校正后的色譜圖進(jìn)行autoscale處理,然后直接進(jìn)行ward′s method系統(tǒng)聚類分析,見圖3。結(jié)果顯示13批牛膽粉樣品依照圖3中虛線I可將樣品分為距離較遠(yuǎn)的2大類,這2大類分別為10批自制樣品和3批市售樣品;若依照虛線Ⅱ可將樣品分為3類,其中自制樣品分為了距離十分接近的兩類。由圖1可知,市售樣品的色譜峰比自制樣品的色譜峰峰面積小且峰個數(shù)多,這些差別反映在色譜圖的系統(tǒng)聚類分析中正是自制樣品與市售樣品較大的聚類距離。
3.2.3 主成分分析 與以上系統(tǒng)聚類分析步驟相同,先將經(jīng)過校正的樣品色譜進(jìn)行autoscale處理,然后再進(jìn)行主成分分析。結(jié)果第一、第二和第三主成分的方差貢獻(xiàn)分別為88.2%,2.44%,1.74%,累計(jì)方差貢獻(xiàn)為92.3%,前3個主成分的樣品得分分布見圖4。由該圖可知,與系統(tǒng)聚類分析結(jié)果相似,總體來說樣品可分為自制與市售樣品兩大類,而這兩大類的差別主要表現(xiàn)在第一主成分的得分上。
這一情況更加明顯,市售與自制樣品分別分布在第一主成分得分的原點(diǎn)上下,見圖5。
將各批樣品的平均色譜圖與變量的第一主成分得分分布圖進(jìn)行對比見圖6,可以發(fā)現(xiàn)其中4處色譜區(qū)間的第一主成分得分相比其色譜信號具有更明顯的得分權(quán)重,尤其是第一、第二和第四個色譜區(qū)間的色譜峰極為不明顯,但第一主成分的得分權(quán)重卻不容忽視,可見這3處是自制與市售樣品的重要差別之處,同時(shí)也是區(qū)別自制與市售樣品的關(guān)鍵所在。
3.3 主要膽酸類成分測定
將各批樣品按照上述供試品溶液制備方法制備,并按照上述色譜條件進(jìn)行測定,以標(biāo)準(zhǔn)曲線法計(jì)算GCA,GDCA,TCA,TDCA(由GCANa,GDCANa,TCANa,TDCANa換算可得)含量,見表2。RSD分別為38.1%,43.5%,43.0%,40.2%。
3.4 討論
與色譜峰或化學(xué)組分含量相比,以全輪廓譜圖為研究對象可以得到更全面的分析結(jié)果,避免一些微量組分信息的遺失,同時(shí)也降低了對色譜峰的分離情況的要求。但是全輪廓譜圖的分析又必須以色譜信號的校正為前提,為了保證校正前后色譜信號的表征信息不出現(xiàn)較大的誤差,校正算法必須能夠保證色譜信號的輪廓形狀在校正前后不發(fā)生較大的變化。本文采用的COW算法是目前國際上流行的校正算法,其特點(diǎn)就是能夠較大程度的保留校正前的色譜信息,但是其2個參數(shù)的選擇是難點(diǎn),也是影響校正效果的關(guān)鍵因素。
聚類分析是無監(jiān)督模式識別中常用的一種方法,是對未標(biāo)出類別的模式樣本按照樣本間相似程度分類,具有相似性的歸為一類,而不具相似性的歸為另一類。本文對13批樣品的色譜信息進(jìn)行分析聚類,所參考的并非僅僅是顯著的色譜特征,還包括色譜信息經(jīng)抽象后特征空間內(nèi)的特征變量的分布情況,并以多維空間中的距離進(jìn)行度量。最終樣本是可以顯著地分為2大類,即自制樣品和市售樣品。
主成分分析是最古老的多元統(tǒng)計(jì)分析技術(shù),應(yīng)用十分廣泛。主成分分析的主要目的就是對矩陣數(shù)據(jù)進(jìn)行降維,以解決化學(xué)信息重疊現(xiàn)象嚴(yán)重的問題,得到的新變量要盡可能多的表征原有變量的數(shù)據(jù)結(jié)構(gòu)特征[10]。本文中的分析對象為牛膽粉色譜的全輪廓譜圖,變量多達(dá)3 600個,通過主成分分析可將樣品之間的差異歸為1個主成分變量,極大的方便了不同制法樣品間色譜信息比較以及重點(diǎn)色譜范圍的尋找和確定。
各批樣品均可檢出并定量GCA,GDCA,TCA,TDCA成分,這4種成分平均質(zhì)量分?jǐn)?shù)分別為 (25.2±17.0)%,(4.1±3.4)%,(24.5±20.0)%,(5.2±3.8)%,平均總質(zhì)量分?jǐn)?shù)為(59.0±26.0)%,是牛膽粉中最主要的膽汁酸類成分。根據(jù)測定結(jié)果,牛膽粉中的GCA和TCA含量均高于GDCA和TDCA。
GCA和GDCA是牛膽粉中主要的甘氨結(jié)合型膽汁酸,兩者平均總質(zhì)量分?jǐn)?shù)為(29.3±17.6)%;TCA和TDCA是牛膽粉中主要的牛磺結(jié)合型膽汁酸,兩者平均總質(zhì)量分?jǐn)?shù)為(29.7±23.9)%??梢娕D懛壑械母拾苯Y(jié)合型膽汁酸與?;墙Y(jié)合型膽汁酸的含量基本相當(dāng),這可以作為牛膽與羊膽等其他膽汁類藥材的重要區(qū)別特征之一。
本文中的自制牛膽粉為將收集到的牛膽汁過濾后直接進(jìn)行冷凍干燥所得到,與市售牛膽粉相比4種主要膽汁酸成分的含量普遍較高,而市售樣品的色譜圖中色譜峰較多,其中在9~10 min處有1個較大的色譜峰。2015年版《中國藥典》[9]在人工牛黃項(xiàng)下對牛膽粉的規(guī)定為“由牛膽汁加工制成”,這一規(guī)定顯然較為模糊。本文的自制樣品與市售樣品存在顯著的差異,考慮到牛膽粉為常用藥材人工牛黃的重要原料,其質(zhì)量直接影響到人工牛黃的產(chǎn)品質(zhì)量,因此該差異的形成原因十分值得進(jìn)行深入研究。此外,《中國藥典》中對人工牛黃原料牛膽粉的含量測定仍然為紫外-可見分光光度法測定膽酸含量,該方法原理為傅克反應(yīng),所測結(jié)果為具有相同化學(xué)結(jié)構(gòu)的一類成分的含量,鑒于牛膽粉之于人工牛黃質(zhì)量的重要性以及人工牛黃使用的廣泛性,建議《中國藥典》能夠使用專屬性更強(qiáng),靈敏度更高的HPLC-ELSD法對牛膽粉中的最主要膽汁酸類成分GCA,GDCA,TCA,TDCA進(jìn)行含量控制,以更有效和合理地對牛膽粉的質(zhì)量進(jìn)行評價(jià)與控制。
[參考文獻(xiàn)]
[1] 南京中醫(yī)藥大學(xué). 中藥大辭典 [M]. 2版. 上海:上??茖W(xué)技術(shù)出版社, 2006.
[2] Qiao X,Ye M,Pan D L,et al. Differentiation of various traditional Chinese medicines derived from animal bile and gallstone: simultaneous determination of bile acids by liquid chromatography coupled with triple quadrupole mass spectrometry [J]. J Chromatogr A, 2011, 1218:107.
[3] 張啟明. 牛膽粉的化學(xué)研究[J]. 藥物生物技術(shù),1997, 4(1):58.
[4] 張能榮. 牛羊膽汁的質(zhì)量研究[J]. 中草藥,1983, 14(7):15.
[5] Shoji H,Michiko T,Misako T,et al. Thin-layer chromatography and densitometry of bile components [J]. Chem Pharm Bull, 1964, 12(4):483.
[6] 彭新磊. 膽汁、膽酸和膽汁酸[J]. 生物學(xué)通報(bào), 1998, 33(3):23.
[7] 齊曉慧,那日桑. 蒙成藥烏力吉-18的臨床應(yīng)用概況[J]. 中國民族醫(yī)藥雜志, 1998, 10(3):34.
[8] 中華人民共和國衛(wèi)生部藥典委員會. 中華人民共和國衛(wèi)生部藥品標(biāo)準(zhǔn)?蒙藥分冊[S]. 呼和浩特:內(nèi)蒙古科技出版社,1998.
關(guān)鍵詞:模式識別;本科教學(xué);教學(xué)實(shí)踐;教學(xué)改革
隨著電子信息技術(shù)的迅速發(fā)展和信息處理自動化需求的不斷擴(kuò)大,模式識別方法和技術(shù)在信息處理領(lǐng)域中的重要性越來越受到重視。在吸引了眾多研究者投身到模式識別研究領(lǐng)域的同時(shí),模式識別的教學(xué)也從研究生教學(xué)逐漸延伸到了本科教學(xué)。模式識別作為計(jì)算機(jī)、電子信息技術(shù)等專業(yè)的專業(yè)基礎(chǔ)課程,已經(jīng)在越來越多的高等院校開設(shè)。本科模式識別課程主要討論以統(tǒng)計(jì)學(xué)為基礎(chǔ)的模式識別理論和方法,內(nèi)容包括:貝葉斯決策理論以及參數(shù)估計(jì)方法、以誤差函數(shù)最小化為原則的線性和非線性判別、近鄰規(guī)則、特征提取和選擇、聚類分析、神經(jīng)網(wǎng)絡(luò)、支撐矢量機(jī)、隨機(jī)方法、非度量方法、獨(dú)立于算法的機(jī)器學(xué)習(xí)等內(nèi)容[1]。由于模式識別研究領(lǐng)域的廣泛性,模式識別本科教學(xué)的內(nèi)容和側(cè)重點(diǎn)的安排目前尚處于探索階段。模式識別領(lǐng)域的發(fā)展日新月異,這就要求教師在授業(yè)解惑的同時(shí)能夠與時(shí)俱進(jìn)地介紹該領(lǐng)域的發(fā)展前沿,從而培養(yǎng)學(xué)生主動探索知識的興趣。
本文將結(jié)合本科模式識別教學(xué)的實(shí)踐,分析該課程在內(nèi)容設(shè)置方面面臨的問題并給出相應(yīng)的解決問題的建議;結(jié)合模式識別課程的特點(diǎn),提出了以應(yīng)用實(shí)例為先導(dǎo)的教學(xué)方法,以提高學(xué)生的學(xué)習(xí)興趣;針對不同類型的學(xué)生,提出了如何培養(yǎng)學(xué)生實(shí)踐能力和科研興趣的方法。
1模式識別教學(xué)內(nèi)容的層次劃分和講授方法
模式識別是一門理論與實(shí)踐緊密結(jié)合的學(xué)科,其理論基礎(chǔ)涉及高等數(shù)學(xué)、線性代數(shù)、數(shù)理統(tǒng)計(jì)、矩陣論、隨機(jī)過程、工程優(yōu)化方法、小樣本統(tǒng)計(jì)學(xué)習(xí)理論、模糊數(shù)學(xué)等學(xué)科[2]。然而除了高等數(shù)學(xué)、線性代數(shù)和數(shù)理統(tǒng)計(jì),其他課程都是研究生階段才會開設(shè)的數(shù)學(xué)基礎(chǔ)課。這就使得本科的模式識別教學(xué)面臨著尷尬的局面:既不能花過多的時(shí)間講數(shù)學(xué)基礎(chǔ)知識,又要把以這些數(shù)學(xué)知識為基礎(chǔ)的內(nèi)容講清楚。面對這一難題,我們在教學(xué)實(shí)踐中總結(jié)出了一套辦法,具體做法是將教學(xué)內(nèi)容劃分為基礎(chǔ)型、前沿型兩類;并采用弱化公式推導(dǎo),強(qiáng)調(diào)數(shù)學(xué)表達(dá)式物理含義的方法進(jìn)行講授。
基礎(chǔ)型教學(xué)指的是已經(jīng)發(fā)展完善的模式識別原理和方法?;A(chǔ)型內(nèi)容包括:貝葉斯決策理論、概率密度函數(shù)估計(jì)、線性判別、近鄰規(guī)則、獨(dú)立于算法的機(jī)器學(xué)習(xí)等內(nèi)容。貝葉斯決策理論和概率密度函數(shù)估計(jì)是以數(shù)理統(tǒng)計(jì)為基礎(chǔ)的[3],這一部分也是模式識別的重點(diǎn)內(nèi)容。線性判別是以高等數(shù)學(xué)和線性代數(shù)為基礎(chǔ),同時(shí)涉及工程優(yōu)化方法課程的部分內(nèi)容。在這部分內(nèi)容中,公式推導(dǎo)占據(jù)了相當(dāng)大的篇幅,而且推導(dǎo)過程是學(xué)生可以理解和掌握的。對于基礎(chǔ)型的內(nèi)容,可以采取理論推導(dǎo)和實(shí)際例子相結(jié)合的講授方式。在公式推導(dǎo)的過程中,尤其要強(qiáng)調(diào)公式的物理含義,同時(shí)給出幾個有趣的例子,在增強(qiáng)記憶加深理解的同時(shí)提高學(xué)生的學(xué)習(xí)興趣。
前沿型教學(xué)指的是正在發(fā)展中的模式識別原理和方法。前沿型內(nèi)容包括:特征提取和選擇、聚類分析、神經(jīng)網(wǎng)絡(luò)、支撐矢量機(jī)、隨機(jī)方法等內(nèi)容。這部分內(nèi)容或者是數(shù)學(xué)基礎(chǔ)超出了本科生的能力范圍,或者處于發(fā)展前沿,很多內(nèi)容正處于探討階段。對于前沿型的內(nèi)容,可以忽略公式推導(dǎo)過程,直接講授推導(dǎo)的結(jié)論以及結(jié)論的物理含義,同樣結(jié)合實(shí)際例子加深學(xué)生的理解。對于發(fā)展中的模式識別方法可以適當(dāng)介紹該領(lǐng)域的發(fā)展前沿,在開拓視野的同時(shí)激發(fā)學(xué)生的科研興趣,引導(dǎo)部分學(xué)生從事感興趣的科學(xué)領(lǐng)域的研究。
2實(shí)例先導(dǎo)的教學(xué)方法
模式識別方法是為了解決信息處理中面臨的識別問題而提出的。在講授方法之前,首先要明確將要介紹的模式識別方法的應(yīng)用背景和使用范圍,而不是像我們通常做的那樣,先介紹方法的理論基礎(chǔ)和流程,最后再給出一個例子,或者通過課后練習(xí)和作業(yè)的形式讓學(xué)生掌握課程介紹的理論和方法的應(yīng)用。針對本科模式識別課程的特點(diǎn),我們在教學(xué)實(shí)踐中摸索出了一套以實(shí)例為先導(dǎo)的教學(xué)方法,并與上機(jī)實(shí)驗(yàn)和課程設(shè)計(jì)相結(jié)合,大大提高了學(xué)生的學(xué)習(xí)興趣和動手能力,取得了良好的教學(xué)效果。
實(shí)例先導(dǎo)的教學(xué)方法是在介紹每一章或者相關(guān)的幾章內(nèi)容之前首先用一個實(shí)際的例子引出要學(xué)習(xí)的內(nèi)容,在相關(guān)內(nèi)容的學(xué)習(xí)結(jié)束之后給出解決實(shí)例問題的模式識別方法。例如:在講授貝葉斯決策理論之前,給出根據(jù)長度和光澤度等數(shù)值特征識別鮭魚和鱸魚的例子[4];在講授決策樹之前,給出根據(jù)顏色,形狀、尺寸等非度量特征識別水果的例子等等。通過學(xué)習(xí),找到了解決這類問題的一般方法,同時(shí)學(xué)生也通過實(shí)例記住并理解了該方法的適用范圍。又例如在講授特征的選擇與提取這一章時(shí),先不講特征空間的映射和變換,而是從幾個實(shí)例出發(fā),說明并不是特征越多越好,而是要選擇合適的特征向量;特征的組合變換可以使復(fù)雜的分類問題轉(zhuǎn)化為簡單的問題等。從而讓學(xué)生更好地理解特征選擇和提取的目的和重要性。
在接觸到實(shí)際的模式識別問題時(shí),會引發(fā)學(xué)生的思考。在授課過程中,教師可以針對具體問題組織學(xué)生進(jìn)行討論,看是否能夠利用已學(xué)過的模式識別方法解決該問題。若可以解決,則引導(dǎo)學(xué)生分析用已學(xué)方法解決該問題時(shí)存在的不足,從而引出下面將要介紹的新方法。這樣,在介紹新方法的同時(shí),學(xué)生會很自然地將新方法與舊的方法進(jìn)行比較,分析各種方法的優(yōu)劣,有利于學(xué)生對教學(xué)內(nèi)容的深入理解和掌握。這種方法在講授解決同一類模式識別問題的不同方法時(shí)是適用的。如在講授貝葉斯決策時(shí),可以通過對比的方式介紹幾種決策規(guī)則的特點(diǎn),又如在講授線性判別方法中各種形式的感知器算法時(shí),也可以對比學(xué)習(xí)各種算法的優(yōu)劣。若該模式識別問題不能用已學(xué)的方法解決,則引導(dǎo)學(xué)生分析該模式識別問題的特點(diǎn),思考為何必須引入新的模式識別方法來解決該問題,學(xué)生是否能夠提出自己的解決方案。在分析和思考之后,教師再將解決該問題的思路引入到下面將要介紹的新方法上。這種方法在講授解決不同類型的模式識別問題時(shí)是適用的。如在講授非度量模式識別方法時(shí),面對非度量語義屬性的模式識別問題是前面介紹的方法無法解決的,要引入非度量模式識別方法加以解決。
因此我們建議在教材的編寫上可以嘗試采用實(shí)例先導(dǎo)的方法。首先在引言部分給出一個實(shí)際例子,然后在介紹方法的部分結(jié)合理論分析給出解決實(shí)例問題的方法。這種方法有利于提高學(xué)生的學(xué)習(xí)興趣,增強(qiáng)記憶,加深理解。
3實(shí)踐能力和科研興趣的培養(yǎng)
模式識別是一門理論和實(shí)踐緊密結(jié)合的科學(xué),該學(xué)科的發(fā)展日新月異,在計(jì)算機(jī)和信息處理領(lǐng)域的地位越來越重要。因此,在模式識別課程的教學(xué)過程中要注重學(xué)生實(shí)踐能力和科研興趣的培養(yǎng)。在教學(xué)實(shí)踐中,我們采用了上機(jī)實(shí)驗(yàn)和科學(xué)報(bào)告相結(jié)合的教學(xué)方式。
掌握各種模式識別方法的原理和流程是本科模式識別教學(xué)的第一個階段。在此基礎(chǔ)上,我們要求學(xué)生在計(jì)算機(jī)上實(shí)現(xiàn)模式識別方法并用于解決實(shí)際的模式識別問題。在上機(jī)實(shí)現(xiàn)的過程中,學(xué)生不僅需要掌握模式識別問題在計(jì)算機(jī)中的表示方法和識別結(jié)果的展示形式,尤其重要的是學(xué)生需要對模式識別方法的每一個細(xì)節(jié)都要深入理解和掌握才能將算法實(shí)現(xiàn)。在上機(jī)教學(xué)中,我們采用了Matlab編程環(huán)境實(shí)現(xiàn)課程中介紹的模式識別方法。Matlab的編程語言簡單高效,而且提供了功能強(qiáng)大的圖形展示功能[5]。例如在貝葉斯決策和線性分類器的上機(jī)實(shí)驗(yàn)中,學(xué)生可以利用畫圖函數(shù)用不同的顏色和符合標(biāo)記不同類別的樣本,可以輕松地畫出決策面,這種可視化的分類結(jié)果展示形式不僅提高了學(xué)生的學(xué)習(xí)興趣,而且加深了學(xué)生對模式識別方法及其特點(diǎn)的理解。
在學(xué)生成績考核中,除了筆試成績我們還增設(shè)了上機(jī)作業(yè)成績和科學(xué)報(bào)告成績兩個部分。上機(jī)作業(yè)的內(nèi)容是要求學(xué)生從若干個上機(jī)題目中選擇有興趣的實(shí)現(xiàn)一個簡單的模式識別系統(tǒng)。例如設(shè)計(jì)實(shí)現(xiàn)貝葉斯分類器、線性分類器、神經(jīng)網(wǎng)絡(luò)分類器、決策樹等??茖W(xué)報(bào)告可以有兩種形式,要求學(xué)生或者在模式識別領(lǐng)域的主流英文期刊上選擇感興趣的英文文獻(xiàn),將其翻譯為中文;或者就模式識別領(lǐng)域的一個感興趣的話題談?wù)勛约旱目捶ê椭鲝?。通過上機(jī)作業(yè)和科學(xué)報(bào)告的形式,學(xué)生的動手能力得到了良好的鍛煉。不僅提高了學(xué)生的學(xué)習(xí)熱情,而且引導(dǎo)學(xué)生積極思考,不少同學(xué)在科學(xué)報(bào)告中提出了自己的學(xué)術(shù)看法和主張,有些內(nèi)容頗具獨(dú)到的見解。
在學(xué)生成績考核中,除了筆試成績我們還增設(shè)了上機(jī)作業(yè)成績和科學(xué)報(bào)告成績兩個部分。上機(jī)作業(yè)的內(nèi)容是要求學(xué)生從若干個上機(jī)題目中選擇有興趣的實(shí)現(xiàn)一個簡單的模式識別系統(tǒng)。例如設(shè)計(jì)實(shí)現(xiàn)貝葉斯分類器、線性分類器、神經(jīng)網(wǎng)絡(luò)分類器、決策樹等。科學(xué)報(bào)告可以有兩種形式,要求學(xué)生或者在模式識別領(lǐng)域的主流英文期刊上選擇感興趣的英文文獻(xiàn),將其翻譯為中文;或者就模式識別領(lǐng)域的一個感興趣的話題談?wù)勛约旱目捶ê椭鲝?。通過上機(jī)作業(yè)和科學(xué)報(bào)告的形式,學(xué)生的動手能力得到了良好的鍛煉。不僅提高了學(xué)生的學(xué)習(xí)熱情,而且引導(dǎo)學(xué)生積極思考,不少同學(xué)在科學(xué)報(bào)告中提出了自己的學(xué)術(shù)看法和主張,有些內(nèi)容頗獨(dú)到的見解。
4結(jié)語
本科模式識別教學(xué)由于學(xué)生的數(shù)學(xué)基礎(chǔ)有限而面臨著兩難的境地。既要把原理和方法講清楚,又不能過多的涉及復(fù)雜的數(shù)學(xué)推導(dǎo),這給教學(xué)帶來很大困難。在教學(xué)實(shí)踐中,我們把教學(xué)內(nèi)容劃分為基礎(chǔ)型、前沿型兩類,并提出了弱化公式推導(dǎo),強(qiáng)調(diào)公式的物理含義,以及結(jié)合實(shí)例增強(qiáng)記憶的教學(xué)方法。為了提高學(xué)生的學(xué)習(xí)興趣,加深理解,我們提出了實(shí)例先導(dǎo)的教學(xué)方法。用實(shí)際例子引導(dǎo)學(xué)生思考,加深學(xué)生對模式識別方法應(yīng)用背景和適用范圍的理解。模式識別是實(shí)踐性很強(qiáng)的科學(xué),并且該學(xué)科的發(fā)展十分迅速。在教學(xué)實(shí)踐中,我們十分重視學(xué)生動手能力和科研興趣的培養(yǎng)。通過上機(jī)作業(yè)和科學(xué)報(bào)告的形式引導(dǎo)學(xué)生積極動手,積極思考。
參考文獻(xiàn):
[1] 邊肇祺,張學(xué)工. 模式識別[M]. 2版. 北京:清華大學(xué)出版社. ,2002:9-303.
[2] 顧波. 模式識別本科教學(xué)方法淺談[J]. 中國科教創(chuàng)新導(dǎo)刊.,2010(4):68.
[3] Andrew R. Webb. 統(tǒng)計(jì)模式識別[M]. 2版. 王萍,等,譯. 北京:電子工業(yè)出版社,2004:1-10.
[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分類[M]. 2版. 李宏東,姚天翔,等,譯. 北京:機(jī)械工業(yè)出版社. ,2003.
[5] 楊淑瑩. 模式識別與智能計(jì)算:Matlab技術(shù)實(shí)現(xiàn)[M]. 北京:電子工業(yè)出版社,2008:1-300.
Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming
QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2
(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)
關(guān)鍵詞:仿生;模式識別;神經(jīng)網(wǎng)絡(luò);分類器
中圖分類號: F224-39 文獻(xiàn)標(biāo)識碼: A 文章編號: 1673-1069(2017)02-154-2
1 仿生模式識別的引入
為了適應(yīng)現(xiàn)實(shí)需要,人們開始希望機(jī)器能夠代替人類完成某些繁重的識別工作。我們通常所說的模式識別就是指運(yùn)用機(jī)器進(jìn)行分類識別。以往的識別方法,多數(shù)是建立在“分類劃分”的基礎(chǔ)上,根據(jù)給定的分類準(zhǔn)則來找尋“最優(yōu)的分類界面”,具體的實(shí)現(xiàn)算法也都是注重于不同類樣本的區(qū)別,即,一類樣本與有限種類已知樣本之間的區(qū)分?;诖顺霭l(fā)點(diǎn)的局限性,識別當(dāng)中出現(xiàn)的問題是顯而易見的:首先,如果遇見未學(xué)習(xí)過的新事物,常常會牽強(qiáng)地認(rèn)為它是某一類已學(xué)過的舊事物;其次是對未學(xué)習(xí)過的新事物進(jìn)行學(xué)習(xí)時(shí),往往會破壞掉原來的規(guī)矩,打亂舊事物的識別。針對以上的缺陷,才有了仿生模式識別的概念。仿生模式的目標(biāo)是找到同類事物的最佳覆蓋面。
2 仿生模式識別在神經(jīng)網(wǎng)絡(luò)中的超曲面劃分
2.1 多權(quán)值神經(jīng)網(wǎng)絡(luò)的高維封閉曲面
(5)式中Wji和W′ji是方向權(quán)值,它們決定了曲面的方向,W′ji是核心權(quán)值,它決定了曲面的幾何中心。Xj為第j個輸入端的輸入;n是輸入空間維數(shù);p為冪參數(shù),用以控制曲面的彎曲程度;s表示單項(xiàng)正負(fù)號方法的參數(shù),若S=0單項(xiàng)符號只能為正,若S=1時(shí)單項(xiàng)的符號和Wji的符號相同;若設(shè)置了S=0,則該式就變成了一個封閉超曲面的神經(jīng)元。f函數(shù)的基設(shè)置為一個定值時(shí),輸入點(diǎn)的軌跡是一個封閉的超曲面,其核心位置由決定。
用p值來改變封閉超曲面的形狀,如圖1~圖8所示。若使權(quán)值取不同的值,就相當(dāng)于將封閉曲面在不同方向進(jìn)行拉伸或壓縮,θ取值不同,則偏離核心位置的程度也不同。
2.2 通用超曲面神經(jīng)網(wǎng)絡(luò)的計(jì)算式
上式中,Ymi(t+1)是輸入空間的第i個神經(jīng)元在輸入第m個對象,在t+1時(shí)間的輸出狀態(tài)值。i是神經(jīng)元數(shù)量,最大是1024。Wji與W′ji是第j個輸入節(jié)點(diǎn)至第i個神經(jīng)元的“方向”權(quán)值和“核心”權(quán)值;fki是第i個神經(jīng)元的輸出非線性函數(shù),下標(biāo)ki是第i個神經(jīng)元的非線性函數(shù)在函數(shù)庫中的序號;Imj表示的是第m個輸入對象中的第j個輸入值;W′cgi和是Wcgi第cg個(取值范圍[1,256])神經(jīng)元輸出到第i個(取值范圍[1,1024])神經(jīng)元的權(quán)值“核心”和“方向”權(quán)值;p表示的是冪參數(shù);而S是單項(xiàng)正負(fù)符號規(guī)則;(t)為當(dāng)輸入為第m個對象時(shí)第cg個神經(jīng)元在時(shí)間t的輸出狀態(tài)值,θ([1,1024])是第i個神經(jīng)元的閾值;λi是神經(jīng)元非線性函數(shù)坐標(biāo)比例因子;Ci是神經(jīng)元輸入規(guī)模比例因子。
由傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)和經(jīng)向基RBF神經(jīng)網(wǎng)絡(luò)及超曲面神經(jīng)網(wǎng)絡(luò)對圖9中三類事物的分類邊界分別為折線和圓環(huán)及橢圓的并,可見超曲面神經(jīng)網(wǎng)絡(luò)具有更準(zhǔn)確的分類效果。
3 總結(jié)
仿生模式識別是對事物逐類分別訓(xùn)練“認(rèn)識”的過程。它的顯著優(yōu)點(diǎn)是對于沒有經(jīng)過訓(xùn)練的對象會拒識,而新增加樣本的訓(xùn)練不會影響到原有的識別。因此,仿生模式識別,較之原有的識別模式識別效果更佳,可以廣泛應(yīng)用在人臉識別,語音識別等眾多領(lǐng)域。
參 考 文 獻(xiàn)
[1] 覃鴻,王守覺.多權(quán)值神經(jīng)元網(wǎng)絡(luò)仿生模式識別方法在低訓(xùn)練樣本數(shù)量非特定人語音識別中與HMM及DTW的比較研究[J].電子學(xué)報(bào),2005(5).
級別:北大期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級別:省級期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)
級別:部級期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)
級別:部級期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級別:部級期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)