卷積神經(jīng)網(wǎng)絡(luò)識(shí)別方法范文

時(shí)間:2024-04-02 18:04:31

導(dǎo)語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡(luò)識(shí)別方法,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

關(guān)鍵詞: 模式識(shí)別; 神經(jīng)網(wǎng)絡(luò); 卷積; 文字識(shí)別

中圖分類號(hào): TN711?34; TP391.4 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)20?0019?03

Large pattern online handwriting character recognition based on multi?convolution neural network

GE Ming?tao1, WANG Xiao?li1, PAN Li?wu2

(1. SIAS International School, Zhengzhou University, Zhengzhou 451150, China;

2. Henan University of Animal Husbandry and Economy, Zhengzhou 450011, China)

Abstract: Online handwriting character recognition is an important field in the research of pattern recognition. The traditional recognition method is based on the common convolutional neural networks (CNNs) technology. It has an efficient recognition rate for the small pattern character set online handwriting characters, but has low recognition rate for the large pattern character set recognition. A recognition method based on multi?convolutional neural networks (MCNNs) is presented in this paper to overcome the situation that the previous methods have the low recognition rate for large pattern character set and improve the recognition rate for the large pattern handwriting character set recognition. The stochastic diagonal Levenbert?Marquardt method is used in the system for training optimization. The experimental results show that the proposed method has the recognition rate of 89% and has a good prospect for online handwriting character recognition for large scale pattern.

Keywords: pattern recognition; neural network; convolution; character recognition

0 引 言

隨著全球信息化的飛速發(fā)展和對(duì)自動(dòng)化程度要求的不斷提高 ,手寫文字識(shí)別技術(shù)被廣泛地應(yīng)用到許多方面。特別是近幾年擁有手寫功能的手機(jī)、平板電腦等智能電子產(chǎn)品的普及,聯(lián)機(jī)手寫文字識(shí)別研究已經(jīng)成為一個(gè)備受關(guān)注的主題。聯(lián)機(jī)手寫字符識(shí)別要求實(shí)時(shí)性較高,識(shí)別過程中要求特征空間的維數(shù)比較高,在進(jìn)行特征樣本訓(xùn)練時(shí)要求訓(xùn)練的數(shù)目很大,要匹配的特征值或特征對(duì)象比較多 [1?2]。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNNs)的優(yōu)點(diǎn)在于圖像的識(shí)別過程中對(duì)視覺模式的獲得是直接從原始圖像中獲得的,所以在設(shè)計(jì)系統(tǒng)時(shí)圖像的預(yù)處理工作很少,與一般神經(jīng)網(wǎng)絡(luò)相比是一種高效的識(shí)別方法。卷積神經(jīng)網(wǎng)絡(luò)在模式識(shí)別的一些領(lǐng)域具有很好的魯棒性,如在識(shí)別有變化的模式和對(duì)幾何變形的識(shí)別方面。利用卷積神經(jīng)網(wǎng)絡(luò)的手寫識(shí)別方法具有如下一些優(yōu)點(diǎn):對(duì)于要檢測(cè)的圖像可以與事先制定網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)之間有較高的匹配率;特征提取和模式分類同時(shí)進(jìn)行;訓(xùn)練參數(shù)往往是系統(tǒng)計(jì)算量的重要參數(shù),而卷積神經(jīng)網(wǎng)絡(luò)中利用權(quán)值共享技術(shù),這樣就可以大大降低該參數(shù),在設(shè)計(jì)系統(tǒng)結(jié)構(gòu)時(shí)使得結(jié)構(gòu)變得更簡(jiǎn)單,從而使得整個(gè)系統(tǒng)具有更好的適應(yīng)性[3?5]。

目前,人機(jī)交互系統(tǒng)的手寫字符識(shí)別、汽車車牌號(hào)識(shí)別和信息安全中常用的人臉識(shí)別等領(lǐng)域都有卷積神經(jīng)網(wǎng)絡(luò)的成功應(yīng)用。文獻(xiàn)[6]用一個(gè)4層的卷積神經(jīng)網(wǎng)絡(luò)LeNet?5對(duì)Mnist庫進(jìn)行識(shí)別實(shí)驗(yàn),獲得了98.4%的識(shí)別率,用2層的BP網(wǎng)絡(luò)的識(shí)別率[4,6]是87%。許多學(xué)者對(duì)卷積神經(jīng)網(wǎng)絡(luò)在聯(lián)機(jī)手寫文字識(shí)別方面做了多方位的研究。 但是,這些成功的聯(lián)機(jī)手寫文字識(shí)別主要是針對(duì)小模式字符集,利用以往的這些方法對(duì)大規(guī)模模式分類的聯(lián)機(jī)手寫文字的識(shí)別依然有識(shí)別率不高的問題。本文介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本概念和一種典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),給出了基于多重卷積神經(jīng)網(wǎng)絡(luò)的字符識(shí)別和詞語識(shí)別模型。通過使用大字符集的UNIPEN數(shù)據(jù)庫進(jìn)行訓(xùn)練和測(cè)試,本文提出的方法在大模式聯(lián)機(jī)手寫識(shí)別上,取得了較高的識(shí)別速度和滿意的識(shí)別率。

1 卷積神經(jīng)網(wǎng)絡(luò)

文獻(xiàn)[6?7]中詳細(xì)地描述了卷積神經(jīng)網(wǎng)絡(luò)如何保證圖像對(duì)位移、縮放、扭曲魯棒性能。典型的手寫字符卷積神經(jīng)網(wǎng)絡(luò)LeNET 5的結(jié)構(gòu)圖如圖1所示[6?7]。

圖1 典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

在圖1中,輸入層接收要識(shí)別32×32的手寫字符圖像,經(jīng)過簡(jiǎn)單的大小歸一化和圖像灰度處理,之后的結(jié)果作為一個(gè)采樣層的圖像;然后用一個(gè)可學(xué)習(xí)核進(jìn)行卷積操作,卷積結(jié)果經(jīng)過激活函數(shù)的輸出形成這一層的神經(jīng)元,每個(gè)神經(jīng)元與輸入圖像的一個(gè)5×5的鄰域相連接,從而得到由6幅特征圖組成的第一個(gè)隱層(C1層)。每個(gè)特征圖有25個(gè)權(quán)值(如方向線段,端點(diǎn)、角點(diǎn)等),考慮到邊界效果,得到的特征圖的大小是28×28,小于輸入圖層[3?9]。卷積層的數(shù)學(xué)計(jì)算過程可表示為:

[xlj=fi∈Mjxl-1j*kernellij+blj] (1)

式中:[l] 代表層數(shù);kernel是卷積核;[Mj]代表輸入特征圖的一個(gè)選擇。每個(gè)輸出圖有一個(gè)偏置[b]。

每個(gè)卷積層的結(jié)果作為下一個(gè)次采樣層的輸入,次采樣層的作用是對(duì)輸入信息進(jìn)行抽樣操作。如果輸入的特征圖為n個(gè),則經(jīng)過次采樣層后特征圖的個(gè)數(shù)仍然為n,但是輸出的特征圖要變?。ɡ?,各維變?yōu)樵瓉淼?0%)。因此隱層S2是由6個(gè)大小為14×14的特征圖組成的次采樣層。次采樣層計(jì)算公式可以用式(2)表示:

[xlj=fβl-1jdown(xl-1j)+blj] (2)

式中down(?) 表示次采樣函數(shù)。次采樣函數(shù)一般是對(duì)該層輸入圖像的一個(gè)n×n大小的區(qū)域求和,因此,輸出圖像的大小是輸入圖像大小的[1n]。每一個(gè)輸出的特征圖有自己的β和b。

類似的,C3層有16個(gè)10×10的特征圖組成的卷積層,特征圖的每個(gè)神經(jīng)元與S2網(wǎng)絡(luò)層的若干個(gè)特征圖的5×5的鄰域連接。網(wǎng)絡(luò)層S4是由16個(gè)大小為5×5的特征圖組成的次采樣層。特征圖的每個(gè)神經(jīng)元與C3層的一個(gè)2×2大小的鄰域相連接。網(wǎng)絡(luò)層C5是由120個(gè)特征圖組成的卷積層。每個(gè)神經(jīng)元與S4網(wǎng)絡(luò)層的所有特征圖的5×5大小的鄰域相連接。網(wǎng)絡(luò)層F6,包括84個(gè)神經(jīng)元,與網(wǎng)絡(luò)層C5進(jìn)行全連接。最后,輸出層有10個(gè)神經(jīng)元,是由徑向基函數(shù)單元(RBF)組成,輸出層的每個(gè)神經(jīng)元對(duì)應(yīng)一個(gè)字符類別。RBF單元的輸出yi的計(jì)算方法如式(3)所示:

[yi=j(xj-wij)2] (3)

很多研究人員通過對(duì)字符集作彈性訓(xùn)練,經(jīng)測(cè)試發(fā)現(xiàn)在MNIST字符集上的識(shí)別率可以高達(dá)99%以上[6?7] 。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)主要是對(duì)小模式集上,如對(duì)數(shù)字或26個(gè)英文字母組成的集合都有著較高的識(shí)別率。然而,對(duì)大模式集的識(shí)別仍然是一個(gè)挑戰(zhàn),因?yàn)樵O(shè)計(jì)一個(gè)優(yōu)化的并足夠大的單一網(wǎng)絡(luò)是比較困難的,且訓(xùn)練時(shí)間也較長(zhǎng)。因此,本文的目的旨在通過組合多個(gè)對(duì)某一字符集有高識(shí)別率的卷積神經(jīng)網(wǎng)絡(luò),從而構(gòu)成多重卷積神經(jīng)網(wǎng)絡(luò),進(jìn)而提高卷積神經(jīng)網(wǎng)絡(luò)對(duì)大模式集手寫字符的識(shí)別率。

2 多重卷積神經(jīng)網(wǎng)絡(luò)

2.1 多重卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別

根據(jù)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)算過程以及其在處理大模式集手寫字符時(shí)存在的不足,本文提出一種多重卷積神經(jīng)網(wǎng)絡(luò)來改進(jìn)傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型,用多個(gè)擁有高識(shí)別率的小卷積神經(jīng)網(wǎng)絡(luò)組成一個(gè)多重卷積神經(jīng)網(wǎng)絡(luò)。每一重小卷積神經(jīng)網(wǎng)絡(luò)對(duì)某一具體字符集有較高的識(shí)別率,另外,單重卷積神經(jīng)網(wǎng)絡(luò)除了有一個(gè)正式的輸出集之外,還產(chǎn)生一個(gè)未知的輸出(即難以識(shí)別的字符),即如果一個(gè)輸入字符沒有被正確識(shí)別,它將被輸出為一個(gè)未知字符,然后輸入模式轉(zhuǎn)到下一重卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別。最后,通過一個(gè)拼寫檢查模塊進(jìn)行判斷,選擇最好的結(jié)果輸出。系統(tǒng)的流程如圖2所示。

其中CNN 1是識(shí)別手寫數(shù)字的卷積神經(jīng)網(wǎng)絡(luò),CNN 2是識(shí)別手寫小寫英文字母的卷積神經(jīng)網(wǎng)絡(luò),該模型具有極強(qiáng)的擴(kuò)展性,可以添加多任意模式的卷積神經(jīng)網(wǎng)絡(luò)(如中文,日文等)。

圖2 多重卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別示意圖

2.2 隨機(jī)對(duì)角Levenberg?Marquardt訓(xùn)練方法

傳統(tǒng)的結(jié)構(gòu)比較簡(jiǎn)單、單一的卷積神經(jīng)網(wǎng)絡(luò)多采用基本的Back Propagation(BP)規(guī)則訓(xùn)練網(wǎng)絡(luò),往往需要幾百次迭代,網(wǎng)絡(luò)的收斂速度較慢。本文采用LeCun博士提出的隨機(jī)對(duì)角Levenberg?Marquardt 算法對(duì)網(wǎng)絡(luò)作訓(xùn)練,該算法需要的迭代次數(shù)明顯比基本的BP 算法少[4,9]。隨機(jī)對(duì)角Levenberg?Marquardt算法的公式為:

[ηki=ε?2E?w2ij+μ] (4)

式中[ε]是全局的學(xué)習(xí)率,一般取初始值0.01,太大會(huì)使網(wǎng)絡(luò)無法收斂,太小則會(huì)降低收斂速度,且使網(wǎng)絡(luò)更容易陷入局部極小值,訓(xùn)練過程中可以用啟發(fā)式規(guī)則改變[ε]的值,本文取最下值為5e-005; [?2E?w2ij]是一個(gè)估計(jì)值,根據(jù)訓(xùn)練集的大小可以調(diào)整樣本數(shù)量,文中隨機(jī)選取200個(gè)樣本估算它的值;[μ]用來避免[?2E?w2ij] 太小時(shí)[ηki]的變化過大 。

2.3 多重卷積神經(jīng)網(wǎng)絡(luò)詞句識(shí)別

本文提出的多重卷積神經(jīng)網(wǎng)絡(luò)對(duì)手寫詞語的識(shí)別方法可以簡(jiǎn)單地描述為:首先對(duì)輸入的手寫圖像進(jìn)行預(yù)處理和分割,然后通過多重卷積神經(jīng)網(wǎng)絡(luò)模塊分別進(jìn)行識(shí)別,最后采用單詞識(shí)別模塊對(duì)識(shí)別結(jié)果進(jìn)行判斷,選擇最好的結(jié)果輸出。其過程如圖3所示。

圖3 多重卷積神經(jīng)網(wǎng)絡(luò)聯(lián)機(jī)手寫詞句識(shí)別過程

本文提出的多重卷積神經(jīng)網(wǎng)絡(luò)聯(lián)機(jī)手寫文字識(shí)別方法克服了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)文字識(shí)別的對(duì)字符集的限制,每一重卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)針對(duì)小模式的卷積神經(jīng)網(wǎng)絡(luò),易于訓(xùn)練和優(yōu)化,更重要的是此方案的靈活性非常好易于調(diào)節(jié)參數(shù),可擴(kuò)展性強(qiáng)。每一重卷積神經(jīng)網(wǎng)絡(luò)都具有可重用能力,可以根據(jù)需要加載一個(gè)或多個(gè)網(wǎng)絡(luò),可以根據(jù)新的模式添加新的網(wǎng)絡(luò)而不需改變或重建原來的網(wǎng)絡(luò)。

3 訓(xùn)練和實(shí)驗(yàn)

為了評(píng)估多重卷積神經(jīng)網(wǎng)絡(luò)對(duì)基于大模式字符集的聯(lián)機(jī)手寫文字識(shí)別的性能,本系統(tǒng)采用MNIST和UNIPEN兩種不同的手寫字符訓(xùn)練集進(jìn)行測(cè)試。UNIPEN數(shù)據(jù)庫是在1992年舉行的IEEE IAPR會(huì)議上提出并建立的,其目的是創(chuàng)建一個(gè)大型的手寫體數(shù)據(jù)庫用于為在線手寫識(shí)別提供研究和開發(fā)的基礎(chǔ),得到了多個(gè)知名公司或研究所的支持并完成了UNIPEN的規(guī)范設(shè)計(jì)。在進(jìn)行數(shù)據(jù)比對(duì)實(shí)驗(yàn)中,本文采用許多研究使用的MNIST手寫數(shù)字?jǐn)?shù)據(jù)庫,該數(shù)據(jù)庫是NEC 研究中心設(shè)計(jì)的,是NIST(The National Institute of Standards and Technology)數(shù)據(jù)庫的一個(gè)子集,該訓(xùn)練集中有大量訓(xùn)練樣本和測(cè)試用例。本文默認(rèn)用以下定義:

[識(shí)別率=正確識(shí)別數(shù)樣本總數(shù)×100%]

[失誤率誤識(shí)率=錯(cuò)誤識(shí)別數(shù)樣本總數(shù)×100%]

實(shí)驗(yàn)測(cè)試是在通用的臺(tái)式電腦上進(jìn)行的。整個(gè)識(shí)別原型系統(tǒng)采用C#編寫,運(yùn)行在.NetFrame 4.5平臺(tái)上。經(jīng)測(cè)試對(duì)MNIST訓(xùn)練集識(shí)別正確率可達(dá)[9]99%,對(duì)UNIPEN數(shù)字識(shí)別正確率可達(dá)97%,對(duì)UNIPEN數(shù)字和大寫字母識(shí)別正確率可達(dá)89%(1a,1b) ,對(duì)UNIPEN小寫字母識(shí)別正確率可達(dá)89%(1c) 。圖4是對(duì)UNIPEN小寫字母3次訓(xùn)練的均方誤差比較。

圖4 訓(xùn)練的誤差數(shù)據(jù)

從圖4中可以看出,在開始的幾個(gè)訓(xùn)練周期內(nèi),均方誤差(MSE)下降得很快,然后在第13個(gè)周期后神經(jīng)網(wǎng)絡(luò)達(dá)到一個(gè)穩(wěn)定的值,約為0.148 5。也就是說,網(wǎng)絡(luò)在第13個(gè)周期后,改善程度就很小。所以修改訓(xùn)練錯(cuò)誤率的值為0.000 45后重新進(jìn)行18代的第二次訓(xùn)練,均方誤差有所降低。經(jīng)過第三次的訓(xùn)練后趨于穩(wěn)定,對(duì)UNIPEN小寫字母識(shí)別正確率可達(dá)89%。經(jīng)測(cè)試,通過使用隨機(jī)對(duì)角Levenberg?Marquardt方法,收斂速度比基本BP算法快了許多,經(jīng)過68代訓(xùn)練后識(shí)別正確率可達(dá)89%。

4 結(jié) 語

本文提出了基于多重卷積神經(jīng)網(wǎng)絡(luò)的聯(lián)機(jī)手寫字符的識(shí)別方法,通過使用多個(gè)識(shí)別率高的卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)對(duì)角 Levenberg? Marquardt方法,可以適用于大模式聯(lián)機(jī)手寫識(shí)別。經(jīng)過實(shí)驗(yàn)數(shù)據(jù)比較,該方法在大模式聯(lián)機(jī)手寫識(shí)別過程中具有很高的識(shí)別率,與此同時(shí)識(shí)別速度也很快,有很好的實(shí)時(shí)性,總體效果很好。在當(dāng)今觸摸屏應(yīng)用遍及生產(chǎn)生活的各個(gè)方面的趨勢(shì)下,該方法有著廣闊的應(yīng)用前景。同時(shí)此方法為今后多手寫漢字識(shí)別的研究提供了很好的借鑒。

注:本文通訊作者為潘立武。

參考文獻(xiàn)

[1] 吳鳴銳,張鈸.一種用于大規(guī)模模式識(shí)別問題的神經(jīng)網(wǎng)絡(luò)算法[J].軟件學(xué)報(bào),2001,12(6):851?855.

[2] 張輝.大規(guī)模聯(lián)機(jī)手寫漢字識(shí)別數(shù)據(jù)庫整理、統(tǒng)計(jì)與實(shí)驗(yàn)分析[D].廣州:華南理工大學(xué),2012.

[3] 徐姍姍,劉應(yīng)安,徐,等.基于卷積神經(jīng)網(wǎng)絡(luò)的木材缺陷識(shí)別[J].山東大學(xué)學(xué)報(bào):工學(xué)版,2013,43(2):23?28.

[4] 呂剛.基于卷積神經(jīng)網(wǎng)絡(luò)的多字體字符識(shí)別[J].浙江師范大學(xué)學(xué)報(bào):自然科學(xué)版,2011,34(4):425?428.

[5] PHAM D V. Online handwriting recognition using multi convolution neural networks [M]. Berlin Heidelberg: Springer, 2012: 310?319.

[6] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient?based learning applied to document recognition [C]// Proceeding of IEEE. USA: IEEE, 1998: 2278?2324.

[7] SIMARD P Y, STEINKRAUS Dave, PLATT John. Best practices for convolutional neural networks applied to visual document analysis [C]// International Conference on Document Analysis and Recognition (ICDAR). Los Alamitos: IEEE Computer Society, 2003: 958?962.

篇2

關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);Morlet小波;決策理論;Hilbert變換

中圖分類號(hào):TP18文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)32-9050-02

Wireless Signal Simulation Algorithm for Automatic Identification

ZHANG Meng

(Purchasing, China Railway Communication Co., Ltd., Beijing 100140, China)

Abstract: We have firstly discussed the modulation distinguishing method based on rational budgeting theory through the method of comparing Tine-Frequency analysis of the analysis signals formed by Hibert Transform . And on the basic of analyzing the fault of this method ,we put forward the distinguishing method based on NN. When NN is distinguishing signals, it mainly depends on the different positions of peak. Wavelet Transform here equals a mathematic microscope .it reflects the inexorable links between the signal categories and the positions of peak. Taking advantage Wavelet Transform and the simple three-layer BP NN, the more accurate Time-Frequency characteristics of signals to be distinguishing can be drawn.

Keywords: BP ANN; Morlet Wavelet; BudgetingTheory; Hibert Transform

在軍事電子對(duì)抗等多方面的重要應(yīng)用,通信信號(hào)調(diào)制的自動(dòng)識(shí)別分類問題也相繼發(fā)展起來。無線電信號(hào)調(diào)制實(shí)識(shí)別就是要判斷截獲信號(hào)的調(diào)制種類。為此,需要事先對(duì)其特征進(jìn)行選定,并確定它們與相應(yīng)調(diào)制種類相聯(lián)系的取值范圍,然后再對(duì)信號(hào)進(jìn)行特征測(cè)量,并根據(jù)測(cè)量結(jié)果對(duì)信號(hào)的調(diào)制進(jìn)行分類判決。

如果把無線電信號(hào)的調(diào)制識(shí)別與分類視為一種模式識(shí)別問題,那末,從模式識(shí)別理論來看,模式分類是模式識(shí)別的一個(gè)子系統(tǒng)。因此,在模式識(shí)別理論框架下,無線電信號(hào)的調(diào)制識(shí)別是一個(gè)總體概念。而調(diào)制分類則只是調(diào)制識(shí)別的一個(gè)分支[1]。

1 基于決策理論的模擬調(diào)制方式識(shí)別方法

此算法主要實(shí)現(xiàn)區(qū)分AM、FM、DSB、LSB、USB、VSB、AM-FM等七種調(diào)制樣式,所分析的對(duì)象序列s(n)是由接收機(jī)中頻輸出并經(jīng)過采樣得到的,這樣s(n)的采樣頻率和載頻都已知,分別記做Fs和Fc。算法分兩個(gè)步驟:

第一步,根據(jù)信號(hào)的包絡(luò)特征將AM、USB、LSB與FM區(qū)分開,因?yàn)榍叭N信號(hào)的包絡(luò)不為恒定值,而FM的包絡(luò)理論上是恒定值(實(shí)際中接近恒定)。因而可以從中提取一個(gè)特征參數(shù)R。參數(shù)R反映了零中心歸一化包絡(luò)的功率譜特征,FM的零中心歸一化包絡(luò)接近零,因其參數(shù)R應(yīng)遠(yuǎn)遠(yuǎn)小于前三種信號(hào)。實(shí)際中若R

第二步,根據(jù)信號(hào)頻譜的對(duì)稱性,將AM與USB與LSB區(qū)分開,因?yàn)锳M的單邊頻譜關(guān)于載頻是近似對(duì)稱的,USB和LSB的單邊頻譜對(duì)于載頻來說分別只有上邊頻和下邊頻。因而可以從中提取另一個(gè)特征參數(shù) 。理論上,由于AM的上下邊頻對(duì)稱,所以AM的P接近零,而LSB和USB的P分別接近1和-1。實(shí)際中若|P|< 0.5,判為AM信號(hào),若P>0.5,判為L(zhǎng)SB,P

第三步,零中心非弱信號(hào)段瞬時(shí)相位非線性分量絕對(duì)值的標(biāo)準(zhǔn)偏差:σap 。

σap由下式定義:

(1)

式中,at是判斷弱信號(hào)段的一個(gè)幅度判決門限電平,c是在全部取樣數(shù)據(jù)Ns中屬于非弱信號(hào)值的個(gè)數(shù),?準(zhǔn)NL(i)是經(jīng)零中心化處理后瞬時(shí)相位的非線性分量,在載波完全同步時(shí),有:?準(zhǔn)NL(i)= φ(i)-φ0

式中:,φ(i)為瞬時(shí)相位。用σap來區(qū)分是DSB信號(hào)還是AM-FM信號(hào)。

第四步,零中心非弱信號(hào)段瞬時(shí)相位非線性分量的標(biāo)準(zhǔn)偏差:σdp。

σdp由下式定義:

(2)

σdp主要用來區(qū)別不含直接相位信息的AM、VSB信號(hào)類和含直接相位信息的DSB、LSB、USB、AM-FM信號(hào)類,其判決門限設(shè)為t(σdp) 。

2 決策論方法的改進(jìn)

前面介紹的基于決策理論的模擬調(diào)制方式識(shí)別方法存在缺陷針對(duì)上述問題,人們又提出了基于神經(jīng)網(wǎng)絡(luò)(NN)的識(shí)別方法。

2.1 BP網(wǎng)絡(luò)作為分類器的模擬調(diào)制方式識(shí)別方法

該算法用基于有監(jiān)督訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型BP網(wǎng)絡(luò)作為分類器,用BP模型多層感知網(wǎng)絡(luò)與反向傳播學(xué)習(xí)算法相結(jié)合,通過不斷比較網(wǎng)絡(luò)的實(shí)際輸出與指定期望輸出間的差異來不斷的調(diào)整權(quán)值,直到全局(或局部)輸出差異極小值,不難想象該神經(jīng)網(wǎng)絡(luò)對(duì)模型細(xì)節(jié)中的諸多問題均有良好效果。

基于NN的模擬信號(hào)調(diào)制識(shí)別框圖[2]如圖1所示,該NN采用三層結(jié)構(gòu)即,1個(gè)輸入層,1個(gè)輸出層,1個(gè)中間層。中間層可采用多層。但由于受到計(jì)算復(fù)雜性的限制,目前采用單層或雙層中間層的NN比較多見。本圖中間層采用單層25個(gè)節(jié)點(diǎn),輸入層和輸出層的節(jié)點(diǎn)數(shù)取決于信號(hào)特征參數(shù)的個(gè)數(shù)和信號(hào)的分類數(shù),因而分別為4和7。

神經(jīng)網(wǎng)絡(luò)具有信息分布式存儲(chǔ)、大規(guī)模自適應(yīng)并行處理和高度容錯(cuò)特性,適用于模式識(shí)別的基礎(chǔ)。其學(xué)習(xí)能力和容錯(cuò)特性對(duì)不確定性模式識(shí)別具有獨(dú)到之處[3]。通信信號(hào)在傳播過程中受到信道噪聲的污染,接受到的信號(hào)是時(shí)變的、非穩(wěn)定的,而小波變換特別適用于非穩(wěn)定信號(hào)的分析,其作為一種信息提取的工具已得到較廣泛的應(yīng)用。小波變換具有時(shí)頻局部性和變焦特性,而神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、自適應(yīng)、魯棒性、容錯(cuò)性和推廣能力,兩者優(yōu)勢(shì)的結(jié)合可以得到良好的信號(hào)模式自動(dòng)識(shí)別特性,從而形成各種處理方法。

2.2 基于小波的特征提取和識(shí)別方法

小波特別適用于非穩(wěn)定信號(hào)的分析,作為一種特征提取的工具已得到較為廣泛的應(yīng)用。小波的重要特點(diǎn)是它能夠提供一個(gè)信號(hào)局部化的頻域信息。小波變換能夠?qū)⒏鞣N交織在一起的不同頻率組成的混合信號(hào)分解成不同頻率的塊信號(hào),它對(duì)不同的時(shí)間和頻率有不同的解釋,因此,對(duì)調(diào)制信號(hào)進(jìn)行小波分解,得到不同水平下的細(xì)節(jié)信息,這些信息對(duì)于不同類別的調(diào)制信號(hào)來說是有差別的[4]。

在實(shí)際應(yīng)用中,小波變換常用的定義有下列兩種:

(3)

(4)

式中,星號(hào)*表示共軛。式(3)表示小波變換是輸入信號(hào)想x(t)和小波函數(shù)φα, τ(t)的相關(guān)積分;式(4)用卷積代替了相關(guān)積分。兩種定義在本質(zhì)上是一致的。本為采用后者。

將式(4)中的τ和t離散化,即令τ=kTs,及t=iTs,得連續(xù)小波變換公式(4)的離散形式,又稱小波系數(shù):

(5)

Morlet小波是一種單頻復(fù)正弦調(diào)制高斯波,也是最常用的復(fù)值小波。其實(shí)、頻兩域都具有很好的局部性,它的時(shí)域形式如下:

(6)

雖然信號(hào)特征有很多種,神經(jīng)網(wǎng)絡(luò)在進(jìn)行信號(hào)識(shí)別時(shí),主要是依據(jù)譜峰位置的不同,因此提取信號(hào)特征主要任務(wù)就是尋找信號(hào)類別與譜峰位置間的必然聯(lián)系。而小波變換在這里則相當(dāng)于一個(gè)數(shù)學(xué)顯微鏡,通過它,可以詳細(xì)了解各類信號(hào)在不同低頻段上的頻譜構(gòu)成。

整個(gè)系統(tǒng)在PC機(jī)上進(jìn)行仿真,采用Windows2000操作系統(tǒng)和Matlab6.1和Cool Edit2.0進(jìn)行聲音錄制。

在仿真中,采用44K的采樣率,錄制了一段歌聲和一段笑聲,用Matlab生成22K的正弦載波,并根據(jù)第二章的各調(diào)制樣式的定義,生成了各個(gè)仿真的調(diào)制波形。并轉(zhuǎn)化成.wav文件錄在電腦中。

3 結(jié)束語

本文僅限于理論理論研究,用MatLab仿真實(shí)現(xiàn),沒有用DSP芯片等物理電路實(shí)現(xiàn),僅為實(shí)際實(shí)現(xiàn)提供理論指導(dǎo)。

參考文獻(xiàn):

[1] 羅利春.無線電偵察信號(hào)分析與處理[M].北京:國防工業(yè)出版社,2003.

[2] 楊小牛,樓才義,徐建良.軟件無線電原理與應(yīng)用[M].北京:電子工業(yè)出版社,2001.

篇3

[關(guān)鍵詞]主動(dòng)學(xué)習(xí);深度神經(jīng)網(wǎng)絡(luò);反饋;目標(biāo)識(shí)別

中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2016)08-0383-01

Object Feedback Recognition System Base on Deep Learning

Hao Liu1,Junyu Dong1,Xin Sun1,Muwei Jian1

[Abstract]This paper proposed a novel deep neural network based object recognition method with a feedback process by using an appropriate active learning method. It selects better non-labeled samples to feedback and retrain the deep neural network model, which makes the accuracy and robustness of the object recognition system improved gradually during use. The experiments show that the proposed method can recognize the target object in a fast way and improve the accuracy of application in the real scene gradually.

[Key words]Active Learning; Deep Neural Network; Feedback; Object Recognition

1.介紹

目標(biāo)識(shí)別一直以來都是機(jī)器學(xué)習(xí)領(lǐng)域研究的前沿問題,近些年來,出現(xiàn)了一些優(yōu)秀的基于特征的物體識(shí)別方法,例如基于梯度信息的SIFT/SURF[1]算法等,但隨著數(shù)據(jù)集樣本的增多,逐漸達(dá)到了一定的瓶頸。近年來,基于深度學(xué)習(xí)所提取的抽象特征在物體識(shí)別中取得了非常好的表現(xiàn)。2012年Krizhevsky等人通過使用卷積神經(jīng)網(wǎng)絡(luò)取得了較高的圖像分類準(zhǔn)確率。2014年R. Girshick[2]等人所提出的Region Based CNN算法在目標(biāo)識(shí)別領(lǐng)域也取得了較好的結(jié)果。雖然這些方法取得了較好的效果,但是日常生活中的場(chǎng)景是多變的,因此需要所得到的模型能夠自動(dòng)學(xué)習(xí)和適應(yīng)新的場(chǎng)景和需求,本文將基于RCNN方法提出一種帶反饋的自適應(yīng)學(xué)習(xí)目標(biāo)識(shí)別算法,它隨著反饋的增加,模型越來越完善和智能。

2.相關(guān)技術(shù)介紹

2.1 RCNN算法

Region Based CNN算法首先使用Selective search算法在圖像上產(chǎn)生約2000個(gè)候選窗口,進(jìn)行目標(biāo)檢測(cè)。然后使用CNN對(duì)每一個(gè)候選窗口提取4096維特征來表示每個(gè)Proposal,最后用SVM分類器對(duì)目標(biāo)進(jìn)行分類。

2.2 主動(dòng)反饋學(xué)習(xí)

主動(dòng)學(xué)習(xí)具有減少冗余和快速收斂的優(yōu)勢(shì)。通過一定的主動(dòng)學(xué)習(xí)方法選擇出一個(gè)或一批最有用的樣本,并向檢查者詢問標(biāo)簽,然后利用獲得的新知識(shí)來訓(xùn)練分類器和進(jìn)行下一輪查詢。本文使用主動(dòng)學(xué)習(xí)的思想對(duì)反饋?zhàn)R別過程進(jìn)行控制。

3.基于主動(dòng)學(xué)習(xí)的物體反饋?zhàn)R別

目標(biāo)反饋?zhàn)R別是一個(gè)智能化的交互過程,它先使用有限訓(xùn)練數(shù)據(jù)訓(xùn)練出一個(gè)初始分類模型,這個(gè)模型對(duì)物體進(jìn)行識(shí)別的準(zhǔn)確率可能并不高。接下來,我們希望后續(xù)的每次識(shí)別都能夠?yàn)槟P吞峁┬畔?,模型依?jù)這些信息重新訓(xùn)練,實(shí)現(xiàn)對(duì)分類模型的修改與完善。本文基于RCNN算法,首先使用有限標(biāo)定樣本進(jìn)行訓(xùn)練,利用RCNN 生成一個(gè)初始模型。然后每次使用主動(dòng)學(xué)習(xí)的方法,從未標(biāo)記樣本集中選擇出n0個(gè)最有用的、最利于完善分類模型的樣本圖像;最后利用檢查者對(duì)樣本所做的標(biāo)記,進(jìn)一步訓(xùn)練分類器,完善模型,迭代進(jìn)行,最終實(shí)現(xiàn)模型的自動(dòng)更新達(dá)到最優(yōu)的識(shí)別效果。

4.實(shí)驗(yàn)

以1.1圖的Train圖像為例進(jìn)行識(shí)別,圖1.2得到識(shí)別結(jié)果為Bus,識(shí)別發(fā)生錯(cuò)誤,此時(shí)使用本文方法進(jìn)行反饋,系統(tǒng)將結(jié)果反饋給分類模型,這樣選擇出的每張圖像都會(huì)反饋一個(gè)結(jié)果來優(yōu)化模型,迭代進(jìn)行。如果如圖1.3再次對(duì)這張圖像進(jìn)行識(shí)別,得到識(shí)別結(jié)果“未檢測(cè)到Bus”,識(shí)別正確,說明反饋過程起到了應(yīng)有的作用。通過實(shí)驗(yàn)可以表明,本文提出的方法會(huì)使物體識(shí)別變得越來越智能。

5.結(jié)論

本文提出的基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)反饋?zhàn)R別方法,使用主動(dòng)學(xué)習(xí)來對(duì)反饋?zhàn)R別過程進(jìn)行控制,通過對(duì)VOC2007數(shù)據(jù)集中的Train類圖像進(jìn)行識(shí)別試驗(yàn)的結(jié)果可以看到,本文提出的方法成功提升了目標(biāo)識(shí)別系統(tǒng)的準(zhǔn)確度和魯棒性,逐漸提升了在復(fù)雜多樣的真實(shí)場(chǎng)景下識(shí)別目標(biāo)的準(zhǔn)確度,使得系統(tǒng)越來越完善與智能,最終實(shí)現(xiàn)了非常好的目標(biāo)識(shí)別效果。

參考文獻(xiàn)

篇4

關(guān)鍵詞:化學(xué)計(jì)量學(xué) 分析化學(xué) 人工神經(jīng)網(wǎng)絡(luò)

化學(xué)計(jì)算學(xué)作為化學(xué)的分支學(xué)科,起步較晚,在涉及內(nèi)容上又比較廣闊,涉及到數(shù)學(xué)、統(tǒng)計(jì)學(xué)及計(jì)算機(jī)應(yīng)用技術(shù)等相關(guān)學(xué)科,可以說是一門交叉性的學(xué)科。正是因?yàn)榭茖W(xué)技術(shù)的發(fā)展及多學(xué)科相互滲透的作用才誕生了化學(xué)計(jì)量學(xué)這門獨(dú)特的學(xué)科。涵蓋于化學(xué)測(cè)量的整個(gè)過程,采樣理論、實(shí)驗(yàn)設(shè)計(jì)、選擇與優(yōu)化、變量處理及數(shù)據(jù)分析斗屬于化學(xué)計(jì)量學(xué)?;瘜W(xué)計(jì)量學(xué)擔(dān)負(fù)的主要任務(wù)是進(jìn)行化學(xué)測(cè)量數(shù)據(jù)的分析與處理,進(jìn)行測(cè)量程序與實(shí)驗(yàn)方法的最佳選擇,最早由瑞典化學(xué)家提出,一直沿用至今。正是因?yàn)榛瘜W(xué)計(jì)量學(xué)的巨大作用,解決了傳統(tǒng)化學(xué)研究中不能攻破的難題,成為化學(xué)研究的新方向與關(guān)注點(diǎn)。

一、化學(xué)計(jì)量學(xué)對(duì)于化學(xué)測(cè)量的應(yīng)用分析

在化學(xué)研究中,需要將化學(xué)計(jì)量學(xué)滲透于化學(xué)測(cè)量的全過程。在上世紀(jì)五十年代以來,新的化學(xué)儀器分析方法已經(jīng)被充分的引入到分析化學(xué)中,分析測(cè)試工作已經(jīng)逐步實(shí)現(xiàn)了儀器化、自動(dòng)化與初步的計(jì)算機(jī)化,這些技術(shù)的深入應(yīng)用,為化學(xué)分析提供了可靠的測(cè)量數(shù)據(jù),但是將這些分析儀器的優(yōu)點(diǎn)結(jié)合起來,將雜亂無章的數(shù)據(jù)信息進(jìn)行重新排列組合,最大限度的解決信息的篩選,成為化學(xué)研究工作者當(dāng)前面臨的最大難題。

化學(xué)計(jì)量學(xué)在解決這一問題中發(fā)揮了重大作用。將分析分離技術(shù)集于一體,通過特定的高維儀器產(chǎn)生分析信號(hào),利用新型的分析信號(hào)多元校正及有效分辨方法進(jìn)行復(fù)雜多組分的體系定性,進(jìn)行定量解析。利用這種化學(xué)計(jì)量學(xué)的方法可以對(duì)巨大的數(shù)據(jù)信息進(jìn)行有效的篩選,從而提取最有用的信息,對(duì)這些有用信息進(jìn)行分析,實(shí)現(xiàn)了單純的“數(shù)據(jù)提供者”到“問題解決者”的角色轉(zhuǎn)變。化學(xué)計(jì)量法對(duì)于化學(xué)測(cè)量產(chǎn)生的影響是深遠(yuǎn)且巨大的?;瘜W(xué)計(jì)量法應(yīng)該貫穿于化學(xué)測(cè)量的全過程。

二、當(dāng)前化學(xué)計(jì)量學(xué)在分析化學(xué)中的應(yīng)用分析

(一)化學(xué)計(jì)量學(xué)在化學(xué)定量構(gòu)效關(guān)系中的應(yīng)用分析

化學(xué)定量構(gòu)效關(guān)系研究是化學(xué)學(xué)科的根本性研究問題,結(jié)合物質(zhì)的化學(xué)成分與基本的結(jié)構(gòu)進(jìn)行化學(xué)性質(zhì)的測(cè)定,是我國目前化學(xué)理論研究中的重要目標(biāo)。在進(jìn)行研究時(shí)一般采用圖論與數(shù)值的方法進(jìn)行各種化合物的表征,將所獲取的計(jì)算結(jié)果與實(shí)際的被測(cè)量化學(xué)物的物理、化學(xué)及生物特性結(jié)合起來,用比較明確的定量關(guān)系來代替含糊的定性描述。目前化學(xué)計(jì)量學(xué)在進(jìn)行分析化學(xué)研究時(shí)引入了全局最優(yōu)算法,在利用誤差反向傳播的多層次感知模型進(jìn)行苯酚衍生物的活性測(cè)驗(yàn)時(shí)取得了明顯的研究效果,較之先前的研究方法,改進(jìn)是十分明顯的。

(二)化學(xué)計(jì)量學(xué)中模式識(shí)別方法在分析化學(xué)中的應(yīng)用

化學(xué)計(jì)量學(xué)中的模式識(shí)別法是根據(jù)化學(xué)測(cè)量數(shù)據(jù)矩陣,對(duì)樣本集通過樣本性質(zhì)進(jìn)行分類進(jìn)行選取的方法。根據(jù)測(cè)量在多維模式空間中的相對(duì)位置不同,用線性判斷識(shí)別分析法、最鄰近法等進(jìn)行模式的識(shí)別。模式識(shí)別法的研究能夠?yàn)闆Q策及過程優(yōu)化提供最有實(shí)用價(jià)值的信息資料。我國石油化工行業(yè)、材料化學(xué)研究領(lǐng)域都基于該思想破解了很多研發(fā)難題。其中K―最鄰近法從伏安波匯總對(duì)重疊的伏安響應(yīng)信號(hào)進(jìn)行區(qū)分,將K―最鄰近法用于電位階伏安波及毛細(xì)管曲線分類中,實(shí)現(xiàn)了對(duì)有機(jī)化合物構(gòu)效關(guān)系的有效表征。二SMCA法最廣泛的應(yīng)用就是食品的鑒定。

(三)化學(xué)計(jì)量學(xué)的人工神經(jīng)網(wǎng)絡(luò)應(yīng)用分析

除了我們上面提到的應(yīng)用,化學(xué)計(jì)量學(xué)在神經(jīng)網(wǎng)絡(luò)應(yīng)用方面也發(fā)揮了積極的作用。所謂的人工神經(jīng)網(wǎng)絡(luò)是基于現(xiàn)代生物學(xué)的對(duì)人腦組織進(jìn)行研究而提出的,利用大量的簡(jiǎn)單的處理單元進(jìn)行充分連接,從而形成的巨大的復(fù)雜的網(wǎng)絡(luò)體系,主要是用來模擬人的大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)域的一定神經(jīng)行為。人工神經(jīng)網(wǎng)絡(luò)可以對(duì)數(shù)據(jù)模式進(jìn)行合理的解析與分類,對(duì)于原因與結(jié)果關(guān)系不確定的非線性測(cè)量數(shù)據(jù)有著獨(dú)特的應(yīng)用。分析化學(xué)的不確定性很多,借助于化學(xué)計(jì)量學(xué)的人工神經(jīng)網(wǎng)絡(luò)得到了有效的應(yīng)用解決。從目前神經(jīng)網(wǎng)絡(luò)的應(yīng)用情況來看,在譜圖分析、藥物分子藥效的預(yù)測(cè)及蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)方面都取得了不錯(cuò)的成績(jī)。此外,在分析化學(xué)中應(yīng)用比較廣泛的還有遺傳算法,遺傳算法可以進(jìn)行多組分分析波長(zhǎng)選擇、數(shù)據(jù)校正優(yōu)化、核磁共振脈沖波形選擇等。人工神經(jīng)網(wǎng)絡(luò)還進(jìn)一步促進(jìn)了儀器聯(lián)機(jī)與實(shí)驗(yàn)的自動(dòng)化。在生產(chǎn)方面起到了重要的指導(dǎo)作用。

(四)化學(xué)計(jì)量法波普化學(xué)的應(yīng)用分析

目前在化學(xué)研究中,化學(xué)家們一直努力的目標(biāo)主要是波普數(shù)據(jù)庫的有效利用。波普數(shù)據(jù)庫的質(zhì)譜、核磁共振譜、色譜等復(fù)雜分析體系的快速定性定量分析都是當(dāng)前研究的重點(diǎn)。化學(xué)計(jì)量學(xué)為這方面的研究提供了新的突破口。各種濾波、平滑、交換、卷積技術(shù)的應(yīng)用,促進(jìn)了分析化學(xué)的發(fā)展??梢灾苯犹峁┎豢煞蛛x的直接地測(cè)定相互干擾的共存性物種,對(duì)于完全未知的混合物也可以實(shí)現(xiàn)準(zhǔn)確的測(cè)定。

(五)化學(xué)計(jì)量法的多元校正分析應(yīng)用

我國化學(xué)的多元化分析成為今后化學(xué)研究的大趨勢(shì),不僅在研究目標(biāo)上體現(xiàn)出多元化,對(duì)于研究對(duì)象也呈現(xiàn)出多元化的特性。這對(duì)于化學(xué)研究工作者是不小的挑戰(zhàn)。要求化學(xué)工作者能夠快速、準(zhǔn)確的定位與定量,從而得出分析結(jié)果。在這樣的背景下,多元校正法應(yīng)用而生,其產(chǎn)生為現(xiàn)代分析儀器提供了大量的測(cè)量數(shù)據(jù),并對(duì)這些數(shù)據(jù)進(jìn)行了解析,可以說多元校正法是新型的數(shù)學(xué)統(tǒng)計(jì)方法。多元校正法在多個(gè)方面進(jìn)行了研究?jī)?yōu)化,靈敏度、檢測(cè)度、精密度等都對(duì)指標(biāo)進(jìn)行了優(yōu)化,在對(duì)這些指標(biāo)優(yōu)化后,大大擴(kuò)展了分析儀器的功能與方法的有效及實(shí)用性。正是因?yàn)檎辉O(shè)計(jì)、均勻性設(shè)計(jì)分析、板因式設(shè)計(jì)分析等多種實(shí)驗(yàn)設(shè)計(jì)優(yōu)化方法的相互協(xié)調(diào),對(duì)分析選擇性進(jìn)行了改善,在一定程度上拓寬了其化學(xué)計(jì)量法多元校正的應(yīng)用領(lǐng)域。

三、結(jié)束語:

化學(xué)計(jì)量學(xué)從產(chǎn)生到現(xiàn)在大約只有30多年的歷史,但是在短短的幾十年內(nèi),其應(yīng)用不斷得到普及,其應(yīng)用效果不斷得到化學(xué)行業(yè)的肯定。將來,化學(xué)計(jì)量學(xué)將依然是令人關(guān)注的問題,有著廣闊而光明的前景?;瘜W(xué)計(jì)量學(xué)不斷發(fā)展,將對(duì)儀器的智能化分析提供新的研究理論與方法途徑,為高維聯(lián)用儀器的發(fā)展提供新的突破口與改進(jìn)點(diǎn)。通過本文對(duì)化學(xué)計(jì)量學(xué)在分析化學(xué)中的應(yīng)用分析,我們?cè)诳吹交瘜W(xué)計(jì)量學(xué)優(yōu)勢(shì)作用的同時(shí),更應(yīng)該看到其發(fā)展中的不足,針對(duì)這些不足進(jìn)行研究分析,在進(jìn)行多次驗(yàn)證的基礎(chǔ)上尋找新的解決途徑,完善這些不足,為化學(xué)計(jì)量學(xué)的發(fā)展提供更加廣闊的發(fā)展空間。在分析化學(xué)發(fā)展領(lǐng)域,增強(qiáng)對(duì)化學(xué)計(jì)量學(xué)的引入是今后化學(xué)研究發(fā)展的一個(gè)大方向。

參考文獻(xiàn)

[1]黃丹.淺談化學(xué)計(jì)量學(xué)在分析化學(xué)中的應(yīng)用及發(fā)展前景[J].今日科苑.2009(08).

[2]周統(tǒng)武,蔡娟.化學(xué)計(jì)量學(xué)的學(xué)科現(xiàn)狀與發(fā)展方向[J].中國科技信息,2009(03).

[3]周南.關(guān)于“分析化學(xué)中的計(jì)量學(xué)與質(zhì)量保證”的國際研討會(huì)[J].理化檢驗(yàn)(化學(xué)分冊(cè)),2007(03).

篇5

關(guān)鍵詞:PCB;圖像處理;視覺檢測(cè)

中圖分類號(hào):TP277文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)07-1648-06

當(dāng)今世界科技發(fā)展日新月異,電子產(chǎn)業(yè)的發(fā)展直接制約著國民經(jīng)濟(jì)的騰飛與否,而PCB電路板制作工藝的提高對(duì)促進(jìn)電子產(chǎn)業(yè)的發(fā)展至關(guān)重要,能否有效精確地檢測(cè)PCB電路板的缺陷一直都是電子行業(yè)的研究熱點(diǎn)。國外的印刷電路板自動(dòng)檢測(cè)技術(shù)一直領(lǐng)先于國內(nèi),國內(nèi)的很多廠家不得不采用昂貴的外國技術(shù),雖然近年國內(nèi)的印刷電路板自動(dòng)檢測(cè)技術(shù)發(fā)展迅速,但大都沒有取得令人非常滿意的結(jié)果。加入研究這一領(lǐng)域的熱潮,趕超外國的先進(jìn)技技水平,打斷外國壟斷技術(shù),對(duì)于發(fā)展國民經(jīng)濟(jì)具有十分重要的意義。

1 PCB檢測(cè)系統(tǒng)的硬件設(shè)計(jì)

1.1 PCB檢測(cè)系統(tǒng)的硬件組成框圖

雖然本文所做的工作主要是軟件方面,但對(duì)于硬件系統(tǒng)的設(shè)計(jì)也是至關(guān)重要的,它對(duì)于建立有效的計(jì)算機(jī)視覺識(shí)別檢測(cè)系統(tǒng),起著決定性作用。因此,必須在綜合考慮系統(tǒng)性價(jià)比和系統(tǒng)性能的基礎(chǔ)上,設(shè)計(jì)出合理的硬件系統(tǒng)[9]。PCB檢測(cè)系統(tǒng)的硬件組成框圖如圖1所示:圖1 PCB檢測(cè)系統(tǒng)硬件組成框圖

1.2系統(tǒng)的硬件組成

系統(tǒng)的硬件組成[10]主要包括:計(jì)算機(jī)主機(jī)、CCD攝像機(jī)、圖像采集卡、照明系統(tǒng)及相關(guān)的設(shè)備。

2 PCB電路板缺陷檢測(cè)識(shí)別

PCB電路板在電子工業(yè)中的應(yīng)用越來越廣泛,如何降低電路板的故障率、提高電路板的質(zhì)量直接影響到整個(gè)產(chǎn)業(yè)的發(fā)展。因此,對(duì)于PCB電路板缺陷的識(shí)別技術(shù)的發(fā)展至關(guān)重要。PCB電路板的缺陷很多[16],主要有短路、斷路、劃痕、凸起、空洞、缺焊、過焊等等,由于實(shí)驗(yàn)室設(shè)備限制和個(gè)人水平所限,本文主要研究的內(nèi)容是PCB電路板短路與斷路的檢測(cè)識(shí)別

近年來出現(xiàn)了很多圖像檢測(cè)算法,這些算法大致可分為三大類:有參考算法、無參考算法以及混合型算法。有參考算法分為兩大類:圖像對(duì)比法和模型對(duì)比法。無參考算法是一種不需要標(biāo)準(zhǔn)圖像的檢測(cè)算法,它是基于一定的設(shè)計(jì)規(guī)則來進(jìn)行檢測(cè)的?;旌闲头椒ㄊ菍⒂袇⒖妓惴ㄅc無參考算法混合使用,從而發(fā)揮出各自的優(yōu)點(diǎn)。比如,模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用,或者連接表方法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用等。本文中短路與斷路的檢測(cè)識(shí)別采取了圖像對(duì)比法,即將經(jīng)過一定處理后的圖像進(jìn)行相減,從而分析相應(yīng)的結(jié)果;而對(duì)焊點(diǎn)缺陷的識(shí)別主要采用模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用。

2.1 PCB電路板缺陷檢測(cè)識(shí)別的主要流程圖

圖2為子程序流程圖;圖3為主程序流程圖。

2.2 PCB電路板短路與斷路的檢測(cè)識(shí)別

2.2.1邊緣檢測(cè)

在對(duì)圖像進(jìn)行基本的處理過后可以將圖像與背景分割開來。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺中的基本問題,邊緣檢測(cè)的目的是標(biāo)識(shí)數(shù)字圖像中亮度變化明顯的點(diǎn)。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化。

這些包括:深度上的不連續(xù);表面方向不連續(xù);物質(zhì)屬性變化;場(chǎng)景照明變化。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺中,尤其是特征提取中的一個(gè)研究領(lǐng)域。

圖像邊緣檢測(cè)大幅度地減少了數(shù)據(jù)量,并且剔除了可以認(rèn)為不相關(guān)的信息,保留了圖像重要的結(jié)構(gòu)屬性。有許多方法用于邊緣檢測(cè),它們的絕大部分可以劃分為兩類[17]:基于查找一類和基于零穿越的一類。基于查找的方法通過尋找圖像一階導(dǎo)數(shù)中的最大和最小值來檢測(cè)邊界,通常是將邊界定位在梯度最大的方向?;诹愦┰降姆椒ㄍㄟ^尋找圖像二階導(dǎo)數(shù)零穿越來尋找邊界,通常是Laplacian過零點(diǎn)或者非線性差分表示的過零點(diǎn)。

1)Roberts算子

邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募稀D像的邊緣對(duì)應(yīng)著圖像灰度的不連續(xù)性。顯然圖像的邊緣很少是從一個(gè)灰度跳到另一個(gè)灰度這樣的理想狀況。真實(shí)圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡狀。邊緣的銳利程度由圖像灰度的梯度決定。梯度是一個(gè)向量,?f指出灰度變化的最快的方向和數(shù)量,如式2-1所示。

?f=(決定的。

因此最簡(jiǎn)單的邊緣檢測(cè)算子是用圖像的垂直和水平差分來逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)

因此當(dāng)我們想尋找邊緣的時(shí)候,最簡(jiǎn)單的方法是對(duì)每一個(gè)像素計(jì)算出(2,4)的向量,然后求出他的絕對(duì)值,然后進(jìn)行閥值操作就可以了。利用這種思想就得到了Roberts算子,由式2-5所示。

R(i,j)=

(式2-5)

它是一個(gè)兩個(gè)2×2模板作用的結(jié)果。

2)Sobel算子

該算法通過2個(gè)3*3的模板,對(duì)選定的二維圖像中同樣大小窗口進(jìn)行卷積,通常是一個(gè)模板對(duì)一個(gè)邊緣響應(yīng)大,另一個(gè)模板對(duì)水平邊緣響應(yīng)大,兩個(gè)卷積值對(duì)最大值作為該點(diǎn)對(duì)輸出。對(duì)于圖像上的任意點(diǎn)(i,j)進(jìn)行卷積,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)則輸出圖像公式如式2-8所示。

用sobel算子檢測(cè)階躍邊緣得到的邊緣寬度至少為兩個(gè)寬度。3)Laplacian邊緣檢測(cè)算子

Laplacian算子定義由式2-9所示。

Δ2f(x,y)=

(式2-9)它的差分形式由式2-10所示。

Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}

=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)

Laplacian算子是一種各向同性算子,在只關(guān)心邊緣的位置而不考慮其周圍的灰度象素差值時(shí)時(shí)比較合適,Laplacian算子對(duì)孤立象素的響應(yīng)要比對(duì)邊緣或線的響應(yīng)更要強(qiáng)烈,因此只適用于無噪聲圖像。

原圖像與用三種邊緣檢測(cè)算子處理后的圖像如下所示:圖6 Sobel邊緣檢測(cè)圖7 Laplacian邊緣檢測(cè)

從上面四幅圖分析比較可得出結(jié)論:用Roberts邊緣檢測(cè)得出的圖像較之其他方法更為清晰,噪點(diǎn)更少,圖像更為連續(xù),所以本文中采用Roberts算子來進(jìn)行邊緣檢測(cè)。

2.2.2閾值分割

閾值分割法是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過設(shè)定不同的特征閾值,把圖像象素點(diǎn)分為若干類。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。設(shè)原始圖像為f(x,y),按照一定的準(zhǔn)則f(x,y)中找到特征值T,將圖像分割為兩個(gè)部分,分割后的圖像為:

若?。篵0=0(黑),b1=1(白),即為我們通常所說的圖像二值化。

在數(shù)字化的圖像數(shù)據(jù)中,無用的背景數(shù)據(jù)和對(duì)象物的數(shù)據(jù)經(jīng)常放在一起,同時(shí),圖像中還含有各種噪聲,因此可以根據(jù)圖像的統(tǒng)計(jì)性質(zhì),從概率的角度來選擇合適的閾值。

1)最大方差閾值法

把待處理圖像的直方圖在某一閾值處分割為兩組,當(dāng)被分割成的兩組間的方差最大時(shí),便可以決定閾值了。

設(shè)灰度圖像f(x,y)的灰度級(jí)為0-L,灰度級(jí)I的像素為Ni,則圖中:

總象素?cái)?shù)N=∑j=0 i=LNi(式2-11)灰度級(jí)i出現(xiàn)的概率Pi= 1-ω(K)(式2-16)則兩組間的數(shù)學(xué)期望為ω0μ0ω1μ1=μ(式2-17)兩組間的方差為ρ2(k)

ρ2(k)是K的函數(shù),計(jì)算k取從0,1,2…L時(shí)ρ2(k)的值,當(dāng)多的值為最大時(shí),K即為閾值。

2)雙峰法

根據(jù)圖像的直方圖具有背景和對(duì)象物的兩個(gè)峰,分割兩個(gè)區(qū)域的閾值由兩個(gè)峰值之間的谷所對(duì)應(yīng)的灰度值決定。設(shè)灰度圖像f(x,y)的灰度級(jí)為0-L,灰度i的像素為Pi,分別計(jì)算

因?yàn)閷?shí)際PCB電路板有著許多的劃痕、污點(diǎn)等,使用最大方差閾值法時(shí),會(huì)在處理后的圖像上產(chǎn)生許多誤點(diǎn),而影響實(shí)際結(jié)果的分析,而雙峰法能夠順利地濾除這些干擾,這個(gè)結(jié)論在分析對(duì)比以上圖像時(shí)也可得出。所以本文選用了雙峰法來進(jìn)行閾值分割。

2.2.3粒子分析與圖像對(duì)比

經(jīng)過邊緣檢測(cè)和閾值分割的圖像中會(huì)存在許多瑕點(diǎn),這些點(diǎn)會(huì)影響到最后的圖像識(shí)別與分析,有可能會(huì)增加多余的殘留圖像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能進(jìn)行去除,如圖11和圖12所示。圖11原圖像圖12粒子分析

將標(biāo)準(zhǔn)PCB圖片減去缺陷缺陷PCB圖片,便可以得到缺陷板的斷路部分的圖像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到斷路部分的具體分析,如圖13示。

將缺陷PCB圖片減去標(biāo)準(zhǔn)PCB圖片,便可以得到缺陷板的短路部分的圖像,與上述相同的方法,便可以得到短路部分的具體分析,如圖14所示。

3結(jié)束語

利用LABVIEW來進(jìn)行PCB電路板缺陷的識(shí)別與檢測(cè)是一項(xiàng)非常好的課題,它在近些年已經(jīng)得到了一定的發(fā)展,并將得到更大的進(jìn)步。限于本人能力和時(shí)間,本文的研究還未涉及很深的領(lǐng)域,可以在以下方面加以改進(jìn):

1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的設(shè)計(jì)可以再利用其他語言如VISUAL BASIC,C++等編程語言加以輔助設(shè)計(jì),相信可以取得更加令人滿意的結(jié)果。

2)由于實(shí)驗(yàn)設(shè)備等其他因素,本文中只重點(diǎn)研究了PCB電路板短路與斷路的檢測(cè)識(shí)別,PCB電路板的其他缺陷還有待于進(jìn)一步的分析研究、分類和總結(jié),并設(shè)計(jì)出更好的檢測(cè)方法,以真正滿足PCB電路板檢測(cè)的需求。

3)照明設(shè)備的限制在很大程度上影響到了圖像的檢測(cè)效果,為取得PCB缺陷檢測(cè)的進(jìn)一步進(jìn)展,在照明設(shè)備的選擇上必須重視,并且設(shè)計(jì)出更好的圖像采集系統(tǒng)。

4)在識(shí)別與檢測(cè)手段上,可以引入更新更好的方法,而不要局限于在傳統(tǒng)的方法中分析比較,例如基于BP神經(jīng)網(wǎng)絡(luò)的識(shí)別檢測(cè),圖像的模糊決策等將有待于進(jìn)一步研究。

總之,基于LABVIEW的機(jī)器視覺檢測(cè)系統(tǒng)已經(jīng)取得了不錯(cuò)的進(jìn)展,高速發(fā)展的PCB制造技術(shù)和計(jì)算機(jī)技術(shù)對(duì)于PCB缺陷的檢測(cè)提出了更高的要求,同時(shí)也大大地促進(jìn)了PCB缺陷檢測(cè)技術(shù)的發(fā)展。利用機(jī)器視覺檢測(cè)在未來的較長(zhǎng)的一段時(shí)間內(nèi)將占據(jù)檢測(cè)行業(yè)的半壁江山,相信在未來會(huì)取得更大的發(fā)展。

參考文獻(xiàn):

[1]程學(xué)慶,房曉溪.LabVIEW圖形化編程與實(shí)例應(yīng)用[M].北京:中國鐵道出版社,2005.

[2]胡仲波.基于虛擬儀器技術(shù)的PCB視覺檢測(cè)系統(tǒng)[D].南京:南京理工大學(xué)碩士學(xué)位論文,2006.

[3]段峰,王耀南.機(jī)器視覺技術(shù)及其應(yīng)用綜述[J].自動(dòng)化博覽,2002,19(3).

[4]周長(zhǎng)發(fā).精通Visual C++圖像處理編程[M].北京:電子工業(yè)出版社,2004.

[5]陳錫輝,張銀鴻.LabVIEW 8.20程序設(shè)計(jì)從入門到精通[M].北京:清華大學(xué)出版社,2007.

[6]鄭偉.圖像法檢測(cè)印刷電路板缺陷[M].西安:西安理工大學(xué),2002.

[7] National Instruments,IMAQ User Manual Concepts[Z].1999.

[8]李強(qiáng).PCB板缺陷自動(dòng)檢測(cè)技術(shù)的分析研究[D].合肥:合肥工業(yè)大學(xué),2002.

[9]傅茂名.基于形態(tài)邊緣檢測(cè)算法的一種改進(jìn)[J].電子科技大學(xué)學(xué)報(bào),2005(2).

[10]王思華.計(jì)算機(jī)視覺新技術(shù)及其在IC標(biāo)記質(zhì)量檢驗(yàn)系統(tǒng)設(shè)計(jì)中的應(yīng)用[J].電子技術(shù)應(yīng)用,2000(9).

[11]岳永哲.圖像處理技術(shù)在閱卷系統(tǒng)中的應(yīng)用[D].北京:北京工業(yè)大學(xué),2006.

[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.

[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.

[14]高育鵬,楊俊,何廣軍.基于圖像識(shí)別的自動(dòng)閱卷系統(tǒng)研究[J].現(xiàn)代電子期刊,2006(22).

[15]楊青燕,彭延軍.基于灰度圖像的答題卡識(shí)別技術(shù)[J].山東科技大學(xué)學(xué)報(bào):自然科學(xué)版,2009(3).

[16]周海濤,韓曉軍.基于數(shù)字圖像處理的答題卡識(shí)別方法研究[J].電腦知識(shí)與技術(shù),2008(28).

[17]周萬珍,鄭廣,王建霞,等.數(shù)字圖像處理技術(shù)在客觀題閱卷中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006(8).

[18]王勝春.基于SVM的信息卡識(shí)別系統(tǒng)[D].長(zhǎng)沙:湖南師范大學(xué),2008.

[19]吳志明.SMT系統(tǒng)中焊點(diǎn)位置的檢測(cè)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2006.

[20]楊敏,王春青,鄒增大,等.表面組裝印刷電路板上焊點(diǎn)信息的自動(dòng)獲取[J].焊接學(xué)報(bào),2005,39(6).