卷積神經(jīng)網(wǎng)絡(luò)概念范文

時(shí)間:2024-03-28 17:40:46

導(dǎo)語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡(luò)概念,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

卷積神經(jīng)網(wǎng)絡(luò)概念

篇1

關(guān)鍵詞: 模式識(shí)別; 神經(jīng)網(wǎng)絡(luò); 卷積; 文字識(shí)別

中圖分類號(hào): TN711?34; TP391.4 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)20?0019?03

Large pattern online handwriting character recognition based on multi?convolution neural network

GE Ming?tao1, WANG Xiao?li1, PAN Li?wu2

(1. SIAS International School, Zhengzhou University, Zhengzhou 451150, China;

2. Henan University of Animal Husbandry and Economy, Zhengzhou 450011, China)

Abstract: Online handwriting character recognition is an important field in the research of pattern recognition. The traditional recognition method is based on the common convolutional neural networks (CNNs) technology. It has an efficient recognition rate for the small pattern character set online handwriting characters, but has low recognition rate for the large pattern character set recognition. A recognition method based on multi?convolutional neural networks (MCNNs) is presented in this paper to overcome the situation that the previous methods have the low recognition rate for large pattern character set and improve the recognition rate for the large pattern handwriting character set recognition. The stochastic diagonal Levenbert?Marquardt method is used in the system for training optimization. The experimental results show that the proposed method has the recognition rate of 89% and has a good prospect for online handwriting character recognition for large scale pattern.

Keywords: pattern recognition; neural network; convolution; character recognition

0 引 言

隨著全球信息化的飛速發(fā)展和對(duì)自動(dòng)化程度要求的不斷提高 ,手寫文字識(shí)別技術(shù)被廣泛地應(yīng)用到許多方面。特別是近幾年擁有手寫功能的手機(jī)、平板電腦等智能電子產(chǎn)品的普及,聯(lián)機(jī)手寫文字識(shí)別研究已經(jīng)成為一個(gè)備受關(guān)注的主題。聯(lián)機(jī)手寫字符識(shí)別要求實(shí)時(shí)性較高,識(shí)別過程中要求特征空間的維數(shù)比較高,在進(jìn)行特征樣本訓(xùn)練時(shí)要求訓(xùn)練的數(shù)目很大,要匹配的特征值或特征對(duì)象比較多 [1?2]。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNNs)的優(yōu)點(diǎn)在于圖像的識(shí)別過程中對(duì)視覺模式的獲得是直接從原始圖像中獲得的,所以在設(shè)計(jì)系統(tǒng)時(shí)圖像的預(yù)處理工作很少,與一般神經(jīng)網(wǎng)絡(luò)相比是一種高效的識(shí)別方法。卷積神經(jīng)網(wǎng)絡(luò)在模式識(shí)別的一些領(lǐng)域具有很好的魯棒性,如在識(shí)別有變化的模式和對(duì)幾何變形的識(shí)別方面。利用卷積神經(jīng)網(wǎng)絡(luò)的手寫識(shí)別方法具有如下一些優(yōu)點(diǎn):對(duì)于要檢測的圖像可以與事先制定網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)之間有較高的匹配率;特征提取和模式分類同時(shí)進(jìn)行;訓(xùn)練參數(shù)往往是系統(tǒng)計(jì)算量的重要參數(shù),而卷積神經(jīng)網(wǎng)絡(luò)中利用權(quán)值共享技術(shù),這樣就可以大大降低該參數(shù),在設(shè)計(jì)系統(tǒng)結(jié)構(gòu)時(shí)使得結(jié)構(gòu)變得更簡單,從而使得整個(gè)系統(tǒng)具有更好的適應(yīng)性[3?5]。

目前,人機(jī)交互系統(tǒng)的手寫字符識(shí)別、汽車車牌號(hào)識(shí)別和信息安全中常用的人臉識(shí)別等領(lǐng)域都有卷積神經(jīng)網(wǎng)絡(luò)的成功應(yīng)用。文獻(xiàn)[6]用一個(gè)4層的卷積神經(jīng)網(wǎng)絡(luò)LeNet?5對(duì)Mnist庫進(jìn)行識(shí)別實(shí)驗(yàn),獲得了98.4%的識(shí)別率,用2層的BP網(wǎng)絡(luò)的識(shí)別率[4,6]是87%。許多學(xué)者對(duì)卷積神經(jīng)網(wǎng)絡(luò)在聯(lián)機(jī)手寫文字識(shí)別方面做了多方位的研究。 但是,這些成功的聯(lián)機(jī)手寫文字識(shí)別主要是針對(duì)小模式字符集,利用以往的這些方法對(duì)大規(guī)模模式分類的聯(lián)機(jī)手寫文字的識(shí)別依然有識(shí)別率不高的問題。本文介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本概念和一種典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),給出了基于多重卷積神經(jīng)網(wǎng)絡(luò)的字符識(shí)別和詞語識(shí)別模型。通過使用大字符集的UNIPEN數(shù)據(jù)庫進(jìn)行訓(xùn)練和測試,本文提出的方法在大模式聯(lián)機(jī)手寫識(shí)別上,取得了較高的識(shí)別速度和滿意的識(shí)別率。

1 卷積神經(jīng)網(wǎng)絡(luò)

文獻(xiàn)[6?7]中詳細(xì)地描述了卷積神經(jīng)網(wǎng)絡(luò)如何保證圖像對(duì)位移、縮放、扭曲魯棒性能。典型的手寫字符卷積神經(jīng)網(wǎng)絡(luò)LeNET 5的結(jié)構(gòu)圖如圖1所示[6?7]。

圖1 典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

在圖1中,輸入層接收要識(shí)別32×32的手寫字符圖像,經(jīng)過簡單的大小歸一化和圖像灰度處理,之后的結(jié)果作為一個(gè)采樣層的圖像;然后用一個(gè)可學(xué)習(xí)核進(jìn)行卷積操作,卷積結(jié)果經(jīng)過激活函數(shù)的輸出形成這一層的神經(jīng)元,每個(gè)神經(jīng)元與輸入圖像的一個(gè)5×5的鄰域相連接,從而得到由6幅特征圖組成的第一個(gè)隱層(C1層)。每個(gè)特征圖有25個(gè)權(quán)值(如方向線段,端點(diǎn)、角點(diǎn)等),考慮到邊界效果,得到的特征圖的大小是28×28,小于輸入圖層[3?9]。卷積層的數(shù)學(xué)計(jì)算過程可表示為:

[xlj=fi∈Mjxl-1j*kernellij+blj] (1)

式中:[l] 代表層數(shù);kernel是卷積核;[Mj]代表輸入特征圖的一個(gè)選擇。每個(gè)輸出圖有一個(gè)偏置[b]。

每個(gè)卷積層的結(jié)果作為下一個(gè)次采樣層的輸入,次采樣層的作用是對(duì)輸入信息進(jìn)行抽樣操作。如果輸入的特征圖為n個(gè),則經(jīng)過次采樣層后特征圖的個(gè)數(shù)仍然為n,但是輸出的特征圖要變?。ɡ?,各維變?yōu)樵瓉淼?0%)。因此隱層S2是由6個(gè)大小為14×14的特征圖組成的次采樣層。次采樣層計(jì)算公式可以用式(2)表示:

[xlj=fβl-1jdown(xl-1j)+blj] (2)

式中down(?) 表示次采樣函數(shù)。次采樣函數(shù)一般是對(duì)該層輸入圖像的一個(gè)n×n大小的區(qū)域求和,因此,輸出圖像的大小是輸入圖像大小的[1n]。每一個(gè)輸出的特征圖有自己的β和b。

類似的,C3層有16個(gè)10×10的特征圖組成的卷積層,特征圖的每個(gè)神經(jīng)元與S2網(wǎng)絡(luò)層的若干個(gè)特征圖的5×5的鄰域連接。網(wǎng)絡(luò)層S4是由16個(gè)大小為5×5的特征圖組成的次采樣層。特征圖的每個(gè)神經(jīng)元與C3層的一個(gè)2×2大小的鄰域相連接。網(wǎng)絡(luò)層C5是由120個(gè)特征圖組成的卷積層。每個(gè)神經(jīng)元與S4網(wǎng)絡(luò)層的所有特征圖的5×5大小的鄰域相連接。網(wǎng)絡(luò)層F6,包括84個(gè)神經(jīng)元,與網(wǎng)絡(luò)層C5進(jìn)行全連接。最后,輸出層有10個(gè)神經(jīng)元,是由徑向基函數(shù)單元(RBF)組成,輸出層的每個(gè)神經(jīng)元對(duì)應(yīng)一個(gè)字符類別。RBF單元的輸出yi的計(jì)算方法如式(3)所示:

[yi=j(xj-wij)2] (3)

很多研究人員通過對(duì)字符集作彈性訓(xùn)練,經(jīng)測試發(fā)現(xiàn)在MNIST字符集上的識(shí)別率可以高達(dá)99%以上[6?7] 。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)主要是對(duì)小模式集上,如對(duì)數(shù)字或26個(gè)英文字母組成的集合都有著較高的識(shí)別率。然而,對(duì)大模式集的識(shí)別仍然是一個(gè)挑戰(zhàn),因?yàn)樵O(shè)計(jì)一個(gè)優(yōu)化的并足夠大的單一網(wǎng)絡(luò)是比較困難的,且訓(xùn)練時(shí)間也較長。因此,本文的目的旨在通過組合多個(gè)對(duì)某一字符集有高識(shí)別率的卷積神經(jīng)網(wǎng)絡(luò),從而構(gòu)成多重卷積神經(jīng)網(wǎng)絡(luò),進(jìn)而提高卷積神經(jīng)網(wǎng)絡(luò)對(duì)大模式集手寫字符的識(shí)別率。

2 多重卷積神經(jīng)網(wǎng)絡(luò)

2.1 多重卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別

根據(jù)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)算過程以及其在處理大模式集手寫字符時(shí)存在的不足,本文提出一種多重卷積神經(jīng)網(wǎng)絡(luò)來改進(jìn)傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型,用多個(gè)擁有高識(shí)別率的小卷積神經(jīng)網(wǎng)絡(luò)組成一個(gè)多重卷積神經(jīng)網(wǎng)絡(luò)。每一重小卷積神經(jīng)網(wǎng)絡(luò)對(duì)某一具體字符集有較高的識(shí)別率,另外,單重卷積神經(jīng)網(wǎng)絡(luò)除了有一個(gè)正式的輸出集之外,還產(chǎn)生一個(gè)未知的輸出(即難以識(shí)別的字符),即如果一個(gè)輸入字符沒有被正確識(shí)別,它將被輸出為一個(gè)未知字符,然后輸入模式轉(zhuǎn)到下一重卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別。最后,通過一個(gè)拼寫檢查模塊進(jìn)行判斷,選擇最好的結(jié)果輸出。系統(tǒng)的流程如圖2所示。

其中CNN 1是識(shí)別手寫數(shù)字的卷積神經(jīng)網(wǎng)絡(luò),CNN 2是識(shí)別手寫小寫英文字母的卷積神經(jīng)網(wǎng)絡(luò),該模型具有極強(qiáng)的擴(kuò)展性,可以添加多任意模式的卷積神經(jīng)網(wǎng)絡(luò)(如中文,日文等)。

圖2 多重卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別示意圖

2.2 隨機(jī)對(duì)角Levenberg?Marquardt訓(xùn)練方法

傳統(tǒng)的結(jié)構(gòu)比較簡單、單一的卷積神經(jīng)網(wǎng)絡(luò)多采用基本的Back Propagation(BP)規(guī)則訓(xùn)練網(wǎng)絡(luò),往往需要幾百次迭代,網(wǎng)絡(luò)的收斂速度較慢。本文采用LeCun博士提出的隨機(jī)對(duì)角Levenberg?Marquardt 算法對(duì)網(wǎng)絡(luò)作訓(xùn)練,該算法需要的迭代次數(shù)明顯比基本的BP 算法少[4,9]。隨機(jī)對(duì)角Levenberg?Marquardt算法的公式為:

[ηki=ε?2E?w2ij+μ] (4)

式中[ε]是全局的學(xué)習(xí)率,一般取初始值0.01,太大會(huì)使網(wǎng)絡(luò)無法收斂,太小則會(huì)降低收斂速度,且使網(wǎng)絡(luò)更容易陷入局部極小值,訓(xùn)練過程中可以用啟發(fā)式規(guī)則改變[ε]的值,本文取最下值為5e-005; [?2E?w2ij]是一個(gè)估計(jì)值,根據(jù)訓(xùn)練集的大小可以調(diào)整樣本數(shù)量,文中隨機(jī)選取200個(gè)樣本估算它的值;[μ]用來避免[?2E?w2ij] 太小時(shí)[ηki]的變化過大 。

2.3 多重卷積神經(jīng)網(wǎng)絡(luò)詞句識(shí)別

本文提出的多重卷積神經(jīng)網(wǎng)絡(luò)對(duì)手寫詞語的識(shí)別方法可以簡單地描述為:首先對(duì)輸入的手寫圖像進(jìn)行預(yù)處理和分割,然后通過多重卷積神經(jīng)網(wǎng)絡(luò)模塊分別進(jìn)行識(shí)別,最后采用單詞識(shí)別模塊對(duì)識(shí)別結(jié)果進(jìn)行判斷,選擇最好的結(jié)果輸出。其過程如圖3所示。

圖3 多重卷積神經(jīng)網(wǎng)絡(luò)聯(lián)機(jī)手寫詞句識(shí)別過程

本文提出的多重卷積神經(jīng)網(wǎng)絡(luò)聯(lián)機(jī)手寫文字識(shí)別方法克服了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)文字識(shí)別的對(duì)字符集的限制,每一重卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)針對(duì)小模式的卷積神經(jīng)網(wǎng)絡(luò),易于訓(xùn)練和優(yōu)化,更重要的是此方案的靈活性非常好易于調(diào)節(jié)參數(shù),可擴(kuò)展性強(qiáng)。每一重卷積神經(jīng)網(wǎng)絡(luò)都具有可重用能力,可以根據(jù)需要加載一個(gè)或多個(gè)網(wǎng)絡(luò),可以根據(jù)新的模式添加新的網(wǎng)絡(luò)而不需改變或重建原來的網(wǎng)絡(luò)。

3 訓(xùn)練和實(shí)驗(yàn)

為了評(píng)估多重卷積神經(jīng)網(wǎng)絡(luò)對(duì)基于大模式字符集的聯(lián)機(jī)手寫文字識(shí)別的性能,本系統(tǒng)采用MNIST和UNIPEN兩種不同的手寫字符訓(xùn)練集進(jìn)行測試。UNIPEN數(shù)據(jù)庫是在1992年舉行的IEEE IAPR會(huì)議上提出并建立的,其目的是創(chuàng)建一個(gè)大型的手寫體數(shù)據(jù)庫用于為在線手寫識(shí)別提供研究和開發(fā)的基礎(chǔ),得到了多個(gè)知名公司或研究所的支持并完成了UNIPEN的規(guī)范設(shè)計(jì)。在進(jìn)行數(shù)據(jù)比對(duì)實(shí)驗(yàn)中,本文采用許多研究使用的MNIST手寫數(shù)字?jǐn)?shù)據(jù)庫,該數(shù)據(jù)庫是NEC 研究中心設(shè)計(jì)的,是NIST(The National Institute of Standards and Technology)數(shù)據(jù)庫的一個(gè)子集,該訓(xùn)練集中有大量訓(xùn)練樣本和測試用例。本文默認(rèn)用以下定義:

[識(shí)別率=正確識(shí)別數(shù)樣本總數(shù)×100%]

[失誤率誤識(shí)率=錯(cuò)誤識(shí)別數(shù)樣本總數(shù)×100%]

實(shí)驗(yàn)測試是在通用的臺(tái)式電腦上進(jìn)行的。整個(gè)識(shí)別原型系統(tǒng)采用C#編寫,運(yùn)行在.NetFrame 4.5平臺(tái)上。經(jīng)測試對(duì)MNIST訓(xùn)練集識(shí)別正確率可達(dá)[9]99%,對(duì)UNIPEN數(shù)字識(shí)別正確率可達(dá)97%,對(duì)UNIPEN數(shù)字和大寫字母識(shí)別正確率可達(dá)89%(1a,1b) ,對(duì)UNIPEN小寫字母識(shí)別正確率可達(dá)89%(1c) 。圖4是對(duì)UNIPEN小寫字母3次訓(xùn)練的均方誤差比較。

圖4 訓(xùn)練的誤差數(shù)據(jù)

從圖4中可以看出,在開始的幾個(gè)訓(xùn)練周期內(nèi),均方誤差(MSE)下降得很快,然后在第13個(gè)周期后神經(jīng)網(wǎng)絡(luò)達(dá)到一個(gè)穩(wěn)定的值,約為0.148 5。也就是說,網(wǎng)絡(luò)在第13個(gè)周期后,改善程度就很小。所以修改訓(xùn)練錯(cuò)誤率的值為0.000 45后重新進(jìn)行18代的第二次訓(xùn)練,均方誤差有所降低。經(jīng)過第三次的訓(xùn)練后趨于穩(wěn)定,對(duì)UNIPEN小寫字母識(shí)別正確率可達(dá)89%。經(jīng)測試,通過使用隨機(jī)對(duì)角Levenberg?Marquardt方法,收斂速度比基本BP算法快了許多,經(jīng)過68代訓(xùn)練后識(shí)別正確率可達(dá)89%。

4 結(jié) 語

本文提出了基于多重卷積神經(jīng)網(wǎng)絡(luò)的聯(lián)機(jī)手寫字符的識(shí)別方法,通過使用多個(gè)識(shí)別率高的卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)對(duì)角 Levenberg? Marquardt方法,可以適用于大模式聯(lián)機(jī)手寫識(shí)別。經(jīng)過實(shí)驗(yàn)數(shù)據(jù)比較,該方法在大模式聯(lián)機(jī)手寫識(shí)別過程中具有很高的識(shí)別率,與此同時(shí)識(shí)別速度也很快,有很好的實(shí)時(shí)性,總體效果很好。在當(dāng)今觸摸屏應(yīng)用遍及生產(chǎn)生活的各個(gè)方面的趨勢(shì)下,該方法有著廣闊的應(yīng)用前景。同時(shí)此方法為今后多手寫漢字識(shí)別的研究提供了很好的借鑒。

注:本文通訊作者為潘立武。

參考文獻(xiàn)

[1] 吳鳴銳,張鈸.一種用于大規(guī)模模式識(shí)別問題的神經(jīng)網(wǎng)絡(luò)算法[J].軟件學(xué)報(bào),2001,12(6):851?855.

[2] 張輝.大規(guī)模聯(lián)機(jī)手寫漢字識(shí)別數(shù)據(jù)庫整理、統(tǒng)計(jì)與實(shí)驗(yàn)分析[D].廣州:華南理工大學(xué),2012.

[3] 徐姍姍,劉應(yīng)安,徐,等.基于卷積神經(jīng)網(wǎng)絡(luò)的木材缺陷識(shí)別[J].山東大學(xué)學(xué)報(bào):工學(xué)版,2013,43(2):23?28.

[4] 呂剛.基于卷積神經(jīng)網(wǎng)絡(luò)的多字體字符識(shí)別[J].浙江師范大學(xué)學(xué)報(bào):自然科學(xué)版,2011,34(4):425?428.

[5] PHAM D V. Online handwriting recognition using multi convolution neural networks [M]. Berlin Heidelberg: Springer, 2012: 310?319.

[6] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient?based learning applied to document recognition [C]// Proceeding of IEEE. USA: IEEE, 1998: 2278?2324.

[7] SIMARD P Y, STEINKRAUS Dave, PLATT John. Best practices for convolutional neural networks applied to visual document analysis [C]// International Conference on Document Analysis and Recognition (ICDAR). Los Alamitos: IEEE Computer Society, 2003: 958?962.

篇2

關(guān)鍵詞:Deep Learning;多隱含層感知;DropConnect;算法

中圖分類號(hào):TP181

Deep Learning是機(jī)器學(xué)習(xí)研究的新領(lǐng)域,它掀起了機(jī)器學(xué)習(xí)領(lǐng)域的第二次浪潮,并受到學(xué)術(shù)界到工業(yè)界高度重視。Deep Learning概念根源于人工神經(jīng)網(wǎng)絡(luò)[3],它由Geoffrey Hinton等在Science上提出。它致力于建立模擬人腦分析學(xué)習(xí)機(jī)制的多層次神經(jīng)網(wǎng)絡(luò),并通過這種網(wǎng)絡(luò)分析解釋數(shù)據(jù),如視頻、文本和聲音等。Deep Learning的多隱含層使得它具有優(yōu)異的特征學(xué)習(xí)能力,而且學(xué)習(xí)得到的特征對(duì)數(shù)據(jù)有更本質(zhì)的刻畫,從而有利于可視化或分類。它的“逐層初始化”(layer-wise pre-training[4])可以有效克服深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度。本文在對(duì)Deep Learning算法分析的基礎(chǔ)上,著重闡述了對(duì)Regularization of Neural Networks using DropConnect模型的改進(jìn)。

1 Deep Learning算法分析

1.1 Deep Learning多隱含層感知架構(gòu)

Deep Learning算法最優(yōu)秀特征是多隱含層感知器架構(gòu),這種架構(gòu)通過組合低層特征來形成更加抽象的高層屬性類別或特征,并實(shí)現(xiàn)對(duì)數(shù)據(jù)分布式表示。Deep Learning的多隱含層結(jié)構(gòu)是由輸入層、隱層(多層)、輸出層組成的多層網(wǎng)絡(luò)(如圖1所示),只有相鄰層神經(jīng)元之間有連接,同一層以及跨層節(jié)點(diǎn)之間相互無連接,每一層可以看作是一個(gè)淺層機(jī)器學(xué)習(xí)模型(如logistic regression,Support Vector Machines)。

圖1 含多個(gè)隱含層的Deep Learning模型

Deep Learning的多隱含層感知結(jié)構(gòu)模擬的是人腦的大腦皮層工作。人大腦皮層計(jì)算也是分多層進(jìn)行[5],例如圖像在人腦中是分多個(gè)階段處理,首先是進(jìn)入大腦皮層V1區(qū)提取邊緣特征,然后進(jìn)入大腦皮層V2區(qū)抽象成圖像的形狀或者部分,再到更高層,以此類推。高層的特征是由底層組合而成。使用含多隱含層感知器架構(gòu)網(wǎng)絡(luò)主要優(yōu)勢(shì)在于它能以更簡潔的方式表達(dá)比淺層網(wǎng)絡(luò)大得多的函數(shù)關(guān)系(如圖2)。通過這種深層非線性網(wǎng)絡(luò)結(jié)構(gòu),Deep Learning可以實(shí)現(xiàn)復(fù)雜函數(shù)的逼近,表征輸入數(shù)據(jù)的分布式表示,并展現(xiàn)了強(qiáng)大的從少數(shù)樣本集中學(xué)習(xí)數(shù)據(jù)集本質(zhì)特征的能力。

圖2 多層次實(shí)現(xiàn)復(fù)雜函數(shù)圖

1.2 Deep Learning訓(xùn)練過程

(1)首先逐層構(gòu)建單層神經(jīng)元,使得每次都是訓(xùn)練一個(gè)單層網(wǎng)絡(luò)。

(2)當(dāng)所有層訓(xùn)練完后,使用Wake-Sleep算法[6]進(jìn)行調(diào)優(yōu)。

將除最頂層的其它層間的權(quán)重是雙向的。向上的權(quán)重用于“認(rèn)知”,向下的權(quán)重用于“生成”。然后使用Wake-Sleep算法調(diào)整所有的權(quán)重。讓“認(rèn)知”和“生成”達(dá)成一致,也就是保證生成的最頂層表示能夠盡可能正確的復(fù)原底層的結(jié)點(diǎn)。

1.3 Deep Learning數(shù)據(jù)處理一般過程

Deep Learning算法通過傳感器等方式獲得數(shù)據(jù)之后,首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。在數(shù)據(jù)預(yù)處理中,標(biāo)準(zhǔn)的第一步是數(shù)據(jù)歸一化處理,第二步是數(shù)據(jù)白化處理(如PCA白化和ZCA白化)。其次特征提取和特征選擇。然后將輸出作為下層的輸入,不斷進(jìn)行特征提取和特征選擇,直到學(xué)習(xí)到合符要求的最佳特征。在特征提取和特征選擇過程中,常用自動(dòng)編碼、稀疏編碼、聚類算法、限制波爾茲曼機(jī)、卷積神經(jīng)網(wǎng)絡(luò)等算法進(jìn)行特征提取和特征選擇。然后用反向傳播算法、隨機(jī)梯度下降算法、批量梯度下降算法等進(jìn)行調(diào)優(yōu)處理,再用池化等算法避免特征過度擬合,從而得到最終提取特征。最后將學(xué)習(xí)到的最終提取特征輸入到分類器(如softmax分類器,logistic回歸分類器)進(jìn)行識(shí)別、推理或預(yù)測。

2 基于Regularization of Neural Networks using DropConnect模型改進(jìn)

2.1 Regularization of Neural Networks using DropConnect模型[2]

該模型的四個(gè)基本組成成分是:

(1)特征提?。簐=g(x;Wg)。x是輸入層的輸入數(shù)據(jù),Wg是特征提取函數(shù)的參數(shù),v是輸出的提取特征,特征提取函數(shù)g()。其中g(shù)()為多層卷積神經(jīng)網(wǎng)絡(luò)算法函數(shù),而Wg卷積神經(jīng)網(wǎng)絡(luò)的偏值。

(2)DropConnect層:r=a(u)=a((M*W)v)如圖3。v是輸出的提取特征,W是完全連接的權(quán)重矩陣,M是二進(jìn)制掩碼矩陣,該矩陣的每個(gè)元素隨機(jī)的以1-p概率設(shè)置為0或以p概率設(shè)置為1,a()是一個(gè)非線性激活函數(shù),r是輸出向量。M*W是矩陣對(duì)應(yīng)元素相乘。

(3)Softmax分類器層:o=s(r;Ws)。將r映射到一個(gè)k維的輸出矩陣(k是類的個(gè)數(shù)),Ws是softmax分類函數(shù)的參數(shù)。

(4)交叉熵?fù)p失:A(y,o)=-∑yi(oi),i∈1,2,3…k。y是標(biāo)簽,o是概率。

圖3 DropConnect示意圖

2.2 模型改進(jìn)描述和分析

對(duì)DropConnect模型的改進(jìn)主要集中在上面它的四個(gè)基本組成成分中的DropConnect層。由于該層以隨機(jī)方式讓掩碼矩陣M的每個(gè)元素Mij按1-p的概率設(shè)置為0,然后讓掩碼矩陣與層間的權(quán)重矩陣對(duì)應(yīng)相乘即M*W。相對(duì)DropOut模型r=a((M*(Wv))得到的特征,r=a((M*W)v)得到的特征是比較好的特征r,同時(shí)也提高算法的泛化性。因?yàn)镈ropconnect模型在權(quán)重W和v運(yùn)算之前,將權(quán)重以一定的概率稀疏了,從運(yùn)行結(jié)果看整體算法的錯(cuò)誤率降低了。但是,由于是隨機(jī)的讓Mij按1-p的概率為0,并且這種隨機(jī)是不可以預(yù)測的,故可能會(huì)導(dǎo)致某些重要特征對(duì)應(yīng)的權(quán)重被屏蔽掉,最終造成輸出ri的準(zhǔn)確性降低。故就此提出了新的設(shè)計(jì)思想。

改進(jìn)思想是用單層稀疏編碼層代替DropConnect層,通過稀疏編碼訓(xùn)練出一組最佳稀疏的特征。具體描述:讓經(jīng)過多層卷積神經(jīng)網(wǎng)絡(luò)提取到的特征v作為稀疏編碼的輸入,經(jīng)過稀疏編碼重復(fù)訓(xùn)練迭代,最終得到最佳的稀疏的特征r。因?yàn)橄∈杈幋a算法是一種無監(jiān)督學(xué)習(xí)方法,用它可以尋找出一組“超完備”基向量來更高效地表示輸入數(shù)據(jù)。

總之任何對(duì)Deep Learning算法的改進(jìn),都是為了提取出最佳特征,并使用優(yōu)秀的分類算法來分類、預(yù)測或推理,最終降低算法的錯(cuò)誤率。而對(duì)于怎樣改進(jìn)算法,以何種方式降低錯(cuò)誤率,則沒有具體的限制。并且各種提取特征和特征選擇的算法之間并不是互斥的,它們之間可以有各種形式的嵌套,最終的目標(biāo)都是提高算法的正確率和效率。

3 結(jié)束語

Deep Learning使得語音、圖像和文本等的智能識(shí)別和理解取得驚人進(jìn)展,如Google Brain項(xiàng)目和微軟推同聲傳譯系統(tǒng)。它極大地推動(dòng)了人工智能和人機(jī)交互快速發(fā)展。隨著從學(xué)術(shù)界到工業(yè)界的廣泛重視,Deep Learning算法的改進(jìn)依然在繼續(xù),Deep Learning算法的正確率和效率仍在不斷提高。Deep Learning的發(fā)展將加快“大數(shù)據(jù)+深度模型”時(shí)代來臨。

參考文獻(xiàn):

[1]Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science,2006(5786):504-507

[2]湯姆?米切爾.機(jī)器學(xué)習(xí)[M].北京:機(jī)械工業(yè)出版社,2003:1-280.

[3]吳昌友.神經(jīng)網(wǎng)絡(luò)的研究及應(yīng)用[D].哈爾濱:東北農(nóng)業(yè)大學(xué),2007.

[4]HINTON G,OSINDERO S,TEH Y. A fast learning algorithm for deep belief nets[J].Neural Computation,2006(07):1527-1554.

[5]Hubel D H, Wiesel T N. Receptive fields,binocular interaction and functional architecture in the cat's visual cortex[J].The Journal of physiology,1962(01):106.

[6]Chuang Gao,Bin Chen,Wei Wei.Dynamic detection of wake-sleep transition with reaction time-magnitude[J].Neural Regenerattion Research,2009(07):552-560.

篇3

究竟深度學(xué)習(xí)、機(jī)器學(xué)習(xí)與人工智能的關(guān)系是什么?能為人類帶來怎樣的改變?《中國信息化》記者采訪到了IEEE的兩位專家,為讀者解答關(guān)于人工智能與機(jī)器學(xué)習(xí)的技術(shù)與應(yīng)用趨勢(shì)。

常規(guī)人工智能幫助機(jī)器自學(xué)

首先,我們需要明確一個(gè)問題,深度學(xué)習(xí)和人工智能之間的關(guān)系是什么?

Steve Furber博士是IEEE會(huì)士,“歐盟人腦計(jì)劃”神經(jīng)形態(tài)計(jì)算系統(tǒng)項(xiàng)目和SpiNNaker計(jì)劃的負(fù)責(zé)人,目前擔(dān)任英國曼徹斯特大學(xué)計(jì)算機(jī)科學(xué)學(xué)院教授。對(duì)于這個(gè)問題,Steve Furber表示,分清楚通用人工智能(AGI)和常規(guī)人工智能(或機(jī)器學(xué)習(xí))之間的區(qū)別非常重要。前者是指機(jī)器能夠獲得像人類一樣的智慧和能力,而后者是指開發(fā)出各種算法來讓機(jī)器通過對(duì)數(shù)據(jù)進(jìn)行深層次的統(tǒng)計(jì)分析以進(jìn)行“自學(xué)”。

目前看來,通用人工智能的發(fā)展依然任重道遠(yuǎn)。而深度學(xué)習(xí)是機(jī)器學(xué)習(xí)(常規(guī)人工智能)算法的其中一種,最初的發(fā)展來源于吉奧夫.辛頓(Goeff Hinton)的大力推動(dòng)。大概十年前,吉奧夫.辛頓重新整理了他在上個(gè)世紀(jì)80年代的研究成果并將其拓展為深度神經(jīng)網(wǎng)絡(luò)理論。他發(fā)現(xiàn)電子計(jì)算機(jī)技術(shù)經(jīng)歷了這樣一段時(shí)間發(fā)展,已經(jīng)取得了日新月異的進(jìn)步,很多在上世紀(jì)無法實(shí)現(xiàn)的技術(shù)在當(dāng)時(shí)已經(jīng)能夠?qū)崿F(xiàn)了。另外,他也在學(xué)習(xí)算法的一些分支領(lǐng)域中有了突破性的研究。

所以,現(xiàn)在很多在應(yīng)用領(lǐng)域中性能最佳的機(jī)器學(xué)習(xí)算法都是基于模仿人類大腦結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)而來的。

Kevin Curran博士是IEEE高級(jí)會(huì)員,IEEE互聯(lián)網(wǎng)安全領(lǐng)域?qū)<?,英國厄爾斯特大學(xué)計(jì)算機(jī)科學(xué)專業(yè)教授、智能環(huán)境與虛擬世界研究實(shí)驗(yàn)室團(tuán)隊(duì)總負(fù)責(zé)人,曾參與多個(gè)“歐盟框架計(jì)劃”科研項(xiàng)目及技術(shù)轉(zhuǎn)移項(xiàng)目。

Kevin Curran表示,人工智能涵蓋的領(lǐng)域十分廣泛,深度學(xué)習(xí)只是其中的一個(gè)分支,并隸屬于機(jī)器學(xué)習(xí)的范疇。至今為止,人工智能的概念仍是非常寬泛的。因此,為了實(shí)現(xiàn)多樣性的應(yīng)用,人工智能需要有自主“思考”能力與機(jī)器學(xué)習(xí)技術(shù)的支持,深度學(xué)習(xí)便是幫助機(jī)器實(shí)現(xiàn)“獨(dú)立思考”的其中一種方式。

所謂深度學(xué)習(xí),就是將數(shù)據(jù)輸入系統(tǒng)后,通過建模及模擬人腦的神經(jīng)網(wǎng)絡(luò)從而進(jìn)行學(xué)習(xí)的技術(shù)。

他說,我們可以這樣來比喻,像生物神經(jīng)元一樣,神經(jīng)網(wǎng)絡(luò)系統(tǒng)中有一系列分層排列的模擬神經(jīng)元(信息傳遞的連接點(diǎn)),且經(jīng)過每個(gè)神經(jīng)元的響應(yīng)函數(shù)(又稱“激活函數(shù)”)都會(huì)分配一個(gè)相應(yīng)的“權(quán)值”,表示彼此間的連接強(qiáng)度。通過每層神經(jīng)元相互“連接”,計(jì)算機(jī)就可以由達(dá)到最佳方案時(shí)所有神經(jīng)元的加權(quán)和,從而可以即時(shí)實(shí)現(xiàn)這一決策方案。

當(dāng)然,計(jì)算機(jī)也會(huì)參考類似的先例,在龐大的數(shù)據(jù)庫中調(diào)出對(duì)應(yīng)的決策方案,如此復(fù)雜的決策過程都是由計(jì)算機(jī)在深度神經(jīng)網(wǎng)絡(luò)內(nèi)部自動(dòng)完成的。不過對(duì)于這一點(diǎn),人類更勝一籌,因?yàn)槿祟惪梢灾苯訉?duì)比不同決策的測試結(jié)果,在總體上更直觀地評(píng)估深度學(xué)習(xí)推算的決策方案。可以預(yù)見,深度學(xué)習(xí)將與其它各項(xiàng)技術(shù)結(jié)合,持續(xù)深化人工智能的技術(shù)發(fā)展及應(yīng)用領(lǐng)域。

深度學(xué)習(xí)解決社會(huì)難題

明確了深度學(xué)習(xí)和人工智能的關(guān)系,再來看看最近深度學(xué)習(xí)取得的技術(shù)突破體現(xiàn)在哪些方面?這些突破離商用或者離我們的生活有多遠(yuǎn)?

Steve Furber表示,繼當(dāng)初杰夫. 辛頓的突破之后,相關(guān)領(lǐng)域的科研毫無疑問已經(jīng)取得了長足的發(fā)展。他認(rèn)為其中最重大的一項(xiàng)成就,應(yīng)該就是Yann LeCun在卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域的研究成果。卷積神經(jīng)網(wǎng)絡(luò)作為最有效的深層神經(jīng)網(wǎng)絡(luò),現(xiàn)在已經(jīng)被越來越廣泛地運(yùn)用到了很多智能應(yīng)用之中,并且它們也越來越像人類大腦了。比如現(xiàn)在常常在用的Google, Siri和Facebook等都應(yīng)用了卷積神經(jīng)網(wǎng)絡(luò)。

Kevin Curran則表示,目前深度學(xué)習(xí)在計(jì)算機(jī)視覺,自動(dòng)語音識(shí)別,自然語言處理,音頻識(shí)別和生物信息學(xué)等領(lǐng)域都取得了技術(shù)性突破,并在不同的應(yīng)用領(lǐng)域都展示了深度學(xué)習(xí)的極佳效果。全球IT行業(yè)巨頭Google, Microsoft, Facebook等企業(yè)已經(jīng)紛紛把深度學(xué)習(xí)作為重點(diǎn)項(xiàng)目,應(yīng)用到他們的各種研究項(xiàng)目。

那么,對(duì)于深度學(xué)習(xí)和人工智能的商業(yè)化會(huì)首先應(yīng)用在哪些領(lǐng)域?

Steve Furber表示,深度學(xué)習(xí)和人工智能的商業(yè)化應(yīng)用已經(jīng)率先在語音識(shí)別系統(tǒng)方面得到實(shí)現(xiàn),例如Apple公司的Siri,微軟公司的Cortana等。

Kevin Curran則認(rèn)為,深度學(xué)習(xí)可以用來解決任何具有對(duì)抗性的問題,例如需要用到策略的博弈,各種比賽,戰(zhàn)爭或金融交易。短期內(nèi),它可被用于智能手機(jī)助手,優(yōu)化其輔助功能;但從長遠(yuǎn)來看,它將能夠幫助科學(xué)家攻克諸如氣候模擬、醫(yī)療疾病分析等社會(huì)難題。同時(shí),深度學(xué)習(xí)也有助于研發(fā)反應(yīng)更加迅速的機(jī)器人,可以更智能地應(yīng)對(duì)改變環(huán)境因素時(shí)的情景。最終,深度學(xué)習(xí)將能迅速地推進(jìn)科研進(jìn)度。憑借其強(qiáng)大的運(yùn)算性能及龐大的數(shù)據(jù)分析,科研人員可以產(chǎn)出更多研究碩果,有望在更短的時(shí)間內(nèi)實(shí)現(xiàn)對(duì)現(xiàn)有技術(shù)的重要突破。

而對(duì)于在其他領(lǐng)域的應(yīng)用發(fā)展,Kevin Curran認(rèn)為,醫(yī)療領(lǐng)域是目前深度學(xué)習(xí)和人工智能取得重要成果的關(guān)鍵領(lǐng)域之一。他說,深度學(xué)習(xí)能夠探測未來個(gè)人健康的潛在風(fēng)險(xiǎn)。它可以通過一系列健康大數(shù)據(jù)中尋找疾病的致病機(jī)理,從而實(shí)現(xiàn)在健康和疾病相關(guān)研究領(lǐng)域的重大突破。這僅靠人工計(jì)算是永遠(yuǎn)不可能實(shí)現(xiàn)的。

而對(duì)于中國目前非常關(guān)注的智能制造領(lǐng)域,Kevin Curran認(rèn)為,制造機(jī)器人是深度學(xué)習(xí)在應(yīng)用領(lǐng)域的經(jīng)典案例。深度學(xué)習(xí)的機(jī)器人能夠自動(dòng)適應(yīng)外部環(huán)境變化。舉個(gè)例子,現(xiàn)階段的機(jī)器人都需要事先編程才能精準(zhǔn)地完成相應(yīng)的任務(wù)。一旦要讓它們完成程序以外的任務(wù),就必須重新改寫程序代碼。例如,專門負(fù)責(zé)修理某車型的機(jī)器人面對(duì)一款完全不同的車型時(shí)便不能順利完成修理任務(wù)。而具備深度學(xué)習(xí)技術(shù)的機(jī)器人就不一樣了,即時(shí)讓它們?nèi)バ蘩韽膩頉]有“見”過的車型,它們也可以自動(dòng)重新調(diào)整算法和技術(shù),順利完成修理工作。

中國占據(jù)一席之地

人工智能研究的起步,一般被認(rèn)為是在20世紀(jì)50年代。中國則遲至80年代,才實(shí)質(zhì)性進(jìn)入人工智能研究領(lǐng)域?,F(xiàn)在,在深度學(xué)習(xí)和人工智能領(lǐng)域,中國和世界的差距主要體現(xiàn)在哪些方面?

Steve Furber認(rèn)為目前在深度學(xué)習(xí)方面最前沿的研究仍然主要集中在包括Google以及DeepMind和Facebook等為數(shù)不多的幾家大型科技公司的研發(fā)部門之中。但是,近年來美國也有致力于這一領(lǐng)域的創(chuàng)業(yè)公司如雨后春筍般不斷涌現(xiàn)??梢灶A(yù)見,在未來這領(lǐng)域內(nèi)的技術(shù)研究將有突破性的進(jìn)展。

篇4

關(guān)鍵詞:灰值動(dòng)態(tài)學(xué)卷積模板卷積投影牌照識(shí)別

基于圖像理解的汽車牌照自動(dòng)識(shí)別系統(tǒng)是智能交通系統(tǒng)一個(gè)重要分支,有著非常廣泛的應(yīng)用前景,而把汽車牌照從復(fù)雜的汽車圖像中分割出來是汽車牌照自動(dòng)識(shí)別系統(tǒng)必須解決的關(guān)鍵問題。在過去的十幾年中,各國的科研人員提出了不少提取汽車牌照的方法。Choi和Kim提出利用Hough變換尋找垂直邊緣提取汽車牌照的方法,此方法由于許多汽車前部散熱器產(chǎn)生的垂直邊緣和某些牌照邊框的扭曲或某些汽車牌照沒有邊框而魯棒性較差。S.K.Kim和H.J.Kim提出的基于遺傳算法分割提取汽車牌照的方法,最大缺點(diǎn)是耗時(shí)長,難以進(jìn)行實(shí)時(shí)處理。S.H.Park提出的一種基于神經(jīng)網(wǎng)絡(luò)提取汽車牌照的方法,使用二個(gè)時(shí)延神經(jīng)網(wǎng)絡(luò)在水平和垂直方向?qū)斎雸D像進(jìn)行濾波,得到牌照的候選區(qū)域,然后利用牌照的長寬比、面積、面積與周長比來區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。此方法要求圖像中的牌照尺寸基本不變,一旦圖像中的牌照尺寸發(fā)生了較大的變化,必須對(duì)神經(jīng)網(wǎng)絡(luò)重新進(jìn)行訓(xùn)練。T.R.Crimmins提出了一種數(shù)字形態(tài)學(xué)方法,此方法用不同尺寸的每個(gè)可能字符作為結(jié)構(gòu)元素,采用擊中擊不中方法先提取輸入圖像中的字符,再根據(jù)牌照字符的語法得到汽車牌照,這種方法計(jì)算量非常大且易受噪聲影響。C.H.Poon提出了一種灰值形態(tài)學(xué)方法,它通過檢測字符中的直線段和字符間的空間來提取牌照,這種方法耗時(shí)較多,且沒有利用版照的尺寸信息。C.M.Hwang提出了空間頻率方法,它利用牌照區(qū)域內(nèi)空間頻率變化大的特性,對(duì)圖像進(jìn)行一階差分。差分圖在牌照區(qū)域內(nèi)形成多個(gè)峰,然后利用峰的幅度、寬度和密度區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。這種方法具耗時(shí)少、抗噪能力強(qiáng)的優(yōu)點(diǎn)。本文提出的灰值形態(tài)學(xué)方法僅利用了牌照區(qū)域內(nèi)空間頻率變化大的特性而且利用了牌照區(qū)域字符筆劃具有高曲的特性,因而比單純的空間頻率方法更加有效。通過建立牌照與卷積算子形態(tài)學(xué)結(jié)構(gòu)元素尺寸的相互關(guān)系。本文提出的方法對(duì)不同尺寸牌照具有很好的魯棒性。

1數(shù)字形態(tài)學(xué)

數(shù)字形態(tài)學(xué)是一種重要的數(shù)字圖像處理方法和理論。在數(shù)字形態(tài)學(xué)中,兩種最基本的變換或運(yùn)算是腐蝕和膨脹,其它形態(tài)學(xué)變換都可通過它們來定義。下面列出了一些灰值形態(tài)學(xué)變換的定義。

圖像f(x,y)平移(a,b)定義為:

f(a,b)(x,y)=f(x-a,y-b)

圖像f(x,y)相對(duì)于原點(diǎn)的反射為:

f^(x,y)=f(-x,-y)

二幅圖像f(x,y)和g(x,y)的最小記為(f∧g)(x,y)。

當(dāng)(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內(nèi)時(shí):

(f∧g)(x,y)=min{f(x,y),g(x,y)}

否則:

(f∧g)(x,y)=0

二幅圖像f(x,y)和g(x,y)的最大記為(f∨g)(x,y)。

當(dāng)(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內(nèi)時(shí):

(f∨g)(x,y)=max{f(x,y),g(x,y)}

當(dāng)(x,y)∈D(f)且(x,y)∈D(g)時(shí)

(f∨g)(x,y)=f(x,y)

當(dāng)(x,y)∈D(g)且(x,y)∈D(f)時(shí)

(f∨g)(x,y)=g(x,y)

f(x,y)被g(x,y)膨脹定義為:

(fg)(x,y)=max{f(x-a,y-b)+g(a,b)}

(a,b)∈D(g)

f(x,y)被g(x,y)腐蝕定義為:

(fg)(x,y)=max{f(x-a,y-b)-g(a,b)}

(a,b)∈D(g)

開運(yùn)算定義:

fog=(fg)g

閉運(yùn)算定義:

f·g=(fg)g

Top-Hat變換定義:

Hat(f,g)=f-fog

與Top-Hat變換相對(duì)的是波谷檢測器(Valley變換),其定義為:

Valley(f,g)=(f·g)-f

形態(tài)學(xué)梯度有下面三種形式:

Grad(f)=f-(fg)

Grad(f)=(fg)-f

Grad(f)={[(fg)-(fg)]}/2

2牌照提取算法

在牌照提取算法中,需要用到卷積、模板卷積和卷積投影等概念。下面對(duì)它們進(jìn)行定義。

對(duì)于圖像[aij]m×n,i=0...m-1,j=0...n-1,模板[aij]p×q。p<m,q<n,其卷積、模板卷積和卷積投影都是一維數(shù)組。

水平模板卷積

垂直模板卷積投影vmp:

水平模板卷積投影hmp:

圖1中牌照區(qū)域的長為173象素、高為36象素。從左到右、從上到下的8條曲線依次為牌照區(qū)域灰度圖第10~17條水平方向的灰度值。通過觀察發(fā)現(xiàn),在牌照區(qū)域的水平方向不令空間頻率變化大,而且具有許多陡峭的峰(欲)和高曲率點(diǎn)。而灰值形態(tài)學(xué)的梯度變換可以對(duì)圖像進(jìn)行高通濾波,灰值形態(tài)學(xué)的Top-Hat變換和Valley變換可以撮高曲率點(diǎn)、波峰和波谷。

進(jìn)行形態(tài)學(xué)變換,需要考慮二個(gè)因素:結(jié)構(gòu)元素和變換類型。變換類型準(zhǔn)備采用灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換。結(jié)果元素采用n×1的維水平結(jié)構(gòu),以提取水平方向上的高頻分量、波峰和波谷。結(jié)構(gòu)元素的大小n對(duì)Top-Hat變換和Valley變換的結(jié)果結(jié)構(gòu)元素的大小n對(duì)Top-Hat變換和Valley變換的結(jié)果有著很大的影響,因此問題的關(guān)鍵是怎樣確定n。

分析圖1中水平方向的灰度曲線,發(fā)現(xiàn)在穿過字符的水平線上,灰度曲線波峰的寬度與字符垂直筆劃的寬度存在著某種線性關(guān)系。根據(jù)中國汽車牌照的一般規(guī)范,牌照上字符的垂直筆劃寬度與牌照的寬度也存在著某種線性關(guān)系。結(jié)構(gòu)元素的尺寸n與灰度曲線波峰的寬度又可建立一種線性關(guān)系。因此可建立n與牌照寬度w的一種近似線性的關(guān)系:

n=Integer{(w/k)+b}

式中的Integer()表示對(duì)括號(hào)內(nèi)的值取整。w、b都為整數(shù)。根據(jù)經(jīng)驗(yàn)令w、b分別為25和0,則:

n=Integer(w/25)

由上式可知,當(dāng)牌照的寬度w變化25個(gè)象素時(shí),結(jié)構(gòu)元素的大小n才變化1個(gè)單位,也就是說n對(duì)w不是很敏感。

牌照區(qū)域提取算法包括以下幾步:

(1)縮小圖像:對(duì)輸入的灰值汽車圖像進(jìn)行隔行隔列抽樣,得到一幅大小為四分之一原因的新圖像。接下列抽樣,得到一幅大小為四分之一原圖的新圖像。接下來的處理均在新圖像上進(jìn)行,這樣可以大大減少處理時(shí)間,提高算法的效率。根據(jù)形態(tài)學(xué)的尺度變換兼容性原理,對(duì)圖像縮?。ǚ糯螅┖笤龠M(jìn)行形態(tài)學(xué)變換,只要對(duì)結(jié)構(gòu)元素做相應(yīng)的變換,結(jié)果不變。

(2)水平分割:對(duì)汽車圖像進(jìn)行水平分割,得到幾個(gè)可能含牌照的水平區(qū)域。

(3)垂直分割:對(duì)第(2)步所得到的每一個(gè)水平區(qū)域進(jìn)行垂直分割,得到一些牌照的候選區(qū)域。

(4)牌照區(qū)域甄別:分析各個(gè)候選區(qū)域得出真正的牌照區(qū)域。

2.1水平分割

分別對(duì)汽車圖像進(jìn)行灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換,如圖2。一般來說,在大多數(shù)汽車車牌照自動(dòng)識(shí)別系統(tǒng)應(yīng)用中,CCD攝取的汽車圖像中牌照的大致寬度和高度是已知的。如果牌照的寬度為w∈(a,b),則取水平模板m×1,其中m=(a+b)/2。用模板分別對(duì)圖像的梯度圖、Top-Hat變換圖和Valley變換圖進(jìn)行水平模板卷積。對(duì)每幀變換圖取每一行模板水平卷積的最大值,得到1個(gè)一維數(shù)組,3幅變換圖共得到3個(gè)一維數(shù)組g1,ti和vi,其中i大于等于1,而小于等于圖像的高度,其曲線如圖2的b、c、d。觀察圖2可以發(fā)現(xiàn),由于受車體上其它字符和車前燈等因素的影響,僅僅依靠梯度圖較難對(duì)牌照進(jìn)行水平定位,而結(jié)合Top-Hat變換圖和Valley變換圖,能更好地對(duì)牌照進(jìn)行水平定位。據(jù)此,構(gòu)成了1個(gè)一維數(shù)組pi。

pi=gi×ti×vi

其曲線如圖3。取圖3中最高峰的位置作為牌照的水平中線,為了確保不會(huì)出錯(cuò),把次高峰也作為牌照的另一備選位置。了高峰和次高峰的位置,分割出2個(gè)寬為汽車圖像寬度,高為牌照的最大可能高度b的區(qū)域,如圖4中的a和b。

2.2垂直分割

對(duì)圖4中的a和b二個(gè)區(qū)域分別進(jìn)行灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換,并在垂直方向?qū)ψ儞Q圖進(jìn)行卷積得到3個(gè)一維數(shù)組gi、ti和vi,其中i大于等于1,而小于等于圖像的寬度w,其曲線如圖5和圖6。qi=gi×ti×vi

的曲線如圖7。利用下面的公式分別對(duì)圖4中的a和b進(jìn)行垂直分割。

{(m,n)|qi>kT,i=m...n,n-m+1∈(a,b)}

其中:T=Max(qi),k為一經(jīng)驗(yàn)值,(a,b)為牌照的寬度范圍。

i=l...w

分割結(jié)果如圖8所示。

2.3牌照區(qū)域甄別

篇5

【關(guān)鍵詞】Android平臺(tái) 人臉檢測 人臉識(shí)別系統(tǒng)

1 引言

近年來,信息安全越來越受到人們關(guān)注,身份驗(yàn)證和識(shí)別技術(shù)成為眾人矚目的焦點(diǎn),生物特征識(shí)別技術(shù)和人工智能技術(shù)不斷更新發(fā)展,其中,人臉識(shí)別技術(shù)因具有并發(fā)性、非接觸性、非強(qiáng)制性、操作簡單等特點(diǎn),被越來越廣泛地運(yùn)用到各個(gè)領(lǐng)域中。Android系統(tǒng)是目前移動(dòng)設(shè)備的主流操作系統(tǒng)之一,在移動(dòng)操作系統(tǒng)市場份額中占據(jù)了主導(dǎo)地位。隨著人們?cè)谝苿?dòng)領(lǐng)域信息安全意識(shí)的提高,在移動(dòng)平臺(tái)上進(jìn)行人臉識(shí)別具有廣闊的發(fā)展前景,同時(shí)也面臨諸多挑戰(zhàn)。本文結(jié)合Android移動(dòng)終端的特點(diǎn),研究基于Android的人臉識(shí)別系統(tǒng)的實(shí)現(xiàn),更好地滿足移動(dòng)領(lǐng)域信息安全方面的市場需求。

2 人臉識(shí)別原理

人臉識(shí)別技術(shù)是一種基于生理特征的識(shí)別技術(shù),通過計(jì)算機(jī)提取人臉特征,并根據(jù)這些特征進(jìn)行身份驗(yàn)證的一種技術(shù)。廣義的人臉識(shí)別過程包括人臉圖像采集及預(yù)處理、人臉檢測與特征提取和人臉的對(duì)比與識(shí)別三大部分,其原理如圖1所示。

人臉檢測的算法有很多種,典型的有特征抽取算法、人臉小波檢測、基于模板匹配、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)方法、Adaboost算法等。本文選擇Adaboost算法實(shí)現(xiàn)人臉檢測。人臉識(shí)別技術(shù)包括特征提取和特征識(shí)別,實(shí)現(xiàn)方法可概括為3類:基于幾何特征方法(歐式距離判別法)、基于模板方法(特征臉方法、神經(jīng)網(wǎng)絡(luò)方法等)和基于模型方法(隱馬爾科夫方法)。本文選擇基于LDP的特征臉?biāo)惴▽?shí)現(xiàn)人臉特征提取與特征識(shí)別。

3 人臉識(shí)別算法

3.1 圖像預(yù)處理

現(xiàn)實(shí)生活應(yīng)用人臉檢測與識(shí)別系統(tǒng)時(shí),人臉的圖像是在各種隨機(jī)的場景下由攝像頭或照相機(jī)拍攝的,因此受到光照變化、背景色彩、設(shè)備質(zhì)量以及人臉姿態(tài)等因素的影響,需要對(duì)其進(jìn)行預(yù)處理,主要包括光照補(bǔ)償、濾波去噪處理和幾何歸一化的處理,經(jīng)過這些處理,后期操作中將得到較好的識(shí)別效果。

首先定位人眼。為了提高定位效率,先確定人眼在人臉圖像中的大概位置,然后基于這個(gè)大致的范圍,采用灰度積分投影和灰度差分積分投影相結(jié)合的方法精確定位人眼:

M(y)=kphori(y)- Dhori(y)

其中,k為系數(shù),K phori(y)為灰度積分投影,Dhori(y)為灰度差分積分投影。

其次是臉部圖像的幾何變換和剪裁,根據(jù)所檢測到的人眼位置,通過圖像旋轉(zhuǎn)、剪裁、縮放等手段,使得臉部圖像中人眼是對(duì)齊的且不包含背景、額頭、耳朵和下巴,并將處理后的臉部圖像縮放到70×70固定大小。

再次是分離直方圖均衡,這個(gè)過程能夠使得每一個(gè)臉部圖像都具有相同的對(duì)比度以及亮度。

最后是圖像平滑,圖像平滑能夠有效地減少圖像的噪聲。

3.2 人臉檢測

自適應(yīng)增強(qiáng)(adaptive boosting,AdaBoost)是一種需要監(jiān)督的機(jī)器學(xué)習(xí)算法。特征選取和特征計(jì)算決定了AdaBoost算法的運(yùn)行速度。Viola等人提出了基于Haar特征的AdaBoost人臉檢測算法。本文使用Haar 特征進(jìn)行特征提取。

基于特征的檢測能對(duì)選定區(qū)域的狀態(tài)進(jìn)行編碼。矩形特征是對(duì)輸入圖像使用矩形進(jìn)行提取特征。Haar特征是一些由黑白矩形組成的特征,臉部的一些特性可以用矩形特征簡單地描述,矩形特征值是兩個(gè)不同的矩形區(qū)域像素和之差。如果圖像特征表示眼睛的顏色比臉頰上端的顏色深??梢杂锰卣髦祦砭幋a特征,特征值定義為:

V=Sum黑-Sum白

其中,Sum黑、Sum白分別表示黑色和白色矩形覆蓋區(qū)域的像素和。

使用Viola等人提出的積分圖像的概念,可加快矩形特征的計(jì)算速度。進(jìn)而計(jì)算出Haar特征的特征值,定義積分圖中位置(x,y)處的值為待測圖像位置(x,y)處的上方和左側(cè)所有像素之和。

S(x,y)=s(x,y?1)+i(x,y)

C(x,y)=c(x?1,y)+s(x,y)

其中,c(x,y)為積分圖在(x,y)點(diǎn)處的值,i(x,y)為原圖像素點(diǎn)(x,y)處的灰度值,s(x,y)表示一行灰度值的累加和。初始時(shí)s(x,-1)=0,c(-1,y)=0。

弱分類器對(duì)正負(fù)樣本分類的準(zhǔn)確率應(yīng)大于 1/2,這樣訓(xùn)練算法最終收斂。一個(gè)弱分類器 h(x,f,p,θ):其中 1 表示人臉,0 表示非人臉。

計(jì)算在每個(gè)特征f下的所有樣本特征值,并進(jìn)行排序。然后掃描一遍排好序的特征值,從而確定特征f的一個(gè)最后閾值,最終訓(xùn)練成一個(gè)弱分類器。所有迭代得到的弱分類器,并按照―定的權(quán)值疊加起來,得到一個(gè)強(qiáng)分類器。將多個(gè)強(qiáng)分類器連接起來,得到Adaboost級(jí)聯(lián)分類器。如圖2所示。

3.3 人臉特征的提取

局部二值模式LBP(Local Binary Patterns)是一種從局部紋理定義中衍生出來的算法,所謂的紋理是圖像分析中常用的鑒別特征,它所含有的信息能夠表征物體表面的變化。由于其優(yōu)秀的分類特性和計(jì)算的簡便性,使得其廣泛的運(yùn)用于圖像檢索、人臉分析和工業(yè)檢測等領(lǐng)域。

Ojala等人提出的LBP算子的模板大小被定義為3x3,以此模板依次掃描圖像中的像素點(diǎn),將該模板的中心點(diǎn)位置的灰度值與周圍位置的8個(gè)灰度值相比較,若鄰域位置的灰度值大于中心位置的灰度值則該鄰域位置標(biāo)記為l,相反標(biāo)記為0;將這中心像素點(diǎn)周圍的8個(gè)像素點(diǎn)順時(shí)針依次連接組成8位二進(jìn)制數(shù);將該二進(jìn)制數(shù)轉(zhuǎn)換為十進(jìn)制數(shù),替代中心像素點(diǎn)位置的像素值。

gc代表中心像素位置的灰度值大小,P為該中心位置周圍鄰域像素點(diǎn)的個(gè)數(shù),gi(i=O,l,...,P-1)是周圍第i個(gè)像素位置的灰度值。則以(xc,yc)為中心位置的一個(gè)局部鄰域的紋理特征可以表示為:

LDP算法結(jié)合了LBP的優(yōu)點(diǎn),在其基礎(chǔ)上考慮到特征的方向性,能更有效和更為魯棒的描述人臉。與LBP碼相類似,我們需要對(duì)得到的卷積結(jié)果進(jìn)行二值化處理,需要選定一個(gè)閾值。這里我們對(duì)返回的卷積結(jié)果的絕對(duì)值b0,b1,b2,b3,b4,b5,b6,b7從大到小進(jìn)行排序,取其中第K個(gè)大小的值為閾值,大于該閾值的賦值為1,相反為0。

LDP算子對(duì)于存在噪聲和非均勻的光照變化的圖像具有更好的魯棒性。

4 Android平臺(tái)人臉識(shí)別系統(tǒng)設(shè)計(jì)

4.1 Android JNI技術(shù)

本文所研究的人臉識(shí)別算法是由C語言實(shí)現(xiàn),并且調(diào)用了Opencv庫,這樣相對(duì)于使用Java語言實(shí)現(xiàn)有較高的執(zhí)行效率。Android系統(tǒng)應(yīng)用層采用的Java語言,但Android系統(tǒng)中也提供了JNI接口使得在Android程序中能方便的調(diào)用C語言或其他語言。JNI位于本地庫與Java框架層之間,其結(jié)構(gòu)如圖3所示。

4.2 系統(tǒng)功能模塊

Android平臺(tái)上的人臉檢測與識(shí)別系統(tǒng)主要由圖像采集模塊、人臉圖像預(yù)處理模塊、人臉檢測模塊、人臉注冊(cè)模塊和人臉識(shí)別模塊等共五個(gè)模塊組成。

圖像采集模塊:利用Android平臺(tái)攝像頭進(jìn)行圖像采集,調(diào)用Opencv庫,實(shí)現(xiàn)調(diào)用攝像頭、對(duì)拍攝的物體進(jìn)行自動(dòng)對(duì)焦、連續(xù)拍照等功能,快速獲取圖像幀的信息。

人臉圖像預(yù)處理模塊:對(duì)采集到的圖像幀進(jìn)行光照補(bǔ)償、濾波去噪處理和幾何歸一化的處理等處理。

人臉檢測模塊:經(jīng)預(yù)處理的圖像采用Adaboost人臉檢測方法獲取人臉,并對(duì)裁剪出的人臉圖像進(jìn)行標(biāo)記。

人臉注冊(cè)模塊:經(jīng)過訓(xùn)練后可以輸入姓名,然后可連續(xù)錄制十張照片,并按照人臉檢測中的步驟提取出10張人臉照片保存到SD卡中,將人臉姓名和編號(hào)按順序?qū)懭雈aceN.txt文件中。

人臉識(shí)別模塊:根據(jù)測試者人臉圖像計(jì)算人臉LDP特征,得到識(shí)別結(jié)果。如果測試者的人臉特征在我們?cè)O(shè)置的閾值的內(nèi)則,輸出識(shí)別人臉的姓名,否則提示人臉庫中無此人,請(qǐng)擺正人臉配合識(shí)別。

本文設(shè)計(jì)并實(shí)現(xiàn)了基于Android的人臉識(shí)別系統(tǒng)。針對(duì)Android平臺(tái)的硬件能力有限的特點(diǎn),開發(fā)了一種適用于Android平臺(tái)的系統(tǒng)資源消耗較少的人臉識(shí)別系統(tǒng)。系統(tǒng)開發(fā)過程中主要使用了Adaboost人臉檢測算法和基于LDP特征臉的人臉識(shí)別算法,采用OpenCV視覺開源庫在Android平臺(tái)上加以實(shí)現(xiàn),目前該入臉識(shí)別系統(tǒng)已經(jīng)達(dá)到較高的識(shí)別水平,具有很好的實(shí)用性和應(yīng)用前景。

參考文獻(xiàn)

[1]陳會(huì)安,李強(qiáng).Java和Android開發(fā)實(shí)戰(zhàn)詳解[M].北京:人民郵電出版社,2014.

[2]HUGHES A.Android mobile security:a comprehensive evaluationof its feats and flaws[D].UTICA COI.I.EGE,2015.

[3]趙麗紅,劉紀(jì)紅.人臉檢測方法綜述[J].計(jì)算機(jī)應(yīng)用研究,2004,21(09):l-4.

[4]張恒喜,史爭軍.基于SQlJte的Android數(shù)據(jù)庫編程[J].電腦編程技巧與維護(hù),2011(21):30-31.

篇6

關(guān)鍵詞:小波變換;多分辨率分析;諧波;電能質(zhì)量

中圖分類號(hào):TM714.3 文獻(xiàn)標(biāo)識(shí)碼:B

文章編號(hào):1004373X(2008)0313402

Application ofWaveletandMulti―resolution

Theory to the OilfieldDistributionNetworkHarmonic Detection

WEN Jiabin1,LI Jinghua1,ZONG Jidong2

(1.Electric & Electronic Engineering College,Harbin University of Science Technology,Harbin,150040,China;

2.The Seventh Oil―producing Factory,Daqing Oil Field Co.Ltd.,Daqing,163000,China)

Abstract:Regarding low voltage distribution network of The Seventh Oil―producing Factory,Daqing Oil Field as the research background,the power quality of multi―points in this factory is detected.In view of the harmonic situation,the wavelet and multi―resolusion theory with favorable retractility and translation characteristic is selected,using Matlab to analyze the harmonic current,according to the harmonic reconstruction and the error account,the method of harmonic detection is proved to have very good performance.

Keywords:wavelet transformation;multi―resolution analysis;harmonic;power quality

1 引 言

目前,油田鉆采系統(tǒng)與油氣集輸系統(tǒng)的驅(qū)動(dòng)裝置逐步由恒速的交流電動(dòng)機(jī)傳動(dòng)改為可調(diào)速的電氣傳動(dòng)系統(tǒng),油田電系統(tǒng)中電力半導(dǎo)體裝置日益增多,導(dǎo)致供配電網(wǎng)中諧波日益嚴(yán)重,這對(duì)用電設(shè)備和系統(tǒng)設(shè)備產(chǎn)生嚴(yán)重危害,必須對(duì)其進(jìn)行研究并采取相應(yīng)的措施。

本文對(duì)大慶油田有限責(zé)任公司第七采油廠葡三聯(lián)合站、敖包塔聯(lián)合站、葡四聯(lián)合站站內(nèi)低壓配電網(wǎng)進(jìn)行大量點(diǎn)的電能質(zhì)量檢測,針對(duì)近年來應(yīng)用變頻設(shè)備、無功補(bǔ)償裝置對(duì)電網(wǎng)及其用電設(shè)備產(chǎn)生的諧波影響這一問題,運(yùn)用小波方法開展諧波檢測技術(shù)的研究。

從國內(nèi)外的現(xiàn)狀來看,主要的諧波測量及分析方法有4種:基于傅里葉變換的諧波檢測方法;基于瞬時(shí)無功功率理論的諧波檢測方法;基于人工神經(jīng)網(wǎng)絡(luò)的諧波分析、檢測方法;基于小波變換的諧波分析、檢測方法。本文主要選用小波變換的方法對(duì)諧波電流進(jìn)行檢測分析。

2 小波變換與傅里葉變換

小波變換的思想來源于伸縮和平移方法,其概念是在1984年由法國地球物理學(xué)家J.MorLet正式提出[1]。小波變換作為一種新的數(shù)學(xué)工具,是傳統(tǒng)傅里葉變換的發(fā)展,在信號(hào)處理領(lǐng)域中有著巨大的潛在應(yīng)用前景。傳統(tǒng)的快速傅里葉變換,是對(duì)信號(hào)在整個(gè)時(shí)間過程中變化情況的分析,所以盡管在頻域內(nèi)是局部的,在時(shí)域內(nèi)卻是全局的、非局部的。小波是一個(gè)時(shí)間函數(shù),他的正負(fù)波動(dòng)同時(shí)速降為零,其傅里葉變換也呈現(xiàn)為帶通濾波器的頻率特性,也就是說,小波在時(shí)域和頻域內(nèi)都是局部化的。將小波函數(shù)伸縮和平移得到的一組函數(shù)稱為分析小波,他在時(shí)域和頻域內(nèi)也是局部化的。與窗口傅里葉變換不同的是,小波變換的時(shí)間――頻率窗不是固定不變的,這也是小波變換與傅里葉變換相比最大的優(yōu)勢(shì)。因此小波變換非常適合于提取電力信號(hào)中的暫態(tài)信號(hào)。

3 小波多分辨率分析法

采用正交小波變換時(shí),任意信號(hào)X(t)∈L2(R)可采用多分辨率分解公式表示為:

式中,φj,k=2-J/2φ(2-Jt-k)為尺度函數(shù);Ψj,k=2-J/2為小波函數(shù);{φj,k(t)}為尺度空間Vj的標(biāo)準(zhǔn)正交基;{Ψj,k(t)}為小波空間Wj的標(biāo)準(zhǔn)正交基。Vj-1=VjWj,其中Wj為Vj在Vj-1空間的正交補(bǔ)空間。J為尺度j的某個(gè)特定值,分解系數(shù)aj(k)和dj(k)分別稱為離散平滑近似信號(hào)和離散細(xì)節(jié)信號(hào)。其遞推公式如下:

式中,h0和h1分別是低通數(shù)字濾波器和高通數(shù)字濾波器的單位取樣響應(yīng)。取h1(k)=(-1)kh0(k),構(gòu)成正交鏡像對(duì)稱濾波器組。aj+1(k)和dj+1(k)分別是h0(-k)和h1(-k)卷積后再抽取得到的信號(hào)序列。多分辨率分解只是對(duì)低頻部分進(jìn)一步分解,而高頻部分則不予以考慮。所以小波多分辨率信號(hào)分解可用多抽樣率子帶濾波器組來實(shí)現(xiàn),在小波分解中,設(shè)采樣頻率為fs,則 x(n)占據(jù)的頻帶為0~fs/2 , 經(jīng)過J級(jí)分解,得到d1(k),d2(k),…dj(k),aj(k)這J+1個(gè)號(hào)序列,所占據(jù)的頻帶依次為fs/4~fs/8,fs/8~fs/16,…,fs/2j+1~fs/2j,0~fs/2j+1,由此可以將所需的頻段提取出來,這就是用濾波器組實(shí)現(xiàn)小波多分辨率分析的原理[2]。

圖1 三層分辨率分解樹結(jié)構(gòu)圖

Daubechies小波具備刻畫信號(hào)的全局和局部奇異性變化的特點(diǎn),尤其是對(duì)局部奇異變化非常敏感。由前邊的分析可知多分辨率分析的實(shí)質(zhì)是不同尺度下的帶通濾波器和低通濾波器的設(shè)計(jì)。

4 檢測實(shí)例分析

本文以大慶油田有限責(zé)任公司第七采油廠的三聯(lián)輸油崗2號(hào)外輸泵進(jìn)變頻50 Hz電流為例進(jìn)行分析,測量儀器選用日本日置電能質(zhì)量分析儀,圖2為根據(jù)測量數(shù)據(jù)繪制出來的電流波形和基波波形。

根據(jù)所測的電流繪制的電流頻譜圖見圖3,測量數(shù)據(jù)表明在接入變頻器情況下電流諧波較為嚴(yán)重,以5次、7次為主且已超出GB/T14549―93《電能質(zhì)量公用電網(wǎng)諧波》的標(biāo)準(zhǔn)。

在進(jìn)行小波變換時(shí),根據(jù)Daubechies小波的變換原理[3] ,選用db24小波進(jìn)行4次分解,采樣頻率為3 kHz。經(jīng)小波分解,得到不同頻帶分量,具體的各高頻、低頻部分如圖4所示。

圖2 測得的原始電流及其基波電流

圖3 2號(hào)外輸泵諧波電流頻譜分析

圖4 小波分解后的低頻、高頻部分

圖4為經(jīng)過db24小波分解后的高頻及低頻部分,其中,a(4)~a(1),b(4)~b(1)的頻帶如表1所列:

其低頻系數(shù)為a(4),他所占據(jù)的頻帶為0~f/25,原始信號(hào)中占0~93.75 Hz范圍內(nèi)的僅含基波,所以由a(4)重構(gòu)即可得基波分量。

將提取基波波形放大(見圖5),與原基波波形比較,可以看到,低頻的第四層將正弦信號(hào)中的最低頻率組成清晰地分離出來了。

圖5 提取的基波放大波形

圖6為經(jīng)dbN小波重構(gòu)后的諧波波形及重構(gòu)誤差,由圖6可知,重構(gòu)后的波形與原波形誤差很小,僅為9.671 0e-8,重構(gòu)效果較好。

圖6 經(jīng)dbN小波重構(gòu)后的波形及誤差

由于小波分析是基于多分辨率分析的信號(hào)處理理論,因而在上述諧波檢測仿真中,不同的尺度具有不同的時(shí)間和頻率分辨率,因而小波分解能將原始信號(hào)的不同頻率成分分開,所以諧波可以檢測出來。

5 結(jié) 語

本文對(duì)大慶油田有限責(zé)任公司第七采油廠變頻、無功補(bǔ)償裝置的諧波電流進(jìn)行了檢測分析,運(yùn)用具有良好的伸縮、平移特性的小波分析方法,對(duì)諧波進(jìn)行了仿真研究。分析和仿真結(jié)果表明,小波多分辨分析法可以有效地檢測電力系統(tǒng)的電壓和電流中的諧波含量并分解出基波信號(hào)和諧波信號(hào),故其可以應(yīng)用于諧波的檢測和補(bǔ)償。

參考文獻(xiàn)

[1]胡昌華,張軍波.基于Matlab的系統(tǒng)分析與設(shè)計(jì)――小波分析[M].西安:西安電子科技大學(xué)出版社,2001.

[2]梁玉娟,李群湛,趙麗平.基于小波分析的電力系統(tǒng)諧波分析[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2006,15(6):67―70.

篇7

關(guān)鍵詞:圖像 并行處理 研究 應(yīng)用

中圖分類號(hào):TP751 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2013)12-0060-02

1 并行處理技術(shù)在圖像處理領(lǐng)域的應(yīng)用

數(shù)字圖像處理技術(shù)是現(xiàn)代信息處理技術(shù)中的一個(gè)重要內(nèi)容,也是計(jì)算機(jī)應(yīng)用領(lǐng)域中的主要內(nèi)容,隨著我國信息技術(shù)的發(fā)展,廣大學(xué)者對(duì)于圖像的并行處理技術(shù)研究熱情也日漸高漲起來。

1.1 圖像分割技術(shù)

在圖像處理技術(shù)中,為有效實(shí)現(xiàn)對(duì)圖像信息的識(shí)別,分析以及數(shù)據(jù)編碼處理,圖像分割技術(shù)成為圖像處理中的重要組成部分。在圖像的分割處理過程中,對(duì)分割細(xì)節(jié)的處理提出了較高的要求,細(xì)節(jié)的精細(xì)化處理為之后的圖像處理奠定了穩(wěn)固的統(tǒng)計(jì)基礎(chǔ)。為有效提升圖像分割技術(shù)的精準(zhǔn)性,在對(duì)圖像進(jìn)行分割處理時(shí),會(huì)利用并行處理量對(duì)分割計(jì)算作進(jìn)一步加工。圖像分割方法的實(shí)際應(yīng)用分為二階統(tǒng)計(jì)和三階統(tǒng)計(jì)兩種計(jì)量方式,而由于統(tǒng)計(jì)量的不同數(shù)據(jù)特點(diǎn),又會(huì)將不同階的統(tǒng)計(jì)量分為不同階矩,以此保證圖像分割技術(shù)的精細(xì)化。在對(duì)圖形進(jìn)行分割處理過程中,首先應(yīng)對(duì)圖像局部進(jìn)行非監(jiān)督非參數(shù)變化檢測,對(duì)于圖像中的不同區(qū)域進(jìn)行邊緣數(shù)據(jù)的統(tǒng)計(jì)估算,以此實(shí)現(xiàn)對(duì)分割后圖像進(jìn)行并行處理的目的。為保證并行處理的計(jì)算精度,在對(duì)圖像進(jìn)行分割處理時(shí),應(yīng)進(jìn)一步對(duì)圖像中不同紋理的并行處理方差進(jìn)行計(jì)算,以此確定圖像的峰態(tài)和偏態(tài)特性,進(jìn)而實(shí)現(xiàn)以并行處理技術(shù)對(duì)圖像的精確分割。

1.2 圖像濾波技術(shù)

在以并行處理量對(duì)圖像的高斯過程進(jìn)行統(tǒng)計(jì)時(shí),由于高斯過程會(huì)在圖像中形成高斯背景噪聲,并對(duì)圖像的濾波產(chǎn)生影響,因此將并行處理應(yīng)用于圖像的高斯計(jì)算中,通過對(duì)高斯過程進(jìn)行有效的噪聲控制,能夠在最大程度上減小圖像的濾波處理中高斯噪聲的影響。在將并行處理量應(yīng)用于圖像的高斯過程中時(shí),通常采用數(shù)學(xué)中迭代重建的計(jì)算方法,即通過在對(duì)圖像進(jìn)行并行處理譜計(jì)算時(shí),通過對(duì)圖像進(jìn)行雙階譜相位的測定和幅值的測量,使圖像的空間域能夠有效避免噪聲的影響,進(jìn)而得到去噪后的圖像信息。并行處理量在圖像的濾波技術(shù)應(yīng)用中,實(shí)現(xiàn)了對(duì)并行處理譜域的重置和構(gòu)建,有效實(shí)現(xiàn)了圖像的去噪處理,并在同時(shí)保留了圖像數(shù)據(jù)的細(xì)節(jié),最大限度的維護(hù)了圖像的高斯特性,保證了并行處理處理中圖像的完整性。

1.3 圖像的特性識(shí)別和提取

為有效解決圖像處理中不變性圖像識(shí)別和處理的問題,通過將并行處理應(yīng)用于圖像的變量計(jì)算中,并對(duì)圖像中低階矩和頻域進(jìn)行并行處理測定,能夠?qū)崿F(xiàn)對(duì)問題的有效處理。圖形的特性識(shí)別和提取,即對(duì)圖像的局部特征和構(gòu)造不變量的方式進(jìn)行并行處理的統(tǒng)計(jì)計(jì)算,并通過獲取圖像的幅值信息,實(shí)現(xiàn)對(duì)圖像性信息的獲取。圖像特性識(shí)別和提取技術(shù)的發(fā)展是基于超光譜圖像的自動(dòng)目標(biāo)識(shí)別技術(shù)基礎(chǔ)上進(jìn)一步深入而產(chǎn)生的,圖像處理學(xué)者通過結(jié)合并行處理量和數(shù)字虛擬維,將二維傅里葉精確的轉(zhuǎn)化為了圖像的一維投影,以此實(shí)現(xiàn)了對(duì)圖像平移和尺度的測量。而在對(duì)圖像進(jìn)行旋轉(zhuǎn)系數(shù)測定時(shí),由于圖像旋轉(zhuǎn)造成的圖形特性紊亂使得其并行處理矩在并行處理時(shí)失去常數(shù)的穩(wěn)定性,進(jìn)而造成圖像的特定發(fā)生變化,無法實(shí)現(xiàn)有效的圖像特性識(shí)別和提取。為有效維護(hù)圖像特性的穩(wěn)定性,在對(duì)圖像內(nèi)容進(jìn)行分析時(shí)通常采用圖像內(nèi)容識(shí)別技術(shù),通過并行處理量和PCA技術(shù)相結(jié)合,加強(qiáng)圖并行處理技術(shù)中的線性判別能力,以此實(shí)現(xiàn)對(duì)圖像特性的識(shí)別和提取。

1.4 圖像檢測技術(shù)

所謂的圖像檢測技術(shù)就是通過一定的技術(shù)手段對(duì)于圖像中有價(jià)值信息進(jìn)行獲取,實(shí)現(xiàn)圖像的高效利用,對(duì)于圖像的分析和使用更準(zhǔn)確以及更具針對(duì)性,圖像檢測技術(shù)現(xiàn)階段主要有兩個(gè)方面的應(yīng)用,其一就是圖像邊緣檢測技術(shù),再者就是圖像中具體有價(jià)值信息技術(shù)檢測。比如交通管理中交管局對(duì)于交通狀況的分析,都是通過對(duì)于圖像中車輛以及行人數(shù)量和通行情況進(jìn)行圖像檢測處理,還有遙測遙感技術(shù)領(lǐng)域中地理檢測對(duì)于某地段的土壤分析、大氣氣候條件分析等都是通過衛(wèi)星遙感技術(shù)獲取對(duì)應(yīng)的圖像,在由圖像檢測技術(shù)獲取相關(guān)的信息來實(shí)現(xiàn)。利用并行處理量在處理圖像檢測技術(shù)時(shí)提取圖像邊緣信息,在圖像小模塊中利用并行處理技術(shù)綜合分析其非對(duì)稱分布的信息。再有就是利用HOS技術(shù)在生物醫(yī)學(xué)中對(duì)于病變組織實(shí)行檢測,其關(guān)鍵是要先對(duì)生物組織進(jìn)行掃描確定,然后利用數(shù)字射頻技術(shù)對(duì)掃描空間的HOS進(jìn)行分析。并行處理量在圖像檢測中的較為常見的應(yīng)用還有對(duì)于乳腺的檢測,現(xiàn)階段X線圖像都是通過子帶分解濾波器進(jìn)行處理,然后將帶子的圖像分解成為交替疊加的正方形區(qū)域,利用并行處理量中的并行處理矩估計(jì)各個(gè)區(qū)域的偏態(tài)數(shù)據(jù),這些由并行處理量算出來的技術(shù)參數(shù)都能夠作為確定區(qū)域的非對(duì)稱性和脈沖幅度,實(shí)際應(yīng)用效果表明并行處理量在檢測微鈣化方面有著較為明顯的效果。還有較為常見的利用是在機(jī)動(dòng)車的檢測中,并行處理量在機(jī)動(dòng)車檢測中,能夠通過掃描產(chǎn)生的HOS信號(hào)對(duì)于機(jī)動(dòng)車進(jìn)行車身進(jìn)行檢測,并且在檢測前期并不需要了解待檢機(jī)動(dòng)車的型號(hào),就算檢測條件比較復(fù)雜,也能夠?qū)崿F(xiàn)對(duì)于待檢車輛的檢測。

1.5 圖像復(fù)原技術(shù)

圖像復(fù)原技術(shù)的開發(fā)是為了改善有價(jià)值圖像的質(zhì)量,比如在網(wǎng)絡(luò)傳輸中容易出現(xiàn)圖像質(zhì)量損失的情況,或者是對(duì)于圖像要進(jìn)行特效處理,再者就是對(duì)于失誤操作引起的圖像的恢復(fù)技術(shù)。圖像處理領(lǐng)域?qū)τ趫D像的恢復(fù)技術(shù)從上世紀(jì)就開始了,當(dāng)時(shí)在圖像處理領(lǐng)域掀起了較大的波瀾,許多研究者相繼發(fā)表了自己的圖像恢復(fù)技術(shù),但是隨著圖像恢復(fù)要求的不斷增高,原有的圖像恢復(fù)技術(shù)已經(jīng)不能夠滿足圖像復(fù)原的要求了,因此人們開始著力于并行處理量技術(shù)。通過研究發(fā)現(xiàn),采用并行處理量對(duì)圖像進(jìn)行修復(fù),不用對(duì)于原始圖像進(jìn)行評(píng)估來建立修復(fù)模型,并行處理技術(shù)能夠估計(jì)出原始圖像和現(xiàn)有圖像的模糊數(shù)據(jù)。尤其是后期盲圖像恢復(fù)技術(shù)的研究成功,為圖像復(fù)原技術(shù)帶來了新的技術(shù)革命。盲圖像恢復(fù)技術(shù)包括模糊投影技術(shù)和恢復(fù)投影技術(shù)兩部分內(nèi)容。對(duì)于模糊投影處理技術(shù)而言,要首先對(duì)需要處理的圖像進(jìn)行投影變換,將二維圖像轉(zhuǎn)換為一維圖片,然后再通過盲圖像處理技術(shù)進(jìn)行點(diǎn)擴(kuò)散估計(jì)。對(duì)于恢復(fù)投影技術(shù),則是先利用并行處理量技術(shù)采用去卷積操作,是喜愛那投影回到原圖像中實(shí)現(xiàn)圖像復(fù)原的目的。目前還有更為先進(jìn)的含噪模糊圖喜愛那個(gè)PSF技術(shù)來實(shí)現(xiàn)圖像的復(fù)原,這種技術(shù)能夠?qū)D像別細(xì)微的地方進(jìn)行修復(fù)處理,并建立基礎(chǔ)的模型,圖像的基礎(chǔ)參數(shù)用并行處理圖像處理法來進(jìn)行確定,主要是利用并行處理量中的并行處理累積量來確定,之前的使用模擬實(shí)驗(yàn)驗(yàn)證了該技術(shù)的可行性。還有研究人員將研究方向轉(zhuǎn)向模糊類型的并行處理量技術(shù)研究,從目前的研究進(jìn)展來看,該技術(shù)在圖像恢復(fù)中有著較為明朗的應(yīng)用前景。

2 并行處理中存在的問題及其前景展望

在并行處理技術(shù)的不斷進(jìn)步中,由于其理論知識(shí)和實(shí)際應(yīng)用仍存在一定差距,使得圖像的并行處理研究領(lǐng)域中仍存在技術(shù)瓶頸,如在圖像內(nèi)容和信號(hào)處理的融合過程中,由于HOS理論仍側(cè)重于對(duì)圖像處理技術(shù)的討論,而導(dǎo)致圖像與信號(hào)處理無法實(shí)現(xiàn)有機(jī)融合,使得圖像和信號(hào)的轉(zhuǎn)化技術(shù)出現(xiàn)漏洞。在圖像和信號(hào)處理過程中,并行處理中存在的問題會(huì)對(duì)圖像的處理產(chǎn)生直接的影響,因此有效解決并行處理問題,是圖像處理技術(shù)發(fā)展的關(guān)鍵。在并行處理對(duì)圖像進(jìn)行處理時(shí),由于并行處理次的HOS技術(shù)開發(fā)仍不成熟,使得并行處理在對(duì)圖像進(jìn)行多維處理時(shí),無法做到精確的數(shù)據(jù)測量,進(jìn)而影響到圖像的并行處理譜測定。

基于現(xiàn)階段的圖像并行處理技術(shù)基礎(chǔ),在伴隨并行處理理論進(jìn)步的同時(shí),也會(huì)有力帶動(dòng)實(shí)用并行處理技術(shù)的發(fā)展,HOS技術(shù)的成熟,會(huì)使得并行處理在圖像的分割,濾波及特性勢(shì)識(shí)別提取等技術(shù)中得到更為深入的應(yīng)用,隨著圖像維數(shù)研究的進(jìn)一步深入,圖像與信號(hào)處理會(huì)更為優(yōu)化,并通過高效結(jié)合有效完善并行處理技術(shù)。通過在圖像處理技術(shù)中應(yīng)用并行處理,實(shí)現(xiàn)了HOS技術(shù)和其他信號(hào)處理理論的有機(jī)結(jié)合,使得圖像處理能夠應(yīng)用到FPGA和DSP等技術(shù)的實(shí)際應(yīng)用中,并伴隨并行處理的深入研究受到更為廣泛的應(yīng)用,進(jìn)一步提高圖像處理技術(shù)的高效性和完整性。

現(xiàn)階段對(duì)于并行處理的研究還有實(shí)現(xiàn)統(tǒng)一的理論能夠使HOS在信號(hào)濾波、檢測及獲取等全過程的較為完整的技術(shù)知識(shí)體系。伴隨著工業(yè)生產(chǎn)的要求越來越高,對(duì)于圖像處理技術(shù)的要求也越來越高,傳統(tǒng)的二維處理技術(shù)已經(jīng)不能夠滿足圖像處理的要求,圖像處理會(huì)向著三維甚至是多維方向發(fā)展,圖像維數(shù)的增加會(huì)對(duì)并行處理圖像處理技術(shù)的數(shù)據(jù)處理量增高,進(jìn)而導(dǎo)致數(shù)據(jù)處理時(shí)間變長,因此提高并行處理的算法速度是目前急需解決的技術(shù)難題之一。再者對(duì)于并行處理的圖像處理技術(shù),目前為止還沒有完整的優(yōu)化修復(fù)技術(shù)標(biāo)準(zhǔn),這對(duì)于并行處理技術(shù)在圖像處理方面的大范圍推廣和長久發(fā)展帶來了一定程度的困擾。因此并行處理的未來研究勢(shì)必會(huì)向著建立統(tǒng)一的優(yōu)化標(biāo)準(zhǔn)為方向,提高并行處理的適用范圍,為其進(jìn)一步發(fā)展提供理論上的可能?,F(xiàn)階段并行處理在小波變形、人工神經(jīng)網(wǎng)絡(luò)分析等領(lǐng)域還沒有很好的應(yīng)用,因此研究人員必須在小波變形等領(lǐng)域進(jìn)一步挖掘并行處理的適用內(nèi)容,提高并行處理的應(yīng)用效率,進(jìn)一步推廣并行處理在圖像處理領(lǐng)域的適用范圍。

3 結(jié)語

雖然現(xiàn)階段并行處理技術(shù)取得了較大的成就,但是現(xiàn)階段還沒有形成統(tǒng)一的使用方法,因此還不能建立有效完整的評(píng)價(jià)體系,因此必須在現(xiàn)有的科學(xué)技術(shù)水平上,繼續(xù)挖掘并行處理與其他學(xué)科和工業(yè)的內(nèi)在聯(lián)系,將并行處理的應(yīng)用更加的完善和健全,進(jìn)一步提高我國工業(yè)生產(chǎn)及人們生活的水平。

參考文獻(xiàn)

[1]蘇光大.圖像并行處理技術(shù)[J].北京清華大學(xué)出版社,2013.

[2]汪潤生.圖像理解[J].長沙國防科技大學(xué)出版社,2013.

[3]朱述龍.遙感圖像獲取與分析[J].北京科學(xué)出版社,2013.

[4]趙忠明.基于小波提取邊緣特征點(diǎn)的遙感圖像配準(zhǔn)技術(shù)[J].西北工業(yè)大學(xué),2012.