神經(jīng)網(wǎng)絡(luò)的運(yùn)用范文

時間:2024-03-28 18:14:37

導(dǎo)語:如何才能寫好一篇神經(jīng)網(wǎng)絡(luò)的運(yùn)用,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

神經(jīng)網(wǎng)絡(luò)的運(yùn)用

篇1

關(guān)鍵詞:瓷磚表面缺陷;布爾神經(jīng)網(wǎng)絡(luò);瓷磚檢測

中圖分類號:TP274 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-2374(2013)30-0031-02

過去的神經(jīng)網(wǎng)絡(luò)沒有解釋能力,其不能很好地觀測物體內(nèi)部機(jī)理構(gòu)造,而本文所論述的布爾神經(jīng)網(wǎng)絡(luò)是在過去神經(jīng)網(wǎng)絡(luò)上的一種升級,它將原始數(shù)據(jù)按照某種規(guī)則進(jìn)行了編碼,然后利用編碼后得到的數(shù)據(jù)信息來重新驅(qū)動網(wǎng)絡(luò),其各個節(jié)點(diǎn)具備有效的物理意義。當(dāng)前瓷磚表面的缺陷依據(jù)瓷磚不規(guī)則性及顏色可分為幾種,按照缺陷所對應(yīng)的類型可選擇使用不同的濾波器來進(jìn)行檢測,因?yàn)槿毕荽纱u表面通常存在不規(guī)則形,所以濾波器在使用過程中有著極大的局限性,針對缺陷本身來說,雖然不同的瓷磚產(chǎn)品有著一定的差異,但是同種瓷磚又基本保持不變。而布爾神經(jīng)網(wǎng)絡(luò)其可在大范圍內(nèi)有效控制檢測的精度及速度,并具有智能型,因此對它的研究將具備極為重要的現(xiàn)實(shí)意義。

1 布爾神經(jīng)網(wǎng)絡(luò)應(yīng)用背景

隨著社會經(jīng)濟(jì)的不斷發(fā)展,客戶對各類型產(chǎn)品表面的質(zhì)量要求越來越苛刻,表面質(zhì)量已經(jīng)成為了直接決定產(chǎn)品價格及各個企業(yè)之間競爭的重要指標(biāo),另外,過去的人工目視檢測方法存在很多的缺陷及不足,如無法適應(yīng)高速機(jī)組,對細(xì)小表面缺陷的檢測效率極低,并且如果長期進(jìn)行檢測,檢測人員易出現(xiàn)視覺疲勞而無法長時間有效地進(jìn)行整個材料表面的檢測。總之,傳統(tǒng)的檢測已經(jīng)無法滿足現(xiàn)代化生產(chǎn)的需要。在這種背景下,新的檢測方法必然出現(xiàn),而其中布爾神經(jīng)網(wǎng)絡(luò)的應(yīng)用就是其中的一種有效的檢測手段。

2 廣義的布爾神經(jīng)網(wǎng)絡(luò)

過去的BP網(wǎng)絡(luò)在分類上屬于一種分層網(wǎng)絡(luò),其各個節(jié)點(diǎn)域下一層節(jié)點(diǎn)在連接時通常是完全均勻的,而這種均勻直接連接在圖像感知時通常會致使網(wǎng)絡(luò)感知能力受到限制,但是廣義的布爾神經(jīng)網(wǎng)絡(luò)是通過研究過去的前向神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)及缺陷之后升級而來。如果單獨(dú)從數(shù)據(jù)驅(qū)動方面來講,布爾神經(jīng)網(wǎng)絡(luò)也可叫做前向傳播網(wǎng)絡(luò)。在該網(wǎng)絡(luò)中其各個權(quán)重和神經(jīng)網(wǎng)絡(luò)只能取值兩個,分別為{-1,1}、{0,1},其閾值也被限定為整數(shù)。

但是在具體進(jìn)行運(yùn)算階段通常是使用二進(jìn)乘法、整數(shù)加法、比較操作法等幾種方法,因此與傳統(tǒng)的方法相比較其運(yùn)算速度得到了提高,另外,這種網(wǎng)絡(luò)在訓(xùn)練階段因?yàn)椴淮嬖诜聪騻鞑ミ^程,所以其不需要反復(fù)迭代,這使得其運(yùn)算速度又得到了進(jìn)一步提高。

設(shè)總數(shù)是K的訓(xùn)練樣本為ak,當(dāng),根據(jù)樣本ak,可計(jì)算對應(yīng)的權(quán)值wk=2ak-1,由于ak的取值范圍在[0、1],因此,其第k節(jié)點(diǎn)的閾值表達(dá)式為:

在該式中rk表示神經(jīng)網(wǎng)絡(luò)第k節(jié)點(diǎn)的吸引域,在該吸引域中心是該神經(jīng)網(wǎng)絡(luò)的權(quán)重矢量中心wk,而在對樣本進(jìn)行具體檢測時通常應(yīng)用的方法為漢明距離測量法,如果測試樣本在進(jìn)入某節(jié)點(diǎn)吸引域,那么對應(yīng)的節(jié)點(diǎn)則被激活,其值顯示為1。

2.1 布爾神經(jīng)網(wǎng)絡(luò)檢測流程

布爾神經(jīng)網(wǎng)絡(luò)是一種三層網(wǎng)絡(luò),如圖1所示,其第一層通常設(shè)置為輸入層,在進(jìn)行檢測過程中在該層輸入標(biāo)本模式數(shù)據(jù),在分類過程則輸入采樣樣本數(shù)據(jù)信息,其第二層通常是以C個節(jié)點(diǎn)所組成,其各個節(jié)點(diǎn)都與輸入點(diǎn)相互連接,各個節(jié)點(diǎn)均有三個相同的參數(shù),即權(quán)重、閾值及吸引域,這些參數(shù)必須要由訓(xùn)練算法來求算,第三層包括兩個節(jié)點(diǎn),分別是接受節(jié)點(diǎn)與拒絕節(jié)點(diǎn),接受節(jié)點(diǎn)的閾值為1,和各個種類的節(jié)點(diǎn)相互連接的閾值也是1,拒絕的節(jié)點(diǎn)的閾值則為θ,其和第二層的連接權(quán)重則為-1,當(dāng)種類層中出現(xiàn)多個節(jié)點(diǎn)是1的時候,那么接收點(diǎn)將被激活,與之相反當(dāng)所有的種類節(jié)點(diǎn)顯示為0時,那么拒絕節(jié)點(diǎn)將被激活,說明該次輸入為奇異點(diǎn),也叫做缺陷點(diǎn),進(jìn)而完成對缺陷的檢測。

2.2 布爾神經(jīng)網(wǎng)絡(luò)的連續(xù)特征值

以上所述的布爾神經(jīng)網(wǎng)絡(luò)需要輸入的驅(qū)動數(shù)據(jù)是二進(jìn)制數(shù),但在實(shí)際運(yùn)用過程通常是連續(xù)值,因此必須要對該網(wǎng)絡(luò)所對應(yīng)的連續(xù)特征值進(jìn)行研究,首先要對連續(xù)值做好編碼,將這些數(shù)據(jù)信息轉(zhuǎn)化為和其完全對應(yīng)的二進(jìn)制數(shù),而其具體的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2所示,該處通常利用溫度計(jì)進(jìn)行編碼,在實(shí)際操作過程中使用一連串的1來對連續(xù)值進(jìn)行對應(yīng)表示。因?yàn)槠浯嬖趯?yīng)關(guān)系,因此該串1的長度和連續(xù)量的值一般為正比關(guān)系,在具體進(jìn)行編碼過程中,由于要對一些特征值進(jìn)行歸一化數(shù),導(dǎo)致同類型的特征值在差異方面出現(xiàn)了更大的變化。

2.2.1 編碼算法。(1)對所有的特征值進(jìn)行歸一化,讓其值的分布區(qū)間在[0,1],即以其最大值除去其所有的同種特征值。(2)選定一個有效的正整數(shù),稱編碼為階次,使用該階次與所得歸一化特征值相乘,再加上0.5,并和其最為靠近的整數(shù)相互替換,最后將特征值變?yōu)檎麛?shù),使其分布區(qū)間為[1,階次+1]。(3)將相互替換得到的整數(shù)變?yōu)槎M(jìn)制數(shù),如果所得二進(jìn)制數(shù)的階次為5,則第4的編碼為111100。

2.2.2 訓(xùn)練計(jì)算。首先將訓(xùn)練獲取的數(shù)據(jù)及信息逐一離散化、歸一化,其次構(gòu)建好網(wǎng)絡(luò),依據(jù)一定的規(guī)律在訓(xùn)練過程中有序的增減種類節(jié)點(diǎn),接著對特征節(jié)點(diǎn)所對應(yīng)的閾值依據(jù)二進(jìn)制布爾神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式來求算,通常情況下訓(xùn)練節(jié)點(diǎn)的權(quán)重是1,而其閾值和所對應(yīng)連接特征數(shù)其對應(yīng)的權(quán)重及閾值均是1。

2.2.3 分類計(jì)算。(1)對輸入的樣本信息進(jìn)行歸一化并進(jìn)行編碼轉(zhuǎn)換。(2)假設(shè)拒絕節(jié)點(diǎn)顯示為1,那么根據(jù)第四步進(jìn)行。(3)種類節(jié)點(diǎn)的閾值必須加1。(4)如果拒絕節(jié)點(diǎn)顯示為1,則根據(jù)第五步或者根據(jù)第三步進(jìn)行。(5)種類層其節(jié)點(diǎn)在進(jìn)行計(jì)算時必須要減1,另外需要讀取的種類節(jié)點(diǎn)也是1,并且在進(jìn)行檢測時確定其所屬的種類。(6)將各種類層所對應(yīng)節(jié)點(diǎn)的閾值減去2,并進(jìn)行再次分類。

3 分層進(jìn)行檢測

在具體利用布爾神經(jīng)網(wǎng)絡(luò)檢測瓷磚表面缺陷過程中,除了必要的將網(wǎng)絡(luò)分類中權(quán)重及閾值除去外,還要求對神經(jīng)節(jié)點(diǎn)的各個吸引域做好對應(yīng)的控制,但是其對一些較大的吸引域做出的結(jié)果往往很是粗糙,這致使虛警出現(xiàn)的概率大大地增加,另外也會導(dǎo)致漏警出現(xiàn)的概率增加。在進(jìn)行分層檢測時,對于存在差異的分辨率要求適應(yīng)不同的吸引域,對一些較低分辨率要求采用較大的吸引域,隨著進(jìn)行逐層檢驗(yàn)還需要緩慢減小吸引域,最終使得檢驗(yàn)精度得到有效提高,因?yàn)閷ο聦拥臋z驗(yàn)是在上層檢驗(yàn)結(jié)果出現(xiàn)之后才進(jìn)行的,所以排除了吸引域,因此使得檢驗(yàn)精度得到不斷提高。從圖像顯示來說,圖像結(jié)構(gòu)包含K個層次,其中不同的層次在組合過程中其分辨率存在差異,最底層是由最初的輸入圖像,而在塔形k+1層則是下層元素在該基礎(chǔ)的一種簡單變換,另外第k層的元素比k+1層要多,這就呈現(xiàn)了一種塔形結(jié)構(gòu),因此對輸入客體來講,其敘述的準(zhǔn)確性相對K層來說較為粗糙,最后頂層所具有的的元素應(yīng)該

最少。

4 布爾神經(jīng)網(wǎng)絡(luò)方法的運(yùn)用方向

一般來說瓷磚表面出現(xiàn)的缺陷主要為刮痕、裂紋、斑點(diǎn)及針孔,其中針孔缺陷在進(jìn)行檢測時通常是根據(jù)其的反射性質(zhì),并通過線型CCD來完成檢測的,而本文所述的檢測手段僅對瓷磚表面的刮痕、裂紋及斑點(diǎn)進(jìn)行檢測,由于瓷磚本身的大小及形狀有著極大的不確定性,所以使用本文所述的方法進(jìn)行瓷磚的缺陷檢測比傳統(tǒng)濾波器檢測效果

更好。

5 結(jié)語

本文主要闡述了對瓷磚表面缺陷檢測過程中布爾神經(jīng)網(wǎng)絡(luò)技術(shù)的一些簡單運(yùn)用,其具體分為兩個階段,即訓(xùn)練階段與檢測階段,為了測試檢測的正確性,通常是將同一塊磚的無缺陷部位來作為檢測的訓(xùn)練樣本,而將其中的缺陷部分進(jìn)行檢測,工作時充分利用以下三個參數(shù):方差、能量、均值,在數(shù)字化過程中要求取階次N=10,這樣可直接獲取[1,11]位所對應(yīng)的二進(jìn)表達(dá),因?yàn)槭褂昧藴囟冗M(jìn)行編碼,所以整個過程一定要以值的大小來做基礎(chǔ)參考,從實(shí)驗(yàn)結(jié)果來看,利用本文所述的方法來檢測,對缺陷的檢出率得到了有效提高。

參考文獻(xiàn)

[1] 戴哲敏,許增樸,于德敏,王永強(qiáng).計(jì)算機(jī)視覺在

瓷磚表面顏色勻度分析中的應(yīng)用[J].中國陶瓷工業(yè),

2002,(4).

[2] 吳平川,路同浚,王炎.機(jī)器視覺與鋼板表面缺陷的

無損檢測[J].無損檢測,2000,(1).

[3] 趙海洋,馮心海,薛鈞義,江顯異.基于機(jī)器視覺的

瓷磚表面質(zhì)量分析與檢測[J].西安建筑科技大學(xué)學(xué)報(bào)

(自然科學(xué)版),2000,(1).

[4] 羅瑋,彭復(fù)員,柳健.彩色瓷磚的自動分類系統(tǒng)[J].

篇2

一般而言,計(jì)算機(jī)網(wǎng)路安全管理指的是計(jì)算機(jī)在連接網(wǎng)絡(luò)后進(jìn)行信息的交換、瀏覽以及下載的過程中,對信息安全進(jìn)行有效的管理,防止信息被他人竊取或者破壞。隨著信息時代的到來,越來越多的人對計(jì)算機(jī)產(chǎn)生了很強(qiáng)的依賴,從兒童到老年人,計(jì)算機(jī)的影響無處不在,隨著計(jì)算機(jī)的普及,人們在使用計(jì)算機(jī)的過程中對其安全性就有了顧忌。對于計(jì)算機(jī)網(wǎng)絡(luò),只要連接互聯(lián)網(wǎng),隨時都存在被攻擊的可能,相對而言,沒有任何計(jì)算機(jī)是絕對的安全或者是不受到任何的攻擊。運(yùn)用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)行攻擊或者盜取個人信息或者是企業(yè)信息的事件凡乎每年都會發(fā)生,計(jì)算機(jī)網(wǎng)絡(luò)存在嚴(yán)重的安全隱患。所以,要及時的認(rèn)識以及了解計(jì)算機(jī)網(wǎng)絡(luò)面臨的安全隱患,積極的采取相應(yīng)的措施加強(qiáng)對計(jì)算機(jī)網(wǎng)絡(luò)安全的管理

2神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理應(yīng)用的現(xiàn)狀

2.1對神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)安全管理運(yùn)用中的重視程度不夠。計(jì)算機(jī)網(wǎng)絡(luò)安全是因特網(wǎng)發(fā)展的最基礎(chǔ)的目的,但與此同時近乎所有的計(jì)算機(jī)網(wǎng)絡(luò)在開創(chuàng)以及不斷的發(fā)展過程中都趨向于實(shí)用以及便利,相反卻在一定程度卜沒有重視對計(jì)算機(jī)的安全管理,更沒有將神經(jīng)網(wǎng)絡(luò)技術(shù)運(yùn)用到計(jì)算機(jī)的安全管理中,進(jìn)而對計(jì)算機(jī)網(wǎng)絡(luò)的安全管理留下了嚴(yán)重的隱患。另外,神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中主要是對計(jì)算機(jī)的網(wǎng)絡(luò)安全進(jìn)行評估,然而由于不重視對神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中的運(yùn)用,使得沒有建立良好的計(jì)算機(jī)網(wǎng)絡(luò)安全評價標(biāo)準(zhǔn)體系。

2.2對神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全評價模型的設(shè)計(jì)和實(shí)際運(yùn)用不夠合理。一般來說,神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中主要是對計(jì)算機(jī)網(wǎng)絡(luò)安全進(jìn)行一定的評估,在對其進(jìn)行評估的過程中,就需要設(shè)計(jì)一定的計(jì)算機(jī)網(wǎng)絡(luò)安全評價模型,主要包含刊浦俞入層、輸出層以及隱含層的設(shè)計(jì);但是,目前神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中對于評價模型的設(shè)計(jì)還沒有將這三方面有效的聯(lián)系起來、除此之外,對神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理的實(shí)際運(yùn)用中,不能科學(xué)、合理的實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)安全管理評價模型運(yùn)用,不注重對評價模型的學(xué)習(xí)以及不關(guān)注對評價模型進(jìn)行有效的驗(yàn)證。

3加強(qiáng)神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中的應(yīng)用采取的措施

3.1神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中要科學(xué)、合理的設(shè)計(jì)網(wǎng)絡(luò)安全評價模型。神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中要科學(xué)。合理的設(shè)計(jì)網(wǎng)絡(luò)安全評價模型,以便更好的實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)安全、高效的運(yùn)行。為此,計(jì)算機(jī)網(wǎng)絡(luò)安全評價模型需要進(jìn)行一下設(shè)計(jì):首先是對輸入層的設(shè)計(jì),一般來說,神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中,對于輸入層考慮的是神經(jīng)元的節(jié)點(diǎn)數(shù)以及評價指標(biāo)的數(shù)量,盡可能的使這兩者數(shù)量保持一致。其次是對隱含層的設(shè)計(jì),對于隱含層的設(shè)計(jì)需要注意的是若某個連續(xù)函數(shù)在任意的閉區(qū)間中,可以通過在隱含層里的神經(jīng)網(wǎng)絡(luò)來靠近,大多數(shù)情況下,神經(jīng)網(wǎng)絡(luò)通常運(yùn)用的是單隱含層。最后是輸出層的設(shè)計(jì),神經(jīng)網(wǎng)絡(luò)的輸出層設(shè)計(jì)主要是獲得計(jì)算機(jī)網(wǎng)絡(luò)安全管理評價的最終結(jié)果,例如可以設(shè)置計(jì)算機(jī)網(wǎng)絡(luò)安全管理評價的輸出層節(jié)點(diǎn)數(shù)為2,那么相應(yīng)的輸出結(jié)果(l,)l指的是非常安全、(o,)l指的是較不安全、(,l山指的是基本安全以及(,0切指的是非常的不安全。

3.2神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中要對評價模型進(jìn)行有效的驗(yàn)證。需要注意的是,神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中要對評價模型進(jìn)行有效的驗(yàn)證,一般體現(xiàn)在一下幾方面:首先是要關(guān)注評價模型的實(shí)現(xiàn),為了實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中的良好運(yùn)用,就要依據(jù)客戶滿意的評價模型,運(yùn)用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)創(chuàng)建設(shè)置含有輸入層、隱含層以及輸出層的神經(jīng)網(wǎng)絡(luò)模型,然后再對網(wǎng)絡(luò)安全進(jìn)行檢驗(yàn)。其次是要注意對評價模型的學(xué)習(xí),在對計(jì)算機(jī)網(wǎng)絡(luò)安全進(jìn)行評價之前,需要對神經(jīng)網(wǎng)絡(luò)進(jìn)行標(biāo)準(zhǔn)化的處理,才能盡可能的減少對計(jì)算機(jī)網(wǎng)絡(luò)安全管理評價中的誤差。最后要注意對評價模型進(jìn)行驗(yàn)證,當(dāng)神經(jīng)網(wǎng)絡(luò)經(jīng)過標(biāo)準(zhǔn)化處理以及在計(jì)l章機(jī)網(wǎng)絡(luò)安全評價之后,就需要刊輸出的結(jié)果進(jìn)行一定的驗(yàn)證,以便確定神經(jīng)網(wǎng)絡(luò)對計(jì)算機(jī)網(wǎng)絡(luò)安全的評價輸出結(jié)果是否與期望的評價結(jié)果相一致,進(jìn)一步驗(yàn)證神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中安全評價模型的準(zhǔn)確與否。

3.3重視神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用以及建立健全安全評價標(biāo)準(zhǔn)體系。神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中主要的任務(wù)是對計(jì)算機(jī)網(wǎng)絡(luò)的安全進(jìn)行一定的評價,并且將評價的結(jié)果準(zhǔn)確、及時的反饋給用戶,所以就應(yīng)該對其在計(jì)算機(jī)網(wǎng)絡(luò)安全管理中的應(yīng)用引起高度的重視,為此就應(yīng)該建立健全計(jì)算機(jī)網(wǎng)絡(luò)安全管理的評價標(biāo)準(zhǔn)體系。一方面是評價指標(biāo)的建立,計(jì)算機(jī)網(wǎng)絡(luò)安全管理是復(fù)雜的過程,同時影響計(jì)算機(jī)網(wǎng)絡(luò)安全的因素比較多。因此,建立科學(xué)、合理以及有效的計(jì)算機(jī)網(wǎng)絡(luò)安全管理評價標(biāo)準(zhǔn),對于神經(jīng)網(wǎng)絡(luò)高效的開展評價工作有很大的關(guān)聯(lián)。另一方面是刊評價標(biāo)準(zhǔn)的準(zhǔn)確化,影響計(jì)算機(jī)網(wǎng)絡(luò)安全管理的因素非常的多,就應(yīng)該對各種評價標(biāo)準(zhǔn)進(jìn)行細(xì)化,以達(dá)到評價的準(zhǔn)確。

4結(jié)束語

篇3

關(guān)鍵詞 人工神經(jīng)網(wǎng)路 林分材種出材率 BP算法

引言

林分材種出材率是林分調(diào)查工作的重要指標(biāo),它可以進(jìn)一步評價森林木材資源的經(jīng)濟(jì)價值,而研究森林木材,又可以合理正確的經(jīng)營森林資源,達(dá)到人與自然和諧相處的目的。林分林種出材率就是原木材積于立木材積之比,我國現(xiàn)行的森林采伐限額制度、查處亂砍濫伐林木案件、制訂林業(yè)發(fā)展規(guī)劃、計(jì)劃和編制森林經(jīng)營方案、預(yù)測和計(jì)算、開展森林資源資產(chǎn)評估等等,都需掌握積蓄量和材種的出材率的指標(biāo)。我國已經(jīng)不斷學(xué)習(xí)借鑒前蘇聯(lián)的先進(jìn)技術(shù)編制自己的材種出材率表了,隨著我國天然林保護(hù)工程的全面實(shí)施和林業(yè)分類經(jīng)營的逐步推行,人工商品林比例的不斷提高,我國森林結(jié)構(gòu)和性質(zhì)也有所變化,所以傳統(tǒng)的統(tǒng)計(jì)學(xué)以難以解決很多問題,運(yùn)用人工神經(jīng)網(wǎng)絡(luò)在林業(yè)生成與運(yùn)用則是一個不二之選的方法,對林業(yè)的發(fā)展也有很大的理論價值和推廣意義。

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network-ANN),簡稱“神經(jīng)網(wǎng)絡(luò)”,是由大量處理單元過極其豐富和完善的互聯(lián)組成的非線性、自適應(yīng)信息處理系統(tǒng)。它的提出是基于現(xiàn)代神經(jīng)科學(xué)研究成果上,以模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行信息處理。涉及學(xué)科較多,較為廣泛。

1 研究內(nèi)容和方法

平均樹高,平均胸徑,林種年齡,立地質(zhì)量,積蓄量,保留密度等等因素都會影響林分材種出材率,而林分林種出材率具有非線性和非確定性的因素,一般采用統(tǒng)計(jì)分析方法進(jìn)行預(yù)測采樣,需要大量的林木樣本元素,模型涉及的許多參數(shù)無法或很難有較高的精確度。

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)具有非線性,非局限性,自適應(yīng),自組織,自學(xué)習(xí)的特征,相較于傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,不同之處在于它的容錯性和儲存量,通過單元之間的相互作用,相互連接能模擬大腦的局限性。ANN的獨(dú)到之處,也使得人們注意了ANN,并且廣泛的應(yīng)用于各種學(xué)科之中,如心理學(xué),邏輯學(xué),數(shù)學(xué)模型,遺傳算法,語音識別,智能控制等等。當(dāng)然,運(yùn)用人工神經(jīng)網(wǎng)絡(luò)對林分林種出材率進(jìn)行預(yù)測也同樣具有很好的效果與實(shí)現(xiàn)。

研究主要完成,通過對數(shù)據(jù)的采樣和分析處理,對神經(jīng)網(wǎng)路預(yù)測模型的結(jié)構(gòu),參數(shù)進(jìn)行優(yōu)化,再應(yīng)用到林分材種出材率的預(yù)測中。以c++程序設(shè)計(jì)為設(shè)計(jì)平臺,運(yùn)用人工神經(jīng)網(wǎng)絡(luò)中的BP算法,分析各隱含層神經(jīng)元的數(shù)量,訓(xùn)練的次數(shù),隱含層函數(shù),樣本數(shù)量,進(jìn)行優(yōu)化建立林分材種出材率的預(yù)測模型。

1.1BP人工神經(jīng)網(wǎng)絡(luò)

BP(Back-Propagation Network)神經(jīng)網(wǎng)絡(luò)是一種以誤差逆?zhèn)鞑ニ惴?BP)訓(xùn)練的多層前饋網(wǎng)絡(luò),目前應(yīng)用較為廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)和存貯多個輸入-輸出模式映射關(guān)系,而且無需事前對這種映射關(guān)系的數(shù)學(xué)方程進(jìn)行描述。它通過不斷反向傳播來調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,使神經(jīng)網(wǎng)絡(luò)的誤差平方和最小。BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)由三層組成分別是輸入層(input)、隱層(hidelaver)和輸出層(output layer)。

BP人工神經(jīng)網(wǎng)絡(luò)主要以標(biāo)準(zhǔn)BP算法為主,而標(biāo)準(zhǔn)BP算法有存在許多問題,由于是非線性梯度優(yōu)化算法,就會存在局部極小值問題,使得精確度受限;算法迭代系數(shù)過多,使得學(xué)習(xí)率降低,收斂速度降低;網(wǎng)絡(luò)對初始化的值存在發(fā)散和麻痹;隱節(jié)點(diǎn)不確定性的選取。所以引進(jìn)了幾種BP算法:動量BP算法、學(xué)習(xí)速率可變的BP算法和LM算法(Levenberg-Marquardt)。動量BP算法以上一次修正結(jié)果來影響本次的修正,動量因子越大,梯度的動量就越大。學(xué)習(xí)效率可變的BP算法怎是力求算法的穩(wěn)定,減小誤差。為了在近似二階訓(xùn)練速率進(jìn)行修正時避免計(jì)算HeSSian矩陣,選擇LM算法。所以為了神經(jīng)網(wǎng)絡(luò)計(jì)算的速度與精確度,所以運(yùn)用不同的優(yōu)化算法來改善BP網(wǎng)絡(luò)中的局部極小值問題,提高收斂速度和避免了抖動性。

2 基于BP人工神經(jīng)網(wǎng)絡(luò)和林分材種出材率預(yù)測模型的建立

分析了大量的材種出材率的相關(guān)資料后,均有非線性的特征,對于模型的建立和預(yù)測,傳統(tǒng)的識別系統(tǒng)在研究和實(shí)踐中有很大的問題,而采用人工神經(jīng)網(wǎng)絡(luò),不僅其特征是非線性,而且人工神經(jīng)網(wǎng)絡(luò)具有較為穩(wěn)定的優(yōu)越性,所以,對于林分材種出材率的預(yù)測和建立采用BP人工神經(jīng)網(wǎng)絡(luò)。

2.1建模工具

研究采用c++程序設(shè)計(jì)對數(shù)值的計(jì)算和預(yù)測,對模型進(jìn)行編譯和實(shí)現(xiàn)。c++語言是受到非常廣泛應(yīng)用的計(jì)算機(jī)編程語言,它支持過程化程序設(shè)計(jì),面向?qū)ο蟪绦蛟O(shè)計(jì)等等程序設(shè)計(jì)風(fēng)格。c++是一門獨(dú)立的語言,在學(xué)習(xí)時,可以結(jié)合c語言的知識來學(xué)習(xí),而c++又不依賴于c語言,所以我們可以不學(xué)c語言而直接學(xué)習(xí)C++。

用c++來模擬BP網(wǎng)絡(luò)是相對較好的程序設(shè)計(jì)語言,以面向?qū)ο蟪绦蛟O(shè)計(jì)來設(shè)計(jì)和實(shí)現(xiàn)林分材種出材率的BP算法,直觀而簡潔。

2.2BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的確定

對于使用BP算法,關(guān)鍵在于隱含層層數(shù)和各層節(jié)點(diǎn)數(shù)。而神經(jīng)元的輸入輸出又影響著隱含層層數(shù),而對于BP萬羅中的輸入輸出層是確定的,重點(diǎn)就在于隱含層層數(shù),增加隱含層數(shù)可以提高網(wǎng)絡(luò)的處理能力,是的訓(xùn)練復(fù)雜化,樣本數(shù)目增加,收斂速度變慢等,而隱含層的節(jié)點(diǎn)數(shù)越多,可以提到其精確度。

研究過程中,多層隱含層會將訓(xùn)練復(fù)雜化,所以我們往往選擇三層就夠了,即一個輸入層,一個隱含層,一個輸出層的基本單層BP網(wǎng)絡(luò)結(jié)構(gòu)。最后確定以下四個神經(jīng)元:平均樹高、平均胸徑、林種年齡、每公頃積蓄量作為輸入單元。輸出單元為林分材種出材率。

結(jié)論

以BP神經(jīng)網(wǎng)絡(luò)建立林分材種出材率的網(wǎng)絡(luò)模型,使得出材率的精確度提高。根據(jù)樣本的選取和整理,算法的優(yōu)化,避免了異常數(shù)據(jù)和算法的不安全性對神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)影響,提高了網(wǎng)絡(luò)的繁華能力,利用數(shù)據(jù)歸一化節(jié)約了網(wǎng)絡(luò)資源,學(xué)習(xí)負(fù)擔(dān)減輕,避免了訓(xùn)練過程中的抖動與麻痹狀態(tài)。歲模型的總體分析,減少神經(jīng)元個數(shù)的輸入,權(quán)值減少,極大的提高了網(wǎng)絡(luò)訓(xùn)練中的收斂速度,也使得網(wǎng)絡(luò)的穩(wěn)定性和容錯性提高。

篇4

關(guān)鍵詞:回歸神經(jīng)網(wǎng)絡(luò);時間序列;數(shù)據(jù)預(yù)測;歸一化方法

中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)07-1508-03

在工業(yè)、氣象、金融、地理、醫(yī)藥、交通、環(huán)境等領(lǐng)域,都存在大量需要進(jìn)行分析與處理的數(shù)據(jù)信息,在對這些數(shù)據(jù)信息進(jìn)行挖掘分析的過程中,為了能提高分析效能與提高分析性能,在進(jìn)行數(shù)據(jù)分析初期階段需要對原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)值通過某種算法轉(zhuǎn)化為所需分布范圍數(shù)據(jù),即數(shù)據(jù)標(biāo)準(zhǔn)化處理。

利用神經(jīng)網(wǎng)絡(luò)模型來進(jìn)時間序列數(shù)據(jù)趨勢預(yù)測是一個已經(jīng)開展了很長時間研究的熱門話題,這方面也有了許多研究成果。Connor[1]等運(yùn)用非線性自回歸平均移動預(yù)測模型來進(jìn)行時間序列問題魯棒預(yù)測,cheung[2]等運(yùn)用神經(jīng)網(wǎng)絡(luò)模型對未來的金融數(shù)據(jù)進(jìn)行預(yù)測,Wang[3]等設(shè)計(jì)出一種基于回歸神經(jīng)網(wǎng)絡(luò)的多維并行預(yù)測模型,文獻(xiàn)[4] 采用基于自回歸神經(jīng)網(wǎng)絡(luò)進(jìn)行多維動態(tài)預(yù)測。在運(yùn)用神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行趨勢預(yù)測時,需要對時間序列數(shù)據(jù)進(jìn)行缺失值及數(shù)據(jù)標(biāo)準(zhǔn)化處理,下文運(yùn)用多維動態(tài)預(yù)測模型對幾種常見的數(shù)據(jù)歸一化方法進(jìn)行分析。

1 回歸神經(jīng)網(wǎng)絡(luò)預(yù)測模型

圖一為基于回歸神經(jīng)網(wǎng)絡(luò)的多維動態(tài)預(yù)測模型[5]。網(wǎng)絡(luò)模型分為輸入層、分配層、隱層與輸出層四層;隱層為具有延遲一步功能的反饋單元,作用函數(shù)為Sigmoid函數(shù),輸出層作用函數(shù)為線性累加函數(shù)。

2 數(shù)據(jù)歸一化方法

數(shù)據(jù)歸一化方法很多,用的較多的有線性歸一化與非線性歸一化兩種方法。線性歸一化方法主要運(yùn)用極值或則均值通過線性運(yùn)算公式對原始數(shù)據(jù)進(jìn)行運(yùn)算,將數(shù)據(jù)轉(zhuǎn)換為[-1,1]區(qū)間內(nèi)的數(shù)值;非線性歸一化方法主要運(yùn)用一些非線性行數(shù)對原始數(shù)據(jù)進(jìn)行運(yùn)算,將數(shù)據(jù)轉(zhuǎn)換為一定分布范圍數(shù)據(jù)。

從實(shí)驗(yàn)結(jié)果來看,初始數(shù)據(jù)的歸一化處理方法對自回歸神經(jīng)網(wǎng)絡(luò)預(yù)測模型的預(yù)測性能有明顯的影響,線性歸一化方法中最大值運(yùn)算法要優(yōu)于最大最小值法;非線性歸一化方法中,對數(shù)運(yùn)算法優(yōu)于反正切運(yùn)算法,總體來看,運(yùn)用最大值運(yùn)算法對初始數(shù)據(jù)進(jìn)行歸一化標(biāo)準(zhǔn)化處理適合于自回歸神經(jīng)網(wǎng)絡(luò)預(yù)測模型。

4 結(jié)論

通過運(yùn)用基于自回歸神經(jīng)網(wǎng)絡(luò)的動態(tài)預(yù)測模型來分析幾種常見數(shù)據(jù)歸一化方法對模型預(yù)測性能的影響,結(jié)果表明,數(shù)據(jù)歸一化方法的選擇會對自回歸神經(jīng)網(wǎng)絡(luò)預(yù)測模型性能有明顯影響;對于自回歸神經(jīng)網(wǎng)絡(luò)預(yù)測模型,運(yùn)用最大值運(yùn)算法來進(jìn)行數(shù)據(jù)歸一化處理要優(yōu)于其它幾種常見方法。

參考文獻(xiàn):

[1] Connor J T,Martin R. D,Atlas L E.Recurrent neural networks and robust time series prediction[J].In IEEE Trans. on neural networks,1994(5):240–254.

[2] Cheung Y M,Leung W M,Xu L.A RPCL-CLP architeeture for finaneial time series forecasting[C].Proceedings of IEEE International Conference on Neural Network,1995,2:829-832.

篇5

本文作者:仇阿根、熊利榮、趙陽陽 單位:中國測繪科學(xué)研究院、武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院、華中農(nóng)業(yè)大學(xué)工學(xué)院

花生仁的外衣完整性檢測是一種模式識別。根據(jù)影響花生仁外衣完整性的顏色特征參數(shù),對花生仁外衣完整性進(jìn)行識別。在神經(jīng)網(wǎng)絡(luò)運(yùn)用領(lǐng)域里,算法的確定無法用一個完全標(biāo)準(zhǔn),主要是靠經(jīng)驗(yàn)來選擇的?;谝陨显?,花生仁外衣完整性檢測神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)算法選擇BP算法[9],該算法能實(shí)現(xiàn)輸入與輸出之間的非線性映射,對于樣本數(shù)量有限的情況也同樣適用。一個典型的BP網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。BP神經(jīng)網(wǎng)絡(luò)通常具有多個隱含層。本文中,隱層神經(jīng)元采用Sigmoid型傳遞函數(shù),輸出層采用logsig型傳遞函數(shù)?;ㄉ实耐庖峦暾詸z測是一種模式識別。根據(jù)影響花生仁外衣完整性的顏色特征參數(shù),對花生仁外衣完整性進(jìn)行識別。在神經(jīng)網(wǎng)絡(luò)運(yùn)用領(lǐng)域里算法的確定無法用一個完全標(biāo)準(zhǔn)的算法確定,主要是靠經(jīng)驗(yàn)來選擇的?;谝陨显颍ㄉ释庖峦暾詸z測神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)算法選擇BP算法。一個典型的BP網(wǎng)絡(luò)結(jié)構(gòu)(如圖3所示)通常具有一個或多個隱層。其中,隱層神經(jīng)元通常采用Sigmoid型傳遞函數(shù),而輸出層神經(jīng)元則采用logsig型傳遞函數(shù)。

BP識別系統(tǒng)是以BP神經(jīng)網(wǎng)絡(luò)分類器[10]為核心的系統(tǒng),系統(tǒng)設(shè)計(jì)如圖4所示。BP神經(jīng)網(wǎng)絡(luò)分類器由一個BP網(wǎng)絡(luò)訓(xùn)練子系統(tǒng)生成得到,圖像由CCD攝像頭獲得后,由圖像采集卡數(shù)字化輸入計(jì)算機(jī),提取特征區(qū)域獲得顏色特征參數(shù),這些參數(shù)輸入BP網(wǎng)絡(luò)即可得到分類結(jié)果。影響花生完整性的顏色特征參數(shù)為H,I和S,因此輸入層節(jié)點(diǎn)數(shù)等于3;網(wǎng)絡(luò)的輸出有兩種情況,即完好與破損,因此輸出層有2個節(jié)點(diǎn);對應(yīng)于完整和破損這兩種判斷結(jié)果,分別用2位二進(jìn)制編碼為10和01。隱含層的節(jié)點(diǎn)數(shù)的確定非常重要,數(shù)目過少,網(wǎng)絡(luò)將不能建立正確的判斷界,使網(wǎng)絡(luò)訓(xùn)練不出來或不能識別以前沒有的樣本,且容錯性差;而節(jié)點(diǎn)數(shù)目過多,學(xué)習(xí)時間長,使網(wǎng)絡(luò)的泛化能力降低。本文通過多次反復(fù)訓(xùn)練網(wǎng)絡(luò),確定隱含層節(jié)點(diǎn)數(shù)目為40。本研究采用Matlab軟件及其神經(jīng)網(wǎng)絡(luò)工具箱來實(shí)現(xiàn)網(wǎng)絡(luò)建模。在神經(jīng)網(wǎng)絡(luò)工具箱中,對神經(jīng)網(wǎng)絡(luò)的名稱、類型、結(jié)構(gòu)和訓(xùn)練函數(shù)等參數(shù)進(jìn)行設(shè)置,如表1所示。

建立了BP神經(jīng)網(wǎng)絡(luò)并對網(wǎng)絡(luò)進(jìn)行初始化后,就可對網(wǎng)絡(luò)進(jìn)行訓(xùn)練了。將訓(xùn)練步數(shù)設(shè)為500步,將訓(xùn)練目標(biāo)誤差goal參數(shù)設(shè)置為0.01,結(jié)果如圖5所示。圖5中,橫坐標(biāo)表示本網(wǎng)絡(luò)的預(yù)置訓(xùn)練步數(shù),縱向坐標(biāo)表示本網(wǎng)絡(luò)的預(yù)置訓(xùn)練誤差,水平橫線表示期望的目標(biāo)誤差,誤差變化曲線如圖5所示。由圖5可知,當(dāng)網(wǎng)絡(luò)訓(xùn)練到170步時,網(wǎng)絡(luò)誤差已經(jīng)達(dá)到期望的目標(biāo)值0.01,訓(xùn)練即可停止。

本文采用BP神經(jīng)網(wǎng)絡(luò)與計(jì)算機(jī)視覺技術(shù)相結(jié)合的手段,建立了一個花生外衣完整性判別系統(tǒng)。實(shí)驗(yàn)證明,判別準(zhǔn)確率達(dá)到87.1%。此系統(tǒng)很容易推廣在其他農(nóng)產(chǎn)品的檢測中,只需要改變輸入和輸出樣本數(shù)據(jù),重新訓(xùn)練一下BP網(wǎng)絡(luò),即可投入使用。因此,將BP神經(jīng)網(wǎng)絡(luò)運(yùn)用到農(nóng)產(chǎn)品的品質(zhì)檢測過程中,具有巨大的潛力和廣闊的應(yīng)用前景。但必須指出的是,此方法高效可行,整個訓(xùn)練過程只用了6s,且本研究建立在靜態(tài)實(shí)驗(yàn)環(huán)境下,生產(chǎn)效率依然很低。如果要將此實(shí)驗(yàn)結(jié)果運(yùn)用生產(chǎn)實(shí)際,必須設(shè)計(jì)出配套的硬件分級設(shè)備,這將是后續(xù)研究的重點(diǎn)。

篇6

黑科技?神經(jīng)網(wǎng)絡(luò)是個什么鬼

說到神經(jīng)網(wǎng)絡(luò),很多朋友都會認(rèn)為這是一個高大上的概念。從生物學(xué)角度來說,人類復(fù)雜的神經(jīng)系統(tǒng)是由數(shù)目繁多的神經(jīng)元組合而成,它們互相聯(lián)結(jié)形成神經(jīng)網(wǎng)絡(luò),經(jīng)過對信息的分析和綜合,再通過運(yùn)動神經(jīng)發(fā)出控制信息,從而實(shí)現(xiàn)各種精密活動,如識別各種物體、學(xué)習(xí)各種知識、完成各種邏輯判斷等。

隨著人工智能技術(shù)的發(fā)展,科學(xué)家開發(fā)出人工神經(jīng)網(wǎng)絡(luò),它的構(gòu)成原理和功能特點(diǎn)等方面更加接近人腦。它不是按給定的程序一步一步地執(zhí)行運(yùn)算,而是能夠自身適應(yīng)環(huán)境、總結(jié)規(guī)律、完成某種運(yùn)算、識別或過程控制。比如多倫多大學(xué)的Krizhevsky等人構(gòu)造了一個超大型卷積神經(jīng)網(wǎng)絡(luò),有9層,共65萬個神經(jīng)。第一層神經(jīng)元只能識別顏色和簡單紋理,但是第五層的一些神經(jīng)元可以識別出花、圓形屋頂、鍵盤、烏、黑眼圈等更為抽象豐富的物體(圖1)。因此神經(jīng)網(wǎng)絡(luò)實(shí)際上是基于人工智能技術(shù)而形成的一種和人類神經(jīng)網(wǎng)絡(luò)相似的網(wǎng)絡(luò)系統(tǒng)。

媲美Photoshop 神經(jīng)網(wǎng)絡(luò)磨皮技術(shù)背后

如上所述,現(xiàn)在神經(jīng)網(wǎng)絡(luò)技術(shù)發(fā)展已經(jīng)非常迅猛,而且運(yùn)用在各個領(lǐng)域。神經(jīng)網(wǎng)絡(luò)磨皮則是指該技術(shù)在照片識別和美化方面的運(yùn)用。那么它是怎樣實(shí)現(xiàn)對照片的美化?在Photoshop中磨皮操作是用戶先選中人臉區(qū)域,然后再使用Photoshop內(nèi)置的方法實(shí)現(xiàn)磨皮。神經(jīng)網(wǎng)絡(luò)磨皮原理類似,只不過這些操作是自動完成的。

首先是對照片人臉識別。要實(shí)現(xiàn)對照片的美容就必須先精確識別人臉,由于人臉有五官這個顯著特征,因此神經(jīng)網(wǎng)絡(luò)磨皮技術(shù)只要通過機(jī)器對一定數(shù)量的人臉照片進(jìn)行識別、讀取,然后就可以精確識別人臉。它的原理和常見的人臉識別技術(shù)類似(圖2)。

其次則是美化。在完成人臉識別后就需要對美化操作進(jìn)行機(jī)器學(xué)習(xí),以磨皮為例。因?yàn)槿四樀拿總€年齡階段皮膚性質(zhì)是不同的,為了達(dá)到更真實(shí)的磨皮效果,神經(jīng)網(wǎng)絡(luò)磨皮是實(shí)現(xiàn)用戶“回到”幼年或者“穿越”到老年臉部皮膚的效果。研究人員將年齡段分類為0~18歲、19~29歲、30~39歲、40~49歲、50~59歲和60歲以上這幾個階段(圖3)。

然后準(zhǔn)備兩個深度學(xué)習(xí)機(jī)器同時工作。兩個機(jī)器一個用來生成人臉,一個用來鑒別人臉。而且兩個機(jī)器會通過分析人臉圖像,提前學(xué)習(xí)到各年齡段人臉大概是什么樣子的。在每個年齡分組里,研究人員讓機(jī)器學(xué)習(xí)超過5000張標(biāo)記過年齡的人臉圖像。通過大量的照片學(xué)習(xí)后,機(jī)器就可以學(xué)會每個年齡分組內(nèi)的標(biāo)簽,它可以準(zhǔn)確知道每個人不同年齡階段的臉部特征。這樣無論你是要磨皮為年輕時的皮膚光滑、圓潤狀態(tài),還是要變?yōu)?0歲以后皺褶、粗糙的皮膚,神經(jīng)磨皮都可以輕松幫助你實(shí)現(xiàn)。

當(dāng)然學(xué)習(xí)有個通病,就是在合成過程中,機(jī)器可能會喪失掉圖片原有的識別資料(1D)。為了解決這個問題,上述介紹中的人臉鑒別機(jī)器就發(fā)揮功效了。它通過查看這個照片的識別資料是不是唯一的,如果不是的話照片則會被拒絕輸出。研究人員讓機(jī)器合成10000張從數(shù)據(jù)庫中抽取出來的人像,這些照片之前從未用來訓(xùn)練機(jī)器。然后他們用開發(fā)的軟件程序來檢測訓(xùn)練前后的兩張照片是否為同一個人,測試結(jié)果顯示有80%經(jīng)訓(xùn)練的照片都被認(rèn)為和原照片是同一個人(而作為對比,用其他方法加工照片,平均測試結(jié)果只有50%)。舉個簡單例子,如果40歲的用戶將自己磨皮為20歲的樣子,如果軟件程序來檢測訓(xùn)練前后的兩張照片為同一個人,那么就輸出磨皮效果,從而讓用戶可以輕松磨皮到20歲的狀態(tài)。這樣經(jīng)過訓(xùn)練的神經(jīng)磨皮算法可以很真實(shí)地實(shí)現(xiàn)人臉的磨皮。

神經(jīng)網(wǎng)絡(luò) 不H僅是磨皮

篇7

關(guān)鍵詞 人工;神經(jīng)網(wǎng)絡(luò);機(jī)器學(xué)習(xí)方法

中圖分類號Q1 文獻(xiàn)標(biāo)識碼A 文章編號 1674-6708(2011)40-0111-02

0 引言

機(jī)器學(xué)習(xí)方法經(jīng)常被應(yīng)用到解決醫(yī)學(xué)和生物信息學(xué)的問題。在這個報(bào)告中我列舉了一些把機(jī)器學(xué)習(xí)方法應(yīng)用到生物信息學(xué)領(lǐng)域的實(shí)例。比如:組建多重神經(jīng)網(wǎng)絡(luò),運(yùn)用該神經(jīng)網(wǎng)絡(luò)對4種不同形勢的腫瘤患者進(jìn)行分類。

1 介紹

人工神經(jīng)網(wǎng)絡(luò)屬于機(jī)器學(xué)習(xí)領(lǐng)域。關(guān)于人工神經(jīng)網(wǎng)絡(luò)的概念最早提出于1940年代。后來在1980年代后被推廣應(yīng)用,尤其是在醫(yī)學(xué)領(lǐng)域。

其中一個非常有用的用途是對疾病進(jìn)行分類,達(dá)到診斷的目的,或者對基因表達(dá)進(jìn)行分類。在這類神經(jīng)網(wǎng)絡(luò)里面,k點(diǎn)最近鄰居算法是最常被采用的算法。

人工神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)是:不需要人們蛆關(guān)注神經(jīng)網(wǎng)絡(luò)里面的細(xì)節(jié)信息;人工神經(jīng)網(wǎng)絡(luò)可以很容易地被重新訓(xùn)練來應(yīng)對不同地分類數(shù)據(jù)。人工神經(jīng)網(wǎng)絡(luò)可以用來解決有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),比如:自組織特征映射(self-organized feature map)就可以用來解決無監(jiān)督學(xué)習(xí)的問題。

它的不足之處在于:人工神經(jīng)網(wǎng)絡(luò)往往需要大量的訓(xùn)練數(shù)據(jù),而這些訓(xùn)練數(shù)據(jù)往往不是很容易獲得。人工神經(jīng)網(wǎng)絡(luò)可以被看作是一個黑盒,它的細(xì)節(jié)隱藏在點(diǎn)點(diǎn)之間的權(quán)值里面。這些權(quán)值的意義是人類無法理解的。同時,人工神經(jīng)網(wǎng)絡(luò)需要被仔細(xì)的訓(xùn)練以避免過擬合的情況出現(xiàn)。我們常常需也要降低高維數(shù)據(jù)的維度。下面,我將分析介紹人工神經(jīng)網(wǎng)絡(luò)的具體應(yīng)用。

人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示:

X1 ,X2 ,X3是該神經(jīng)網(wǎng)絡(luò)的輸入值,w0 ,w1 ,w2 ,w3 是該神經(jīng)網(wǎng)絡(luò)的輸入結(jié)點(diǎn)到內(nèi)部節(jié)點(diǎn)的路徑權(quán)值,每個神經(jīng)元的激活函數(shù)是如上圖右側(cè)所示的函數(shù)圖像。

這個函數(shù)被稱作為sigmoid函數(shù),表達(dá)式如下:

多重神經(jīng)網(wǎng)絡(luò)通常有3層,事實(shí)上,3層神經(jīng)網(wǎng)絡(luò)以能進(jìn)行很好的分類效果。這三個層包括輸入層,隱藏層,輸出層。在每個神經(jīng)元內(nèi)部我們可以選擇sigmoid激活函數(shù)或其他種類的激活函數(shù)。

如圖2所示:

單個神經(jīng)元僅能提供線性的分割面,所以多層神經(jīng)網(wǎng)絡(luò)可以提供非線性的分類函數(shù)(即:若干個線性分割面的復(fù)雜組合)。這并不意味著4層神經(jīng)網(wǎng)絡(luò)就一定比3層神經(jīng)網(wǎng)絡(luò)能一共更好的分類效果,因?yàn)閷訑?shù)越多,需要的訓(xùn)練集就越龐大,得到的效果也不會提高。

既然有訓(xùn)練問題,就會涉及到訓(xùn)練算法。較為早的和著名的訓(xùn)練算法是delta 規(guī)則。它于20世紀(jì)60年代被提出。它的原理是計(jì)算理論輸出值和世紀(jì)輸出值的均方差。tp 為理論輸出值,yp為實(shí)際輸出值,表示為:

訓(xùn)練的開始階段,我們通常設(shè)定一個隨機(jī)選取值,令該值等于:

該公式里,α是學(xué)習(xí)速率,學(xué)習(xí)速率越大,學(xué)習(xí)的過程就越快,完成學(xué)習(xí)的時間短。但如果學(xué)習(xí)的速率過大,可能導(dǎo)致網(wǎng)絡(luò)的理想權(quán)值在合理結(jié)果的附近游擺而永遠(yuǎn)無法獲得理想的權(quán)值。

神經(jīng)網(wǎng)絡(luò)被訓(xùn)練好了以后,它就被用到解決目標(biāo)問題。原始的數(shù)據(jù)集可以被分為兩部分:一部分用來訓(xùn)練,一部分用來測試。

有時候神經(jīng)網(wǎng)絡(luò)會把訓(xùn)練數(shù)據(jù)集里面的噪音點(diǎn)的特征納入自己的權(quán)值表達(dá)里,從而該神經(jīng)網(wǎng)絡(luò)無法真正體現(xiàn)該點(diǎn)集的真實(shí)特征。我們把這種情況叫做過擬合。過擬合是由于網(wǎng)絡(luò)比待估函數(shù)復(fù)雜造成的。比如一個可以同3層網(wǎng)絡(luò)解決的問題,我們用4層網(wǎng)絡(luò)或者由更多神經(jīng)元的三層網(wǎng)絡(luò)去解決該問題,就容易造成過擬合。為了更好的明確訓(xùn)練時所采用的神經(jīng)網(wǎng)絡(luò)的隱藏層的層數(shù),Livingstone 和 Manalack 提出了如下計(jì)算公式:

D = m*o/w

該公式里m是訓(xùn)練樣本的數(shù)目,o是該網(wǎng)絡(luò)的輸出值,w是網(wǎng)絡(luò)權(quán)值的數(shù)目,D就是隱藏層的數(shù)目。

得到了隱藏層的數(shù)目之后,我們可以以這個數(shù)目創(chuàng)建神經(jīng)網(wǎng)絡(luò),邊訓(xùn)練邊削減,直到我們獲得一個一半化的網(wǎng)絡(luò)。對于沒有隱藏網(wǎng)絡(luò)層或只有一個隱藏網(wǎng)絡(luò)層的神經(jīng)網(wǎng)絡(luò),我們需要先確定它要解決的問題是否是線性的。

適當(dāng)?shù)挠?xùn)練方案是能也可以使網(wǎng)絡(luò)的復(fù)雜性和數(shù)據(jù)的復(fù)雜性得到合適的匹配。一個合適的訓(xùn)練方案應(yīng)該是如下步驟:首先選擇一個很大的網(wǎng)絡(luò)并且把它的每個權(quán)值都設(shè)到一個很小的值上。通過訓(xùn)練,這些權(quán)值可以逐漸游擺到一個合理的值。

由于初始數(shù)據(jù)集通常要被分為訓(xùn)練集和測試集。在醫(yī)學(xué)領(lǐng)域,我們能獲得的數(shù)據(jù)集往往很小,比如某種病的病人數(shù)目不會很大。所以我門需要采用交叉驗(yàn)證的技巧來是較小的數(shù)據(jù)集在被分為訓(xùn)練集和測試集之后能較好的訓(xùn)練神經(jīng)網(wǎng)絡(luò)。

篇8

[關(guān)鍵詞] Spiking神經(jīng)網(wǎng)絡(luò) 學(xué)習(xí)模型 股市預(yù)測

一、引言

隨著經(jīng)濟(jì)的增長,對于股市的預(yù)測將變得越來越重要,也成為經(jīng)濟(jì)理論研究中的一個重要課題。股票市場的變化有很多因素,是一個復(fù)雜的非線性系統(tǒng),而人工神經(jīng)網(wǎng)絡(luò)能夠從大量復(fù)雜的數(shù)據(jù)中找到數(shù)據(jù)間的內(nèi)在聯(lián)系,具有良好的自我學(xué)習(xí)和抗干擾能力,在股票預(yù)測領(lǐng)域中取得了顯著的效果。本文應(yīng)用一種更接近于生物神經(jīng)系統(tǒng)的Spiking神經(jīng)網(wǎng)絡(luò),采用基于粒子群算法的學(xué)習(xí)模型,構(gòu)建了滬市上證綜合指數(shù)的學(xué)習(xí)預(yù)測模型,并用實(shí)際數(shù)據(jù)進(jìn)行了分析實(shí)驗(yàn)。

二、Spiking神經(jīng)網(wǎng)絡(luò)及其學(xué)習(xí)模型

Spike神經(jīng)元模型是更接近生物神經(jīng)元的一個數(shù)學(xué)模型,由Spike神經(jīng)元構(gòu)成的人工神經(jīng)網(wǎng)絡(luò)稱為Spiking神經(jīng)網(wǎng)絡(luò)。在Spiking神經(jīng)網(wǎng)絡(luò)中,一個Spike神經(jīng)元在t時刻接收來自于父突觸神經(jīng)元的多個post-synaptic potential(PSP)信號,不斷改變自己的膜電壓。當(dāng)它的膜電壓超過閾值時,產(chǎn)生一個spike,并通過突觸連接向外發(fā)送PSP信號。用于描述PSP信號的spike響應(yīng)函數(shù)定義為:

三、上證綜合指數(shù)的預(yù)測

滬市上證綜合指數(shù)是上海證券交易所編制的,以上海證券交易所掛牌上市的全部股票為計(jì)算范圍,以發(fā)行量為權(quán)數(shù)綜合,上證綜指反映了上海證券交易市場的總體走勢,所以對上證綜指的預(yù)測具有重要的意義。文中選取了2006年6月~2007年7月共286個工作日的滬市上證綜合指數(shù)作為研究的原始數(shù)據(jù),利用滑動窗口技術(shù),通過前6天收盤時的上證指數(shù)來預(yù)測第7天收盤時的上證指數(shù)。

我們構(gòu)建了具有6個輸入神經(jīng)元、4個隱含層神經(jīng)元和1個輸出節(jié)點(diǎn)的前向全連接Spiking神經(jīng)網(wǎng)絡(luò),并利用以上的Spiking神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型進(jìn)行測試。選取了原始數(shù)據(jù)中的前276個數(shù)據(jù)構(gòu)成神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,后10個數(shù)據(jù)用于測試。在實(shí)驗(yàn)前,我們對原始數(shù)據(jù)進(jìn)行歸一化的處理轉(zhuǎn)換為[0,1]之間的值。把歸一化后的前6天收盤時的上證指數(shù)分別作為6個輸入神經(jīng)元的spike時間加入到Spiking神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)和計(jì)算,獲得神經(jīng)網(wǎng)絡(luò)輸出節(jié)點(diǎn)的spike時間,該時間對應(yīng)于第7天的收盤指數(shù)。按本文式(3)計(jì)算獲得Spiking神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)誤差,通過粒子群算法不斷調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù)使誤差最小化。獲得了最優(yōu)的Spiking神經(jīng)網(wǎng)絡(luò)后,用測試集的數(shù)據(jù)對其性能進(jìn)行了測試。經(jīng)Spiking神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)預(yù)測后的上證指數(shù)變化如圖。

結(jié)果表明,與傳統(tǒng)BP算法相比,基于粒子群算法的Spiking神經(jīng)網(wǎng)絡(luò)具有較快的運(yùn)算速度和逼近性能, 同時可以克服SpikeProp算法陷入局部最優(yōu)解和對權(quán)值有約束的缺點(diǎn),可以較好地處理股票類非線性數(shù)據(jù)的學(xué)習(xí)和預(yù)測。

四、結(jié)論

股票市場的不確定因素太多,是一個復(fù)雜的非線性系統(tǒng),而神經(jīng)網(wǎng)絡(luò)具有自我學(xué)習(xí)的能力,能很好地解決不明確環(huán)境中的非線性應(yīng)用問題。Spiking神經(jīng)網(wǎng)絡(luò)作為一種新型的動態(tài)的神經(jīng)網(wǎng)絡(luò),其利用動態(tài)的spike時間進(jìn)行信息編碼和計(jì)算的特點(diǎn)與股票市場中動態(tài)的時間序列相吻合。文中對應(yīng)用Spiking神經(jīng)網(wǎng)絡(luò)預(yù)測國內(nèi)股票市場做了初步的探討,獲得了較好的擬合效果。進(jìn)一步改進(jìn)原始數(shù)據(jù)的處理方式,提高Spiking神經(jīng)網(wǎng)絡(luò)的自適應(yīng)能力,將能得到更好的預(yù)測效果。

參考文獻(xiàn):

[1]Sander M:Bohte, Spiking Neural Networks [D].ISBN 90-6734-167-3, 2003

[2]Gerstner W, Kistler W. Spiking Neuron Models: Single Neurons, Populations, Plasticity [M]. Cambridge University Press, 2002

[3]韓文蕾王萬誠:概率神經(jīng)網(wǎng)絡(luò)預(yù)測股票市場的漲跌[J].計(jì)算機(jī)應(yīng)用與軟件,2005,22(11):133~135

篇9

關(guān)鍵詞:強(qiáng)化學(xué)習(xí);神經(jīng)網(wǎng)絡(luò);馬爾科夫決策過程;算法;應(yīng)用

中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2012)28-6782-05

在機(jī)器學(xué)習(xí)領(lǐng)域,大致可以將學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三大類。強(qiáng)化學(xué)習(xí)以其在線學(xué)習(xí)能力和具有無導(dǎo)師制的自適應(yīng)能力,因此被認(rèn)為設(shè)計(jì)智能Agent的核心技術(shù)之一。從20世紀(jì)80年代末開始,隨著數(shù)學(xué)基礎(chǔ)日益發(fā)展的支持,應(yīng)用范圍不斷擴(kuò)大,強(qiáng)化學(xué)習(xí)也就成為目前機(jī)器學(xué)習(xí)的研究熱點(diǎn)之一。在研究過程中,隨著各種方法、技術(shù)和算法大量應(yīng)用于強(qiáng)化學(xué)習(xí)中,其缺陷和問題也就日漸顯現(xiàn)出來,尋找一種更好的方式和算法來促進(jìn)強(qiáng)化學(xué)習(xí)的發(fā)展和廣泛應(yīng)用,是研究人員探討和研究的重點(diǎn)。因此,神經(jīng)網(wǎng)絡(luò)及其算法以其獨(dú)特的泛化能力和存儲能力成為眾多研究人員重視的研究對象。

在此之前,已有大量研究者通過神經(jīng)網(wǎng)絡(luò)的特性來加強(qiáng)強(qiáng)化學(xué)習(xí)的效果及應(yīng)用。張濤[2]等人利用將Q學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)中的BP網(wǎng)絡(luò)、S激活函數(shù)相結(jié)合,加上神經(jīng)網(wǎng)絡(luò)的泛化能力,不僅解決了倒立擺系統(tǒng)的一系列問題,而且還進(jìn)一步提高了強(qiáng)化學(xué)習(xí)理論在實(shí)際控制系統(tǒng)的應(yīng)用。林聯(lián)明在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)研究Sarsa強(qiáng)化算法,提出用BP網(wǎng)絡(luò)隊(duì)列保存SAPs,解決由于過大而帶來的Q值表示問題[3]。強(qiáng)化學(xué)習(xí)理論在機(jī)器控制研究中也應(yīng)用廣泛。段勇在基于行為的移動機(jī)器人控制方法基礎(chǔ)上,將模糊神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)理論相結(jié)合,構(gòu)成模糊強(qiáng)化系統(tǒng),解決了連續(xù)狀態(tài)空間和動作空間的強(qiáng)化學(xué)習(xí)問題和復(fù)雜環(huán)境中的機(jī)器人導(dǎo)航問題[4]。由此可見,將神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)相結(jié)合,已經(jīng)是現(xiàn)今強(qiáng)化學(xué)習(xí)研究的重點(diǎn)方向,也已經(jīng)取得了頗豐的成果。但是,如何將神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)理論更好的融合,選擇何種算法及模型,如何減少計(jì)算量和加快學(xué)習(xí)算法收斂速度,以此來推動強(qiáng)化學(xué)習(xí)理論研究更向前發(fā)展,解決更多的實(shí)際應(yīng)用問題,這些依然還是待解決的研究課題之一。下面,根據(jù)本人對強(qiáng)化學(xué)習(xí)的研究,朋友給予的指導(dǎo)以及參照前人的研究成果,對基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)作個基本概述。

1 強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)(reinforcement),又稱再勵學(xué)習(xí)或評價學(xué)習(xí),它是重要的機(jī)器學(xué)習(xí)方法之一,在機(jī)器人控制、制造過程控制、任務(wù)調(diào)配及游戲中有著廣泛的應(yīng)用。

1.1 定義

所謂強(qiáng)化學(xué)習(xí)就是智能Agent從環(huán)境狀態(tài)到行為映射的學(xué)習(xí),并通過不斷試錯的方法選擇最優(yōu)行為策略,以使動作從環(huán)境中獲得的累積獎賞值最大。

強(qiáng)化學(xué)習(xí)狀態(tài)值函數(shù)有三個基本表達(dá)式,如下:

這三個狀態(tài)的值函數(shù)或狀態(tài)—動作對函數(shù)的值函數(shù)是用來表達(dá)目標(biāo)函數(shù),該目標(biāo)函數(shù)是從長期的觀點(diǎn)確定什么是最優(yōu)的動作。其中[γ]為折扣因子,[rt]是agent從環(huán)境狀態(tài)[st]到[st+1]轉(zhuǎn)移后所接受到的獎賞值,其值可以為正,負(fù)或零。其中式(1)為無限折扣模型,即agent需要考慮未來h([h∞])步的獎賞,且在值函數(shù)以某種形式進(jìn)行累積;式(2)為有限模型,也就是說agent只考慮未來h步的獎賞和。式(3)為平均獎賞模型,agent考慮其長期平均的獎賞值。最優(yōu)策略可以由(4)式確定

1.2 基本原理與一般結(jié)構(gòu)

強(qiáng)化學(xué)習(xí)就是能夠和環(huán)境進(jìn)行交互的智能Agent,通過怎樣的學(xué)習(xí)選擇能夠達(dá)到其目標(biāo)的最優(yōu)動作。通俗的說,在Agent與環(huán)境進(jìn)行交互的過程中,每個行為動作都會獲得特定的獎賞值。如果Agent的某個行為策略導(dǎo)致環(huán)境正的獎賞值(強(qiáng)化信號),那么Agent以后產(chǎn)生這個行為策略的趨勢就會加強(qiáng)。Agent的目標(biāo)就是對每個離散的狀態(tài)發(fā)現(xiàn)最優(yōu)策略以期望的折扣獎賞和最大。

在上述定義中描述了強(qiáng)化學(xué)習(xí)的三個狀態(tài)值或函數(shù)動作對函數(shù)來表達(dá)目標(biāo)函數(shù),可以求得最優(yōu)策略(根據(jù)(4)式)。但是由于環(huán)境具有不確定性[5],因此在策略[π]的作用下,狀態(tài)[st]的值也可以寫為

強(qiáng)化學(xué)習(xí)把學(xué)習(xí)看作試探評價過程,可用圖1描述。強(qiáng)化學(xué)習(xí)選擇一個動作作用于環(huán)境,環(huán)境受到作用后其狀態(tài)會發(fā)生變化,從一個狀態(tài)轉(zhuǎn)換到另一個狀態(tài),同時產(chǎn)生一個強(qiáng)化信號反饋給Agent,即獎懲值。Agent接受到獎懲值和環(huán)境狀態(tài)變化,進(jìn)行學(xué)習(xí)更新,并根據(jù)獎懲值和環(huán)境當(dāng)前狀態(tài)選擇下一個動作,選擇的原則是使受到正強(qiáng)化(獎)的概率增大。選擇的動作不僅影響立即強(qiáng)化值,而且影響環(huán)境下一時刻的狀態(tài)及最終的強(qiáng)化值。

2 神經(jīng)網(wǎng)絡(luò)

2.1 神經(jīng)網(wǎng)絡(luò)概述

神經(jīng)網(wǎng)絡(luò)是指模擬人類大腦的神經(jīng)系統(tǒng)的結(jié)構(gòu)與功能,運(yùn)用大量的處理部件,采用人工方式構(gòu)造的一種網(wǎng)絡(luò)系統(tǒng)。神經(jīng)網(wǎng)絡(luò)是一種非線性動力學(xué)系統(tǒng),并且具有以分布式存儲和并行協(xié)同處理的特點(diǎn),其理論突破了傳統(tǒng)的、串行處理的數(shù)字計(jì)算機(jī)的局限。盡管單個神經(jīng)元的結(jié)構(gòu)和功能比較簡單,但是千千萬萬個神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡(luò)系統(tǒng)所能表現(xiàn)的行為卻是豐富多彩的。

單個神經(jīng)元的模型如圖2所示。

人工神經(jīng)元模型由一組連接,一個加法器,一個激活函數(shù)組成。連接強(qiáng)度可由各連接上的值表示,權(quán)值為正表示激活,權(quán)值為負(fù)表示抑制;加法器用于求輸入信號對神經(jīng)元的相應(yīng)突觸加權(quán)之和。激活函數(shù)用于限制神經(jīng)元輸出振幅。

神經(jīng)元還可以用如下公式表示

激活函數(shù)主要有閾值函數(shù)、分段線性函數(shù)、非線性轉(zhuǎn)移函數(shù)三種主要形式。

一般來說,神經(jīng)網(wǎng)絡(luò)在系統(tǒng)中的工作方式是:接受外界環(huán)境的完全或者不完全的狀態(tài)輸入,并通過神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算,輸出強(qiáng)化系統(tǒng)所需的Q值或V值。人工神經(jīng)網(wǎng)絡(luò)是對人腦若干基本特性通過教學(xué)方法進(jìn)行的抽象和模擬,是一種模仿人腦結(jié)構(gòu)及功能的非線性信息處理系統(tǒng)。

2.2 強(qiáng)化學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的融合

經(jīng)過研究發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)的眾多優(yōu)點(diǎn),可以滿足強(qiáng)化學(xué)習(xí)研究的需要。首先,由于神經(jīng)網(wǎng)絡(luò)模仿人的大腦,采用自適應(yīng)算法,使得Agent智能系統(tǒng)更能適應(yīng)環(huán)境的變化。此外,神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的容錯能力,這樣可以根據(jù)對象的主要特征來進(jìn)行較為精確的模式識別。最后,神經(jīng)網(wǎng)絡(luò)又有自學(xué)習(xí),自組織能力和歸納能力的特點(diǎn),不僅增強(qiáng)了Agent對不確定環(huán)境的處理能力,而且保證了強(qiáng)化學(xué)習(xí)算法的收斂性。神經(jīng)網(wǎng)絡(luò)也有無導(dǎo)師學(xué)習(xí)機(jī)制,正好適用于強(qiáng)化學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的融合重點(diǎn)在于如何運(yùn)用神經(jīng)網(wǎng)絡(luò)多重特性,能夠快速高效地促進(jìn)Agent智能系統(tǒng)經(jīng)歷強(qiáng)化學(xué)習(xí)后,選擇一條最優(yōu)行為策略來滿足目標(biāo)需求。強(qiáng)化學(xué)習(xí)的環(huán)境是不確定的,無法通過正例、反例告知采取何種行為。Agent必須通過不斷試錯才能找到最優(yōu)行為策略。但是在此過程中,會遇到許多問題,比如輸出連續(xù)的動作空間問題,但可利用神經(jīng)網(wǎng)絡(luò)的泛化特征,實(shí)現(xiàn)了輸出在一定范圍內(nèi)的連續(xù)動作空間值[2]。所以,簡單的講,將神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)相融合,主要是利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的存儲能力和函數(shù)估計(jì)能力。目前,在函數(shù)估計(jì)強(qiáng)化學(xué)習(xí)研究上,神經(jīng)網(wǎng)絡(luò)是研究熱點(diǎn)之一。

3 馬爾科夫決策過程

本文主要論述馬爾科夫型環(huán)境下的強(qiáng)化學(xué)習(xí),可以通過馬爾科夫決策過程進(jìn)行建模。下面給出其形式定義:

基本的POMDP由四個元組成:。S是指一個環(huán)境狀態(tài)集,可以是有限的,可列的或者任意非空集;A為Agent行為集合,用A(s)表示在狀態(tài)s處可用的決策集;獎賞函數(shù)R(s,a):[A×S]->Real;T:[A×S]->PD(S);T(s,a,s')為Agent在狀態(tài)s采用a動作使環(huán)境狀態(tài)轉(zhuǎn)移到s'的概率。

一個有限的馬爾科夫決策過程有5元組成:;前四個元與上述是一致的,V為準(zhǔn)則函數(shù)或者目標(biāo)函數(shù)[3],常用準(zhǔn)則函數(shù)有期望折扣總報(bào)酬、期望總報(bào)酬和平均報(bào)酬等并且可以是狀態(tài)值函數(shù)或狀態(tài)-動作對值函數(shù)。

馬爾科夫決策過程的本質(zhì)是:當(dāng)前的狀態(tài)轉(zhuǎn)變?yōu)榱硪粋€狀態(tài)的概率和獎賞值只取決于當(dāng)前的狀態(tài)和選擇的動作,與過去的動作和狀態(tài)無關(guān)。所以,在馬爾科夫環(huán)境下,已知狀態(tài)轉(zhuǎn)移概率函數(shù)T和獎賞函數(shù)R,可以借助于動態(tài)規(guī)劃技術(shù)求解最優(yōu)行為策略。

4 改進(jìn)的強(qiáng)化學(xué)習(xí)算法

到目前為止,強(qiáng)化學(xué)習(xí)領(lǐng)域提出的強(qiáng)化學(xué)習(xí)算法層出不窮,如Sutton提出的TD算法[6],Watkins提出的Q-Learning算法[7],Rummery和Niranjan于1994提出的Sarsa算法[8],以及Dyna-Q學(xué)習(xí)算法[9]等。致力于這方面研究的研究人員,都在極力尋找一種既能保證收斂性,又能提高收斂速度的新型學(xué)習(xí)算法。本文主要在基于神經(jīng)網(wǎng)絡(luò)的特性,研究并提出改進(jìn)的強(qiáng)化學(xué)習(xí)算法。

4.1 基于模糊神經(jīng)網(wǎng)絡(luò)的Q([λ])學(xué)習(xí)算法

Q學(xué)習(xí)算法是強(qiáng)化學(xué)習(xí)領(lǐng)域重要的學(xué)習(xí)算法之一[7,10],它利用函數(shù)Q(x,a)來表達(dá)與狀態(tài)相對應(yīng)的各個動作的評估。Q學(xué)習(xí)算法的基本內(nèi)容為:

(1)任意初始化一個Q(x,a)

(2)初始化 s

(3)從決策集中隨即選擇一個動作a

(4)采取動作策略a,觀察[r,][s]'的值

(5)計(jì)算 [Qs,aQs,a+αr+γmaxa'Qs',a'-Qs,a], (11)

(7)重復(fù)(2)-(6)步,直到s終結(jié)。

式(11)使用下一狀態(tài)的估計(jì)來更新Q函數(shù),稱為一步Q學(xué)習(xí)。將TD([λ])的思想引入Q學(xué)習(xí)過程,形成一種增量式多步Q學(xué)習(xí),簡稱Q([λ])學(xué)習(xí)[11]。步驟與Q算法類似,其計(jì)算公式如下:

如果 [s=st,a=at],則[Qst,at=Qst,at+αtγt+γtetst+at]; (12)

4.2 基于BP神經(jīng)網(wǎng)絡(luò)的Sarsa算法

描述如下:(1)H是用于保存最近訪問的Q值,當(dāng)滿的時候送至神經(jīng)網(wǎng)絡(luò)訓(xùn)練。

如果表H已滿,則利用H中的樣本對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,版本號自動增加1

若網(wǎng)絡(luò)隊(duì)列q也已滿,則隊(duì)尾元素出隊(duì),把新訓(xùn)練的神經(jīng)網(wǎng)絡(luò)入隊(duì)q;

清空訓(xùn)練集;

該算法的主要貢獻(xiàn)是引入神經(jīng)網(wǎng)絡(luò)隊(duì)列保存大量的Q值表,從來降低了保存大量Q值所要花費(fèi)大量的內(nèi)存空間,更重要的是解決了單個神經(jīng)網(wǎng)絡(luò)“增量式”學(xué)習(xí)所帶來的“遺忘”問題。

5 強(qiáng)化學(xué)習(xí)應(yīng)用

由于強(qiáng)化學(xué)習(xí)在算法和理論方面的研究越來越深入,在大空間、復(fù)雜非線性控制,機(jī)器人控制、組合優(yōu)化和調(diào)度等領(lǐng)域呈現(xiàn)出良好的學(xué)習(xí)性能,使得強(qiáng)化學(xué)習(xí)在人工智能,控制系統(tǒng),游戲以及優(yōu)化調(diào)度等領(lǐng)域取得了若干的成功應(yīng)用,而本文主要介紹基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)算法在某些領(lǐng)域的應(yīng)用。

在非線性控制系統(tǒng)方面,張濤等人[2]將BP網(wǎng)絡(luò)運(yùn)用于 Q-Learning算法中,成功解決了連續(xù)狀態(tài)空間的倒立擺平衡控制問題和連續(xù)狀態(tài)空間輸入、連續(xù)動作空間輸出的問題,從而提高了強(qiáng)化學(xué)習(xí)算法的實(shí)際應(yīng)用價值;在機(jī)器人控制方面,應(yīng)用更為廣泛,Nelson[13]等人考慮了基于模糊邏輯和強(qiáng)化學(xué)習(xí)的智能機(jī)器人導(dǎo)航問題,并且段勇等人[4]基于該理論,成功地將模糊神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)結(jié)合起來,采用殘差算法保證函數(shù)逼近的快速性和收斂性,有效地解決了復(fù)雜環(huán)境下機(jī)器人導(dǎo)航的問題。在游戲方面,Tesauro采用三層BP神經(jīng)網(wǎng)絡(luò)把棋盤上的棋子位置和棋手的獲勝概率聯(lián)系起來,通過訓(xùn)練取得了40盤比賽中只輸一盤的好戰(zhàn)績[14]。在優(yōu)化調(diào)度方面,主要包括車間作業(yè)調(diào)度,電梯調(diào)度以及網(wǎng)絡(luò)路由選擇等,Robert Crites等[15]將強(qiáng)化學(xué)習(xí)和前饋神經(jīng)網(wǎng)絡(luò)融合利用,以最終實(shí)驗(yàn)結(jié)果表明為依據(jù),證明了該算法是目前高層建筑電梯調(diào)度算法中最優(yōu)算法之一。

6 結(jié)束語

本文將強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)相融合,介紹利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的存儲能力、泛化能力及函數(shù)估計(jì)能力,可以解決強(qiáng)化學(xué)習(xí)領(lǐng)域遇到的連續(xù)狀態(tài)和動作輸入、輸出的問題,學(xué)習(xí)狀態(tài)空間過大的問題以及不確定環(huán)境處理的問題等?;诖?,主要論述了三種神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的改進(jìn)算法,它們都綜合了神經(jīng)網(wǎng)絡(luò)的特性。最后,簡單介紹了目前基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)應(yīng)用的成功實(shí)例。目前,利用神經(jīng)網(wǎng)絡(luò)進(jìn)行強(qiáng)化學(xué)習(xí)依然是研究熱點(diǎn)課題之一。

參考文獻(xiàn):

[1] 高陽,陳世福,陸鑫. 強(qiáng)化學(xué)習(xí)研究綜述[J].自動化學(xué)報(bào),2004,30(1):86-100.

[2] 張濤,吳漢生.基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)倒立擺控制[J].計(jì)算機(jī)仿真,2006,23(4):298-300.

[3] 林聯(lián)明,王浩,王一雄.基于神經(jīng)網(wǎng)絡(luò)的Sarsa強(qiáng)化學(xué)習(xí)算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,16(1):30-32.

[4] 段勇,徐心如.基于模糊神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)及其在機(jī)器人導(dǎo)航中的應(yīng)用[J].控制與決策,2007,22(5):525-529.

[5] 劉忠,李海紅,劉全.強(qiáng)化學(xué)習(xí)算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(22):5805-5809.

[6] Sutton R S.Learning to predict by the methods of temporal differences.Machine Learning,1988,3:9-44.

[7] Watkins P.Dayan.Q-Learning.Machine Learning,1992,8(3):279-292.

[8] Rummery G,Niranjan M. On-line Q-Learning using connectionist systems. Technical Report CUED/F-INFENG/TR 166,Cambridge University Engineering Department,1994.

[9] Sutton R S,Barto A G, Williams R. Reinforcement Learning is direct adaptive optional control.IEEE Control Systems Manazine,1991,12(2):19-22.

[10] Sutton R S, Barto A G. Reinforcement Learning: An introduction[M].Cambridge:MIT Press ,1998.

[11] Peng J , Dayan P. Q-learning [J]. Machine Learning,1992,8(3):279-292.

[12] Kelley H J , Cliff E M, Lutze F H. Pursuit/evasion in orbit[J]. J of the Astronautical Sciences, 1981, 29(3):277-288.

[13] NELSON H C, YUNG. An intelligent mobile vehicle navigator based on fuzzy logic and reinforcement learning [J].IEEE Trans on Systems, Man and Cybernetics, Part B: Cybernetics,1999,29(2):314-321.

篇10

關(guān)鍵詞:風(fēng)速;短期預(yù)測;相似數(shù)據(jù);小波分析;人工神經(jīng)網(wǎng)絡(luò)

1 引言

隨著風(fēng)電場并網(wǎng)運(yùn)行規(guī)模的增大,國內(nèi)外對于風(fēng)力發(fā)電并網(wǎng)各種課題的研究越來越深入,但關(guān)于風(fēng)電場發(fā)電功率預(yù)測的研究還達(dá)不到令人滿意的程度,預(yù)測誤差一般都在15%以上[1]。

采用的方法通常包括持續(xù)法、卡爾曼濾波法、隨機(jī)時間序列法、神經(jīng)網(wǎng)絡(luò)法。其中,人工神經(jīng)網(wǎng)絡(luò)法進(jìn)行風(fēng)速或風(fēng)電功率預(yù)測應(yīng)用得最廣。文獻(xiàn)[2-3]都利用小波―BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,但訓(xùn)練樣本沒有相關(guān)性,預(yù)測精度偏低。文獻(xiàn)[4-5]利用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)建模,雖然運(yùn)行時間縮短,但是在數(shù)據(jù)相關(guān)性和數(shù)據(jù)去噪處理方面欠缺,導(dǎo)致精度不高。因此,本文建立了基于相似數(shù)據(jù)并結(jié)合小波分析的BP神經(jīng)網(wǎng)絡(luò)建模。

2 基于相似數(shù)據(jù)并結(jié)合小波分析的BP神經(jīng)網(wǎng)絡(luò)建模

2.1 相似數(shù)據(jù)選擇辦法

2.3 反向傳播(BP)神經(jīng)網(wǎng)絡(luò)

2.4 仿真實(shí)驗(yàn)建模

3 算法對比分析

從圖4可得出,BP神經(jīng)網(wǎng)絡(luò)模型的平均相對誤差為20.77%,而本模型為10.21%。因此,采用本模型建模得到的相對誤差較傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度有很大的提高。

4 結(jié)論

針對風(fēng)力發(fā)電中風(fēng)速預(yù)測問題,本文在BP神經(jīng)網(wǎng)絡(luò)理論的基礎(chǔ)上引入相似數(shù)據(jù)并結(jié)合小波分解進(jìn)行短期風(fēng)速預(yù)測,得到如下結(jié)論:

⑴相似數(shù)據(jù)的選取增強(qiáng)了數(shù)據(jù)的相關(guān)性,提高了模型預(yù)測精度。

⑵小波分解降低了信號的非平穩(wěn)性,使模型更好地?cái)M合了風(fēng)速信號的低頻和高頻特性,可進(jìn)一步提高算法精度。

⑶通過對算法對比分析,表明本模型較傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型誤差小,充分地說明此方法在工程應(yīng)用上具有可行性。

[參考文獻(xiàn)]

[1]楊秀媛,肖洋,陳樹勇.風(fēng)電場風(fēng)速和發(fā)電功率預(yù)測研究[J].中國電機(jī)工程學(xué)報(bào),2005,25(11):1-5.

[2]師洪濤,楊靜玲,丁茂生,王金梅.基于小波―BP神經(jīng)網(wǎng)絡(luò)的短期風(fēng)電功率預(yù)測方法[J].電力系統(tǒng)自動化,2011,35(16):44-48.

[3]厲衛(wèi)娜,蘇小林.基于小波- 神經(jīng)網(wǎng)絡(luò)的短期風(fēng)電功率預(yù)測研究[J].電力學(xué)報(bào),2011,26(6):458-461.

[4]王德明,王莉,張廣明.基于遺傳BP神經(jīng)網(wǎng)絡(luò)的短期風(fēng)速預(yù)測模型[J]. 浙江大學(xué)學(xué)報(bào)(工學(xué)版),2012,46(5):837-841.