計算機集群技術(shù)范文
時間:2023-09-17 15:15:16
導(dǎo)語:如何才能寫好一篇計算機集群技術(shù),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
張 偉 渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院 遼寧錦州 121000
【文章摘要】
計算機集群的概念已經(jīng)越來越近的走進(jìn)我們的生活。我們時刻都享受著由此帶來的便利,但是,對于其中內(nèi)部細(xì)節(jié)并沒有太多的了解。本文就從其群集類型入手進(jìn)行研究,這些都是網(wǎng)站應(yīng)用程序需要必不可少的技術(shù)。不同類別的集群技術(shù)在各個行業(yè)發(fā)揮著重要的作用。
【關(guān)鍵詞】
高可用性;集群;Linux Virtual Server ; 負(fù)載均衡
0 引言
我國正處于經(jīng)濟發(fā)展的重要時期,對計算機技術(shù)的重視程度越來越大,對計算機的依賴性也變得越來越大。計算機集群技術(shù)是使計算機可以實現(xiàn)眾多功能的內(nèi)在核心技術(shù)。對計算機集群及時應(yīng)用研究的目的就在于通過了解其操作的原理更好的進(jìn)行程序的操作。從現(xiàn)代的發(fā)展形勢看,大型的企業(yè)以及處理大數(shù)據(jù)的部門以及離不開計算機集群技術(shù)。無論是Linux 集群還是WWW 服務(wù)器系統(tǒng)以及其他的中級服務(wù)器都是由大量的集群技術(shù)完成的。
1 計算機集群技術(shù)的定義
關(guān)于計算機集群技術(shù)定義的說法有很多中,在本文中采用了概括性最全的、最科學(xué)的一種。集群就是在現(xiàn)代可以使用的高速網(wǎng)絡(luò)上將其中的工作站或是其他的中間結(jié)構(gòu),按照一定的順序進(jìn)行連接, 組成新的結(jié)構(gòu)形式,在已有的可以進(jìn)行與計算機進(jìn)行直接交流的操作平臺上進(jìn)行調(diào)度,不斷的調(diào)度處理形成可以高速處理的網(wǎng)絡(luò)系統(tǒng)。將專業(yè)化的信息轉(zhuǎn)化為通俗的語言就是將不同的終極客戶端比如電腦或是手機進(jìn)行網(wǎng)絡(luò)連接,在網(wǎng)絡(luò)的世界里形成一個可以相互聯(lián)系的組織,不同的終端可以運行在同一個頻道上,并在同一個平臺上進(jìn)行系統(tǒng)化的管理。當(dāng)人們使用的過程中,終端是在與一個集群進(jìn)行信息的交流,集群為終端提供他需要的服務(wù), 這個過程中的服務(wù)器已經(jīng)發(fā)揮了集群的作用。
計算機集群系統(tǒng)分為倆大部分,其一是集群文件系統(tǒng);其二是集群NS 系統(tǒng)。這兩種系統(tǒng)分別對不同的內(nèi)容有著作用。集群文件系統(tǒng)可以實現(xiàn)對大量小文件的寫毛還可以實現(xiàn)一個大文件的寫;而集群NS 系統(tǒng)可以將文件間的共享轉(zhuǎn)變?yōu)楝F(xiàn)實, 具備良好的儲備性,其以性能高、負(fù)載承受力好而著稱。集群NS 系統(tǒng)可以文件系統(tǒng)的擴展,實現(xiàn)文件的線性增長。
計算機集群的種類比較分明,大體可以分為三個類型,這三種類型豐富了計算機集群的組織形式,形成了不同的層次。
科學(xué)集群是由主服務(wù)器進(jìn)行統(tǒng)一的管理,在主服務(wù)器的下面控制一個程序。當(dāng)有大量的計算需要進(jìn)行時,這個控制程序?qū)⑦@些計算按照一定的原則分配到網(wǎng)絡(luò)的其他節(jié)點處進(jìn)行分塊運算,這些運算的結(jié)果在程序的指導(dǎo)下返回到控制程序, 控制程序?qū)⑦@個最終結(jié)果返回到服務(wù)器中。這個過程就是將終端的操作指令進(jìn)行內(nèi)部處理的過程,最終有服務(wù)器返回給終端,用戶從終端得到需要的信息。
負(fù)載均衡集群是由負(fù)載均衡器和主服務(wù)器共同組成的。這種集群的處理過程與科學(xué)集群有著相似的地方,其中的區(qū)別在與進(jìn)行操作的程序。負(fù)載均衡器對數(shù)據(jù)指令進(jìn)行分析,確定指令的性質(zhì)和復(fù)雜度,最為首先接到請求的均衡器會按照系統(tǒng)的安排對實時的服務(wù)器工作情況進(jìn)行分析,當(dāng)服務(wù)器比較繁忙的時候,就會將請求分為多個部分,分到多個節(jié)點上進(jìn)行處理。這種集群可以應(yīng)對大規(guī)模的數(shù)據(jù)處理操作,速度快并且服務(wù)器不會損壞。
高可用性集群是簡單的由節(jié)點構(gòu)成, 這些節(jié)點主要的針對對象不是服務(wù)器而是計算機或是終端上可以進(jìn)行操作的程序。這些程序需要將一定的數(shù)據(jù)進(jìn)行存儲已被用戶再次使用。高可用性集群就是為軟件的數(shù)據(jù)持續(xù)性連接進(jìn)行服務(wù),利用跟蹤、監(jiān)控的計算機技術(shù)對軟件的數(shù)據(jù)進(jìn)行保留。
2 集群的特點
集群系統(tǒng)是運行在計算機上起到將人為操作指令轉(zhuǎn)達(dá)計算機并進(jìn)行返回作用的程序。這些程序的出現(xiàn)使得計算機可以被人們普遍接受,計算機領(lǐng)域發(fā)展的速度變得十分的快。集群有著十分突出的幾個特點:
2.1 集群的開發(fā)時間短
進(jìn)行集群開發(fā)一般都是用于商業(yè), 從事商業(yè)的經(jīng)濟活動,迫于企業(yè)的需求必須在短時間內(nèi)開發(fā)成功。在進(jìn)行開發(fā)的過程中,集群系統(tǒng)采用的是商業(yè)專用的工作站。這樣的開發(fā)平臺給了集群開發(fā)者提供了很好的基礎(chǔ),進(jìn)行開發(fā)的過程比較簡單,運行的程序兼容性也比較高。由于這樣的平臺減少了進(jìn)行操作系統(tǒng)設(shè)計和編譯的過程,還不會進(jìn)行節(jié)點的重新研究, 為使用者的開發(fā)提供了很好的條件。外界的需求壓力加上寬松的開放環(huán)境以及成熟的操作系統(tǒng),使得系統(tǒng)開發(fā)周期變得十分短,而且做出的成品質(zhì)量也十分的高。
2.2 用戶使用放心
一般來講,用戶對高端的科技產(chǎn)品了解比較少,對采用的系統(tǒng)或是如何的內(nèi)部運行沒有深入的研究,甚至就不知道如何進(jìn)行研究。然而,集群幫助用戶解決了這個問題。在購買終端機的時候,用戶不會擔(dān)心由于其內(nèi)部運行速度不快而受到經(jīng)濟損失。因為集群可以將運行速度大大地提高,集群首先將是一個系統(tǒng),可以處理終端機上的軟件操作,識別用戶的操作指令,并做出相應(yīng)的答復(fù);然后它還是一個處理器,這個功能就決定了它的每一個節(jié)點都可以成為一個處理數(shù)據(jù)的工作站, 對輸入的指令進(jìn)行分析處理,甚至是單一的工作站就可以完成指令的操作。這樣一來,使得用戶不用擔(dān)心會出現(xiàn)終端機反應(yīng)速度慢的問題。
2.3 集群研發(fā)的費用低
集群一般情況下都是進(jìn)行小規(guī)模生產(chǎn)的,投入的資金比較少,與高額的巨型機投入相比就是九牛一毛。與巨型機或是PC 不同,他們都是大批量進(jìn)行生產(chǎn)的,價格自然十分的昂貴,一般來講都會達(dá)到上千萬美元。集群研發(fā)就不會出現(xiàn)這樣的情況,一個集群系統(tǒng)僅僅需要幾個或是十幾個工作站就可以應(yīng)對幾乎所有的用戶指令,為用戶提供服務(wù),為軟件的操作系統(tǒng)提供保留數(shù)據(jù)。由于其上產(chǎn)批量小,使用的人數(shù)比較少,可以共享,導(dǎo)致了價格比較低。
2.4 集群節(jié)約了網(wǎng)絡(luò)資源
集群系統(tǒng)是立足于網(wǎng)絡(luò)基礎(chǔ)上建立起來,對網(wǎng)絡(luò)資源的共享性做出了比較大的貢獻(xiàn),為整個系統(tǒng)資源的使用提供了新的機會和途徑。集群是一種靈活多變的結(jié)構(gòu),可以將不同性能的、不同結(jié)構(gòu)的工作站進(jìn)行聯(lián)合,還可以將終端設(shè)備連接在一起。從使用得到情況上看,集群在整個系統(tǒng)中的工作效率比終端機的自身系統(tǒng)的使用效率要高出很多,對資源的分享力或是傳送力效率更高。一般來講,當(dāng)終端機超過百臺的時候,集群使用效率會高到80% 以上,而單機系統(tǒng)的使用效率連其十分之一都不到。當(dāng)終端系統(tǒng)處于不同的狀態(tài)或是進(jìn)行更新的過程中,集群仍然可以進(jìn)行信息的傳遞,保障終端數(shù)據(jù)的連續(xù)性。
2.5 集群的編輯性好
集群是計算機運行離不開的內(nèi)部運轉(zhuǎn)系統(tǒng)。進(jìn)行集群的創(chuàng)新或是研發(fā)都是十分平常的事情,這就需要集群的編輯性好,對不同的操作指令識別能力強,便于不同操作員的編程操作。除了傳統(tǒng)的C++ 編程方式,還有支持其他多個系統(tǒng)下的編程方式,支持多種編程語言。兼容性的強大帶給系統(tǒng)良好的承接性和創(chuàng)新空間。
3 計算機集群技術(shù)的具體應(yīng)用
集群有著不同的層次,有著良好的特性,對于計算機的發(fā)展起到了很大的推動性。集群的出現(xiàn)使得計算機可以在短時間內(nèi)進(jìn)行大量數(shù)據(jù)的處理,使得其在實際的生活生產(chǎn)中的作用十分明顯。如今這個“快魚吃慢魚”的時代,集群系統(tǒng)滿足了人們對時間方面的需求,滿足了人們對客觀環(huán)境的需求。集群以自身的優(yōu)勢在短暫的 時間內(nèi)從中小規(guī)模發(fā)展壯大,甚至影響到巨型機的發(fā)展。接下來就是對其應(yīng)用的領(lǐng)域進(jìn)行說明:
3.1 石油地震數(shù)據(jù)處
對于石油資源的尋找已經(jīng)成為現(xiàn)代比較熱的問題。集群可以發(fā)揮其強大的功能,找到石油資源。一般來講,三維地震勘探是最為常用的勘探手段并且可以取得良好的效果。三維勘察形成的圖像是一個立體的圖像,對石油的具置有著更加情緒的反映。在進(jìn)行勘察的過程中,計算機會儲備大量的數(shù)據(jù)信息,需要計算機進(jìn)行計算并進(jìn)行處理。這個處理過程就是由集群系統(tǒng)完成的。集群使得三維成像成為了現(xiàn)實,促進(jìn)了勘察技術(shù)的發(fā)展。
3.2 數(shù)值天氣預(yù)報分析
數(shù)值預(yù)報是通過在不同云層上的收集到的數(shù)據(jù)進(jìn)行離散分析得到的。這種預(yù)報的初期需要進(jìn)行資料的大量收集,通過大量數(shù)據(jù)將不同云層的具體情況進(jìn)行了解。數(shù)據(jù)量大、計算的函數(shù)比較復(fù)雜、需要處理的時間還有比較短。在這樣的要求下,就需要采用集群系統(tǒng)進(jìn)行分析。在長期天氣預(yù)測的工作中,集群系統(tǒng)發(fā)揮了重大的作用,給天氣預(yù)測發(fā)展帶來了發(fā)展空間。
3.3 CAD 圖像處理過程
CAD 圖像處理的過程中需要進(jìn)行數(shù)據(jù)分析,需要進(jìn)行多種多樣的計算。這個軟件的成功運用離不開集群系統(tǒng)的支持。為了讓CAD 圖像制作過程中可以進(jìn)行高速的計算,集群系統(tǒng)提供了必要的支持。
集群系統(tǒng)的實際應(yīng)用遠(yuǎn)遠(yuǎn)不止這些, 還包括很多其他的重要方面。從根本上來說,集群是一種程序系統(tǒng)。隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展和科技向著高層次的方面研究,這就需要集群系統(tǒng)進(jìn)行更加高端的程序設(shè)計,并為國民經(jīng)濟的發(fā)展做出貢獻(xiàn)。
4 集群系統(tǒng)發(fā)展的未來
集群系統(tǒng)存在著巨大的發(fā)展前景,很多的機構(gòu)或是大學(xué)的實驗室還在進(jìn)行著集群系統(tǒng)的深入研究。集群系統(tǒng)之所以有著巨大的潛力在于這是它的結(jié)構(gòu)靈活,使用起來比較方便,加上網(wǎng)絡(luò)與終端技術(shù)的不斷向前發(fā)展,共同使得集群系統(tǒng)向著高端的層次進(jìn)行研究。
集群系統(tǒng)的發(fā)展可以概括為從模塊化的程度向著更高的系統(tǒng)研究。我們知道現(xiàn)代的集群可以分為節(jié)點系統(tǒng)、通訊系統(tǒng)等。操作的環(huán)境和編譯的環(huán)境也比較多。但是,這些都是由摩爾定律的理論推動出來的,離不開傳感、接口模塊以及驅(qū)動等。在未來的發(fā)展過程中,集群系統(tǒng)會融入更多的理念和技術(shù),將集群的編輯過程進(jìn)行簡化,編譯方式更加智能,操作手法更加的便捷,使用的環(huán)境更加多樣。
5 結(jié)語
計算機集群是計算機和網(wǎng)絡(luò)聯(lián)合后一直進(jìn)行研發(fā)的系統(tǒng),這是計算機處理的關(guān)注焦點。從集群的特點看,它以超低的價格,極為便捷的操作手段可以取得巨型機或是PC 一樣的效果,這樣的特點吸引了計算機領(lǐng)域?qū)ζ涞闹匾暢潭?。放眼我國計算機系統(tǒng)的研發(fā),集群系統(tǒng)對我國的經(jīng)濟發(fā)展作用會更加明顯。因為集群對資源的希需求量比較少,便于操作。這與我國的發(fā)展有著很好的切合點。因此,我國應(yīng)該跟進(jìn)時代的腳步進(jìn)行高科技的發(fā)展,形成自身獨特的集群系統(tǒng)。
【參考文獻(xiàn)】
[1] 黃筱調(diào), 趙松年. 機電一體化技術(shù)基礎(chǔ)及應(yīng)用[M]. 北京: 機械工業(yè)出版社,1998 .
[2] 王吉會, 等. 創(chuàng)建實驗教學(xué)新體系培養(yǎng)學(xué)生創(chuàng)新能力[J]. 實驗室研究與探索,2005,24(3):8-10 .
[3] 朱龍彪, 等. 機電一體化專業(yè)方向課程體系的組織與創(chuàng)新實踐能力的培養(yǎng)[J]. 南通工學(xué)院學(xué)報( 社會科學(xué)版),2004(3):100-101 .
篇2
關(guān)鍵詞:內(nèi)存數(shù)據(jù)庫;相似度;代價計算;Rough集
中圖分類號:TP392
文獻(xiàn)標(biāo)識碼:A
文章編號:16727800(2017)004018203
0引言
在數(shù)據(jù)庫集群系統(tǒng)中,數(shù)據(jù)劃分和數(shù)據(jù)分布是系統(tǒng)運行的基礎(chǔ),做好劃分和數(shù)據(jù)分布可以有效提高系統(tǒng)運行效率。隨著內(nèi)存數(shù)據(jù)庫以及內(nèi)存數(shù)據(jù)庫集群的出現(xiàn),針對內(nèi)存數(shù)據(jù)庫集群的數(shù)據(jù)劃分算法也逐步出現(xiàn),但都是基于傳統(tǒng)數(shù)據(jù)庫集群的解決方案,即僅考慮數(shù)據(jù)相關(guān)性。同時對相似性判斷標(biāo)準(zhǔn)都是基于經(jīng)驗性判斷選擇50%為標(biāo)準(zhǔn)。本文提出基于相似度代價計算的內(nèi)存數(shù)據(jù)庫集群數(shù)據(jù)劃分策略,在數(shù)據(jù)相關(guān)性基礎(chǔ)上提出事務(wù)相關(guān)性規(guī)約,并將相似性判斷條件擴大到40%~60%范圍內(nèi),以更準(zhǔn)確、精細(xì)地進(jìn)行數(shù)據(jù)劃分。
1數(shù)據(jù)劃分基本概念
數(shù)據(jù)劃分又稱為數(shù)據(jù)分片或者數(shù)據(jù)分割,是數(shù)據(jù)庫集群的特征之一,是將集群的數(shù)據(jù)全集劃分為獨立的數(shù)據(jù)片段。數(shù)據(jù)劃分必須遵守3個原則:完整性、不相交性和可恢復(fù)性。 數(shù)據(jù)分片方法有3類:水平分片、豎直分片和混合分片。具體分片策略主要有Range分片算法、Round-Robin分片算法、Hybrid-Range分片算法、表達(dá)式分片算法、時間分片算法、哈希分片算法等。 目前數(shù)據(jù)劃分算法主要是針對結(jié)構(gòu)化的關(guān)系型數(shù)據(jù)處理,而且處理過程中將磁盤讀取代價作為重要參考標(biāo)準(zhǔn),處理結(jié)果比較固定。這樣的數(shù)據(jù)劃分策略對內(nèi)存數(shù)據(jù)庫集群已不再適用。
2基于Rough集理論的相似度矩陣
在Rough集的研究中[1],事務(wù)被表示成統(tǒng)一的信息系統(tǒng)。假定數(shù)據(jù)庫全集R={ r1,r2,r3...,rn},ri(1≤i≤n)是數(shù)據(jù)集中的一個元數(shù)據(jù),事務(wù)集合T={t1,t2,t3…,tm},tj(1≤j≤m)是事務(wù)集合中的一個事務(wù),trij表示數(shù)據(jù)ri被事務(wù)tj訪問,由此可得到事務(wù)訪問數(shù)據(jù)矩陣RT。
根據(jù)Rough集理論,可以將事務(wù)訪問數(shù)據(jù)矩陣對應(yīng)到信息系統(tǒng)中。假設(shè)分配到內(nèi)存數(shù)據(jù)庫集群的數(shù)據(jù)集合R={r1,r2,r3...,r8},事務(wù)集合T={t1,t2,t3,t4},構(gòu)造事務(wù)訪問數(shù)據(jù)矩陣,事務(wù)訪問了元數(shù)據(jù)記為1,未訪問記為0,假設(shè)訪問情況如表1所示。
根據(jù)數(shù)據(jù)劃分基本原理,即數(shù)據(jù)之間的相關(guān)性,初步對數(shù)據(jù)進(jìn)行劃分,可得到元數(shù)據(jù)r1、r4相關(guān)性比較強,可以作為一個劃分,r2、r8作為一個劃分,其余作為獨立劃分,得到劃分結(jié)果如表2所示。
再根據(jù)事務(wù)之間的相關(guān)性,將事務(wù)進(jìn)行合并。之前的研究都是確定一個相似度標(biāo)準(zhǔn),基于粒計算的數(shù)據(jù)分片算法[23]中標(biāo)準(zhǔn)一般為同時訪問相同元數(shù)據(jù)不小于50%。50%是一個經(jīng)驗值,被普遍認(rèn)為是一個劃分值,在實際部署中,尤其是在內(nèi)存數(shù)據(jù)庫集群部署中,50%作為一個相似度劃分標(biāo)準(zhǔn)并不一定合理。由于內(nèi)存數(shù)據(jù)庫的讀取效率成幾何倍數(shù)提高,可以適當(dāng)增加數(shù)據(jù)劃分?jǐn)?shù)量,即提升相似度劃分標(biāo)準(zhǔn)。所以提出首先根據(jù)不同相似度標(biāo)準(zhǔn)所付出的代價作為劃分依據(jù)對事務(wù)進(jìn)行劃分,然后對數(shù)據(jù)進(jìn)行第二次劃分,以得到更精確的數(shù)據(jù)劃分結(jié)果。 假設(shè)通過代價計算,得到事務(wù)相似性劃分標(biāo)準(zhǔn)為不小于60%,此時t2和t3事務(wù)可以合并,合并之后結(jié)果如表3所示。 再根據(jù)數(shù)據(jù)相關(guān)性,對數(shù)據(jù)進(jìn)一步劃分,此時r2、r5和r8可以歸為同一個劃分,得到劃分結(jié)果如表4所示。 經(jīng)過劃分之后,得到劃分結(jié)果為R={(r1,r4),(r2,r5,r8),(r3),(r6),(r7)}。
3代價計算劃分算法
上文提到的代價計算,在數(shù)據(jù)進(jìn)行第二次劃分時,假設(shè)一個集群中有n個數(shù)據(jù)劃分,數(shù)據(jù)庫總訪問值記為D,單位為千次/s,第i個數(shù)據(jù)劃分在時間t內(nèi)的數(shù)據(jù)訪問值為Di。Di來自兩方面,數(shù)據(jù)庫的讀和寫,分別記為Dri和Dwi。Dri和Dwi是兩個單位時間內(nèi)的累計值,設(shè)Dri的變化函數(shù)為ri(t),Dwi的變化函數(shù)記為wi(t)??梢缘玫剑?/p>
上述代價計算是基于內(nèi)存數(shù)據(jù)庫的數(shù)據(jù)庫讀寫代價,在之前的傳統(tǒng)數(shù)據(jù)劃分中,基于代價計算的D值都引入了讀寫系數(shù)Vrwc,即要考慮主存與磁盤之間的I/O代價[5]。但是因為內(nèi)存數(shù)據(jù)庫在運行過程中,數(shù)據(jù)都加載到了內(nèi)存,讀和寫操作損耗時間大大減少,因而數(shù)據(jù)庫的讀寫損耗可以忽略。 數(shù)據(jù)進(jìn)行初步劃分之后,D值計算依據(jù)是在不同事務(wù)相似度標(biāo)準(zhǔn)下的不同值,之前會簡單地將這一標(biāo)準(zhǔn)選擇為超過50%。但是通過研究,這一標(biāo)準(zhǔn)并不一定是最佳標(biāo)準(zhǔn),所以本文將計算標(biāo)準(zhǔn)限定在40%~60%,分別計算不同標(biāo)準(zhǔn)下的D值。通過比較D值變化趨勢,得到最佳判定標(biāo)準(zhǔn),并依據(jù)該標(biāo)準(zhǔn)對事物進(jìn)行合并,最后再將數(shù)據(jù)進(jìn)行相關(guān)性劃分,進(jìn)而得到最佳的數(shù)據(jù)劃分。具體步驟如下: 第一步:簡單數(shù)據(jù)關(guān)聯(lián)度劃分,以數(shù)據(jù)同時被相同一組事務(wù)訪問為依據(jù),判斷數(shù)據(jù)是否相關(guān),如果相關(guān)則刪除矩陣中被相同事務(wù)訪問的數(shù)據(jù)節(jié)點,算法描述如下:〖HT5"〗算法1 //輸入:事務(wù)訪問數(shù)據(jù)矩陣 //輸出:去除相同事務(wù)訪問的節(jié)點行的事務(wù)訪問數(shù)據(jù)矩陣 數(shù)組tri[n]臨時存放第i行事務(wù)訪問數(shù)據(jù)記錄 數(shù)組trj[n]臨時存放第j行事務(wù)訪問數(shù)據(jù)記錄 1:for(i=1;i≤m;i++) 2:for(j=i+1;j≤m;j++) 3:tri[i-1]=trin//依次掃描得到第i行事務(wù)訪問數(shù)據(jù)記錄 4:trj[j-1]=trjn//依次掃描得到第j行事務(wù)訪問數(shù)據(jù)記錄 5: if (tri[n]==trj[n]) then 6:delete trj[n]//合并關(guān)聯(lián)度較強的獨立元數(shù)據(jù) 7:end if 8:end for 9:end for〖HT〗由以上操作得到經(jīng)過初步數(shù)據(jù)關(guān)聯(lián)性劃分的事務(wù)訪問數(shù)據(jù)矩陣RT。 第二步:代價計算,事務(wù)相關(guān)性劃分基于第一步的數(shù)據(jù)訪問矩陣RT,根據(jù)事務(wù)同時訪問數(shù)據(jù)的相似程度,計算事務(wù)相關(guān)性,根據(jù)代價計算公式得到合理的相似值為C,常數(shù)A=0,B=0。算法描述如下:〖HT5"〗算法2 //輸入:事務(wù)訪問數(shù)據(jù)矩陣 //輸出:去除相同事務(wù)訪問的節(jié)點行的事務(wù)訪問數(shù)據(jù)矩陣 數(shù)組tri[n]臨時存放第i行事務(wù)訪問數(shù)據(jù)記錄 數(shù)組trj[n]臨時存放第j行事務(wù)訪問數(shù)據(jù)記錄 1:for(k=1;k≤n;k++): 2:for(l=k+1;l≤n;l++) 3:trk[m]=trmk//臨時記錄第k列數(shù)據(jù)被事務(wù)tr訪問的m值 4:trj[m]=trlk//記錄第l列數(shù)據(jù)被事務(wù)tr訪問的m個值 5:trk[a]∪trl[a]=1,A++;(a取值為0,1,2…m) 6:trk[a]∩trl[a]=1,B++;(a取值為0,1,2…m) 7:if(B/A≥C)then 8:trk[a]=trk[a]∪trl[a]; //對相似事務(wù)進(jìn)行合并 9:delete trl[m]; 7:end if 8:end for 9:end for〖HT〗上一步算法結(jié)束之后,根據(jù)第一步算法對矩陣再次進(jìn)行數(shù)據(jù)相關(guān)性劃分,算法結(jié)束。
4實驗結(jié)果分析
實驗在30臺虛擬機上模擬內(nèi)存數(shù)據(jù)庫集群,模擬數(shù)據(jù)中有200個事務(wù)和1 000個獨立元數(shù)據(jù)。經(jīng)過第一步算法劃分之后合并為800個數(shù)據(jù)源,在進(jìn)行代價計算時,得到訪問代價跟事務(wù)相似性關(guān)系如圖1所示。 由圖1結(jié)果可以得到,當(dāng)事務(wù)相似度標(biāo)準(zhǔn)不小于0.52時,較為合理,在該標(biāo)準(zhǔn)下合并事務(wù),事務(wù)合并為132個,再次對數(shù)據(jù)進(jìn)行關(guān)聯(lián)性劃分,得到640個數(shù)據(jù)劃分。通過該算法可以合理劃分?jǐn)?shù)據(jù),有效降低集群訪問代價。
5結(jié)語
本文通過對傳統(tǒng)數(shù)據(jù)庫集群數(shù)據(jù)劃分算法進(jìn)行分析,基于Rough集的新應(yīng)用[6],提出了針對內(nèi)存數(shù)據(jù)庫集群的數(shù)據(jù)劃分算法。該算法有兩次數(shù)據(jù)劃分過程,第一次是普通的根據(jù)數(shù)據(jù)相關(guān)性進(jìn)行數(shù)據(jù)劃分,第二次首先對訪問數(shù)據(jù)的事務(wù)進(jìn)行相關(guān)性劃分。傳統(tǒng)劃分是直接以同時訪問數(shù)據(jù)超過50%為標(biāo)準(zhǔn),本文創(chuàng)新地提出針對內(nèi)存數(shù)據(jù)庫的訪問代價計算方法,對事務(wù)進(jìn)行規(guī)約,同時針對內(nèi)存數(shù)據(jù)庫的特點,忽略磁盤I/O代價。該算法能夠合理地劃分?jǐn)?shù)據(jù),有效降低集群訪問代價。 不過本文所提出的代價計算40%~60%也是一個經(jīng)驗值,沒有計算和論證在此范圍外的情況。此外數(shù)據(jù)庫訪問代價值D是一個整體值,可能會出現(xiàn)單個節(jié)點的Di很高,而整體D值較低的情況,使單個節(jié)點可能超出了負(fù)載能力[7],導(dǎo)致整個集群效率下降。以上兩個問題將作為以后研究的重點。
參考文獻(xiàn):
[1]劉清,孫輝,王洪發(fā).粒計算研究現(xiàn)狀及基于Rough邏輯語義的粒計算研究[J].計算機學(xué)報,2008(4):543555.
[2]于磊,羅謙,張林林.基于粒計算的數(shù)據(jù)分片算法的問題發(fā)現(xiàn)[J].計算機技術(shù)與發(fā)展,2011(6):3235.
[3]吳潤秀,吳水秀,劉清.基于粒計算的數(shù)據(jù)分片算法[J].計算機應(yīng)用,2007(6):13881391.
[4]楊晶,劉天時,馬剛.分布式數(shù)據(jù)庫數(shù)據(jù)分片與分配[J].現(xiàn)代電子技術(shù),2006(18):119121,125.
[5]楊小虎,王新宇,毛明.基于數(shù)據(jù)劃分的分布式模型及其負(fù)載均衡算法[J].浙江大學(xué)學(xué)報:工學(xué)版,2008(4):602607,681.
篇3
針對云計算數(shù)據(jù)中心網(wǎng)絡(luò)(DCN)環(huán)境下,P2P流媒體服務(wù)器集群部署引起的較高帶寬占用問題,提出了一種基于云計算的P2P流媒體服務(wù)器集群部署方法。該方法將P2P流媒體服務(wù)器集群部署建模為一個二次分配問題,并基于蟻群算法,尋找每個虛擬流媒體服務(wù)器與每個部署點之間的映射關(guān)系,實現(xiàn)基于云計算的P2P流媒體服務(wù)器集群部署。通過仿真實驗證明,基于云計算的P2P流媒體服務(wù)器集群部署算法可以有效地減少云計算平臺DCN網(wǎng)絡(luò)帶寬占用。
關(guān)鍵詞:云計算;P2P;流媒體服務(wù)器;集群部署;數(shù)據(jù)中心網(wǎng)絡(luò)
中圖分類號: TP393.01
文獻(xiàn)標(biāo)志碼:A
P2P streaming media server cluster deployment algorithm based on cloud computing
Abstract:
Concerning the high bandwidth occupation problem caused by deploying the P2P (Peer-to-Peer) streaming media server cluster on the Data Center Network (DCN) in cloud, a P2P streaming media server cluster deployment algorithm based on cloud computing was proposed. This algorithm modeled the P2P streaming media server cluster deployment as a quadratic assignment problem, and sought the mapping relationship between each virtual streaming media server and each deployment point to realize the P2P streaming media server cluster deployment based on cloud computing. The simulation experiment demonstrates that the P2P streaming media server cluster deployment algorithm based on cloud computing can effectively reduce the bandwidth usage of DCN in cloud.
Key words:
cloud computing; Peer-to-Peer (P2P); streaming media server; cluster deployment; Data Center Network (DCN)
0 引言
云計算技術(shù)在近幾年迅猛發(fā)展,在計算、存儲等方面帶來了眾多創(chuàng)新性的模式與技術(shù)成果[1],為基于云計算實現(xiàn)低延時、大規(guī)模P2P流媒體傳輸提供了契機。首先,云計算環(huán)境能夠提供大規(guī)模P2P流媒體直播服務(wù)器所需的計算、存儲和可靠的帶寬資源[2];其次,云計算技術(shù)具有動態(tài)可擴展特性與環(huán)境感知能力,基于運行狀態(tài)監(jiān)控,可實現(xiàn)系統(tǒng)資源與數(shù)據(jù)傳輸?shù)膭討B(tài)調(diào)度,適于動態(tài)變化的P2P對等網(wǎng)絡(luò)環(huán)境,并可改變P2P流媒體服務(wù)器資源不可知、不可控的研究現(xiàn)狀。
近來,少數(shù)前瞻性的研究已開始探索云計算與P2P計算、P2P流媒體的結(jié)合應(yīng)用模式。Fouquet等[3]利用云計算平臺中的節(jié)點充當(dāng)超級節(jié)點,作為P2P多播樹的上層節(jié)點,以提升P2P流媒體傳輸?shù)姆€(wěn)定性。Trajkovska等[4]提出了在云計算和樹型P2P網(wǎng)絡(luò)混合環(huán)境中,以QoS參數(shù)和付費成本為代價,提供不同服務(wù)質(zhì)量的模型。Payberah等[5]提出了一種基于云計算環(huán)境下的P2P直播系統(tǒng),系統(tǒng)通過動態(tài)租用云計算環(huán)境下的虛擬機資源,來保證預(yù)設(shè)的P2P直播系統(tǒng)的預(yù)設(shè)的QoS。Cervino等[6]提出了一種混合分發(fā)網(wǎng)絡(luò),通過連接可以互相操作的P2P節(jié)點和云節(jié)點,使某些分發(fā)網(wǎng)絡(luò)節(jié)點進(jìn)入云基礎(chǔ)設(shè)施從而提高服務(wù)質(zhì)量。在上述云計算與P2P流媒體技術(shù)的結(jié)合研究中,均簡單地將云計算平臺作為一種網(wǎng)絡(luò)帶寬等資源無限的平臺,并沒有具體地給出將P2P流媒體服務(wù)器集群部署到云平臺數(shù)據(jù)中心網(wǎng)絡(luò)之上的方法。
隨著網(wǎng)絡(luò)密集型應(yīng)用在云平臺數(shù)據(jù)中心網(wǎng)絡(luò)的大量部署,DCN的內(nèi)部網(wǎng)絡(luò)帶寬成為云計算環(huán)境下的一個瓶頸資源[7]。如何減少數(shù)據(jù)中心網(wǎng)絡(luò)的內(nèi)部帶寬消耗,是應(yīng)用部署需要考慮的核心問題。Meng等[7]討論了如何將虛擬機部署到云平臺DCN網(wǎng)絡(luò)的問題,基于虛擬機之間的通信代價以及部署點之間的代價提出了最小化占用DCN網(wǎng)絡(luò)帶寬的優(yōu)化問題,他們表明這個問題是一個NP-Hard問題,提出了一種基于最大流最小割的TVMPP (Traffic-aware VM Placement Problem)優(yōu)化算法,但是此算法對于P2P流媒體服務(wù)器集群這樣有特定結(jié)構(gòu)與流量的應(yīng)用部署問題卻沒有顯著的效果。本文解決了如何將P2P流媒體服務(wù)器集群有效地部署到云計算數(shù)據(jù)中心網(wǎng)絡(luò)環(huán)境中的問題,使得P2P流媒體服務(wù)器集群最小化占用云計算虛擬化網(wǎng)絡(luò)資源。
1 P2P流媒體服務(wù)器部署問題建模
當(dāng)代的數(shù)據(jù)通信網(wǎng)絡(luò)(Data Communication Network,DCN)架構(gòu)一般是三層體系架構(gòu)。從頂層到底層依次為:核心交換機、聚集交換機和接入交換機。盡管這種三層架構(gòu)的物理拓?fù)浣Y(jié)構(gòu)是一個多根的森林拓?fù)浣Y(jié)構(gòu),在現(xiàn)實中的數(shù)據(jù)包轉(zhuǎn)發(fā)是根據(jù)使用虛擬局域網(wǎng)和生成樹算法構(gòu)成的邏輯兩層拓?fù)浣Y(jié)構(gòu)。這種兩層拓?fù)浣Y(jié)構(gòu)始終是一棵樹,通常根是其中的一個核心交換機。常見的擴展DCN網(wǎng)絡(luò)架構(gòu)有VL2[8]、Fat-Tree[9]、BCube[10]三種。
本文在上述的DCN架構(gòu)基礎(chǔ)上,以文獻(xiàn)[5]提出的通信代價為基礎(chǔ),形式化地對虛擬化環(huán)境下,服務(wù)器之間的通信代價進(jìn)行描述,本文定義部署點為物理機器上可以部署的虛擬機或者是純粹的物理服務(wù)機器。部署點之間通信代價為任何兩個部署點路由所經(jīng)過的最小的交換機的個數(shù)。本文定義同一臺物理主機上的虛擬機之間的通信代價為0。
本文常用符號如表 1。
2 P2P流媒體服務(wù)器部署算法
P2P流媒體服務(wù)器的部署算法就是要解決典型的QAP。這類問題是組合優(yōu)化研究中的一項很重要的內(nèi)容,是NP難問題。蟻群算法由于并行性與分布性、特別適合大規(guī)模啟發(fā)式搜索[11]的特點可以有效解決QAP問題。在本文使用蟻群算法的過程中,將一只螞蟻的一個覓食過程定義為尋找每個虛擬流媒體服務(wù)器與每個部署點之間的一種映射關(guān)系。
由于P2P虛擬流媒體服務(wù)器個數(shù)m可能會小于部署點個數(shù)n,而一般的蟻群算法中兩者是相等的,本文通過添加“空”的虛擬流媒體服務(wù)器來使得m=n?!翱铡钡奶摂M流媒體服務(wù)器指的是在邏輯集群樹中連接的邊的權(quán)值為“0”,不向任何其他虛擬流媒體服務(wù)器發(fā)送、也不接受任何其他虛擬流媒體服務(wù)器的數(shù)據(jù)。這樣矩陣
使用蟻群算法解決此問題可以用圖的形式進(jìn)行描述:在圖G=(V,E)中,節(jié)點V的個數(shù)為2n,其中有n個節(jié)點表示虛擬流媒體服務(wù)器,n個節(jié)點表示部署點;邊E表示的為連接虛擬流媒體服務(wù)器與部署點的代價。一個螞蟻構(gòu)建一個完整解的過程為,尋找連接n個節(jié)點的虛擬流媒體服務(wù)器與n個部署點之間的弧的n條邊。用到的符號定義如表2。
3 驗證與仿真實驗
本文實驗平臺為惠普個人電腦,配置如下:CPU型號為i5-2400,內(nèi)存8GB,操作系統(tǒng)為Windows 7 64位。實驗數(shù)據(jù)在eclipse上使用Java編程仿真得到。實驗中衡量DCN負(fù)載均是以流媒體速率r為單位。
實驗一 實驗選擇了128個部署點,128個P2P媒體服務(wù)器構(gòu)成的服務(wù)器集群。針對不同的DCN架構(gòu),Tree、FatTree、VL2、Bcube等分別進(jìn)行了隨機部署算法(Random)、TVMPP算法[6]以及SCVMPP算法,實驗結(jié)果如圖 1所示。
從圖 1中可以看出Random算法與TVMPP算法在不同的DCN網(wǎng)絡(luò)下面產(chǎn)生的通信代價(DCN網(wǎng)絡(luò)帶寬占用)基本一樣,而本文提出的SCVMPP算法可以有效地減少通信代價。
SCVMPP算法對于不同的DCN架構(gòu)減少的程度也是不一樣的,相對于FatTree以及VL2,Tree架構(gòu)以及BCube架構(gòu)減少的DCN網(wǎng)絡(luò)帶寬負(fù)載更多。這是由部署點代價矩陣決定的,也即DCN網(wǎng)絡(luò)架構(gòu)決定的。
TVMPP算法主要分為兩個部分,第一部分使用Gonzalez等[12]提出的KTMM算法將部署點集合劃分成k個部署點集合,使得各個部署點集合之間通信代價最小化;第二部分是使用了Gomory-Hu算法[13]將通信代價圖先轉(zhuǎn)化為具有最大流最小切割的Gomory-Hu樹,然后將虛擬流媒體服務(wù)器劃分成與第一部分中部署點集合一樣大小的虛擬流媒體服務(wù)器集合。但是P2P流媒體服務(wù)器集群部署中虛擬機的帶寬使用較均衡,在Gomory-Hu算法中生成Gomory-Hu樹時,所有的最大流最小切割劃分代價都是一樣的,這導(dǎo)致在虛擬流媒體服務(wù)器劃分時的效果基本等價于Random劃分,也即使得整個TVMPP算法的效果最終等價于Random部署算法。
SCVMPP算法與TVMPP算法不同,是一個正反饋的過程,與所部署的具體應(yīng)用沒有必然的關(guān)系,對帶寬使用較均衡的應(yīng)用,也會有效地減少服務(wù)器集群所占用的帶寬。
實驗二 本實驗中比較了不同架構(gòu)下隨著集群規(guī)模變化的SCVMPP算法與TVMPP算法。實驗部署點規(guī)模從128變化到1024,實驗中DCN架構(gòu)選擇Tree架構(gòu)和BCube架構(gòu),實驗結(jié)果如圖 2、3所示。從圖中可以看出,隨著部署點規(guī)模的增加,SCVMPP算法產(chǎn)生的通信代價總是小于TVMPP算法。
從圖2、圖3可以看出,隨著部署點規(guī)模的增加,SCVMPP算法在Tree架構(gòu)下相對于TVMPP算法的優(yōu)化百分比沒有在BCube架構(gòu)下好。原因是接入交換機的端口數(shù)k,聚集交換機端口數(shù)m在部署點規(guī)模增加時沒有發(fā)生變化,在Tree架構(gòu)下會導(dǎo)致一個部署點通信代價為5的節(jié)點隨著規(guī)模數(shù)不斷增加,而BCube架構(gòu)不受此影響。
4 結(jié)語
本文針對P2P流媒體服務(wù)器集群在云計算環(huán)境部署時引起數(shù)據(jù)中心網(wǎng)絡(luò)帶寬占用過高的問題提出了P2P流媒體服務(wù)器集群部署算法。通過對此問題的建模分析得出此問題是一個二次分配問題,并基于蟻群算法,將每個虛擬流媒體服務(wù)器部署到云計算環(huán)境中的虛擬機上。最后通過實驗表明本文提出的算法有效減少了數(shù)據(jù)中心網(wǎng)絡(luò)的帶寬占用。
本文算法是基于P2P流媒體服務(wù)器集群邏輯結(jié)構(gòu)是已知的情況,其結(jié)構(gòu)是未知的情況還有待今后研究。
參考文獻(xiàn):
[1] DIKAIAKOS M D, KATSAROS D, MEHRA P, et al. Cloud computing: Distributed Internet computing for IT and scientific research[J]. IEEE Internet Computing, 2009, 13(5): 10-13.
[2] ANTONOPOULOS N. Cloud computing[M]. Berlin: Springer, 2010.
[3] FOUQUET M, NIEDERMAYER H, CARLE G. Cloud computing for the masses[C]// Proceedings of the 1st ACM Workshop on User-provided Networking: Challenges and Opportunities. New York: ACM, 2009: 31-36.
[4] TRAJKOVSKA I, RODRIGUEZ J S, VELASCO A M. A novel P2P and cloud computing hybrid architecture for multimedia streaming with QoS cost functions[C]// Proceedings of the 2010 International Conference on Multimedia. New York: ACM, 2010: 1227-1230.
[5] PAYBERAH A H, KAVALIONAK H, KUMARESAN V, et al. CLive: Cloud-assisted P2P live streaming[C]// Proceedings of the 2012 IEEE International Conference on Peer-to-Peer Computing. Piscataway: IEEE, 2012: 79-90.
[6] CERVINO J, RODRíGUEZ P, TRAJKOVSKA I, et al. Testing a cloud provider network for hybrid P2P and cloud streaming architectures[C]// Proceedings of the 2011 IEEE International Conference on Cloud Computing. Piscataway: IEEE, 2011: 356-363.
[7] MENG X, PAPPAS V, ZHANG L. Improving the scalability of data center networks with traffic-aware virtual machine placement[C]// Proceedings of the 29th Conference on Information Communications. Piscataway: IEEE, 2010: 1-9.
[8] GREENBERG A, HAMILTON J R, JAIN N, et al. VL2: a scalable and flexible data center network[J].ACM SIGCOMM Computer Communication Review, 2009, 39(4): 51-62.
[9] LEISERSON C E. Fat-trees: universal networks for hardware-efficient supercomputing[J]. IEEE Transactions on Computers, 1985, 100(10): 892-901.
[10] GUO C, LU G, LI D, et al. BCube: a high performance, server-centric network architecture for modular data centers[J]. ACM SIGCOMM Computer Communication Review, 2009, 39(4): 63-74.
[11] DORIGO M, BONABEAU E, THERAULAZ G. Ant algorithms and stigmergy[J]. Future Generation Computer Systems, 2000, 16(8): 851-871.
篇4
關(guān)鍵詞:課程群;計算機硬件;農(nóng)業(yè)院校;人才培養(yǎng)
當(dāng)前我國很多高等農(nóng)業(yè)院校計算機專業(yè)已逐漸轉(zhuǎn)變?yōu)檐浖こ毯陀嬎銠C科學(xué)與技術(shù)兩個專業(yè)方向。然而,在教學(xué)實踐中過分強調(diào)軟件與應(yīng)用,計算機硬件方面的教學(xué)卻相對薄弱,導(dǎo)致學(xué)生缺乏計算機體系結(jié)構(gòu)、計算機組成與結(jié)構(gòu)等硬件方向的基本能力。即,計算機教育上存在著“重軟輕硬”的傾向。
1計算機硬件教學(xué)存在問題分析
當(dāng)前,農(nóng)業(yè)院校計算機科學(xué)與技術(shù)本科專業(yè)中,計算機硬件與結(jié)構(gòu)方向的核心和普通知識點一般體現(xiàn)在以下幾門課程中:數(shù)字邏輯、計算機組成原理、微機原理、微機接口技術(shù)、匯編語言、計算機系統(tǒng)結(jié)構(gòu)、計算機系統(tǒng)結(jié)構(gòu)、嵌入式系統(tǒng)等。在教學(xué)過程中,各門課程相互之間內(nèi)容銜接較多、重復(fù)之處也比較多,而某些知識點缺乏前導(dǎo)、造成斷層。教師一般按照自己的教學(xué)大綱和計劃對各門課程內(nèi)容進(jìn)行劃定,而不是以計算機系統(tǒng)的整個體系結(jié)構(gòu)為主線,造成缺乏系統(tǒng)性和科學(xué)性,難以實現(xiàn)學(xué)生從大一到大四的完整體系,使知識的連貫性變差;而且計算機硬件技術(shù),例如:處理器技術(shù)、存儲技術(shù)及網(wǎng)絡(luò)技術(shù)等每天都有新的進(jìn)展和變化,這些變化很難及時地反映到計算機硬件相關(guān)教材和實驗設(shè)備上,因此難以體現(xiàn)發(fā)展中的新技術(shù)和教材之間的關(guān)聯(lián)。由此造成,學(xué)生對這些課程普遍存在沒有學(xué)習(xí)興趣,教師上課缺乏激情的情況[1]。
因此,學(xué)生在掌握計算機硬件基本原理的基礎(chǔ)上,如何結(jié)合計算機硬件技術(shù)的發(fā)展,并充分體現(xiàn)硬件技術(shù)的系統(tǒng)性和實踐性,是當(dāng)前農(nóng)業(yè)院校計算機硬件教學(xué)所面臨的重要問題;也是真正實現(xiàn)計算機科學(xué)與技術(shù)專業(yè)培養(yǎng)目標(biāo)所必須解決的問題。
2計算機硬件課程群
為了解決以上存在的問題,本文提出構(gòu)建計算機科學(xué)與技術(shù)專業(yè)硬件課程群。課程群方法是近年來高等院校課程體系建設(shè)實踐中出現(xiàn)的一項新的課程開發(fā)技術(shù)。其基本思想是把各門課程內(nèi)容聯(lián)系緊密,內(nèi)在邏輯性強,屬同一培養(yǎng)能力范疇的同一類課程作為一個課程群組進(jìn)行建設(shè),從技能培養(yǎng)目標(biāo)層次有效的把握課程內(nèi)容的分配、實施、保障和技能的實現(xiàn)。課程群體系的進(jìn)程如圖1所示。
其優(yōu)勢在于以下3個方面:
1) 內(nèi)容具有科學(xué)性。課程群各組成課程之間關(guān)系密切、邏輯性強,知識具有遞進(jìn)性,便于組織教學(xué)。
2) 實驗室高效利用。課程群使計算機專業(yè)實驗室可以進(jìn)行大型的跨課程綜合型實驗,不僅在使用人次上,更重要的是在每次使用的效率上將得到極大的提高。
3) 教學(xué)具有可控性。課程群所有課程的教與學(xué)透明度提高,教學(xué)中的隨意性和非計劃性減少,可以有效的提高教學(xué)的可控性[2]。
3計算機硬件課程群構(gòu)建的主要內(nèi)容
本課程群的構(gòu)建主要針對我校2010級本科教學(xué)人才培養(yǎng)實施方案。構(gòu)建以下3個方面:計算機硬件課程群課程建設(shè),綜合型實驗與課程設(shè)計設(shè)置和課程群內(nèi)容的更新[3]。
3.1計算機硬件課程群課程建設(shè)
課程群的建立包括確定核心課程與選修課程。在課程群設(shè)置中,以學(xué)科方向和模塊為核心,同時與專業(yè)培養(yǎng)計劃相適應(yīng)。在設(shè)置課程群的時候,打破單一授課的限制,使不同專業(yè)教研室的教師根據(jù)課程群設(shè)置凝聚一起,集中對各門核心課程和選修課程的內(nèi)容與組織進(jìn)行系統(tǒng)地規(guī)劃,避免重復(fù)和脫節(jié)現(xiàn)象。例如:可以考慮把匯編語言課程和計算機組成原理課程結(jié)合,側(cè)重于計算機硬件的五大部件、尋址方式和指令系統(tǒng)。這樣有利于把計算機組成原理中介紹的一般性的知識和具體的微機系統(tǒng)聯(lián)系起來,給學(xué)生打下牢固的理論基礎(chǔ);也可將匯編語言、計算機組成原理和微機接口技術(shù)3門課程全部聯(lián)系起來,將計算機硬件基礎(chǔ)知識全部融合在一起,提供給學(xué)生完善的知識體系[4]。
3.2計算機硬件課程群綜合型實驗建設(shè)
計算機硬件課程群建設(shè)中,強調(diào)實踐教學(xué)的重要性。在課程群建設(shè)中,不是以單一的課程為單位設(shè)計實驗,而是按照整個課程群來設(shè)計一體化的實驗環(huán)境與實驗內(nèi)容??梢詫R編語言方向、微機接口方向、計算機組成原理和計算機體系結(jié)構(gòu)等實驗有機地結(jié)合在一起,創(chuàng)建良好的實驗環(huán)境,靈活運用實驗室、開放式實驗室等多種手段培養(yǎng)學(xué)生的研究能力與團(tuán)隊精神的教育方法。例如,在計算機組成原理實驗中設(shè)置了8255、8253等實驗,同樣在計算機接口實驗技術(shù)中也有同樣的內(nèi)容,因此,可以考慮整合這部分內(nèi)容,利用幾個接口芯片開發(fā)一個小系統(tǒng),不僅使同學(xué)學(xué)習(xí)了相關(guān)接口芯片知識,同時也鍛煉了芯片在系統(tǒng)中的應(yīng)用,建立整機概念等。
3.3課程群內(nèi)容更新建設(shè)
根據(jù)計算機學(xué)科發(fā)展情況,及時、動態(tài)地調(diào)整課程群內(nèi)核心課程、選修課程的設(shè)置,同時考慮到每一門課程具體內(nèi)容的設(shè)置。讓學(xué)生要盡可能學(xué)習(xí)掌握同當(dāng)前主流技術(shù)發(fā)展方向聯(lián)系比較緊密的新技術(shù)(如Pentium 的超標(biāo)量流水線、分離的指令Cache 與數(shù)據(jù)Cache、指令分支預(yù)測技術(shù)、Itanium 的EPIC 核心技術(shù)),以及計算機新技術(shù)發(fā)展趨勢(如未來處理器技術(shù), 現(xiàn)代網(wǎng)絡(luò)環(huán)境對硬件技術(shù)的要求, 64 位微處理器技術(shù))等。
4結(jié)語
本方案已經(jīng)通過相關(guān)課程專業(yè)教師多次研討,打破以往獨立課程設(shè)置方式,初步確立計算機硬件的課程群設(shè)置,計算機硬件綜合實驗設(shè)置的方案。該方案如果做進(jìn)一步的深入研究、探討與實踐,必將對提高計算機專業(yè)學(xué)生軟件和硬件能力的協(xié)調(diào)起到良好的作用,改變當(dāng)前高等農(nóng)業(yè)院校計算機專業(yè)學(xué)生硬件能力偏差的現(xiàn)狀,提高其學(xué)生的自身綜合素質(zhì)和增強其就業(yè)能力。
參考文獻(xiàn):
[1] 唐建宇. 計算機硬件課程教學(xué)中的若干問題分析與探討[J]. 福建電腦,2007(5):188-189.
[2] 劉新平,鄭秋梅,孫士明,等. 計算機硬件課程群實驗體系的改革與完善[J]. 計算機教育,2008(12):117-119.
[3] 王讓定,錢江波,石守東,等. CC2005的計算機學(xué)科硬件與結(jié)構(gòu)課程群改革探索[J]. 計算機教育,2008(8):137-138.
[4] 劉全利,黃賢英,楊宏雨. 計算機組成原理課程群建設(shè)的探討[J]. 科技信息,2008(4):9-10.
Discuss on the Computer Hardware Course Group in Computer Science and
Technology Teaching of Agricultural Universities
ZHANG Xi-hai, YU Xiao, WU Ya-chun, WEI Xiao-li
(Engineering college, Northeast Agriculture University, Harbin 150030, China)
篇5
關(guān)鍵詞: 數(shù)據(jù)庫; 數(shù)學(xué)模型; 查詢優(yōu)化; 和聲搜索算法
中圖分類號: TN911?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)03?0114?03
Database query optimization based on improved harmony search algorithm
GAO Jie1, 2
(1. University of Electronic Science and Technology of China, Chengdu 611731, China;
2. Department of Modern Service, Hebei Women′s Vocational College, Shijiazhuang 050091, China)
Abstract: The database query optimization is the foundation of the database application. Since the database query has low efficiency, and it is difficult to obtain the optimal query scheme, a new database query optimization method based on improved harmony search algorithm is proposed. The research status of the database query optimization is analyzed to find out the shortcomings existing in the current algorithms. The mathematical model of the database query optimization was constructed, and solved with the harmony search algorithm. The defect of the standard harmony search algorithm was improved. The VC++ programming is used to test the performance of the database query optimization. The results show that the algorithm can improve the database query efficiency, and has more significant advantage especially for the large?scale database query optimization.
Keywords: database; mathematical model; query optimization; harmony search algorithm
0 引 言
近些年隨著網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)處理技術(shù)的不斷成熟和融合,出現(xiàn)了許多的數(shù)據(jù)庫,而且數(shù)據(jù)庫規(guī)模越來越龐大[1?2]。查詢優(yōu)化操作是數(shù)據(jù)庫應(yīng)用最常用的技術(shù),查詢優(yōu)化效率的優(yōu)劣直接決定了數(shù)據(jù)庫訪問結(jié)果的好壞,因此如何設(shè)計性能優(yōu)異的數(shù)據(jù)庫查詢優(yōu)化方法具有十分重要的實際應(yīng)用價值[3]。
數(shù)據(jù)庫查詢優(yōu)化問題引起了國內(nèi)外研究人員的高度重視,它們采用各種技術(shù)對其進(jìn)行深入分析,涌現(xiàn)出了大量、有效的數(shù)據(jù)庫查詢優(yōu)化算法[3]。最原始的數(shù)據(jù)庫查詢優(yōu)化算法基于窮盡策略,即搜索每一種可能的查詢方案,找到最優(yōu)的數(shù)據(jù)庫查詢方案,當(dāng)數(shù)據(jù)庫規(guī)模比較小時,其查詢效率高[4],然而對于大型數(shù)據(jù)庫,由于查詢條件和約束比較多,該算法的計算時間復(fù)雜度急劇上升,查詢過程耗時相當(dāng)長,有時甚至無法找到數(shù)據(jù)庫的最優(yōu)查詢方案[5]。為此,有關(guān)研究人員提出了基于動態(tài)規(guī)劃的數(shù)據(jù)庫查詢優(yōu)化算法,該算法的查詢效率得到了提高,但其實質(zhì)上仍然采用窮舉搜索策略,而對于大型數(shù)據(jù)庫,查詢效率低的問題仍然存在[6]。近些年,隨著人工智能算法的不斷成熟,有學(xué)者將遺傳算法、粒子群優(yōu)化算法以及蟻群優(yōu)化算法[7?9]引入到數(shù)據(jù)查詢優(yōu)化問題的求解過程中,它們將最優(yōu)或者次優(yōu)數(shù)據(jù)庫查詢優(yōu)化方案作為搜索目標(biāo),通過模擬自然界一些生物行為進(jìn)行問題求解,找到數(shù)據(jù)庫查詢最優(yōu)方案的速度明顯加快,計算時間復(fù)雜度下降,成為當(dāng)前數(shù)據(jù)庫查詢優(yōu)化問題的主要解決算法[10]。相關(guān)研究表明,數(shù)據(jù)庫查詢優(yōu)化受到多種條件約束,是一種典型的NP,這些算法的求解過程易陷入局部最優(yōu)解,有時不能得到最優(yōu)查詢方案[11]。
和聲搜索(Harmony Search,HS)算法[12]是一種模擬樂師調(diào)整音調(diào)的人工智能算法,具有控制參數(shù)少,簡單易實現(xiàn),收斂速度快等優(yōu)點,在很大程度上防止了局部最優(yōu)解的出現(xiàn)。為了獲得更加理想的數(shù)據(jù)庫查詢優(yōu)化結(jié)果,提出改進(jìn)和聲搜索算法的數(shù)據(jù)庫查詢優(yōu)化算法(Improved Harmony Search,IHS),并采用具體實驗對其性能進(jìn)行測試和分析。結(jié)果表明,本文算法可以提高數(shù)據(jù)庫查詢效率,特別適合于大規(guī)模數(shù)據(jù)庫查詢問題的求解。
1 改進(jìn)和聲搜索算法
1.1 HS算法
HS算法是一種受到和聲音樂啟發(fā)的人工智能算法,模擬樂師們不斷調(diào)整各種樂器的音調(diào)產(chǎn)生美妙的和聲對問題實現(xiàn)求解。設(shè)樂器[(i=1,2,…,m)]為待求解問題的第[i]個決策變量,和聲為待求解問題的第[j]個解向量,HS工作步驟為:
Step1:設(shè)待求解問題為最小優(yōu)化問題,[f(X)]為問題的目標(biāo)函數(shù),那么問題可以描述為:
[min f(X)s.t. X∈(x1,x2,…,xN)] (1)
式中:[X]為決策變量[xi(i=1,2,…,N)]組成的解向量;[N]為變量的個數(shù)。
Step2:確定[N]的值,音調(diào)調(diào)節(jié)概率和帶寬PAR和bw;決策變量取值范圍為[[xLi,xUi];]和聲記憶庫的規(guī)模為HMS;記憶庫的概率為HMCR。
Step3: 隨機生成[HMS]個和聲[x1,x2,…,xHMS,]并且將它們保存在和聲記憶庫中,具體為:
[HM=x11x12…x1Nx21x22…x2N????xHMS1xHMS2…xHMSNf(x1)f(x2)?f(xHMS)] (2)
Step4:通過HM的學(xué)習(xí)、音調(diào)微調(diào)和隨機選擇音調(diào)產(chǎn)生新的和聲[x′i=(x′1,x′2,…,x′N)],具體如下:
[x′1]通過HMCR的概率,其值來自HM[(x′1~xHMS1)],根據(jù)1~HMCR的概率隨機產(chǎn)生,即:
[x′i=x′i∈(x1i,x2i,…,xHMSi), if rand
若[x′i]來自[HM,]那么根據(jù)式(4)對其音調(diào)進(jìn)行微調(diào)。
[x1i=x′i+rand*bw, if rand
式中[rand]為[0,1]的隨機數(shù)。
Step5: 對[x′i]進(jìn)行u估,若其優(yōu)于[HM]的最差解,那么將[x′i]替換為最差解,并保存到[HM]中,即:
[f(xworst)=maxj=1,2,…,HMSf(xj)if f(x)
Step6:如果滿足終止條件就停止運行,否則不斷重復(fù)Step3和Step4。
1.2 IHS算法
相關(guān)研究結(jié)果表明,與其他人工智能算法相似,HS算法在后期出現(xiàn)搜索停滯、易出現(xiàn)“早熟”現(xiàn)象[13],為此本文對其進(jìn)行改進(jìn),提出IHS算法,具體思想為:引入?yún)?shù)WSR,其值的大小與迭代次數(shù)[k]之間是一種動態(tài)的變化關(guān)系,算法工作初期,其值較大,更新HM的最差和聲,算法工作后期更新HM最優(yōu)和聲,可以有效避免“早熟”現(xiàn)象發(fā)生,加快算法的收斂速度。
為了分析IHS算法的性能,選擇Griewank和Rastrigin函數(shù)進(jìn)行測試,采用HS算法進(jìn)行對照實驗,測試結(jié)果見圖1。對圖1的測試結(jié)果進(jìn)行對比分析可以發(fā)現(xiàn),IHS算法的搜索速度明顯要快于HS算法,而且解決了HS算法的“早熟”難題,證明了本文對HS算法改進(jìn)的有效性。
2 GM?QPSO的數(shù)據(jù)查詢優(yōu)化問題求解
2.1 數(shù)學(xué)模型
數(shù)據(jù)庫查詢最優(yōu)方案實際是一個有[n]個關(guān)系的連接樹:[j1, j2,…, ji,]查詢方案評估模型為:
[COST=i=1n-icost(ji)] (6)
設(shè)[R]為關(guān)系[R]的元組數(shù);[C]為[R]和[S]的公共屬性集合,[J=RjoinS,]查詢代價[cost(J)]為:
[cost(J)=R×Sci∈CmaxVci,R,Vci,S] (7)
[V(c,R)]為[R]中屬性[c]的取值,具體為:[V(c,J)=V(c,J), c∈R-SV(c,S), c∈S-Rmin(V(c,R),V(c,S)), c∈R?S1≤i1,i2,…,im
2.2 IHS算法的數(shù)據(jù)庫查詢優(yōu)化問題求解
(1) IHS參數(shù)的初始化。
(2) 設(shè)[xi=round(rand(1,N)),i=1,2,…,HMS]隨機產(chǎn)生[HMS]個向量,即數(shù)據(jù)庫查詢優(yōu)化問題的可行解。
(3) 計算[HM]每個和聲的適應(yīng)度值,并根據(jù)適應(yīng)度值找到最優(yōu)和最差的和聲[xbest]和[xworst,]適應(yīng)度計算公式為:
[f(Xi)=1cost(Xi)] (9)
(4) 確定WSR的值,具體如下所示:
[WSR=0.7×1-kTmax+0.3] (10)
式中[k]為當(dāng)前迭代的次數(shù)。
(5) 產(chǎn)生一個隨機數(shù)rand,若rand>WSR,那么表示[xworst]被選中,且有[xnew=xworst,]否則有[xnew=xbest。]
(6) 若rand
(7) 計算[xnew]的適應(yīng)度值[fnew=f(xnew),]若[xworst]被選中,且[fnew>fworst,]那么就有[xworst=xnew,]否則[xbest=xnew]。
(8) 如果達(dá)到最大迭代次數(shù),最優(yōu)和聲對應(yīng)的解為數(shù)據(jù)庫最優(yōu)查詢方案,否則返回步驟(3),繼續(xù)執(zhí)行。
基于IHS算法的數(shù)據(jù)庫查詢優(yōu)化流程見圖2。
3 性能測試
為了分析IHS算法的數(shù)據(jù)庫查詢優(yōu)化問題求解的有效性,采用VC++編程實現(xiàn)仿真實驗,并選擇HS算法、文獻(xiàn)[8]算法進(jìn)行對比測試,選擇查詢代價和執(zhí)行時間(單位:s)對數(shù)據(jù)庫查詢最優(yōu)方案進(jìn)行評價,所有算法的數(shù)據(jù)庫查詢代價和執(zhí)行時間如圖3,圖4所示。
對圖3中各種算法的數(shù)據(jù)查詢代價進(jìn)行對比分析,得到如下結(jié)論:
(1) 當(dāng)連接數(shù)很小時,IHS算法、HS算法以及文獻(xiàn)[8]算法的數(shù)據(jù)庫查詢代價相差不大,沒有太大的區(qū)別。
(2) 隨著連接數(shù)不斷增加,IHS算法、HS算法以及文獻(xiàn)[8]算法的數(shù)據(jù)庫查詢代價也隨之增加,在相同條件下,IHS算法的數(shù)據(jù)庫查詢代價要小于HS算法以及文獻(xiàn)[8]算法,這是由于IHS算法加快了數(shù)據(jù)庫查詢優(yōu)化問題的求解速度,得到了更加理想的數(shù)據(jù)庫查詢方案。
從圖4的執(zhí)行時間可以看出,相對于HS算法以及文獻(xiàn)[8]算法,IHS算法找到數(shù)據(jù)庫查詢最優(yōu)方案的時間大幅度減少,尤其當(dāng)數(shù)據(jù)庫連接數(shù)很大時,IHS算法的執(zhí)行速度更快,優(yōu)勢更加明顯,可以滿足數(shù)據(jù)庫查詢的實時性要求,同時可以應(yīng)用于網(wǎng)絡(luò)數(shù)據(jù)庫的查詢,應(yīng)用范圍更加廣泛。
4 結(jié) 語
查詢效率直接影響大型數(shù)據(jù)庫的應(yīng)用范圍,為了加快數(shù)據(jù)庫查詢的速度,滿足數(shù)據(jù)庫在線查詢的實際要求,提出基于改進(jìn)和聲搜索算法的數(shù)據(jù)庫查詢優(yōu)化算法,實驗結(jié)果表明,本文算法可以很快找到數(shù)據(jù)庫查詢的最優(yōu)結(jié)果,有效提高了數(shù)據(jù)庫的查詢效率,尤其對于大型數(shù)據(jù)庫查詢的優(yōu)越性更加明顯,可以應(yīng)用于實際的數(shù)據(jù)庫系統(tǒng)中。
參考文獻(xiàn)
[1] 張敏,馮登國,徐震.多級多版本數(shù)據(jù)庫管理系統(tǒng)全局串行化[J].軟件學(xué)報,2007,18(2):346?347.
[2] 張麗平,李松,郝忠孝.球面上的最近鄰查詢方法研究[J].計算機工程與應(yīng)用,2011,47(5):126?129.
[3] 帥訓(xùn)波,馬書南,周相廣,等.基于遺傳算法的分布式數(shù)據(jù)庫查詢優(yōu)化研究[J].小型微型計算機系統(tǒng),2009,30(8):1600?1604.
[4] ZHOU Zehai. Using heuristics and genetic algorithms for large scale database query optimization [J]. Journal of information and computing science, 2007, 2(4): 261?280.
[5] CHEN P H, SHAHANDASHTI S M. Hybrid of genetic algorithm and simulated annealing for multiple project scheduling with multiple resource constraints [J]. Automation in construction, 2009, 18(4): 434?443.
[6] 郭聰莉,朱莉,李向.基于蟻群算法的多連接查詢優(yōu)化方法[J].計算機工程,2009,35(10):173?176.
[7] 林桂亞.基于粒子群算法的數(shù)據(jù)庫查詢優(yōu)化[J].計算機應(yīng)用研究,2012,29(3):974?975.
[8] 鄭先鋒,王麗艷.自適應(yīng)逃逸動量粒子群算法的數(shù)據(jù)庫多連接查詢優(yōu)化[J].四川大學(xué)學(xué)報(自然科學(xué)版),2013,50(3):100?103.
[9] 于洪濤,錢磊.一種改進(jìn)的分布式查詢優(yōu)化算法[J].計算機工程與應(yīng)用,2013,49(8):151?155.
[10] 徐增敏,張昆,丁勇,等.基于動態(tài)視圖的數(shù)據(jù)庫性能調(diào)優(yōu)[J].計算機應(yīng)用與軟件,2012,29(12):58?60.
[11] 林鍵,劉仁義,劉南,等.基于查詢優(yōu)化器的分布式空間查詢優(yōu)化方法[J].計算機工程與應(yīng)用,2012,48(22):161?165.
篇6
關(guān)鍵詞:石英撓性加速度計;參數(shù)辨識;改進(jìn)人工魚群算法
1 引言
石英撓性加速度計是一款在慣性導(dǎo)航、慣性制導(dǎo)及民用工業(yè)上得到廣泛應(yīng)用的慣性器件,由于其自身結(jié)構(gòu)簡單、價格低、可靠性高等優(yōu)點,具有廣泛的發(fā)展前景。隨著對慣導(dǎo)系統(tǒng)等精度要求的不斷提高,對石英撓性加速度計的測量精度要求也越來越高。
人工魚群算法(AFSA)由李曉磊等人在2002年首次提出來[1]。其基本思想是模仿魚類在水中趨向于食物含量最多的地方活動。根據(jù)魚群的這一特點,人工魚群算法構(gòu)造人工魚群并賦予每條人工魚一些魚類的行為(如覓食行為、聚群行為、追尾行為及隨機行為),通過人工魚個體或群體的方式達(dá)到尋優(yōu)的目的。
2 石英撓性加速度計的靜態(tài)數(shù)學(xué)模型
石英撓性加速度計的重力場試驗是加速度計其他試驗的基礎(chǔ)。其原理是利用重力加速度作用于加速度計的輸入軸、擺軸和輸出軸,從而測得加速度計的各項性能參數(shù)。它具有標(biāo)定的偏值和標(biāo)度因數(shù)準(zhǔn)確的優(yōu)點。采用重力場十二位置翻滾試驗時,石英撓性加速度計門狀態(tài)的靜態(tài)數(shù)學(xué)模型可表示為:
(1)
式中,Z是石英撓性加速度計的輸出值;K0是加速度計的偏值; K1是加速度計的標(biāo)度因數(shù);K2、K3分別是加速度計的二階和三階非線性系數(shù);Ki0是加速度計的輸入軸與輸出軸的交叉耦合系數(shù);K0是加速度計的輸出軸靈敏度系數(shù);θ是加速度計輸入軸與水平面夾角。
3 人工魚群算法(AFSA)
3.1 基本人工魚群算法的定義
人工魚群個體的狀態(tài)可用向量表示為,其中為欲尋優(yōu)的變量;表示人工魚個體之間的距離;Visual表示人工魚的感知范圍;δ表示人工魚個體間的擁擠度因子;Step表示人工魚移動的步長[1]。
人工魚群算法引進(jìn)魚群的覓食行為、聚群行為、追尾行為及隨機行為四種行為方式。由覓食行為和隨機行為兩種行為方式發(fā)現(xiàn)問題最優(yōu)解的取向,聚群行為和追尾行為兩種行為方式得到當(dāng)前的最優(yōu)解,若不是最優(yōu)解則繼續(xù)算法的迭代過程,直到滿足問題設(shè)置的終止條件為止。在人工魚群算法中,隨機行為通常作為覓食行為的缺省行為,并且在每個行為方式中人工魚都自動地朝向問題最優(yōu)解的方向更新自己的當(dāng)前位置值。
在算法中為記錄最優(yōu)人工魚個體的狀態(tài),設(shè)立了公告板。其目的是記錄歷史最優(yōu)的狀態(tài),當(dāng)各人工魚個體在尋優(yōu)過程中,每次尋優(yōu)完就檢驗自身狀態(tài)與公告板的狀態(tài),如果自身狀態(tài)優(yōu)于公告板狀態(tài),就將公告板的狀態(tài)改寫為自身狀態(tài);如果自身狀態(tài)不比公告板狀態(tài)優(yōu),就保持原有公告板狀態(tài)。
根據(jù)問題的性質(zhì)或要求而設(shè)定了人工魚群算法的終止條件。如判斷是否達(dá)到預(yù)設(shè)的精度指標(biāo)或魚群最大迭代次數(shù),或連續(xù)多次所獲取的值均不能超過已尋到的極值等方法。
3.2 人工魚群算法的改進(jìn)
在原人工魚群算法中,視野和步長是固定不變的[2]。視野和步長較大,人工魚的全局搜索能力強并且收斂速度快,求解精度不高,有時還會出現(xiàn)振蕩現(xiàn)象。視野和步長較小,人工魚的局部搜索能力強,收斂速度慢,但求解精度高。為了兼顧全局搜索能力、局部搜索能力和收斂速度,一種改進(jìn)方法是非線性動態(tài)調(diào)整視野和步長,算法開始先采用較大的視野和步長,使人工魚在大范圍內(nèi)進(jìn)行粗搜索,隨著搜索的進(jìn)行,視野和步長逐漸減小,演化為局部搜索,最后定位在最優(yōu)解附近區(qū)域并進(jìn)行精細(xì)搜索[3]。其方法為:
(2)
式中,是衰減函數(shù),s是大于1的整數(shù),g為當(dāng)前的迭代次數(shù), 為定義的最大迭代次數(shù)。一般的,為0.001,為0.0002。
對聚群行為和追尾行為的一種改進(jìn)方法是在人工魚的前進(jìn)方向上,人工魚狀態(tài)周圍的伙伴數(shù)與群體規(guī)模N的比值小于擁擠度因子δ,或者人工魚間的距離小于Visual/2。對于聚群行為,同時還要滿足中心位置的食物濃度優(yōu)于當(dāng)前狀態(tài)的食物濃度值的條件。對于追尾行為,同時還要滿足人工魚的當(dāng)前鄰域中的最小食物濃度值優(yōu)于當(dāng)前狀態(tài)的食物濃度值的條件。它們可以使在增強人工魚全局尋優(yōu)能力的同時保證局部范圍內(nèi)的尋優(yōu)能力和局部人工魚不會過度擁擠[4][5]。
4 人工魚群算法辨識過程及結(jié)果
利用人工魚群算法求門狀態(tài)下的模型參數(shù),初始化人工魚群的相關(guān)參數(shù)及編寫食物濃度函數(shù)表達(dá)式。人工魚個體間的距離表示為:
(3)
食物濃度函數(shù)表示為:
(4)
式中,Z為石英撓性加速度計的實際輸出值,為根據(jù)模型式(1)求得的估計值。
人工魚群算法辨識石英撓性加速度計參數(shù)的流程如圖1所示。其中原始魚群的初始化是在一定范圍內(nèi)通過隨機化方式得到。食物濃度函數(shù)的最優(yōu)值取為最小值,把群體的最小值作為公告板的初始值。視野Visual和步長Step根據(jù)式(2)計算,s取為3。覓食行為和隨機行為作為聚群行為和追尾行為的缺省行為。
設(shè)定算法的終止條件為式(4)的精度達(dá)到5×10-9。連續(xù)運行3次人工魚群算法對石英撓性加速度計參數(shù)進(jìn)行辨識,其結(jié)果見表1所示。從表1中可以看見,人工魚群算法能夠有效辨識石英撓性加速度計門狀態(tài)的模型參數(shù)。
運行第1次人工魚群算法的迭代過程曲線如圖2所示。從圖2可以看出,算法迭代至第187次時達(dá)到精度要求。
5 結(jié)論
本文用改進(jìn)的人工魚群算法對石英撓性加速度計參數(shù)進(jìn)行了辨識,算法的終止條件設(shè)置為5×10-9。同時采用最小二乘法辨識了加速度計參數(shù)。從加速度計的參數(shù)辨識結(jié)果可以看出,人工魚群算法能有效辨識加速度計參數(shù),為加速度計模型參數(shù)辨識提供了一種新方法。因人工魚群算法的性能受它的各初始化參數(shù)影響,設(shè)置合適的人工魚參數(shù)可提高算法的尋優(yōu)精度、收斂速度等。
參考文獻(xiàn):
[1]李曉磊,邵之江,錢積新.一種基于動物自治體的尋優(yōu)模式:魚群算法[J].系統(tǒng)工程理論與實踐,2002(11):32-38.
[2]李曉磊.一種新型的智能優(yōu)化方法―人工魚群算法[D].浙江:浙江大學(xué)博士學(xué)位論文,2003.
[3]王聯(lián)國.人工魚群算法及其應(yīng)用研究[D].蘭州:蘭州理工大學(xué)博士論文,2009.
篇7
關(guān)鍵詞:自適應(yīng);極限學(xué)習(xí)機;混沌粒子群;基因分類
中圖分類號:TP181
文獻(xiàn)標(biāo)志碼:A
文章編號:1001-9081(2016)11-3123-04
0 引言
前饋神經(jīng)網(wǎng)絡(luò)能夠通過輸入樣本逼近復(fù)雜的非線性映射,因此在很多領(lǐng)域都有應(yīng)用,但是存在學(xué)習(xí)速度慢、容易陷入局部收斂和在不同場合其參數(shù)難以調(diào)解等復(fù)雜問題,以致其發(fā)展受限。為解決這些問題,2006年Huang[1]提出一種新型單隱層前饋神經(jīng)網(wǎng)絡(luò)――極限學(xué)習(xí)機(Extreme Learning Machine, ELM),通過核函數(shù)將數(shù)據(jù)從低維空間映射到高維空間中,處理非線性數(shù)據(jù),但是參數(shù)隨機產(chǎn)生使結(jié)果存在一定的隨機性,因此容易產(chǎn)生較差的分類效果。1995年James Kennedy和Russel Eberhart提出粒子群(Particle Swarm Optimization, PSO)算法[2-3],該方法是基于群體演化的隨機全局優(yōu)化的一種智能優(yōu)化算法,其中心思想是對鳥群或魚群合作捕食行為的研究。在優(yōu)化復(fù)雜函數(shù)時,PSO算法的搜索精度不能達(dá)到要求,且易陷入局部最優(yōu)的狀況,到搜索后期經(jīng)常會出現(xiàn)震蕩情況。2009年,Lei等[4]提出了基于混沌序列的粒子群優(yōu)化算法,通過引入混沌序列增強了算法的全局搜索能力。2012年, Han等[5]提出了用PSO算法對ELM進(jìn)行優(yōu)化,通過優(yōu)化ELM 的輸入層權(quán)值及隱藏層偏差,得到一個最優(yōu)的網(wǎng)絡(luò)。2015年,Yang等[6]提出基于Tent混沌序列的PSO算法,在增強全局搜索能力的基礎(chǔ)上有效地避免了算法的盲目性,提高了算法收斂速度。
本文通過分析ELM的缺點,提出一種新的自適應(yīng)混沌粒子群極限學(xué)習(xí)機(Adaptive Chaotic Particle Swarm Optimization-Extreme Learning Machine,ACPSO-ELM)分類器。在該算法中,首先通過ELM對給定的數(shù)據(jù)進(jìn)行初始化,產(chǎn)生一組輸入權(quán)值和隱藏層偏置,再通過ACPSO算法尋找最優(yōu)輸入權(quán)值和隱藏層偏置,最后將得到的結(jié)果代入ELM中訓(xùn)練。
改進(jìn)后的自適應(yīng)粒子群優(yōu)化算法步驟如下:
步驟1 給定訓(xùn)練與測試數(shù)據(jù)集,在訓(xùn)練前,對數(shù)據(jù)進(jìn)行歸一化處理。
步驟2 建立基于ACPSO的極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),設(shè)置隱層神經(jīng)元數(shù)目,選中激活函數(shù)。
步驟3 產(chǎn)生種群,設(shè)置粒子數(shù)N,每個粒子設(shè)置為[-1,1]范圍內(nèi)的隨機數(shù)向量,設(shè)置神經(jīng)元個數(shù)及隱層節(jié)點數(shù)。
步驟4 初始化ACPSO的速度與位置變量,設(shè)置種群的個體最優(yōu)位置pbest、群體最優(yōu)位置gbest。
步驟5 計算每個粒子的適應(yīng)度值,先計算網(wǎng)絡(luò)實際輸出,再求期望輸出值與實際輸出值的均方誤差,即得到粒子的適應(yīng)度值。
步驟6 根據(jù)式(6)、(7)更新自適應(yīng)粒子群的位置和速度。
步驟7 計算種群適應(yīng)度方差,根據(jù)方差值判斷算法是否收斂,若收斂則轉(zhuǎn)步驟9; 否則轉(zhuǎn)步驟8。
步驟8 根據(jù)式(10)、(11)進(jìn)行混沌搜索,用搜索到的點隨機取代粒子群中的一個粒子,然后轉(zhuǎn)步驟5。
步驟9 判斷是否達(dá)到最大迭代次數(shù):若達(dá)到,則停止迭代; 否則轉(zhuǎn)步驟5,繼續(xù)迭代。
3 算法描述與實驗結(jié)果
本文為得到分類精度高、泛化性能好和魯棒性高的分類模型,提出了ACPSO-ELM算法,該算法結(jié)合ACPSO算法的高穩(wěn)定與ELM算法分類速度快、精度高的特點,通過實驗對算法性能進(jìn)行驗證。本文從UCI標(biāo)準(zhǔn)分類數(shù)據(jù)集中選擇Breast、Heart、Colon三種基因數(shù)據(jù)集進(jìn)行實驗,實驗由Matlab編程仿真實現(xiàn)。每個數(shù)據(jù)集如表1所示:
為驗證ACPSO-ELM算法的高效性,本文分別用ELM、PSO-ELM、ACPSO-ELM、DPSO-ELM在Breast、Heart、Colon三種基因數(shù)據(jù)集采用10次五折交叉驗證,即將每個基因數(shù)據(jù)集分成5份,選取其中4份作為訓(xùn)練數(shù)據(jù)集,1份作為測試數(shù)據(jù)集,進(jìn)行實驗,取10次結(jié)果精度的平均值作為算法的精度。本文所用實驗粒子群的參數(shù)設(shè)置為N=20,Kmax=50,ωmax=0.95,ωmin=0.4,在ACPSO算法中,c1=c2=1.5。為進(jìn)一步比較算法的性能,圖1~3給出了該算法在3種基因數(shù)據(jù)集上的測試精度對比。
由圖1~3可以看出ELM的分類結(jié)果隨著迭代次數(shù)的增加存在較大的震蕩性,實驗結(jié)果不穩(wěn)定,加入PSO算法對ELM的參數(shù)優(yōu)化后,從圖1~3可以看出,實驗結(jié)果不再隨迭代次數(shù)的增加而大幅度地震蕩,說明PSO算法能夠有效提高ELM算法的穩(wěn)定性;同時由圖1~3可知,ELM的分類精度也得到了顯著的提高,突出了參數(shù)優(yōu)化的重要性。比較PSO-ELM和DPSO-ELM以及ACPSO-ELM三種算法的分類結(jié)果表明,ACPSO-ELM算法相比其他兩種算法具有更好的分類精度以及穩(wěn)定性。
本實驗中最大迭代次數(shù)設(shè)置為50,由表2可知,基于自適應(yīng)混沌序列的粒子群優(yōu)化算法在運行時間上高于其他算法,比較PSO、ACPSO算法可知,由于PSO算法每次迭代過程中粒子群的數(shù)量不變,假設(shè)第i次迭代時粒子群的數(shù)量為Ni,迭代次數(shù)為Kmax,則每次迭代粒子群數(shù)量為N1=N2=…=NKmax,設(shè)每個粒子一次迭代運行時間為Tp,則PSO算法運行總時間為Tp×Kmax×Ni,對于ACPSO算法,由于每次迭代過程中,粒子群通過適應(yīng)度值不斷更新,粒子數(shù)隨著迭代的增加而逐漸減少,所以N1≥N2≥…≥NKmax,設(shè)每個粒子每次迭代運行時間為Ta,則總運行時間為∑Kmaxi=1Ni×Ta。由于本次實驗設(shè)定迭代次數(shù)為50,所以ACPSO-ELM算法相比其他算法運行時間較長。
綜上所述,ACPSO-ELM無論在分類精度還是在穩(wěn)定性、收斂性上都優(yōu)于ELM,同時對比于PSO-ELM和DPSO-ELM算法,ACPSO-ELM是一種十分可靠、高效的分類算法。
4 結(jié)語
針對ELM算法分類精度低、分類不穩(wěn)定等情況,本文提出了ACPSO-ELM算法,通過ACPSO算法對ELM算法內(nèi)權(quán)參數(shù)進(jìn)行優(yōu)化,在不同數(shù)據(jù)集上,與已有算法PSO-ELM,DPSO-ELM比較可知,本文提出的分類算法具有更高的分類精度以及更好的穩(wěn)定性,由于本實驗迭代次數(shù)設(shè)置較小,因此算法的分類速度相比其他算法較慢。
參考文獻(xiàn):
[1] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006,70(1): 489-501.
[2] SHI Y H, EBERHART R. A modified particle swarm optimizer[C]// Proceedings of the 1998 IEEE International Conference of Evolutionary Computation. Piscataway, NJ: IEEE, 1998: 69-73.
[3] KENNEDY J, EBERHART R. Particle swarm optimization[C]// Proceedings of the 1995 IEEE International Conference on Neural Networks. Piscataway, NJ: IEEE, 1995: 1942-1948.
[4] LEI X J,SUN J J,MAQ Z. Multiple sequence alignment based on chaotic PSO[J].Computational Intelligence and Intelligent Systems, 2009, 117(2/3):351-360.
[5] HAN F, YAO H F,LING Q H.An improved extreme learning machine based on particle swarm optimization[C]// Proceedings of the 7th International Conference on Intelligent Computing: Bio-Inspired Computing an Applications. Berlin: Springer-Verlag, 2012:699-704.
[6] YANG J M, MA M M, CHE H J, et al. Multi-objective adaptive chaotic particle swarm optimization algorithm[J]. Control and Decision, 2015, 30(12):2168-2174.
[7] HE Z B, WEN X H, HU LIU, et al. A comparative study of artificial neural network, adaptive neuro fuzzy inference system and support vector machine for forecasting river flow in the semiarid mountain region[J]. Journal of Hydrology, 2014, 509: 379-386.
[8] 陸慧娟,安春霖,馬小平,等.基于輸出不一致測度的極限學(xué)習(xí)機集成的基因表達(dá)數(shù)據(jù)分類[J].計算機學(xué)報, 2013, 36(2): 341-348. (LU H J,AN C L,MA X P, et al. Disagreement measure based ensemble of extreme learning machine for gene expression data classification[J].Chinese Journal of Computers, 2013,36(2):341-348.)
[9] HUANG G B, CHEN L, SIEW C K. Enhanced random search based incremental extreme learning machine[J]. Neurocomputing, 2008, 71(18): 3460-3468.
[10] HUANG G B, ZHOU H M, DING X J, et al. Extreme learning machine for regression and multiclass classification[J]. IEEE Transactions on Systems, Man, and Cybernetics-Part B: Cybernetics, 2012, 42(2): 513-529.
[11] ZHANG Y N, TENG H F. Detecting particle swarm optimization[J]. Concurrency & Computation Practice & Experience, 2009, 21(4):449-473.
[12] 盧新國,林亞平,駱嘉偉,等.癌癥識別中一種基于組合GCM和CCM的分類算法[J].軟件學(xué)報, 2010, 21(11):2838-2851.(LU X G, LIN Y P, LUO J W, et al. Classification algorithm combined GCM with CCM in cancer recognition[J].Journal of Software, 2010, 21(11):2838-2851.)
[13] EBERHART R, KENNEDY J. A new optimizer using particle swarm theory[C]// Proceedings of the 6th International Symposium on Micro Machine and Human Science. Piscataway, NJ: IEEE, 1995: 39-43.
[14] 田東平.基于Tent混沌序列的粒子群優(yōu)化算法[J].計算機工程, 2010, 36(4):180-182.(TIAN D P. Particle swarm optimization algorithm based on tent chaotic sequence[J].Computer Engineering, 2010, 36(4):180-182.)
[15] 劉斌.微粒群優(yōu)化算法的改進(jìn)研究與應(yīng)用[D].西安:西安交通大學(xué), 2009.(LIU B. Improvement research and application of particle swarm optimization algorithm[D]. Xian:Xian Jiaotong University, 2009.)
[16] 施美珍.基于粒子群優(yōu)化算法的模糊聚類分析及其應(yīng)用[D].廣州:華南理工大學(xué), 2012.(SHI M Z. Fuzzy clustering analysis and application based on particle swarm optimization[D].Guangzhou: South China University of Technology, 2012.)
[17] 劉麗霞.基于小波理論與LSSVM的模擬集成電路故障診斷方法[D].西安:西安電子科技大學(xué), 2011.(LIU L X.Fault diagnosis method for analog integrated circuits based on wavelet theory and LSSVM[D].Xian: Xidian University, 2011.)
篇8
關(guān)鍵詞:蟻群算法;車輛運輸;路徑優(yōu)化
中圖分類號:TP301.6;S274 文獻(xiàn)標(biāo)識碼:A 文章編號:0439-8114(2016)20-5372-03
DOI:10.14088/ki.issn0439-8114.2016.20.052
Abstract: A modified ant colony algorithm was adopted and optimized in grain logistics distribution path in order to reduce transportation cost effectively. The results showed that the modified algorithm provide a better solution in grain logistics distribution path optimization than the basic ant colony algorithm. It can cut down path length about 9% and therefore play a bigger role in utilization of the limited resources.
Key words: ant colony algorithm; grain logistics; path optimization
Z食問題關(guān)乎國家的國計民生,其價格高低直接影響國家經(jīng)濟的發(fā)展。在糧食價格的組成中,糧食流通成本比重很高,許多加工糧食企業(yè)對糧食配送采用人工方式,運輸線路不合理,導(dǎo)致運輸成本居高不下。因此,研究如何有效地降低糧食的運輸成本,將有十分重要的現(xiàn)實意義。
降低糧食的流通成本,要根據(jù)各個配送點,設(shè)計出運輸線路最短的路徑,合理利用車輛的資源,用最小的成本達(dá)到糧食配送的目的。解決這類問題的方法較多,但是都存在一定的缺陷。蟻群算法是意大利學(xué)者M(jìn)arco Dorigo等于1991年受自然界螞蟻覓食過程啟發(fā)而提出的一種新型智能搜索優(yōu)化算法。隨后將蟻群算法成功地應(yīng)用于旅行商問題求解上,并取得了很好的試驗結(jié)果。蟻群算法受到許多研究者的關(guān)注,并不斷應(yīng)用于實際問題求解,蟻群算法已經(jīng)被廣泛地應(yīng)用到各個領(lǐng)域解決復(fù)雜組合優(yōu)化問題。因此,本研究對基本蟻群算法進(jìn)行改進(jìn)優(yōu)化,建立數(shù)學(xué)模型,進(jìn)而對糧食配送線路進(jìn)行了試驗仿真。結(jié)果表明,改進(jìn)優(yōu)化的蟻群算法對配送線路優(yōu)化取得了較好的效果。
1 糧食物流配送數(shù)學(xué)模型
由一個糧食配送中心向多個糧食配送點送糧,每個糧食配送點的地理位置和需求量固定,每輛運糧車輛的載重量和最大行駛距離固定,要求以最低的運輸成本合理安排配送線路,同時滿足每個糧食配送點的需求。為了保證數(shù)學(xué)模型滿足配送要求,該模型應(yīng)該滿足以下條件:
1)各條配送線路上各個糧食配送點的糧食需求量之和不超過送糧車輛的最大載重量;
2)糧食配送中心能夠完全滿足各個配送點的糧食需求;
3)糧食必須在有效的時間內(nèi)送到各個配送點;
4)糧食運輸總費用與運輸?shù)目偭渴浅烧取?/p>
多配送點糧食物流配送模型如下:設(shè)共有M個配送點,分別用1,2,3,…M表示。
式(2)表示糧食運輸車在運輸線路上成本最小。式(3)表示所有運輸車都是從配送中心出發(fā),完成后回到配送中心。式(4)表示每輛車運輸糧食的重量不能超過車的最大載重量。式(5)表示每一條線路上只能由一輛運輸車完成。式(6)表示變量的取值。
2 改進(jìn)蟻群算法
蟻群算法是模擬自然界中螞蟻覓食行為的隨機仿生優(yōu)化算法[1],螞蟻之間通過傳遞信息素和協(xié)同合作,從而找到食物到巢穴間最短路徑。蟻群算法具有較好的魯棒性、并行性、全局尋優(yōu)、正反饋機制、分布性等優(yōu)點,但是也存在收斂速度過慢和容易陷入局部最優(yōu)等缺點[2]。
2.1 螞蟻轉(zhuǎn)移規(guī)則的改進(jìn)[3]
為了避免螞蟻在搜索過程中陷入局部最優(yōu)而沒有得到最優(yōu)解,本研究對螞蟻的轉(zhuǎn)移規(guī)則進(jìn)行了改進(jìn)。初始路徑上各個節(jié)點的信息素是相同的,當(dāng)螞蟻經(jīng)過某個節(jié)點時信息素的值就會增加。螞蟻就會快速聚集到這些節(jié)點上,從而導(dǎo)致算法陷入局部最優(yōu)。因此,提出干擾策略,提高螞蟻的搜索空間。
干擾因子表示路徑上的螞蟻擁擠程度,其計算公式為:
參數(shù)α是螞蟻在運動過程中的信息素影響因子,主要表示螞蟻在進(jìn)行路徑搜索時路徑上所積累的信息素濃度對螞蟻進(jìn)行路徑選擇所起的作用大小。
參數(shù)β是期望因子或稱為能見度因子,表示螞蟻在運動過程中能見度對路徑選擇的重要性。
2.2 信息素濃度初始值的改進(jìn)策略[4]
基本蟻群算法的信息素濃度初始值是一個常數(shù),為了提高算法的收斂速度,提出了信息素濃度初始值的改進(jìn)策略,在初始化信息素的同時加入了引導(dǎo)功能,讓螞蟻移動時趨向于終點移動,信息素初始化的公式是:
2.3 全局信息素更新策略[4,5]
采用最大最小螞蟻系統(tǒng)MMAS,就是螞蟻在進(jìn)行一次搜索完后,僅對所走過的路徑進(jìn)行全局更新,可以大大縮小螞蟻的搜索范圍,使得螞蟻的搜索更具有方向性。這種改進(jìn)策略不但可以提高搜索效率,而且可以保證搜索到的最優(yōu)解的充分利用。全局信息素更新如公式(10)所示:
2.4 蟻群算法主要步驟[6-8]
1)初始化參數(shù)α,β等參數(shù)以及螞蟻的數(shù)量和迭代次數(shù)NCmax,利用公式(9)初始化每條邊的信息素。
2)把n個螞蟻放到糧食配送中心,利用公式(8)選擇螞蟻下一次移動的糧食配送點,同時把該配送點加入螞蟻的禁忌表。
3)當(dāng)螞蟻完成一次路徑搜索后回到出發(fā)點,并利用公式(10)更新當(dāng)前較好路徑的信息素。
4)判斷迭代次數(shù)是否小于NCmax,如果成立,跳回步驟2,重蛻鮮霾街瑁否則,程序結(jié)束。
5)當(dāng)?shù)螖?shù)等于NCmax,則輸出糧食配送最優(yōu)路徑和長度,程序結(jié)束。
3 改進(jìn)蟻群算法仿真試驗
以某地區(qū)1個糧食配送中心和20個糧食配送點為例,使用改進(jìn)的蟻群算法在實驗室中用MATLAB2010進(jìn)行模擬測試,配送中心用編號0,其他配送點分別用1,2,…,20,要求運輸費用最少。各配送點的橫縱坐標(biāo)和需求量如表1所示。
參數(shù)設(shè)置為:NCmax=30,Q=2,m=20,α=1,=0.5,β=3,改進(jìn)算法運行15次后得到了最優(yōu)配送線路如圖1所示。由圖1可以看出,共需要4輛車,4輛車的具體配送線路是:0-18-4-3-9-0;0-2-12-5-7-14-15-0;0-8-10-13-11-0;0-6-17-16-20-19-1-0,路徑長度為382.01 km。
4 小結(jié)
從仿真試驗結(jié)果來看,用改進(jìn)的蟻群算法求解糧食物流配送路徑優(yōu)化問題時,有以下幾個優(yōu)點:①找到最優(yōu)解的概率更高;②求解效率和性能都進(jìn)一步提升。但蟻群算法作為一種仿生智能優(yōu)化算法,仍有許多問題和不足之處,需要以后進(jìn)一步深入研究和完善。
參考文獻(xiàn):
[1] 余昌艷.基于蟻群算法的糧食加工企業(yè)物流配送路徑優(yōu)化研究[D].武漢:武漢科技大學(xué),2009.
[2] 高 尚.蟻群算法理論、應(yīng)用及其與其他算法的混合[D].南京:南京理工大學(xué),2005.
[3] 龍 汀.基于蟻群算法的車輛路徑問題的研究[D].合肥:合肥工業(yè)大學(xué),2009.
[4] 汪采萍.蟻群算法的應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué),2007.
[5] 劉 霞,楊 超.最小-最大車輛路徑問題的蟻群算法[J].理工大學(xué)學(xué)報,2012,13(3):336-341.
[6] 郭天池.基于蟻群算法的糧食應(yīng)急調(diào)度問題研究[D].鄭州:河南工業(yè)大學(xué),2011.
篇9
【關(guān)鍵詞】實時集群 計算機系統(tǒng) 研究現(xiàn)狀 應(yīng)用 發(fā)展
現(xiàn)如今,社會科學(xué)技術(shù)迅猛發(fā)展,計算機已經(jīng)普及到了千家萬戶,成為了人們生產(chǎn)生活中必不可少的工具。人們對計算機技術(shù)的應(yīng)用研究也在不斷拓展,尤其是實時集群計算機系統(tǒng)的出現(xiàn)在很大程度上改變了人們傳統(tǒng)的看法,打破了處理器是提高計算機性能主要辦法的觀點。集群計算機系統(tǒng)的出現(xiàn)能夠?qū)崿F(xiàn)兩臺或者多臺計算機的有機結(jié)合,將計算機的硬件與軟件進(jìn)行融合使用,并運用這種強大的處理功能共同解決問題,降低原有的超級計算機的價格成本,使其具有更高的性價比。因此,各國不斷對其進(jìn)行探索,將這種新型的集群計算機系統(tǒng)應(yīng)用于軍事、仿真等領(lǐng)域,并取得了顯著的成效,這也在一定程度上說明了它的巨大優(yōu)勢。鑒于以上內(nèi)容,集群計算機系統(tǒng)必將在未來的行業(yè)發(fā)展中占有一席之地,它也將為多元信息處理和控制系統(tǒng)開創(chuàng)一個嶄新的局面。
一、集群計算機系統(tǒng)的含義、分類以及功能
想要明確了解集群計算機系統(tǒng)的研究現(xiàn)狀,并展望其未來的發(fā)展態(tài)勢,首先就要明確什么是集群計算機系統(tǒng)以及它的分類和主要功能。顧名思義,集群計算機系統(tǒng)就是將多臺計算機進(jìn)行串聯(lián)使用,從而達(dá)到計算效率提升的目的。它是利用高速通信網(wǎng)絡(luò),按照一定的組織結(jié)構(gòu)將一組高檔工作站、服務(wù)器和PC計算機進(jìn)行緊密結(jié)合,從而實現(xiàn)系統(tǒng)高效并行的對策。與以往的單個計算機有所不同,它沒有外部的設(shè)備實施,不存在顯示器、鍵盤等硬件,但是它卻需要具有足夠的內(nèi)存、高性能的主板以及高速的中央處理器等。只有這樣,才能實現(xiàn)計算機設(shè)備的高性能傳遞,使通信協(xié)議更加高效便捷。
集群計算機具有可拓展功能,不需要使用者過多的花費資金就能夠提高系統(tǒng)的性能。另外,它還具有非常良好的恢復(fù)和備份功能,這也就使其具有不同的分類情況。 按照應(yīng)用的目的,可分為高性能集群、高可用性集群兩類;按照節(jié)點劃分,又包括專用和非專用集群。此外,它還能夠根據(jù)節(jié)點硬件的組成情況以及操作系統(tǒng)進(jìn)行分類。簡單來說,實時集群計算機系統(tǒng)最主要的作用就在于其傳遞功能的發(fā)揮,它能夠?qū)⑼ㄐ欧?wù)器中轉(zhuǎn)化而成的廣播信息進(jìn)行接收,并將原始信息通過統(tǒng)計的方式發(fā)送到控制中心,實現(xiàn)資源的有效傳達(dá)。它的工作就好比大型的計算機,能夠完成數(shù)據(jù)輸入與輸出的全過程,實現(xiàn)信息的高效傳送。
二、實時集群計算機系統(tǒng)的研究現(xiàn)狀與發(fā)展趨勢
實時集群計算機系統(tǒng)概念一經(jīng)提出就受到了全世界的廣泛關(guān)注,對其的應(yīng)用研究也不斷涌現(xiàn)。但是其研究現(xiàn)狀仍舊存在不平衡現(xiàn)象,國內(nèi)國外對其的發(fā)展探究有很大的區(qū)別。
第一,國外研究現(xiàn)狀與發(fā)展趨勢。由于傳統(tǒng)計算機所用的處理器和操作系統(tǒng)大多為專用設(shè)備,使用成本較高,程序復(fù)雜,應(yīng)用時間要多于硬件系統(tǒng)的使用壽命,浪費資金現(xiàn)象嚴(yán)重。因此,以美國為首的國家不斷研發(fā)新型的高性能硬件設(shè)備,于是就誕生出現(xiàn)了集群計算機系統(tǒng)。美國宇航局在1994年建立了第一個基于PC并行計算機的系統(tǒng),并于1999年研制成功了256個中央處理器并行使用集群系統(tǒng)。
第二,國內(nèi)研究現(xiàn)狀與發(fā)展趨勢。與國外的研究熱潮相比,我國在這方面的研究和應(yīng)用機構(gòu)相對還比較少,只有清華大學(xué)和西安交通大學(xué)對其進(jìn)行了研發(fā)。1999年,清華大學(xué)研制出了8CPU和16CPU計算機,西安交通大學(xué)則在同一年研究出了8個PII350集群計算機BSPC-8。但是與國外優(yōu)秀的研究技術(shù)相比,我國系統(tǒng)研發(fā)的周期相對較慢,掌握該技術(shù)的專業(yè)人才也不夠。
總的來說,現(xiàn)如今的集群計算機系統(tǒng)已經(jīng)朝著軟件研發(fā)方面進(jìn)行探索,簡化了網(wǎng)絡(luò)協(xié)議,并提出了在集群系統(tǒng)硬件上安裝新設(shè)備的思想。與此同時,為了解決網(wǎng)絡(luò)通信問題,還引進(jìn)了先進(jìn)設(shè)備,在設(shè)計過程中結(jié)合了硬件設(shè)施的特點,實現(xiàn)了TCP與IP通信的有效結(jié)合。
三、實時集群計算機系統(tǒng)的關(guān)鍵技術(shù)應(yīng)用與未來展望
(一)可拓展性
計算機技術(shù)是不斷發(fā)展變化的,為了更好的適應(yīng)設(shè)備的新功能,集群計算機系統(tǒng)也要具有可拓展性。其能力的延展主要包括三個方面:
第一,資源的可拓展性。其主要是指通過處理器數(shù)量、磁盤數(shù)量、存儲部件數(shù)量的增加來提高計算機集群系統(tǒng)的性能;第二,應(yīng)用的可拓展性。它主要是指計算機應(yīng)用程序會伴隨系統(tǒng)功能的改變予以革新;第三,技術(shù)的可拓展性。技術(shù)拓展是集群計算機系統(tǒng)的主要拓展功能,它主要由異構(gòu)可拓展性、代可拓展性和空間可拓展性三方面組成,它能夠在關(guān)鍵技術(shù)改變的時候,提高計算機的適應(yīng)程度。
(二)可用性應(yīng)用技術(shù)
篇10
關(guān)鍵詞:多核集群 高性能 地震資料
目前,地震勘探分析主要面臨兩個問題:一是精度如何提高,二是周期如何縮短。那么高性能計算機多核集群系統(tǒng)則是使地震勘探周期縮短的強有力的工具。
一、高性能計算機應(yīng)用在地震資料處理中
集群有高可用集群、負(fù)載均衡集群、科學(xué)計算集群等這幾類,其中科學(xué)計算集群是用來解決有巨大計算量等的復(fù)雜問題。它把那些對時間有迫切要求的任務(wù)分成若干個部分,每個節(jié)點則根據(jù)CPU(核)的個數(shù)來分配若干任務(wù),然后各節(jié)點則進(jìn)行并行計算。我們可以充分利用其超強的運算能力,來節(jié)約勘探時間成本。在地震勘探數(shù)據(jù)處理分析中,大多數(shù)問題的求解都具備固有的可并行性,這也就很容易解釋為什么集群在石油勘探行業(yè)中被大規(guī)模的使用。
二、高性能計算機集群系統(tǒng)的安裝
1.集群系統(tǒng)的硬件安裝機架化
集群系統(tǒng)硬件安裝機架化是一種致力于集中化管理的結(jié)構(gòu)方式。也就是把原先分散放置于同一平面上的計算機設(shè)備(例如服務(wù)器、磁盤存儲器等等)全部放入到專用機架中,形成立體放置的結(jié)構(gòu),這樣即能節(jié)省占地面積又便于系統(tǒng)的集中式管理。國際上目前通用的機架是19in的標(biāo)準(zhǔn)機架。該機架具有如下幾個特點:a、兼容性好。由于計算機設(shè)備制造商琳瑯滿目,產(chǎn)品結(jié)構(gòu)形式也就不盡相同,又由于設(shè)備在性能應(yīng)用上各有千秋,所以每個計算中心擁有多家計算機產(chǎn)品已司空見慣。這便要求標(biāo)準(zhǔn)機架要具有良好的兼容性。b、通風(fēng)性好。過去的機架結(jié)構(gòu)大多是前后都是密封門,氣流自下向上吹形成冷卻方式。但由于制冷系統(tǒng)風(fēng)壓很低(多為25pa),因此氣流也只能到達(dá)機架的中部,這便造成機架上部形成熱區(qū)從而導(dǎo)致機械故障。計算機設(shè)備機架化后,為縮短風(fēng)路長度,應(yīng)將機架內(nèi)冷卻氣流方向改為前后,即將原來密封的前后門改成多孔狀,以便使氣流的風(fēng)道保持前后暢通,這樣計算機設(shè)備的散熱效果便能得到保障。c、線纜便于管理。多個計算機設(shè)備集中放置,就會使線纜的數(shù)量增多、密度加大,原有的布線方式不僅讓人難以分清設(shè)備的電源線和數(shù)據(jù)線,還嚴(yán)重堵塞了氣流風(fēng)道,形成熱區(qū),使得整個計算機設(shè)備溫度升高,埋下故障隱患,同事給故障排除也增加了困難。當(dāng)然不當(dāng)?shù)牟季€方式還會通過磁場耦合產(chǎn)生干擾和信號反射。針對上述問題,標(biāo)準(zhǔn)機架則采用開孔、架空及分離方法。在機架適當(dāng)位置來開孔,每個單獨機架側(cè)面都會有側(cè)板遮蓋,當(dāng)多個機架并排排列時,可把側(cè)板去掉以便直接連接。架空包括兩層含義:一是多排機架構(gòu)成系統(tǒng)時,各排機架間電纜的連接則是通過架空電纜來過渡的,機架內(nèi)部也是通過架空電纜梯,把電纜分成若干便于管理的層次;二是所有電纜均可在頂部走線,采用該措施后,原有的電纜后走線則變成上走線,這也就空出機架后部空間,防止電纜對風(fēng)道產(chǎn)生阻礙。在機架頂部有幾個被分開來的電纜槽,可把電源線及數(shù)據(jù)線分道布置,這樣既能解決相互干擾問題又能方便電纜管理。
2.集群系統(tǒng)的軟件安裝
集群系統(tǒng)軟件安裝主要包括:a、設(shè)置刀片服務(wù)器管理中心b、安裝管理節(jié)點c、配置xCAT配置文件d、分發(fā)計算節(jié)點操作系統(tǒng)e、配置網(wǎng)絡(luò)服務(wù)f、實現(xiàn)Linux系統(tǒng)雙千兆網(wǎng)卡綁定g、安裝MARVEL、PG2.0(Paradigm)地震資料疊前偏移處理系統(tǒng)h、安裝TOMODO、GeoEast、OMEGA2012、GEOCLUSTER2.1(CGG)和psgseis地震資料處理軟件。
三、集群系統(tǒng)應(yīng)用于地震資料處理中
1.集群系統(tǒng)引入前地震資料處理存在的問題
在集群系統(tǒng)引入前,當(dāng)時用于處理地震資料的計算機存儲容量小、運算速度慢,這便使地震資料處理工作一直處于在常規(guī)疊后時間域中進(jìn)行的狀態(tài),常規(guī)疊后時間域處理就是假設(shè)地下介質(zhì)是均勻或水平層狀,它僅適于處理簡單地質(zhì)或緩變介質(zhì)所構(gòu)造出的資料,其優(yōu)點是操作方法簡單、運算量小。但在構(gòu)造復(fù)雜、橫向速度變化較為劇烈的地區(qū),常規(guī)疊后時間域處理方法已不能準(zhǔn)確反映出地下組織構(gòu)造形態(tài),輕者會造成構(gòu)造高點漂移,重者則使構(gòu)造變得面目全非。這主要因為在這些地區(qū)所得的CMP道集記錄中的反射波旅行時,已不再是雙曲線的形式。常規(guī)的CMP疊加原則已失效,疊加結(jié)果不完全等同于自激自收的零炮檢距剖面。這期間雖做出許多努力,但地震資料處理的質(zhì)量卻一直得不到大幅提高。
2.地震資料處理疊前深度偏移技術(shù)的實現(xiàn)
地震資料處理按方法分為疊前偏移、疊后偏移,按實現(xiàn)的域則分為時間域、深度域。解決復(fù)雜地區(qū)的地震資料處理問題最佳方法就是運用地震資料處理中的疊前深度偏移技術(shù),該技術(shù)能使復(fù)雜構(gòu)造精確成像。根據(jù)構(gòu)造復(fù)雜程度及空間變化速度的大小,各偏移方法在地震資料處理中所處地位如下圖a所示。
疊前深度偏移的關(guān)鍵技術(shù)是怎樣快速準(zhǔn)確建立地下速度模型,目前較常用的速度分析方法有深度聚焦分析、相干反演、剩余速度分析和全局層析法等,這些方法大多基于層剝離的快速度掃描思路,由淺到深逐層開始建立層速度模型,但其計算量太大,原有計算機目前尚無法對其進(jìn)行批量運算處理。從方法上講,疊前深度偏移對于地下形態(tài)基本上是不作假設(shè),速度-深度模型則直接用疊前資料來建立,地下速度縱、橫向均可發(fā)生變化,CMP道集考慮非雙曲效應(yīng)。因此,疊前深度偏移是符合地下實際情況的,也特別能符合復(fù)雜地質(zhì)的地下情況。其特點是運算量大、方法精細(xì)。在實際應(yīng)用中,疊前深度偏移所處理的資料是深度域的,它滿足精細(xì)解釋儲層描述對深度域的期望,使得專家們能夠在深度域進(jìn)行問題研究。在集群系統(tǒng)中,由于有運算速度快、存儲容量大的計算機設(shè)備做支持以及MARVEL、PG2.0等地震資料疊前深度偏移應(yīng)用軟件的全方位引進(jìn),才使疊前深度偏移技術(shù)得以實現(xiàn)應(yīng)用價值。
圖a各偏移方法解決復(fù)雜問題的地位
四、結(jié)束語
通過對計算機設(shè)備進(jìn)行科學(xué)合理選型配置,正確安裝、全面測試系統(tǒng)軟件與應(yīng)用軟件,確保了集群系統(tǒng)時刻處于最佳運行狀態(tài)。地震勘探和石油物探發(fā)展依賴于高性能計算機多核處理系統(tǒng)和高性能存儲的發(fā)展,它們的進(jìn)步會使我們精確刻畫地下地質(zhì)構(gòu)造成為可能。
參考文獻(xiàn)
熱門標(biāo)簽
計算機畢業(yè)論文 計算機論文 計算機技術(shù)論文 計算機教育論文 計算機專業(yè)論文 計算機專業(yè)畢業(yè)論文 計算機教學(xué)論文 計算機基礎(chǔ)論文 計算機應(yīng)用論文 計算化學(xué)論文 心理培訓(xùn) 人文科學(xué)概論