數(shù)據(jù)挖掘技術(shù)在軟件工程的應(yīng)用
時間:2022-06-13 09:23:51
導(dǎo)語:數(shù)據(jù)挖掘技術(shù)在軟件工程的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件工程,可以根據(jù)軟件操作目的自動搜索有效信息數(shù)據(jù),搜索過程需要按照一定的算法進(jìn)行數(shù)據(jù)分類和排序,并建立與之匹配的分析模型,探究不同數(shù)據(jù)之間的內(nèi)在聯(lián)系和發(fā)展規(guī)律,從而為后續(xù)軟件開發(fā)和運(yùn)行維護(hù)管理提供可靠的數(shù)據(jù)支持。
軟件工程與數(shù)據(jù)挖掘技術(shù)的內(nèi)涵
1.軟件工程的內(nèi)涵軟件工程是基于工程理念,采用先進(jìn)的科學(xué)技術(shù)和合適的數(shù)學(xué)方法進(jìn)行的軟件開發(fā)和運(yùn)行維護(hù)管理。在軟件開發(fā)過程中會根據(jù)實(shí)際需要對相關(guān)數(shù)據(jù)進(jìn)行運(yùn)算,運(yùn)算過程所產(chǎn)生的數(shù)據(jù)稱為軟件工程數(shù)據(jù),這種利用數(shù)學(xué)方法運(yùn)算獲得的龐大而安全、完整的軟件工程數(shù)據(jù)常被用來進(jìn)行軟件系統(tǒng)測試,可為軟件運(yùn)行維護(hù)管理提供可靠的數(shù)據(jù)支持。2.數(shù)據(jù)挖掘技術(shù)的內(nèi)涵數(shù)據(jù)挖掘技術(shù)是一種基于大數(shù)據(jù)建立的綜合性現(xiàn)代信息數(shù)據(jù)處理技術(shù),能夠根據(jù)工作實(shí)際需要對數(shù)據(jù)進(jìn)行轉(zhuǎn)化、處理和分析,不但可以提升信息數(shù)據(jù)處理效率和處理質(zhì)量,而且還能挖掘數(shù)據(jù)背后蘊(yùn)涵的價值,具有程序復(fù)雜度高、運(yùn)算計(jì)算量大等特點(diǎn)。數(shù)據(jù)挖掘是數(shù)據(jù)收集的動態(tài)過程,通過借助人工智能、數(shù)據(jù)庫、機(jī)器學(xué)習(xí)、知識工程、統(tǒng)計(jì)學(xué)、信息檢索、數(shù)據(jù)可計(jì)算等多種技術(shù)實(shí)現(xiàn)從海量數(shù)據(jù)中篩選出符合條件的信息數(shù)據(jù),然后通過數(shù)據(jù)分析挖掘出有應(yīng)用價值和研究價值的數(shù)據(jù)。數(shù)據(jù)挖掘流程主要包括數(shù)據(jù)的預(yù)處理、挖掘、整合三個環(huán)節(jié)。其中,數(shù)據(jù)預(yù)處理主要是對原始數(shù)據(jù)采用合適的數(shù)學(xué)計(jì)算方法進(jìn)行整體脈絡(luò)梳理和識別、轉(zhuǎn)化,同時剔除無效數(shù)據(jù),并對預(yù)處理后獲得的數(shù)據(jù)進(jìn)行抽樣檢測;數(shù)據(jù)挖掘主要是對預(yù)處理后的數(shù)據(jù)和系統(tǒng)新生數(shù)據(jù)采用系統(tǒng)算法和對應(yīng)的分析模型進(jìn)行分類和預(yù)測處理;數(shù)據(jù)整合主要是對得到的結(jié)果數(shù)據(jù)進(jìn)行評價,用戶可以根據(jù)自身實(shí)際需要對數(shù)據(jù)進(jìn)行選擇性應(yīng)用,彰顯數(shù)據(jù)最終價值,提升用戶體驗(yàn)效果。
數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件工程的意義
1.有利于信息數(shù)據(jù)正確錄入軟件工程原始數(shù)據(jù)種類繁多、分布混亂,有效數(shù)據(jù)與垃圾數(shù)據(jù)共存。數(shù)據(jù)挖掘技術(shù)具有自主選擇功能,能夠?qū)崿F(xiàn)對原始數(shù)據(jù)自動處理和清洗,根據(jù)需要篩選、過濾出有價值的目標(biāo)數(shù)據(jù),且后臺運(yùn)算能力非常強(qiáng),不但能夠提高系統(tǒng)運(yùn)行效率,而且還能有效避免數(shù)據(jù)運(yùn)算混亂或數(shù)據(jù)破損、丟失等問題,提高了數(shù)據(jù)處理的完整性、有效性和準(zhǔn)確性,從而可以保證信息數(shù)據(jù)正確錄入。另外,通過對提取的目標(biāo)數(shù)據(jù)真實(shí)性進(jìn)行反復(fù)驗(yàn)證,也能夠?yàn)檐浖_發(fā)和項(xiàng)目管理提供可靠的數(shù)據(jù)支持。2.有利于增強(qiáng)信息數(shù)據(jù)理解數(shù)據(jù)挖掘技術(shù)通過對原始數(shù)據(jù)進(jìn)行有效識別、權(quán)威分類、特征分析和細(xì)化處理,從而建立完善的數(shù)據(jù)管理平臺進(jìn)行數(shù)據(jù)分類管理,為用戶提供方便、快捷的數(shù)據(jù)查詢服務(wù)。在軟件工程領(lǐng)域應(yīng)用數(shù)據(jù)挖掘技術(shù),不但提高了工作效率,節(jié)省了時間成本和人力成本,而且能夠充分發(fā)揮數(shù)據(jù)挖掘技術(shù)的技術(shù)優(yōu)勢,實(shí)現(xiàn)信息數(shù)據(jù)有效整合,有利于增強(qiáng)企業(yè)對信息數(shù)據(jù)的深入理解。3.有利于提升信息數(shù)據(jù)利用率軟件從開發(fā)到應(yīng)用整個過程將會產(chǎn)生大量數(shù)據(jù),首先利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)從多個角度進(jìn)行分類和整理,然后再通過各種算法篩選和提取目標(biāo)數(shù)據(jù),最后對目標(biāo)數(shù)據(jù)進(jìn)行深度挖掘和應(yīng)用,可有效提升信息數(shù)據(jù)利用效率。企業(yè)利用數(shù)據(jù)挖掘技術(shù)可以將混亂、抽象的數(shù)據(jù)轉(zhuǎn)化為有序、易于理解的數(shù)據(jù),便于進(jìn)行數(shù)據(jù)分析和直接應(yīng)用,同時也可以根據(jù)實(shí)踐需要選擇數(shù)據(jù),挖掘數(shù)據(jù)背后蘊(yùn)涵的價值獲得商機(jī),進(jìn)而及時調(diào)整運(yùn)營策略搶占市場先機(jī),推動企業(yè)可持續(xù)發(fā)展。
數(shù)據(jù)挖掘技術(shù)在軟件工程中的實(shí)際應(yīng)用
1.軟件版本信息挖掘軟件版本信息具有控制、維護(hù)軟件系統(tǒng)的作用和功能,因此軟件版本信息挖掘管理屬于軟件工程的關(guān)鍵性工作。軟件開發(fā)過程中涉及的程序代碼類型多種多樣,而且每次更新都會產(chǎn)生新的代碼,面臨著軟件版本信息管理混亂的問題。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件版本信息挖掘,能夠?qū)崿F(xiàn)軟件版本各種信息資源同步更新、全方位管控。通過對比分析軟件歷史變更信息,可以有效挖掘不同版本、各個模塊之間的內(nèi)部聯(lián)系,直觀體現(xiàn)軟件內(nèi)部結(jié)構(gòu),快速找出軟件存在的結(jié)構(gòu)問題并采取有效措施予以解決;可以及時更新相關(guān)數(shù)據(jù),提高程序代碼融合效率,幫助軟件開發(fā)人員實(shí)現(xiàn)對程序代碼的統(tǒng)一控制,確保軟件開發(fā)質(zhì)量,推動項(xiàng)目目標(biāo)任務(wù)順利達(dá)成。2.軟件執(zhí)行記錄挖掘?qū)浖?zhí)行記錄進(jìn)行數(shù)據(jù)挖掘,可以發(fā)現(xiàn)不同代碼之間的關(guān)聯(lián)性,對于深入理解代碼的作用、功能和更好地開展軟件維護(hù)管理具有重要意義。數(shù)據(jù)挖掘技術(shù)在軟件執(zhí)行記錄中的應(yīng)用,主要是通過插裝、跟蹤、記錄、分析等幾個步驟實(shí)現(xiàn)對軟件執(zhí)行記錄數(shù)據(jù)挖掘,其實(shí)質(zhì)是利用對軟件跟蹤來逆向建模的過程。①在目標(biāo)測試代碼中插裝跟蹤模型,完整記錄軟件執(zhí)行過程。②對預(yù)處理后的軟件執(zhí)行記錄信息采用分類、類聚、關(guān)聯(lián)等方式展開分析,加深對軟件作用、功能理解。③根據(jù)分析結(jié)果提取關(guān)鍵信息,再次進(jìn)行跟蹤分析,探究不同系統(tǒng)模塊程序代碼之間的關(guān)聯(lián)性。④繪制系統(tǒng)整體結(jié)構(gòu),建立系統(tǒng)功能模塊,方便軟件開發(fā)人員管理和維護(hù)軟件系統(tǒng)。3.開源軟件數(shù)據(jù)挖掘開源軟件是給用戶提供的免費(fèi)試用軟件,其中克隆代碼檢測應(yīng)用非常普遍,主要包括文本對比、程序結(jié)構(gòu)對比、標(biāo)識符對比、語義應(yīng)用和索引對比等四種檢測方法,在軟件工程中的應(yīng)用需要根據(jù)實(shí)際需求選擇相應(yīng)的檢測方法??寺〈a技術(shù)能夠根據(jù)軟件開發(fā)相關(guān)標(biāo)準(zhǔn)實(shí)現(xiàn)代碼快速拷貝和復(fù)制,然后根據(jù)軟件開發(fā)目標(biāo)和要求對拷貝的代碼進(jìn)行修改、完善和進(jìn)一步檢測,避免錯誤代碼傳遞,確保系統(tǒng)正常運(yùn)行??寺〈a技術(shù)不但改善了復(fù)制與粘貼的效率,提高了克隆代碼檢測速度,同時可以規(guī)避代碼漏洞對軟件系統(tǒng)影響,為開源軟件開發(fā)和系統(tǒng)后期維護(hù)管理提供更多便利條件。但是,克隆代碼技術(shù)的應(yīng)用會受到環(huán)境開放性與動態(tài)性、數(shù)據(jù)多樣性、Web軟件開發(fā)大眾化等因素影響,給用戶使用帶來管理和安全方面的問題。隨著數(shù)據(jù)挖掘技術(shù)的不斷進(jìn)步與完善,其中對軟件應(yīng)用情況、錯誤報(bào)告、開發(fā)者詳細(xì)信息等都會進(jìn)行有效跟蹤和自動記錄,有助于軟件開發(fā)人員構(gòu)建出典型的社會網(wǎng)絡(luò),詳細(xì)了解和準(zhǔn)確把握網(wǎng)絡(luò)動態(tài)變化,從而提高開源軟件開發(fā)質(zhì)量,提升開源項(xiàng)目管理整體效果。4.軟件故障檢測數(shù)據(jù)挖掘通過軟件故障檢測數(shù)據(jù)挖掘,能夠預(yù)判軟件故障的發(fā)生,可以提前采取預(yù)防性措施排除隱患,提高軟件管理的針對性,確保軟件系統(tǒng)安全運(yùn)行。數(shù)據(jù)挖掘技術(shù)的應(yīng)用能夠?qū)εc軟件漏洞或缺陷有關(guān)的項(xiàng)目進(jìn)行全面檢測和對數(shù)據(jù)的真實(shí)性進(jìn)行反復(fù)驗(yàn)證,并利用對比排查的方式實(shí)現(xiàn)代碼有效識別、準(zhǔn)確定位和詳細(xì)描述,幫助軟件開發(fā)人員快速找到故障原因,并采取針對性措施修復(fù)漏洞或缺陷。例如發(fā)動機(jī)的穩(wěn)態(tài)故障檢測,數(shù)據(jù)挖掘技術(shù)的運(yùn)用可以構(gòu)建引發(fā)發(fā)動機(jī)穩(wěn)態(tài)故障所有因素的參數(shù)集合,技術(shù)人員通過觀察參數(shù)變化可以準(zhǔn)確判斷發(fā)動機(jī)是否存在故障,故障發(fā)生的具體位置以及發(fā)生的原因等,從而快速進(jìn)行針對性處理。
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用方法
1.關(guān)聯(lián)法。通過深入分析挖掘已掌握的數(shù)據(jù),進(jìn)而探究不同數(shù)據(jù)之間的隱含關(guān)系,如相互關(guān)系、因果關(guān)系等。為了提升數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用效果,需要軟件開發(fā)人員高度重視二者的關(guān)聯(lián)性,利用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢提高信息數(shù)據(jù)支持度和置信度,從而為軟件工程順利發(fā)展提供基礎(chǔ)保障。2.分類法。首先通過構(gòu)建分析模型,將概念集、數(shù)據(jù)類集引入模型以準(zhǔn)確描述信息數(shù)據(jù)特征,然后預(yù)測數(shù)據(jù)庫中分類標(biāo)號、離散值的執(zhí)行動作,進(jìn)而實(shí)現(xiàn)對采集的目標(biāo)信息數(shù)據(jù)進(jìn)行系統(tǒng)分類;其次通過對比不同類型數(shù)據(jù)的應(yīng)用差異,進(jìn)一步了解和掌握各種類型數(shù)據(jù)的發(fā)展規(guī)律。3.聚類法。按照種類、性質(zhì)、簇將原始數(shù)據(jù)進(jìn)行劃分,然后再根據(jù)實(shí)際需要對目標(biāo)數(shù)據(jù)細(xì)化處理,確保同類型、同性質(zhì)、同簇?cái)?shù)據(jù)之間具有較高的相似度,反之則具有較大的差異性。
作者:韓建友 單位:浪潮通信信息系統(tǒng)有限公司
熱門標(biāo)簽
數(shù)據(jù)分析論文 數(shù)據(jù)挖掘論文 數(shù)據(jù)安全論文 數(shù)據(jù)管理論文 數(shù)據(jù)庫論文 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)誤差 數(shù)據(jù)采集 數(shù)據(jù)通信論文 數(shù)據(jù) 心理培訓(xùn) 人文科學(xué)概論