數(shù)據(jù)挖掘提取知識(shí)及有用信息論文
時(shí)間:2022-05-15 06:41:00
導(dǎo)語(yǔ):數(shù)據(jù)挖掘提取知識(shí)及有用信息論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。
編者按:本文主要從前言;數(shù)據(jù)挖掘方法在商業(yè)信息中應(yīng)用的規(guī)則;數(shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用;結(jié)束語(yǔ)進(jìn)行論述。其中,主要包括:商業(yè)信息的增長(zhǎng)速度呈現(xiàn)指數(shù)上升、數(shù)據(jù)挖掘技術(shù)在商業(yè)中的應(yīng)用主要基于AI、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù)、商業(yè)信息泛化、簡(jiǎn)約和特征提取規(guī)則、商業(yè)信息分類(lèi)技術(shù)規(guī)則、商業(yè)信息的聚類(lèi)規(guī)則、商業(yè)信息的關(guān)聯(lián)規(guī)則、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站數(shù)據(jù)中的應(yīng)用、數(shù)據(jù)挖掘技術(shù)可以用在金融領(lǐng)域的應(yīng)用、數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營(yíng)銷(xiāo)中的應(yīng)用、電信業(yè)交叉銷(xiāo)售和提升銷(xiāo)售解決方案、預(yù)測(cè)哪些客戶(hù)最具有流失的傾向以及影響客戶(hù)流失的關(guān)鍵因素等,具體請(qǐng)?jiān)斠?jiàn)。
0前言
隨著現(xiàn)代商業(yè)經(jīng)濟(jì)和信息技術(shù)的發(fā)展,商業(yè)信息的增長(zhǎng)速度呈現(xiàn)指數(shù)上升,積累了海量的、以不同形式存儲(chǔ)的商業(yè)數(shù)據(jù)資料,原有的決策支持系統(tǒng)(DSS)和領(lǐng)導(dǎo)執(zhí)行系統(tǒng)(EIS)已不能滿(mǎn)足需要,這時(shí)出現(xiàn)數(shù)據(jù)挖掘技術(shù),它能夠去粗存精、去偽存真,從海量的商業(yè)信息中提取知識(shí)和有用信息的技術(shù)?,F(xiàn)代信息技術(shù)處理商業(yè)信息經(jīng)過(guò)一定的發(fā)展,逐步形成現(xiàn)在的商業(yè)數(shù)據(jù)挖掘技術(shù)。
1.?dāng)?shù)據(jù)挖掘方法在商業(yè)信息中應(yīng)用的規(guī)則
數(shù)據(jù)挖掘技術(shù)在商業(yè)中的應(yīng)用主要基于AI、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),高度自動(dòng)化地分析商業(yè)原始數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,預(yù)測(cè)客戶(hù)的行為,幫助商業(yè)決策者調(diào)整市場(chǎng)策略,減少風(fēng)險(xiǎn),做出正確的決策,體現(xiàn)一種決策支持過(guò)程。
1.1商業(yè)信息泛化、簡(jiǎn)約和特征提取規(guī)則。商業(yè)信息泛化是為了商業(yè)數(shù)據(jù)更好的理解和掌握,將其具體一般的數(shù)據(jù)信息抽象到較高層次的過(guò)程;商業(yè)信息簡(jiǎn)約是為了采用一定的手段對(duì)信息進(jìn)行描述;商業(yè)信息特征是找出這些信息的共同特征,尋找信息的通用性特征式。
1.2商業(yè)信息分類(lèi)技術(shù)規(guī)則。商業(yè)信息分類(lèi)是按照一組商業(yè)信息對(duì)象的特征給出信息對(duì)象劃分的過(guò)程。其目的是學(xué)會(huì)一個(gè)分類(lèi)函數(shù)或分類(lèi)模型,該模型能把數(shù)據(jù)庫(kù)的數(shù)據(jù)信息項(xiàng)映射到給定類(lèi)別中的某一個(gè)。
1.3商業(yè)信息的聚類(lèi)規(guī)則。聚類(lèi)規(guī)則是識(shí)別一組信息對(duì)象的內(nèi)在規(guī)則,從而將對(duì)象分組,構(gòu)成相似的對(duì)象類(lèi),從而找出數(shù)據(jù)信息的分布規(guī)律,并進(jìn)一步去發(fā)現(xiàn)隱含在一組混雜的數(shù)據(jù)信息集里的分類(lèi)規(guī)則。聚類(lèi)是把一組個(gè)體按照相似性歸類(lèi),即"物以類(lèi)聚"。使屬于同一類(lèi)別的個(gè)體之間的距離盡可能小,而不同類(lèi)別的個(gè)體間的距離盡可能大。
1.4商業(yè)信息的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的商業(yè)數(shù)據(jù)挖掘已經(jīng)從單一概念層次的關(guān)聯(lián)規(guī)則發(fā)展到多概念層次的關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)。關(guān)聯(lián)規(guī)則是如下的一種規(guī)則:"我們?cè)谘芯看笮蜕虉?chǎng)的顧客在購(gòu)買(mǎi)上衣和褲子的時(shí)候,發(fā)現(xiàn)其中在這些顧客中有10%的顧客同時(shí)買(mǎi)了帽子(上衣+褲子+帽子),這就形成簡(jiǎn)單的關(guān)聯(lián)規(guī)則。除了具有上述關(guān)聯(lián)規(guī)律,還有時(shí)間或序列上的規(guī)律,在不同的時(shí)間(春夏秋冬)所購(gòu)的衣服、褲子以及帽子是不相同的,并且不同層次或者不同年齡的人所購(gòu)商品又有一定的規(guī)律性。
2.?dāng)?shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)是目前在商業(yè)信息處理中應(yīng)用的比較多的一項(xiàng)技術(shù),為了在商業(yè)領(lǐng)域中對(duì)海量數(shù)據(jù)庫(kù)和大量復(fù)雜信息中提取有價(jià)值的知識(shí),進(jìn)一步提高信息的利用率,對(duì)公司及時(shí)制定相應(yīng)的對(duì)策有非常重要的意義,在這里,討論幾個(gè)主要商業(yè)行業(yè)中的商業(yè)信息處理。
2.1數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站數(shù)據(jù)中的應(yīng)用
隨著Web技術(shù)的發(fā)展,電子商務(wù)網(wǎng)站正在成為現(xiàn)在商家的必爭(zhēng)之地。如何讓電子商務(wù)網(wǎng)站有效益要想有效益就必須吸引客戶(hù),增加能帶來(lái)效益的客戶(hù)忠誠(chéng)度。電子商務(wù)網(wǎng)站每天都可能有上百萬(wàn)次的在線(xiàn)交易,生成大量的記錄文件和登記表,如何對(duì)這些數(shù)據(jù)進(jìn)行分析和挖掘,充分了解客戶(hù)的喜好、購(gòu)買(mǎi)模式,甚至是客戶(hù)一時(shí)的沖動(dòng),設(shè)計(jì)出滿(mǎn)足于不同客戶(hù)群體需要的個(gè)性化網(wǎng)站,進(jìn)而增加其競(jìng)爭(zhēng)力,幾乎變得勢(shì)在必行。若想在競(jìng)爭(zhēng)中生存進(jìn)而獲勝,就要比您的競(jìng)爭(zhēng)對(duì)手更了解客戶(hù)。
在對(duì)網(wǎng)站進(jìn)行數(shù)據(jù)挖掘時(shí),所需要的數(shù)據(jù)主要來(lái)自于兩個(gè)方面:一方面是客戶(hù)的背景信息,此部分信息主要來(lái)自于客戶(hù)的登記表;而另外一部分?jǐn)?shù)據(jù)主要來(lái)自瀏覽者的點(diǎn)擊流,此部分?jǐn)?shù)據(jù)主要用于考察客戶(hù)的行為表現(xiàn)。但有的時(shí)候,客戶(hù)對(duì)自己的背景信息十分珍重,不肯把這部分信息填寫(xiě)在登記表上,這就會(huì)給數(shù)據(jù)分析和挖掘帶來(lái)不便。在這種情況之下,就不得不從瀏覽者的表現(xiàn)數(shù)據(jù)中來(lái)推測(cè)客戶(hù)的背景信息,進(jìn)而再加以利用。就分析和建立模型的技術(shù)和算法而言,網(wǎng)站的數(shù)據(jù)挖掘和原來(lái)的數(shù)據(jù)挖掘差別并不是特別大,很多方法和分析思想都可以運(yùn)用。所不同的是網(wǎng)站的數(shù)據(jù)格式有很大一部分來(lái)自于點(diǎn)擊流,和傳統(tǒng)的數(shù)據(jù)庫(kù)格式有區(qū)別。因而對(duì)電子商務(wù)網(wǎng)站進(jìn)行數(shù)據(jù)挖掘所做的主要工作是數(shù)據(jù)準(zhǔn)備。
2.2數(shù)據(jù)挖掘技術(shù)可以用在金融領(lǐng)域的應(yīng)用
金融事務(wù)需要搜集和處理大量數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個(gè)客戶(hù)、消費(fèi)群體或組織的金融和商業(yè)興趣,并可觀察金融市場(chǎng)的變化趨勢(shì)。
數(shù)據(jù)挖掘在銀行信息中的應(yīng)用。商業(yè)銀行業(yè)務(wù)的利潤(rùn)和風(fēng)險(xiǎn)是共存的。為了保證最大的利潤(rùn)和最小的風(fēng)險(xiǎn),必須對(duì)賬戶(hù)進(jìn)行科學(xué)的分析和歸類(lèi),并進(jìn)行信用評(píng)估,利用數(shù)據(jù)挖掘工具,可以根據(jù)客戶(hù)的消費(fèi)模式預(yù)測(cè)何時(shí)為客戶(hù)提供何種產(chǎn)品。銀行如何讓一家新開(kāi)的銀行網(wǎng)點(diǎn)實(shí)現(xiàn)快速贏利呢?銀行結(jié)合了GPS推理信息系統(tǒng)和商業(yè)智能應(yīng)用系統(tǒng),在銀行的客戶(hù)信息中,詳細(xì)記錄有客戶(hù)的常駐地,并且,當(dāng)銀行客戶(hù)到該銀行網(wǎng)點(diǎn)辦理業(yè)務(wù)時(shí),銀行商業(yè)智能系統(tǒng)將自動(dòng)記錄客戶(hù)的操作信息,以及銀行網(wǎng)點(diǎn)地址信息。經(jīng)過(guò)大量的記錄,客戶(hù)的常駐地到銀行網(wǎng)點(diǎn)的行動(dòng)路線(xiàn),將被通過(guò)數(shù)據(jù)分析而得出。大量的客戶(hù)路線(xiàn)得出后,我們可能會(huì)發(fā)現(xiàn),某個(gè)地區(qū)進(jìn)行銀行業(yè)務(wù)操作的客戶(hù)特別多,但他們附近沒(méi)有銀行網(wǎng)點(diǎn),而是要到離他們較遠(yuǎn)的地方去辦理,于是銀行就決定在這個(gè)地區(qū)開(kāi)辦一個(gè)銀行網(wǎng)點(diǎn)。
數(shù)據(jù)挖掘在證券信息中的應(yīng)用。上市公司定期公布的財(cái)務(wù)報(bào)告具有很強(qiáng)的信息含量,但是當(dāng)期會(huì)計(jì)盈余數(shù)據(jù)的信息會(huì)在披露前后在股票市價(jià)中迅速得以體現(xiàn)。因此對(duì)于中長(zhǎng)期投資者來(lái)說(shuō),重要的是預(yù)見(jiàn)未來(lái)。質(zhì)地優(yōu)良且未來(lái)具有較高盈利增長(zhǎng)能力的公司是中長(zhǎng)期投資者(包括普通投資者,證券投資基金和券商)普遍關(guān)注的對(duì)象,因?yàn)橹挥羞@類(lèi)公司才能給投資者帶來(lái)持續(xù)的回報(bào)。而財(cái)務(wù)報(bào)告包含了大量描述公司經(jīng)營(yíng)狀況的數(shù)據(jù)。這些數(shù)據(jù)應(yīng)能為投資者提供關(guān)于公司未來(lái)盈利能力的信息。對(duì)于中長(zhǎng)期投資者而言,需要做的就是利用這些信息挖掘出未來(lái)能夠具有較高盈利水平同時(shí)又具有較好的成長(zhǎng)性公司。采用數(shù)據(jù)挖掘技術(shù)來(lái)發(fā)掘這些財(cái)務(wù)報(bào)告中是否包含關(guān)于公司未來(lái)盈利情況的信息,獲得較精確的預(yù)測(cè)效果,選出的投資組合能否獲得超額收益,這對(duì)于投資者來(lái)說(shuō)是非常重要的。
2.3數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營(yíng)銷(xiāo)中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營(yíng)銷(xiāo)中得到了比較普遍的應(yīng)用,它是以市場(chǎng)營(yíng)銷(xiāo)學(xué)的市場(chǎng)細(xì)分原理為基礎(chǔ),其基本假定是"消費(fèi)者過(guò)去的行為是其今后消費(fèi)傾向的最好說(shuō)明"。通過(guò)收集、加工和處理涉及消費(fèi)者消費(fèi)行為的大量信息,確定特定消費(fèi)群體或個(gè)體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為,然后以此為基礎(chǔ),對(duì)所識(shí)別出來(lái)的消費(fèi)群體進(jìn)行特定內(nèi)容的定向營(yíng)銷(xiāo),這與傳統(tǒng)的不區(qū)分消費(fèi)者對(duì)象特征的大規(guī)模營(yíng)銷(xiāo)手段相比,大大節(jié)省了營(yíng)銷(xiāo)成本,提高了營(yíng)銷(xiāo)效果,從而為企業(yè)帶來(lái)更多的利潤(rùn)。這些來(lái)自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級(jí)計(jì)算機(jī)、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進(jìn)行處理,從中得到商家用于向特定消費(fèi)群體或個(gè)體進(jìn)行定向營(yíng)銷(xiāo)的決策信息。4數(shù)據(jù)挖掘技術(shù)在民用通信部門(mén)中的應(yīng)用
我國(guó)各種民用通信用得最多的國(guó)家之一,為了分析出那一類(lèi)收費(fèi)對(duì)應(yīng)那類(lèi)層次的人群,我們就可以利用數(shù)據(jù)挖掘技術(shù),把當(dāng)前電信消費(fèi)者的數(shù)據(jù)進(jìn)行收集、分析、總結(jié),制定出有效的管理辦法,這既有利于公司又有利于客戶(hù)的優(yōu)惠政策,這樣能夠及時(shí)發(fā)現(xiàn)問(wèn)題,減少顧客流失,為通信公司挽回?fù)p失。數(shù)據(jù)挖掘在通信部門(mén)中體現(xiàn)在三個(gè)方面:(1)客戶(hù)挽留解決方案;(2)電信業(yè)客戶(hù)細(xì)分解決方案;(3)電信業(yè)交叉銷(xiāo)售和提升銷(xiāo)售解決方案。這三個(gè)項(xiàng)目的實(shí)施,可以為民用通信部門(mén)解決三個(gè)決策問(wèn)題:第一,預(yù)測(cè)哪些客戶(hù)最具有流失的傾向以及影響客戶(hù)流失的關(guān)鍵因素,通過(guò)預(yù)制的分析模型提供"流失記分"幫助識(shí)別風(fēng)險(xiǎn)客戶(hù),在客戶(hù)流失之前采取針對(duì)性措施來(lái)挽留他們。第二,根據(jù)客戶(hù)可能的行為和潛在的盈利性對(duì)客戶(hù)進(jìn)行分類(lèi),制定更準(zhǔn)確的產(chǎn)品組合、更準(zhǔn)確的產(chǎn)品介紹和產(chǎn)品捆綁服務(wù)。第三,從現(xiàn)有客戶(hù)中識(shí)別出有可能接受交叉銷(xiāo)售和提升銷(xiāo)售的客戶(hù)人選,評(píng)估客戶(hù)過(guò)去的購(gòu)買(mǎi)模式,預(yù)測(cè)客戶(hù)下一步可能購(gòu)買(mǎi)什么。
3.結(jié)束語(yǔ)
隨著數(shù)據(jù)挖掘技術(shù)和現(xiàn)代商業(yè)技術(shù)的不斷發(fā)展,商業(yè)管理者已經(jīng)認(rèn)識(shí)到數(shù)據(jù)挖掘技術(shù)能從原始數(shù)據(jù)中挖掘潛在的巨大商業(yè)價(jià)值和所蘊(yùn)含的科學(xué)知識(shí)。隨著數(shù)據(jù)挖掘技術(shù)不斷應(yīng)用到商業(yè)信息領(lǐng)域中,這將激發(fā)數(shù)據(jù)挖掘技術(shù)的潛力,進(jìn)一步推進(jìn)數(shù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用
熱門(mén)標(biāo)簽
數(shù)據(jù)分析論文 數(shù)據(jù)挖掘論文 數(shù)據(jù)安全論文 數(shù)據(jù)管理論文 數(shù)據(jù)庫(kù)論文 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)誤差 數(shù)據(jù)采集 數(shù)據(jù)通信論文 數(shù)據(jù) 心理培訓(xùn) 人文科學(xué)概論