統(tǒng)計研究工作機遇與挑戰(zhàn)
時間:2022-08-14 02:47:21
導語:統(tǒng)計研究工作機遇與挑戰(zhàn)一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:大數(shù)據(jù)時代的到來在拓寬統(tǒng)計研究范疇,豐富統(tǒng)計研究內(nèi)容的同時也為傳統(tǒng)統(tǒng)計研究工作帶來了巨大的挑戰(zhàn);為順應大數(shù)據(jù)時代的發(fā)展,統(tǒng)計研究工作應適時調(diào)整抽樣調(diào)查的工作思想、深入理解數(shù)據(jù)信息、轉(zhuǎn)換數(shù)據(jù)對接與處理方式、抓住數(shù)據(jù)關系分析重點、轉(zhuǎn)換統(tǒng)計工作重心以及強化分析思維,使大數(shù)據(jù)與統(tǒng)計學有機結合,更好的為統(tǒng)計學服務,為統(tǒng)計研究工作的發(fā)展注入旺盛的生命力。
關鍵詞:統(tǒng)計研究;大數(shù)據(jù);統(tǒng)計學;數(shù)據(jù)分析
自二十世紀六十年代以來,計算機技術的快速發(fā)展,人類的生活方式發(fā)生了巨大的變化,計算機互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、汽車網(wǎng)絡越來越流行,博客,論壇,微信網(wǎng)絡通信已經(jīng)演變成人們的日常生活中,數(shù)據(jù)的積累變得越來越方便,數(shù)據(jù)共享和交流變得越來越方便,自動采集、傳輸?shù)男畔⒑陀嬎阋呀?jīng)出生成為現(xiàn)實,大數(shù)據(jù)的天然產(chǎn)品是高科技時代,毫無疑問,隨著計算機處理技術的快速發(fā)展,能夠處理大規(guī)模復雜數(shù)據(jù)增加,從大規(guī)模的數(shù)據(jù)中提取有價值的信息的能力是一天天增加,人類迅速進入大數(shù)據(jù)的時代,有大數(shù)據(jù)促進人民生活的變化,工作和的思想奠定了基礎。在大數(shù)據(jù)時代,引領人們的生活中的數(shù)據(jù),指導業(yè)務轉(zhuǎn)型和科技創(chuàng)新中發(fā)揮著越來越重要的作用,人們幾乎可以從任何獲得的數(shù)據(jù)可以轉(zhuǎn)化為促進人類生活方式的改變有價值的知識,以及大數(shù)據(jù)時代的戰(zhàn)略意義不僅是掌握龐大的數(shù)據(jù)信息,并在于如何處理數(shù)據(jù)。如何從紛繁的知識中提取有價值的數(shù)據(jù),如何利用這些數(shù)據(jù)來創(chuàng)建偉大的價值是我們面臨的一個重要問題,大數(shù)據(jù)時代的到來,使分析數(shù)據(jù)的研究變得尤為重要,不僅帶來了統(tǒng)計研究的發(fā)展機遇,但也給統(tǒng)計研究帶來了前所未有的挑戰(zhàn)。毫無疑問,隨著大數(shù)據(jù)的出現(xiàn),統(tǒng)計研究已經(jīng)進入了一個新的發(fā)展階段。
一、大數(shù)據(jù)給統(tǒng)計研究帶來的機遇
大數(shù)據(jù)時代擴大了統(tǒng)計研究的范圍,豐富了統(tǒng)計研究的內(nèi)容,擴大了統(tǒng)計研究的活力。傳統(tǒng)的統(tǒng)計研究是根據(jù)要研究的問題收集相關數(shù)據(jù),然后組織、分析和總結。傳統(tǒng)的統(tǒng)計研究一方面,無法保證數(shù)據(jù)的效率,另一方面,由于大量的數(shù)據(jù)收集非常困難,導致研究人員增加工作量。在大數(shù)據(jù)時代,統(tǒng)計研究工作可以分析更多的數(shù)據(jù),甚至可以處理和某個特別現(xiàn)象相關的所有數(shù)據(jù),而不再依賴于隨機采樣,數(shù)據(jù)的限制等因素。傳統(tǒng)的統(tǒng)計研究工作與大數(shù)據(jù)相結合,(1)保證了統(tǒng)計信息的適應性,提高了統(tǒng)計調(diào)查的時效性,增加了統(tǒng)計研究的準確性,在整體上提高了統(tǒng)計研究的質(zhì)量;(2)豐富了傳統(tǒng)統(tǒng)計研究數(shù)據(jù)的收集方法,例如網(wǎng)絡信息、移動通信等,同時這些數(shù)據(jù)范圍廣泛,可用于多個研究目標,重復利用率高,這樣大大降低了統(tǒng)計研究工作的成本。(3)豐富了統(tǒng)計學的內(nèi)涵,更大的發(fā)揮了統(tǒng)計學的作用,擴大了統(tǒng)計研究工作的范圍。
二、統(tǒng)計研究工作所面臨的轉(zhuǎn)變
由大數(shù)據(jù)的概念與其時代屬性,我們不難看出大數(shù)據(jù)具有多樣性(Variety)、大量性(Volume)、高速性(Velocity)、易變性(Variabili⁃ty)、真實性(Veracity)和價值性(Value)等特點[5][6][7]。同時,大數(shù)據(jù)也給我們帶來了一些觀念上的轉(zhuǎn)變,比如:是全部數(shù)據(jù),而不是隨機采樣;是大體方向,而不是精確制導;是相關關系,而不是因果關系等等。對統(tǒng)計研究工作而言,這些特點與轉(zhuǎn)變不僅帶來了統(tǒng)計研究范疇的拓寬、統(tǒng)計研究內(nèi)容的豐富,也同樣帶來了統(tǒng)計研究工作面臨的顛覆性的挑戰(zhàn)。(一)抽樣調(diào)查工作思想的轉(zhuǎn)變。由于數(shù)據(jù)收集和處理能力的限制,傳統(tǒng)的統(tǒng)計研究工作特點是通過有限樣本來了解推斷總體,這也就產(chǎn)生了各式各樣的抽樣調(diào)查技術,但不可否認的是,任何抽樣技術,抽到的都只是總體中的一部分,樣本只能是對總體片面的、部分的反映。而在大數(shù)據(jù)時代,數(shù)據(jù)資料收集和數(shù)據(jù)處理能力對統(tǒng)計分析工作的影響越來越小,我們既可以了解局部又可以了解總體,那些傳統(tǒng)抽樣調(diào)查方法中的不足,諸如抽樣框不穩(wěn)定、隨機取樣困難、受調(diào)查目的限制、調(diào)查范圍有限、樣本量有限、抽樣結果無法進一步細分、糾偏成本高等問題均可以得到改善。進入大數(shù)據(jù)時代,雖然分析整個過程是可能的,但這并不意味著抽樣,但這并不意味著抽樣是無用的。至少就目前而言,不是所有的行業(yè)都有實現(xiàn)智能化,并不是所有的數(shù)據(jù)都可以通過網(wǎng)絡獲得的信息系統(tǒng),有很多數(shù)據(jù)只能通過傳統(tǒng)的方法,抽樣調(diào)查;而且,甚至網(wǎng)絡數(shù)據(jù),在某些情況下,分析整體也不是最好的選擇,在某些情況下,抽樣調(diào)查是更重要的比分析的總時間。(二)對數(shù)據(jù)精確性要求的轉(zhuǎn)變。傳統(tǒng)的統(tǒng)計研究工作是對數(shù)據(jù)進行抽樣分析,研究工作是希望盡可能用有限的數(shù)據(jù)來全面準確的反映和推斷總體,對數(shù)據(jù)的精確性要求非常高,數(shù)據(jù)的不精確主要集中在人為因素以及自然不可控因素。而在大數(shù)據(jù)時代,數(shù)據(jù)規(guī)模大,數(shù)據(jù)來源廣泛,數(shù)據(jù)不精確性在所難免,很多情況下統(tǒng)計研究工作已經(jīng)放棄了樣本研究方法,從而變成對于總體的研究。但大數(shù)據(jù)時代下的這種不精確數(shù)據(jù)并不一定妨礙我們認識總體,也有可能幫助我們從另一個方向更好地認識總體。數(shù)據(jù)的這種不精確性提供的越來越多的信息,有利于我們更好地了解總體的真實情況。(三)數(shù)據(jù)對接與處理方式的轉(zhuǎn)變。傳統(tǒng)的數(shù)據(jù)是結構化數(shù)據(jù)可以使用的常規(guī)統(tǒng)計指標體現(xiàn)或是坐標圖阻礙數(shù)據(jù)固有結構和根據(jù)這一標準數(shù)據(jù)的知識,具備方式已經(jīng)相當成熟,并且比較容易,得到可以直接進行分析的結果。相反,數(shù)據(jù)不僅結構化數(shù)據(jù)也全面反結構化數(shù)據(jù)、聯(lián)合數(shù)據(jù)和非結構化數(shù)據(jù)可以儲存的所有記錄和的信號,具備多種多樣的特性,傳統(tǒng)的統(tǒng)計指標一定要完整地可以表現(xiàn)暴露出來。這些數(shù)據(jù)的概念,必然會拓展如何有效實現(xiàn)結構化數(shù)據(jù)和非結構化的數(shù)據(jù)對接問題。實際工作上的多種類型的數(shù)據(jù)的數(shù)據(jù)進行分析的基礎上,提高對對象的多種類型的描寫和數(shù)據(jù)測度的能力。傳統(tǒng)的統(tǒng)計分析注重推斷,分析的統(tǒng)計數(shù)據(jù),更加注重表現(xiàn)透露,這是周密地為了觀察。對刀片怎么目的和統(tǒng)計數(shù)據(jù)結構化收集大量需求比結熱點透視構化數(shù)據(jù)中發(fā)掘并有價值的信息并有機結合,相輔相成的剩下的課題,討論如何能夠?qū)崿F(xiàn)非結構化數(shù)據(jù)結構化更好的分析、結構化數(shù)據(jù)與否,可以使用非結構化表示:“更容易調(diào)整等以課題中需要解決的問題。franks也幾乎沒有。分析過程直接對非結構化分析數(shù)據(jù)也沒有直接在非結構化的數(shù)據(jù)而得出的結論。目前計算機學界已著手研究開發(fā)(r&d)的技術數(shù)據(jù)處理結構化直接通過統(tǒng)計數(shù)據(jù)結構化處理費或具備知識的數(shù)據(jù)、結構化性非常重要的研究領域。我們堅信通過各種方法特定結構化數(shù)據(jù)和非結構化的數(shù)據(jù)完美地實現(xiàn)竭盡全力地的。(四)數(shù)據(jù)關系分析重點的轉(zhuǎn)變。傳統(tǒng)的統(tǒng)計數(shù)據(jù)處理一般分析工作時,事先搞清事物之間存在某種因果關系后,在解決因果關系的基礎上制定構建驗證的家庭,事先模型因果關系。大數(shù)據(jù)時代、數(shù)據(jù)時代衍生出的對統(tǒng)計分析的創(chuàng)意和技術的革新開闊的視野我們”,他看到很多可以去未發(fā)現(xiàn)之前發(fā)現(xiàn)的事物之間的聯(lián)系,可在年初大容量數(shù)據(jù)上發(fā)現(xiàn)的各種存在相關關系。我們分析數(shù)據(jù)時再探索捕捉不到的因果關系事物的寒霜關注根據(jù)關系變量或現(xiàn)象之間的相互關系進行了此及由表及由、彼里的關聯(lián)。根據(jù)奧姆數(shù)據(jù)時代的重要任務之一的大規(guī)模相關的分析。然而,大學的數(shù)據(jù),“什么”和“為什么”的時代要求,只有這樣,我們才能更好地理解“什么是它?”真正了解數(shù)據(jù)的原因和背景。因果關系很重要,他決定深入分析數(shù)據(jù)。如果一半的數(shù)據(jù)分析與深度的程度有關,如果進行分析的話,第一個是我們感到困惑。因果關系可以幫助我們更好地利用相關性,例如,某事物的原因可能是共同的結果,所以諸如事物之間的關聯(lián)。我們可以幫助更理性的決策,甚至預測未來。事物的因果關系,可以用于進一步的好萊塢數(shù)據(jù)。另一方面,兩者之間因果關系的基礎。相關分析和對平行抗辯的分析,額外的學分可以補充和。(五)統(tǒng)計研究工作的重心的轉(zhuǎn)變。傳統(tǒng)統(tǒng)計研究所工作的重心將收集的基礎資料原委的數(shù)據(jù)、大數(shù)據(jù)的時代,則更什么樣的選擇有用的數(shù)據(jù)。專門的抽樣調(diào)查中充分關注設計統(tǒng)計的提取樣本機隨性并不那么多的音響帶來了不小的沖擊。大學時代、統(tǒng)計數(shù)據(jù),可能會面臨處理。許多非隨機數(shù)據(jù),如何辨別音響效果更為突出的任務。除此之外,掌握的資料,選擇頗顯著。如果有缺陷的依賴的數(shù)據(jù),如果決策產(chǎn)生相當大的影響。但同時也應該清楚的數(shù)據(jù),并不能掩蓋所有數(shù)據(jù)前也是相對的再加上一定是一個具有代表性的樣本的情報的人,呈指數(shù)增長需要驗證”的假設了同樣的快速增長。亟待解決的問題和復雜,而且水平也同樣的速度增長。更好的方法,對日尋求信號和音響效果的區(qū)別。信息只接受了旨在查明真相的必要條件,不是充分條件。但無信息不真相查明真相就達信息。數(shù)據(jù)可以滿足既定事實化的其用途,才可以高質(zhì)量的數(shù)值過于依賴。(六)統(tǒng)計研究中分析思維的轉(zhuǎn)變。(1)傳統(tǒng)的統(tǒng)計分析過程分為三個步驟:穩(wěn)定性、定量和定性。首先,有必要通過經(jīng)驗找到統(tǒng)計方向,其目的是掌握知識、分析數(shù)據(jù)和處理數(shù)據(jù)。我們可以根據(jù)結果得出最終結論。數(shù)據(jù)、定量統(tǒng)計分析過程是發(fā)現(xiàn)“有限數(shù)量的各種直接信息的極限”的基礎,對我們所需要的信息進行分析,找出數(shù)據(jù)的特征和數(shù)量關系,并在判斷和決策的基礎上進行分析。(2)傳統(tǒng)的統(tǒng)計實證分析的路徑通常是“假設-測試”,即根據(jù)統(tǒng)計數(shù)字的第一項建議,繼續(xù)假設、數(shù)據(jù)收集、分析,最后得出結論。事實證明,這種經(jīng)驗分析有很大的誤差。在實證分析大數(shù)據(jù)的時代,很難找到思考絕不是一個簡單的假設檢驗,但“發(fā)現(xiàn)-總結”,全面和深入的了解研究對象,因此,整合數(shù)據(jù),發(fā)現(xiàn)規(guī)則的關系,找到了,反復總結,結論,這將幫助更多,發(fā)現(xiàn)驚喜。(3)傳統(tǒng)的統(tǒng)計分析認為,在保證的前提下基于分布邏輯概率的分析過程,是對整個推理的,通常根據(jù)推理特征的一般特征,根據(jù)推理特征來判斷樣本的輪廓是正確的?,F(xiàn)在這個過程是實際分布的基礎上,所有的功能,并確定什么時間的概率是政治對手或動態(tài)大學數(shù)據(jù)對象是所有的數(shù)據(jù)的大小不需要遵循分布理論說:“與一般特征相比,計算方法,根據(jù)推遲[2]。(七)統(tǒng)計研究中應用技術的轉(zhuǎn)變傳統(tǒng)的統(tǒng)計研究分析技術手段已經(jīng)不能滿足大數(shù)據(jù)信息數(shù)據(jù)研究的需要,進入大數(shù)據(jù)時代,統(tǒng)計研究工作與計算機的結合變得更加緊密。統(tǒng)計研究工作的進行不僅僅局限于掌握統(tǒng)計體系知識,對計算機技能的要求也開始變得越來越依賴,數(shù)據(jù)庫、數(shù)據(jù)結構、統(tǒng)計軟件、算法設計、程序編碼等都是大數(shù)據(jù)時代統(tǒng)計研究工作中不可或缺的應用技術,同時融匯統(tǒng)計技術與計算機技術可以幫助我們更加便捷的處理統(tǒng)計研究工作,更好的解決復雜的數(shù)據(jù)處理問題,更大的發(fā)揮統(tǒng)計研究工作的作用。
三、小結
一個新生事物的出現(xiàn)將必定導致傳統(tǒng)觀念和技術的革命。大數(shù)據(jù)的到來,以其多樣性(Variety)、大量性(Volume)、高速性(Ve⁃locity)、易變性(Variability)、真實性(Veracity)和價值性(Value)等特點彌補了統(tǒng)計研究高成本、高誤差的劣勢,同時也重新定義了統(tǒng)計研究工作的含義,對傳統(tǒng)的統(tǒng)計研究工作提出了諸多的挑戰(zhàn)。但這并不意味著統(tǒng)計研究工作就此結束,反而使其可以在越來越多的領域得以應用,統(tǒng)計研究人員應及時認清大數(shù)據(jù)給統(tǒng)計研究工作帶來的潛力,在抽樣調(diào)查的工作思想、數(shù)據(jù)信息重新認識、數(shù)據(jù)對接與處理方式、數(shù)據(jù)關系分析重點、統(tǒng)計工作重心以及分析思維等方面進行轉(zhuǎn)變,依靠深厚的統(tǒng)計研究方法對大數(shù)據(jù)思想進行系統(tǒng)的理論、實踐研究,創(chuàng)造出迎合大數(shù)據(jù)的新統(tǒng)計方法,擴大統(tǒng)計研究工作應用領域,并且使統(tǒng)計學科得以延伸,提高了統(tǒng)計學科在自然科學和社會科學中的地位,這對統(tǒng)計研究工作者來說雖然是挑戰(zhàn),但更大的則是機遇。我們應該牢牢抓住大數(shù)據(jù)帶來的機遇,沉著冷靜的應對挑戰(zhàn),將大數(shù)據(jù)與統(tǒng)計研究有機地結合,使統(tǒng)計研究及統(tǒng)計學科更加適應現(xiàn)代社會發(fā)展需求。
作者:王舒 單位:中國人民大學
參考文獻:
[1]朱建平,章貴軍等.大數(shù)據(jù)時代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計研究,2014.2(31)10-17
[2]朱建平,張悅涵.大數(shù)據(jù)時代對傳統(tǒng)統(tǒng)計學變革的思考[J].統(tǒng)計研究,2016.2(33)3-9
[3]符一平.淺談統(tǒng)計學在大數(shù)據(jù)時代面臨的機遇、挑戰(zhàn)及其發(fā)展趨勢[J].教育教學究,2016.7(19)245-246
[4]張艷.大數(shù)據(jù)時代的統(tǒng)計研究[J],統(tǒng)計聚焦,2016(9)6-7
[5]GrobelinkM.Big-datacomputing:Creatingrevolutionarybreakthroughsincommerce,scienceandsociety[N/OL].Scientificdoc⁃umentsthatcitethefollowingpaper,2012.10(2).
[6]BrianHopkins,BorisEvelson.Expandyourdigitalhorizonwithbigdata[N/OL]Forrester,2011.9(30).
[7]劉念真.利用Oracle信息模型駕馭大數(shù)據(jù)[R],https://wenku.baidu.com.
[8]邱東.大數(shù)據(jù)時代對統(tǒng)計學的挑戰(zhàn)[J].統(tǒng)計研究,2014.1(31)16-22