社會統(tǒng)計數(shù)據(jù)均勻指數(shù)分析

時間:2022-09-09 05:26:51

導(dǎo)語:社會統(tǒng)計數(shù)據(jù)均勻指數(shù)分析一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

社會統(tǒng)計數(shù)據(jù)均勻指數(shù)分析

影響經(jīng)濟社會統(tǒng)計數(shù)據(jù)空間真實性的要素包括算法、區(qū)域內(nèi)部差異、統(tǒng)計單元規(guī)模大小、統(tǒng)計指標的空間展布規(guī)律、統(tǒng)計指標的空間規(guī)模、統(tǒng)計指標的時間存在特征、統(tǒng)計指標在經(jīng)濟社會構(gòu)成中的重要程度等多個方面。經(jīng)濟社會統(tǒng)計數(shù)據(jù)表達對象的各種特征對于數(shù)據(jù)表達的區(qū)域內(nèi)部真實性有一定的影響。顯然地,以省級行政區(qū)域為統(tǒng)計單元,我國東部省區(qū)和西部省區(qū)區(qū)域內(nèi)部差異程度有很大不同,在軟件工具的支持下計算現(xiàn)有以行政單元為對象的統(tǒng)計數(shù)據(jù)所表現(xiàn)的區(qū)域平均狀況,為相應(yīng)的應(yīng)用提供數(shù)據(jù)空間均勻程度支持。

1經(jīng)濟社會統(tǒng)計數(shù)據(jù)的空間化

以空間分析為手段,將總量數(shù)據(jù)離散到空間區(qū)域上已有很多應(yīng)用[1-3],以行政區(qū)域為單元的統(tǒng)計數(shù)據(jù)分散到更接近真實情況的自然或經(jīng)濟區(qū)域上的做法也有一些嘗試[4],特別是對于區(qū)域面積很大,且內(nèi)部特征差異十分明顯的區(qū)域做這樣的工作更有實際意義。將社會經(jīng)濟信息進行空間化處理是根據(jù)經(jīng)濟對象空間分布特征、影響經(jīng)濟對象分布的自然和社會經(jīng)濟要素分布,將一定空間單元上的對應(yīng)信息轉(zhuǎn)化成1km×1km柵格數(shù)據(jù)(或其他空間大小的單元,如500m×500m等),每個柵格上的值則表示在1km2內(nèi)的平均狀況。

1.1經(jīng)濟社會統(tǒng)計數(shù)據(jù)空間離散化通用方法

經(jīng)濟社會統(tǒng)計數(shù)據(jù)對應(yīng)的社會經(jīng)濟指標在空間的分布和變化受多種因素的影響,這些因素就是該經(jīng)濟社會統(tǒng)計指標的影響因素,區(qū)域經(jīng)濟社會統(tǒng)計數(shù)據(jù)在空間上分布的計算(離散化),必須考慮該指標影響因素的空間分布情況,及其對該指標的空間作用方式,才能將該經(jīng)濟社會指標總量數(shù)據(jù)“分配”到區(qū)域內(nèi)不同的空間上[5]。經(jīng)濟社會統(tǒng)計空間離散化處理的基本方法是,對于某個經(jīng)濟社會統(tǒng)計指標,首先計算其每一種影響因子對該經(jīng)濟社會指標的影響數(shù)值,該計算需要依賴地理信息系統(tǒng)軟件工具實現(xiàn),以ARCGIS軟件為例,其計算方法是利用GRID下的ZONALSTATS函數(shù)進行SUM統(tǒng)計,對于增長百分比性質(zhì)的參數(shù)計算,采用平均值統(tǒng)計方法,公式(1)有:TEMPINFO1=ZONALSTATS(ADMGRD,ELEGRD)。其中:ADMGRD為ZONALGRID;ELEGRD為影響要素。公式(2)有:TEMPINFO2=ZONALSTATS(ADMGRD,STATGRD)。其中:ADMGRD為ZONAL-GRID;STATGRD為被統(tǒng)計對象。這樣可以逐個計算得到影響要素在每個行政單元內(nèi)的總分值、社會經(jīng)濟要素的總量。將TEMPINFO1,TEMPINFO2合并到一起,并用經(jīng)濟要素總量除以總分值,即可得到每個分值所代表的經(jīng)濟總量,并將該值添加到TEMPINFO1的一個屬性項SCORE中;將TEMPIN-FO1與行政區(qū)劃ADM屬性表連接,將SCORE項轉(zhuǎn)換成GRID數(shù)據(jù),結(jié)果為SCOREGRD;用SCOREGRD乘以要處理的社會經(jīng)濟要素數(shù)據(jù)STATGRD,即可得到處理離散過社會經(jīng)濟指標數(shù)據(jù)STATGRD。實際計算中沒有必要就每一種區(qū)域自然及社會經(jīng)濟條件對社會經(jīng)濟要素空間展布的影響分析,可以建立一種模型對某一種社會經(jīng)濟要素的所有影響因子及基礎(chǔ)條件進行統(tǒng)計計算其影響力,模型為公式(3):AGRD=Vi×EiGRD。其中:Vi為第i種影響因子的權(quán)重值,其所有值的和為1;EiGRD為第i種影響因子對該社會經(jīng)濟要素的影響分值GRID。

1.2人口數(shù)據(jù)空間離散化

我國人口的空間分布是若干年來經(jīng)濟社會與自然相互作用的結(jié)果,其基本格局是西疏東密,但東南部地區(qū)密中有疏,西北部地區(qū)疏中有密[6]。根據(jù)全國人口統(tǒng)計實際狀況,人口空間分布數(shù)據(jù)的計算以縣級行政單元人口數(shù)據(jù)為基礎(chǔ),考慮人口空間分布的各種影響因素,特別是與產(chǎn)業(yè)結(jié)構(gòu)的空間分布有很大關(guān)聯(lián)度[7]。在人口離散化計算中,首先計算城鎮(zhèn)人口空間分布,然后計算農(nóng)村人口空間分布,兩之合即總?cè)丝诘目臻g分布。

1.2.1城鎮(zhèn)人口的空間離散模型。雖然在城鎮(zhèn)內(nèi)部人口的分布存在一定差異,全國范圍內(nèi)城鎮(zhèn)分布在空間上有很大的差別[8],但在全國尺度上,城鎮(zhèn)人口在城鎮(zhèn)斑塊上的分布可以視作是均勻的,因此城鎮(zhèn)人口的空間離散化可以將城鎮(zhèn)人口按照城鎮(zhèn)斑塊面積平攤,在全國尺度上具有一定可信任性。全國城鎮(zhèn)人口的離散化處理是以每個縣級行政區(qū)為單元計算的,然后進行匯總,形成全國的城鎮(zhèn)人口分布數(shù)據(jù),對于任意一縣級行政單元來說,該縣級行政單元城鎮(zhèn)用地地塊中的任意柵格i,其上分布的人口(即城鎮(zhèn)人口,以2000年為例)可以表示CTPOP_2000i=CTPOP_2000×Si∑ni=1Si。(4)式中:CTPOP_2000i是2000年該縣級行政單元城鎮(zhèn)用地地塊柵格i上的人口;CTPOP_2000i為該縣的城鎮(zhèn)人口總量;Si為柵格i的面積,該縣級行政單元共有n個城鎮(zhèn)用地地塊柵格;∑ni=1Si即為該縣城鎮(zhèn)用地面積。

1.2.2農(nóng)村人口的空間離散模型。由于自然及社會經(jīng)濟條件的差異,在全國尺度上,農(nóng)村人口空間分布具有極大的不均勻性;農(nóng)村人口的分布依賴于土地利用類型、居民點分布、距交通線遠近、自然資源的分布情況等多種自然地理要素和人文地理要素的空間分布;為此,在縣級行政單元尺度上,為實現(xiàn)盡可能接近農(nóng)村人口分布的實際需要,采用加權(quán)多因子影響力距離衰減模型。加權(quán)多因子影響力距離衰減模型中,首先單獨考慮模擬各種影響因子對人口的影響,而后對各種因子影響力的相對大小進行模擬,并以線性疊加的方式將各種影響因子的影響力綜合起來。由于數(shù)據(jù)的限制,這里主要考慮了城鎮(zhèn)居民點和農(nóng)村居民點中心的吸引作用、農(nóng)村居民點斑塊的限制作用,土地利用/覆蓋類型的影響作用。對于任意一縣級行政單元來說,該縣級行政單元農(nóng)村用地地塊中的任意柵格i(以2000年為例),加權(quán)多因子綜合影響力可以表示為W_2000i=∑mj=1∑ni=1K_2000j×Dij。(5)式中:W_2000i為2000年柵格i上加權(quán)多因子綜合影響力;i為柵格序號,該縣級行政單元內(nèi)共有n個農(nóng)村用地地塊柵格;j為因子編號,該模型中共考慮m個因子;K_2000j為第j個因子在整個模型影響力的權(quán)重值;Dij為j因子在柵格i上的影響力。在得到各柵格點的影響力的總和值W_2000i之后,可以將W_2000i視作面積調(diào)整系數(shù),與城鎮(zhèn)人口空間離散模型相仿,可建立下面的數(shù)學(xué)模型進行農(nóng)村人口的空間離散。得:COPOP_2000i=COPOP_2000×W_2000i×Si∑ni=1W_2000i×Si。(6)式中:COPOP_2000i是2000年某縣級行政單元農(nóng)村用地地塊柵格i上的人口;COPOP_2000是該縣級行政單元的農(nóng)村人口總量;Si為柵格面積,W_2000i為2000年的加權(quán)多因子綜合影響力,也即柵格i上的人口(農(nóng)村人口)調(diào)整系數(shù)。

1.2.3總?cè)丝诘目臻g分布模型。將城鎮(zhèn)人口空間分布數(shù)據(jù)和農(nóng)村人口空間分布數(shù)據(jù)進行疊加,即可形成表征總?cè)丝诳臻g分布數(shù)據(jù)。數(shù)學(xué)模型表示為TPOP_2000i=CTPOP_2000i+COPOP_2000i。(7)式(7)中:TPOP_2000i為任意柵格i處的人口;CTPOP_2000i為柵格i處的城鎮(zhèn)人口;COPOP_2000i為柵格i處的農(nóng)村人口數(shù);i為柵格序號。

2經(jīng)濟社會統(tǒng)計數(shù)據(jù)空間均勻度計算

行政區(qū)域有若干級別,考慮到在諸多研究中大量使用以省級行政單元為對象的經(jīng)濟社會統(tǒng)計數(shù)據(jù),為便于研究,這里以省級行政區(qū)域單元為對象計算區(qū)域GDP、人口、產(chǎn)業(yè)增加值等空間均衡性,各指標值的空間均衡性以均勻指數(shù)表達。表達均勻程度有很多種方法,這里用自相關(guān)指數(shù)(ARCGIS中的MORAN指數(shù))來表示。MORAN指數(shù)是一種空間自相關(guān)描述方式,可以用于描述地理實體在空間的分布關(guān)系,可以用于發(fā)現(xiàn)和解釋物體在空間分布的原因,在模擬空間現(xiàn)象時可以確定空間臨近程度,該指數(shù)的使用有助于提高傳統(tǒng)統(tǒng)計方法分析能力。MORAN指數(shù)的計算為公式(8)C=∑∑WijCij/(∑∑Wij)[∑∑(Zi-Zm)2/n]。其中:C表示MORAN指數(shù);∑∑Wij=4×n;n表示GRID中格網(wǎng)的總數(shù),NROW×NCOLS;i,j指任意兩個相臨的格網(wǎng);Zi格網(wǎng)i的屬性值;Cij是格網(wǎng)i,j屬性的相似性(Zi-Zm)×(Zj-Zm);Wij是格網(wǎng)i,j位置的相似性,如果格網(wǎng)i,j直接相臨(4個方向上),則Wij=1,否則Wij=0。該模型算法中采樣變量σ2采用(∑Zi-Zm)2/n公式計算,其中Zm是GRID數(shù)據(jù)的格網(wǎng)平均值,其計算是根據(jù)空間位置及屬性的相似性進行的。對于計算結(jié)果,有3種值可能出現(xiàn):C>0,表示空間上屬性相似,具有一定的區(qū)域性,屬性值在空間具有一定的平滑性;C=0,表示空間上相對獨立,空間上沒有關(guān)聯(lián)性,基本上是隨機出現(xiàn);C<0,表示完全不相同,具有相鄰空間區(qū)域上的屬性反差很大。借助于軟件工具,基于已空間化的經(jīng)濟社會各指標數(shù)據(jù),可以計算每一省級行政單元上任何指標的MO-RAN指數(shù)。社會經(jīng)濟統(tǒng)計各指標空間均勻指數(shù)計算過程:首先,對于某一社會經(jīng)濟要素及每一個省級行政單元,從對應(yīng)社會經(jīng)濟要素的全國1km×1km柵格數(shù)據(jù)中將各省級行政單元數(shù)據(jù)提取出來;第二,在軟件工具支持下,計算每個省級行政單元的空間自相關(guān)指數(shù)MORAN指數(shù);第三,均勻指數(shù)計算,將MORAN指數(shù)值最小的省級行政單元的值設(shè)為1,MORAN指數(shù)值最大的省級行政單元的值設(shè)為100,其他省級行政單元的均勻指數(shù)利用公式(9)進行計算:EQi=(MORANi-MORANmin)/MORANz×99+1。其中:EQ為均勻指數(shù);i為第i個省級行政單元;MORANi為第i個省級行政單元的MORAN指數(shù);MORANmin為所有省級行政單元中MORAN指數(shù)最小值;MORANz為所有省級行政單元中MORAN指數(shù)最大值與最小值的差值。

3經(jīng)濟社會統(tǒng)計數(shù)據(jù)空間均勻度分析

基于上述算法,分別計算2000年以省區(qū)為統(tǒng)計單元的社會經(jīng)濟指標GDP,第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)增加值及其他指標空間均衡情況,發(fā)現(xiàn)不同的經(jīng)濟社會指標在相同區(qū)域的均衡性有很大的差異。三次產(chǎn)業(yè)結(jié)構(gòu)的空間上的差異受市場空間分布、區(qū)域經(jīng)濟發(fā)展階段和發(fā)展水平等多種因素影響[9]。在三次產(chǎn)業(yè)增加值計算的過程中,發(fā)現(xiàn)在省級行政區(qū)交接地帶,既有產(chǎn)業(yè)結(jié)構(gòu)明顯差異的一面,也有經(jīng)濟合作的烙印[10]。表1是我國2000年度GDP各指標在省級行政單元上的均勻程度。對于GDP總量,就全國而言,其均勻指數(shù)為60.8;就各省區(qū)而言,均勻性最好的是北京市,其次是天津和上海;均勻指數(shù)最低的是西藏,其次是青海、貴州,這說明在各直轄市內(nèi)區(qū)域內(nèi)部的差異相對較小,而在經(jīng)濟欠發(fā)達的西部地區(qū),GDP總量在空間分布極不均勻。對于第一產(chǎn)業(yè),均勻指數(shù)最高的是西藏,其次是青海,其主要原因是這些地區(qū)農(nóng)業(yè)相對較為落后,以畜牧業(yè)為主,由于普遍增加值較低,相對比較均勻;均勻指數(shù)較低的是上海、天津,這些區(qū)域農(nóng)業(yè)增加值比重相對較低,且主要分布在城市邊緣地區(qū),整體的空間均勻性較差。對于第二產(chǎn)業(yè),均勻指數(shù)最高的是北京,其次是黑龍江、上海、天津,由于第二產(chǎn)業(yè)主要集中在城市和城鎮(zhèn)區(qū)域,所以在直轄市及工業(yè)基礎(chǔ)較好的區(qū)域,均勻性較好;均勻性比較差的區(qū)域是西藏、青海。對于第三產(chǎn)業(yè),均勻性較好的是北京、天津、上海,這些區(qū)域的第三產(chǎn)業(yè)基礎(chǔ)較好,分布較為均勻,均勻性比較差的區(qū)域是廣東、西藏、云南等;廣東不均勻的原因主要是珠江三角洲地區(qū)與北部、西部山區(qū)地區(qū)的差異過大造成的,而西藏、云南等地則是人口、城鎮(zhèn)相對集中造成的。

4結(jié)論與討論

從我國以省級行政單元為對象的經(jīng)濟社會指標分析數(shù)據(jù)表達的平均程度發(fā)現(xiàn),我國目前使用的經(jīng)濟社會統(tǒng)計最主要的問題是以大行政區(qū)域為空間單元的統(tǒng)計數(shù)據(jù)掩蓋了區(qū)域內(nèi)部的差異和不均衡[11]。本研究方法本身有一定的不完整性,但定量化、空間化的嘗試本身則是值得肯定的。這種方法主要基于以下幾個方面的考慮:經(jīng)濟社會統(tǒng)計對象的空間分布越是不均勻,統(tǒng)計數(shù)據(jù)的區(qū)域平均的真實性越差;統(tǒng)計對象的空間分布規(guī)律可以在一定程度上被模擬;統(tǒng)計對象的區(qū)域內(nèi)部不均衡性可以量測,可以用統(tǒng)計區(qū)域內(nèi)部所有空間樣本中不同值域段樣本數(shù)占總樣本的比例表示;該方法通過分析統(tǒng)計數(shù)據(jù)隱含的不確定性,使政策措施決策者在以經(jīng)濟社會統(tǒng)計數(shù)據(jù)為依據(jù)制定相應(yīng)的政策措施時,充分考慮統(tǒng)計數(shù)據(jù)所掩蓋下的區(qū)域差異和區(qū)域內(nèi)部差異。