消費數據論文:小議消費數據誤差與修正

時間:2022-02-19 03:15:52

導語:消費數據論文:小議消費數據誤差與修正一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

消費數據論文:小議消費數據誤差與修正

本文作者:王松付志剛工作單位:湖南商學院

中國居民消費數據的三個主要來源及特征

在當前的中國國民經濟核算體系中,居民消費率數據主要有三個來源,其具體推算方法和特征如下:第一個來源是根據支出法國內生產總值及其結構中相應的居民消費與GDP數據比例推算,簡稱為支出法(下同)。其核算方法用公式表示為:居民消費/支出法GDP。由于該方法中推算涉及的所有數據都來源于《中國統計年鑒》,數據獲取直接、來源權威,且保證了統計口徑一致,使其成為衡量宏觀居民消費率最常用的方法。在實際分析中,大量學者(李姝,2002;董輔祁,2004;何剛,2005;劉尚希,2008等)基于此得到的數據,給出了中國居民消費率偏低和存在下降趨勢的判斷。但一個不容忽視的事實是,該方法存在一些問題,如會受到國家統計核算體系調整等因素的影響。許憲春(2004)指出,統計核算的調整和完善會導致GDP和居民消費統計數據的變化,從而導致居民消費率的變化。第二個來源是根據31個省市自治區支出法GDP核算與結構數據的加總進行推算,簡稱為地區加總法。其核算方法用公式表示為:ΣCiΣGDPi,i=1,2,…,31其中,分別表示31個省市自治區,Ci表示各地區的居民消費,GDP表示各地區GDP1。該方法數據獲取沒有前一種方法那樣直接,不過還是比較容易獲取,而且數據的統計口徑一致,因此在宏觀層面數據難以直接獲取或存在誤差的情況下,不失為一個可行且有效的方法。如白重恩、錢震杰(2009)在推算勞動收入占比時,采用類似的方法進行分析,具體利用省際收入法GDP加總數據進行處理。但在分級核算體系下,該方法的準確性直接受到地區統計核算因素的影響。第三個來源是將微觀家計調查數據與宏觀支出法GDP數據結合起來進行推算。具體而言,是利用微觀家計調查得出的城鄉居民消費數據與各地區城鄉人口數據,通過加權推算出居民消費數據,然后與支出法GDP相比得出居民消費率,簡稱城鄉加權法。其核算方法用公式表示為:POPfarmCfarm+POPcityCcity支出法GDP,其中POPcity與POPfarm分別表示為城鄉人口數,Ccity與Cfarm分別表示對應城鄉家計調查的消費支出。該方法最為顯著的特點是有效減少了統計核算因素對數據的影響,但加權得到的居民消費的口徑比定義的小2,且加權的居民消費與支出法GDP的口徑存在不一致。在宏觀層面數據難以直接獲取或存在誤差的情況下,這種推算數據仍可以作為一個參考。如余永定、李軍(2001)推算中國城鎮居民可支配收入總額時,采用類似的方法,具體利用家計調查的城鎮居民家庭人均可支配收入的數據,然后乘以城鎮居民人口數而得到。根據以上三類方法得到的1978~2010年居民消費率變化趨勢如圖1。總體而言,以上三個來源各有優缺點(具體見表1)。就核算方法的特點而言,支出法和地區加總法數據獲取比較簡單,且統計口徑一致,是衡量宏觀居民消費率最常用的方法,但它們分別受到國家、地區統計核算因素的影響,尤其是考慮到我國統計核算體系正處于調整與完善的時期,這一影響是不容忽視的;而城鄉加權法受到統計核算等客觀因素的影響相對較小,但存在統計口徑不一致的問題,即居民消費的統計口徑與GDP核算數據的統計口徑不一致,很有可能導致居民消費被低估。就數據的狀態和變化趨勢而言,支出法與地區加總法的數據在20世紀80年代初和2006年以來的這段時期內基本一致,但其他大部分時間段內支出法的數據大于地區加總法數據,這是由于分級核算體系造成的。其中,80年代中期到20世紀90年代初期,兩者下降的幅度相差不大,從90年代中期到2010年各地區加總法下降幅度較小,而支出法下降幅度非常明顯。在整個時間段上,城鄉加權法的數據都小于支出法的數據,但兩者的變化趨勢很一致,即除2000年前后,兩者都保持著相對穩定的下降趨勢。三個指標的統計數據特征也有很大的區別,從均值水平上看,支出法為45.54%,大于地區加總法約2.7個百分點,大于城鄉加權法約3.6個百分點,從波動水平來看,支出法波動中等,方差為5.53,地區加總法波動最小,方差為5,城鄉加權法為6.1。可以看出,均值水平和方差上,三個數據都顯示了較大的差異。這充分表明,由于來源的不同,導致了三個數據的狀態和變化趨勢彼此存在差異。更為重要的是,這也進一步表明三個來源的居民消費率數據都存在不同程度的誤差。

數據修正模型

由以上分析可知,不同數據來源的居民消費率數據有著不同的狀態和變化趨勢,且都存在誤差,不能準確反映居民消費的實際情況。而實際的居民消費率是不可能直接觀測到的,因此如何修正以上數據,從而減少和消除誤差,使之更能精確反映真實的居民消費率,本文借助加權法和狀態空間模型進行分析。(一)加權法支出法和地區加總法盡管都存在誤差,但在一定程度上都反映了真實居民消費率的狀態和變化趨勢。基于此,本文引入Aruoba等(2011)分析GDP統計核算數據的加權法,構建一個組合的居民消費率,該數據的特征是其誤差比組合前的原始數據的誤差都要小,也就是說組合后的數據能夠更準確地反映真實居民消費率。考慮到口徑的一致性,本文選取支出法和地區加總法為基礎進行分析。具體模型構建如下:consc=λconse+(1-λ)consw+ut(1)其中consi,i=e,w,c分別對應支出法、地區加總法和加權法居民消費率(以下簡稱加權法),λ為權數,處于0與1之間。則(1)式表示加權法居民消費率為支出法和地區加總法的加權平均,故稱為加權法。當λ=1時,加權法等價支出法;當λ=0時,加權法等價地區加總法。因此,λ的選取成為此模型的關鍵,本文以測量誤差的方差最小的標準確定。首先,根據(1)式得到三個居民消費率與真實居民消費率的測量誤差關系為:ec=λee+(1-λ)ew(2)其中,ec=cons-consc,ee=cons-conse,ew=cons-consw,分別加權法、支出法和地區加總法與真實居民消費率的差,即測量誤差。cons為真實的居民消費率。(2)式顯示加權法的誤差為支出法和地區加總法誤差的加權平均。進一步令E(ec)=E(ew)=0。對(2)式左右兩邊求平方期望,可得:E(ec2)=λ2E(ec2)+(1-λ)2E(ew2)+2λ(1-λ)cov(ec,ew)(3)左邊即為組合消費與真實消費的均方誤差(即方差)。本文參考RyanGreenaway-McGrevy(2011)的做法,使(3)式達到最小(鑒于此,加權法也可稱為均方誤差最小法)。求極值可得最優λ為:λ*=σ2w-σewσ2e+σ2w-σ2w=σ2w-ρσwσeσ2e+σ2w-2ρσwσe。(4)其中,σ2i=E(ei2),i=e或w,σew=Cov(ee,ew),ρ=Corr(ee,ew)。最后,本文根據支出法和地區加總法數據計算σ2e=E(ee2)=2104.512、σ2w=E(ew2)=1860.881與ρ=0.922,此時可得最優的λ*=0.115。當λ*=0.115時,(1)式為consc=0.115conse+0.885consw,則通過此關系式得到加權法居民消費率的結果如圖2所示:(二)方法拓展:狀態空間模型以上加權法能夠有效減低統計核算數據帶來的誤差,但無法剔除統計核算體系等客觀因素的影響,其準確性仍存在問題。進一步,考慮到真實居民消費是一個不能被直接觀測到的指標,本文借鑒RyanGreenaway-McGrevy(2010)狀態空間模型分析GDP統計核算數據的方法,研究真實居民消費的狀態和變化趨勢。根據三個來源居民消費數據之間的關系,建立狀態空間模型。其量測方程為:const=rconst+ε1t(8)wconst=β1rconst+ε2t(9)其中,const、rconst及wconst分別表示支出法、真實居民消費與城鄉加權法居民消費,ε1t及ε2t表示觀測誤差,都具有獨立同分布性質,其方差分別為:σ21及σ22。從(8)、(9)式可以看出,狀態空間模型把真實的居民消費作為未知觀測變量,支出法與城鄉加權法為觀測值,觀測值受到統計核算因素的影響存在誤差。進一步,支出法核算的居民消費是對真實居民消費的觀測,故(8)式中回歸系數為1,考慮到由抽樣等因素造成的測量誤差,其含義表示支出法居民消費為真實居民消費與觀測誤差之和;(9)式中,考慮到支出法與加權居民消費存在很大的差異,且城鄉加權法核算的范圍小于真實居民消費核算的范圍,故量測方程(9)中包含一個回歸系數β1。另一方面,還需要對隨機干擾項與的關系進行設定。考慮到加權法與支出法居民消費是按兩種不同方式進行核算,且加權法居民消費不受統計核算調整的影響,故可令兩者的誤差項不具有相關性,即cov(ε1t,ε2t)=0。完整的狀態空間模型還需要包括狀態方程。一般而言,狀態方程是一個可包含外生變量的滯后回歸模型。本文認為未知觀測量即真實居民消費為帶有截距和趨勢項的時間序列過程過程,故可建立如下狀態方程:rconst=β0+β2t+rconst-1+vt(10)其中β2,β1表示未知參數,t為時間趨勢項,Vt表示隨機干擾項,具有獨立同分布性質,其方差為σ23,且與上述隨機干擾項ε1t及ε2t不相關。本文利用1978~2010年的數據對(8)、(9)、(10)組成的狀態空間模型進行估計。其中城鄉加權法居民消費數據來源于中經網數據庫和國研網數據庫,支出法居民消費數據來源于《中國統計年鑒2011》。估計的方法為卡爾曼濾波法。運用eviews7.0軟件,輸入下列關系式:@signalcons=sv1+[var=exp(c(1))]@signalwcons=c(2)*sv1+[var=exp(c(3))]@statesv1=c(4)+c(5)*@trend+sv1(-1)+[var=exp(c(6))]其中@signal表示信號方程,sv1為狀態變量,即未知真實居民消費,var為相應干擾項方差,其等號后面表示方差的形式;@state為狀態方程,@trend為趨勢項。根據以上輸入,得到的結果見表2。其中,列(1)顯示c(4)及c(5)系數不顯著,故考慮刪除截距項或趨勢項,其結果見列(2)、(3)。進一步,假設加權居民消費與真實居民消費差異不大,即令c(2)=1。得到的結果見列(4)。為了判斷哪個結果較優,還需要對以上模型結果進行檢驗。從列(1)、(2)、(3)發現,c(2)系數接近于0,因此需要檢驗c(2)=0是否成立。利用Wald檢驗,結果都顯示拒絕其為0的假設,因此認為c(2)不等于0。進一步,對列(4)中假定c(2)=1進行檢驗,同理,結果認為在1%的顯著水平上拒絕其為1的假設。故認為列(3)為較優的結果因此本文根據列(3)的估計結果,選擇平滑方法4對真實居民消費進行估計,估算結果再除以支出法GDP得到居民消費率。此時的居民消費率稱為濾波后的居民消費率(簡稱濾波法),結合其他兩個居民消費率的數據,結果見圖3。圖3顯示,2000~2010年濾波法的居民消費率下降了10.21個百分點,支出法的居民消費率下降12.63個百分點,前者比后者下降幅度少了2.43個百分點。這充分說明,2000年以來支出法居民消費率夸大了的下降幅度和趨勢。(三)綜合修正模型的構建以上分析顯示,利用加權法和狀態空間模型進行處理,結果都是從不同方面接近真實的居民消費率。其中加權法是把原來兩組存在誤差的數據組合,得到更能有效反映真實情況的數據,但仍會受到統計核算體系等實際因素得到影響;狀態空間模型是將真實居民消費率當作未知觀測量,構建模型對未知觀測量進行預測或估計,不斷逼近真實值,而且能有效減小實際因素的影響。基于此,為能結合兩者方法的優點,并保證修正后數據的更具有穩健性,本文建立以下模型:rconst=λ0+λ1consct+ut。其中rconst表示狀態空間模型得到的居民消費率,是對真實居民消費率的觀測,有效減少的某些實際因素的影響,但無法完全剔除所有影響,因此還存在著隨機的波動;consct表示加權法的居民消費率,由于加權法使結果的方差最小,因此有效剔除大多數隨機干擾因素的影響,但可能受到其他趨勢性因素的影響,在此用λ0表示;λ0、λ1都為待估參數;ut為隨機干擾項。利用加權法和狀態空間模型所得的結果,本文首先對數據進行單位根檢驗,發現加權法居民消費率和狀態空間模型居民消費率并不存在單位根,因此,可以進行以下線性回歸分析,得到的結果為:rconst=-1.639+1.073consct(11)std(1.926)(0.044)***R2=0.949,其中“***”表示在1%的水平上顯著,下同。其中括號內的數據為標準差,模型的擬合優度為0.949,但(11)的回歸結果中,常數項λ0的結果不顯著,因此剔除常數項λ0,得到的結果如下:rconst=1.036consct(12)std(0.039)***R2=0.949擬合優度為0.949,λ1系數在0.01的顯著性水平成立。因此利用(12)式對居民消費率進行估計,得到的結果簡稱為回歸法如圖4所示。圖41978~2010年不同來源的居民消費率進一步,本文對三個方法修正的居民消費率統計特征進行比較,詳見表3。結果顯示,在均值、方差和下降幅度三個方面,三個居民消費率存在差異。從數值上看,回歸法的結果位于濾波法和加權法之間。具體而言,回歸法的方差(27.08)比濾波法(30.59)低3.51,這在一定程度上降低了濾波法結果的波動性;回歸法的均值(44.71)比加權法(43.71)高1個百分點,從而減少了某些實際因素的影響。由此可見,回歸法綜合了濾波法和加權法的優點,更有效的反映真實居民消費率的狀態和變化趨勢。

結論與研究展望

本文指出中國居民消費的核算數據主要存在三個來源,即支出法、城鄉加權法與地區加總法。通過以上數據來源及其特征的分析,筆者認為在中國統計核算體系經歷調整和完善的過程中,由于受到了統計核算體系、統計口徑和調查方法等客觀因素的影響,三個來源的數據都存在誤差,都僅是對實際情況某種程度的反映。數據顯示不同來源的居民消費率表現出不同的狀態和變化趨勢,且差異較大。考慮到實際居民消費率的未知性,本文引入加權法和狀態空間模型對以上三個來源推算出的數據進行處理。結果表明兩種方法各有優劣,其中,加權法能有效減小統計核算數據的誤差,狀態空間模型能消除部分客觀因素對數據的影響,但兩種方法得出的結果準確性還是存在問題。為能結合兩種方法的優點,并保證修正后數據的穩健性,本文綜合兩種方法構建了綜合修正模型(回歸法)對中國居民消費率數據進行修正。修正后的數據對比修正前的數據,一方面準確性得到提高,即誤差更小,受客觀因素的影響更少;另一方面顯示出的變化趨勢也不一樣,即修正后的居民消費率顯示出的下降趨勢并沒有修正前數據顯示的那么快,這表明如果基于修正前的數據來判斷變化趨勢,會夸大下降的程度。綜上可知,修正后的數據比修正前的數據更逼近真實居民消費率,由此為研究中國居民消費問題提供了更為有效的數據支撐。當然,本文還存在進一步改進的空間。其一,支出法、城鄉加權推算法與地區加總推算法在哪些方面未能準確反映真實居民消費率的變化,以及與此相關的典型化事實的挖掘,都有待進一步的分析;其二,中國國民經濟統計核算體系不斷調整和完善,很有可能給統計核算數據帶來系統性影響,這也是本文未能深入探討的,有待于今后深入研究;其三,在處理方法上,未能構建更為有效、完整的修正模型來綜合處理統計數據,這是下一步研究需要重點改進的方面。