人口與計劃生育認識論文
時間:2022-12-25 09:26:00
導語:人口與計劃生育認識論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
1個案與群體
〔實例1〕某調查報告稱,某村2001年出生嬰兒10人,其中男嬰6人,女嬰4人,出生性別比高達150,嚴重失調。
〔實例2〕某鄉給某村下達人口計劃,其中一項指標是計劃生育率,要求當年的計劃生育率不低于95%,而該村一般每年出生不足20人。
〔實例3]某地計生委根據群眾舉報,查出某縣一個超生5胎的情況,據此稱該縣超生問題嚴重。
〔實例4〕某縣總人口不足50萬人,近年來在孕婦中推廣服用“福施福”。上級要求檢查服用“福施福”后,人口缺陷發生率是否逐年下降。還有不少地方把孕產婦死亡率是否逐年下降當作生殖健康服務工作的考核內容。
這幾個例子所出現的問題都是以個案或少量發生的情況,說明一個地方宏觀的情況。人口和計劃生育統計所分析的對象(人口)或事例具有群體性,這個群體是由每個個體的人或事件集合而成。每個個體是否發現這種現象是偶然的,作為表現群體規律的統計數據,只有當群體具有相當的規模后才有意義。群體的規模太小,盡管對每個個體的統計是準確的,指標的計算也是正確的,但計算結果并不能客觀地反映群體的規律。
如實例1,一個村的出生人數僅為10人,計算的出生性別比要么是100(“絕對平衡”),要么就是男女比例嚴重失調。實例2中計劃生育率受出生總數的影響,要么計生率正好100%,只要有一個計劃外出生,計劃生育率就低于95%。例4涉及的出生缺陷發生率或孕產婦死亡率一般統計時均以10萬作為分母,對于一個縣,每年出生幾千人或1萬多人,即使按照出生缺陷、孕產婦死亡發生的平均水平,每年也只有幾例,偶然性很大,在統計數據上很難表現為逐年下降。至于例3,以一個特例說明全縣的情況,更是欠妥。各種人口和計劃生育統計教材上并未說明各項統計指標適用的人群至少要達到多少,但一般說來這些統計指標絕大部分不能用于分析規模在幾百人到一千多人的村級情況,許多指標在縣、鄉級使用也不太合適。多年來各級是通過報表收集人口和計劃生育統計數據。報表由上級制發,基層單位按統一的口徑填報每個項目,然后逐級匯總、上報。這樣以來,上、下級的報表式樣相同,只是數量大小有差別,于是,上級單位計算哪些指標,下級單位“照葫蘆畫瓢”計算相同指標。特別是實行人口與計劃生育目標管理責任制后,各項工作任務和責任要逐級分解、落實,相應地,工作指標也被層層分解,上一級控制的指標(如出生率、計劃生育率)也被一直套用到基層單位。在這種情況下,群體性的要求很容易被忽視。
2自然屬性與社會屬性
〔實例5〕1995年8月,在全國上半年人口形勢分析會上,某省計生委分析本省當年上半年二孩出生數量比上一年同期減少的原因時稱,由于自當年起全省廣泛推行“三結合”,許多群眾為了發家致富,主動退出二孩指標,于是二孩出生明顯減少。筆者的同事立即對此理由提出了置疑:既然是主動退出二孩指標導致二孩出生減少,那么原來應在1995年上半年生育二孩的婦女至少在1994年上半年就應退出二孩指標,而那時候,該省并未開展計劃生育“三結合”;至于1995年上半年開展“三結合”后退出的二孩指標,其二孩出生減少的效果應在1996年以后才能表現出來。群眾退出二孩指標與二孩出生數量的減少在時間上出現了“矛盾”。
〔實例6〕許多文章分析婦女受教育程度越高,生育的孩子越少。
這兩個例子說明分析人口出生數量的變化應考慮人口的自然屬性和社會屬性。人口首先是生物意義上的人口,具有自然屬性,同時,人口生活、存在于一定的社會環境中,具有社會屬性。人口現象的發生既受自然屬性的影響,也受社會屬性的影響。從根本上說,社會屬性對人口現象的影響和制約是有條件的、間接的。而自然屬性的影響和制約是無條件的、直接的。社會屬性的影響和制約常常要通過自然屬性來實現。在分析人口現象的時候,首先要解釋人口的自然屬性,然后再解釋社會屬性。就實例5而言,從婦女退出二孩指標到二孩出生減少,至少間隔10個月,即婦女的懷孕期,無論推行“三結合”力度多大,婦女10個月的懷孕期不能縮短。退指標的發生與出生數的減少在時間上不“同步”,至少要“滯后”一年。也就是說,1995年上半年因開展“三結合”婦女退出二孩生育指標不會影響這個時期的二孩出生數量。關于實例6,一個人的受教育程度屬于社會屬性,婦女受教育水平提高,的確會影響其生育行為。然而,影響生育的自然因素,直接因素是避孕節育行為,具體地說,影響生育的生物因素包括推遲結婚(不發生性行為)、采取避孕措施和流產(終止妊娠)。婦女文化程度影響到上述生物因素發生變化(如文化程度高,能夠更好地掌握避孕知識,可以提高避孕的有效性,減少懷孕的可能),并通過上述因素影響生育孩子的數量。直接講文化程度與孩子數量的關系,未免有些牽強。
3定量與定性
〔實例7〕各地每年都要分析當年的人口形勢,將當年的數據與上一年的數據進行對比。許多分析報告在列舉了對比數據后得出結論:“今年的工作比上一年有明顯的進步,取得了巨大的成績,上了一個新臺階”。但如果我們仔細察看各項指標的數量,發現變化并不大,如計劃生育率由88.5%上升到89%,出生率由15.4‰下降為14.9‰(這其中由于人口年齡結構的變化也能導致出生率下降),多孩出生由165人減少為149人,多孩率由2.2%下降為2%等等。根據這些數據的變化,得出的定性結論應當是:“工作穩步發展,人口增長保持平穩的態勢”。人口和計劃生育的統計分析主要是指對數據的分析,并由“定量”的描述引申到定性的判斷。如果忽視定性的分析,那么,所謂定量分析不過是數量變化的文字描述而已。把握好定性分析的關鍵在于,定性分析應以定量分析為基礎,即“定量”在前,“定性”在后。那種先“定性”,再計算數量變化的做法,違背了“定量”與“定性”的基本規律。這樣進行的定量分析,只是給定性的結論加一些數量的點綴。
4模糊和精確
〔實例8〕某地區的一份材料稱,根據20年來每年總和生育率的變化,推算本地區20年來少生了1831275人。
〔實例9〕某縣計生委利用農村趕集日人口比較集中的機會,出動服務車,設置咨詢臺,向群眾宣傳計劃生育知識,提供咨詢服務。縣計生委的匯報材料稱,“一個月來在集日上接受宣傳、咨詢的群眾累計達到127328人次”。
乍一看,實例8和實例9中的人數和人次數的統計和計算十分認真仔細,數字如此精確,令人欽佩。但轉念一想,不免生疑:實例8中利用總和生育率計算少生人口,需要以年齡別生育率與分年齡婦女人數相乘計算出生人數,一般來看,每個年齡組的計算結果都不會是整數,只好四舍五入。每一年若干個年齡組累計下來,個位數已經含糊不清了。再把20年的少生人數累計起來,怎么可能精確到個位數呢?況且20年間,該地區的人口并非處于“封閉狀態”,各年齡組人數因為人口遷移而變化,也會影響到計算少生的數量。至于實例9,在一個開放的、人們頻繁走動的集市上,如何判定哪個人接受了宣傳,哪個人接受了咨詢,并沒有一個客觀的標準;即使有標準,實際操作中也很難把握,因此,根本沒有可能逐人統計。實例8、實例9中看似精確的數據令人感到滑稽,倒不如模糊一些,說“20年大約少生了18萬人”,“一個月在集市上接受了計劃生育宣傳、咨詢服務的人次達10余萬”,或許有幾分可信。從某種意義上講,人口和計劃生育所涉及的是宏觀層面的事情,與此相應的統計數據所反映的是大致的狀態或趨勢,沒有必要也沒有可能做到精確。許多同志在應用統計方法時,往往注意的是方法本身的定義和計算過程,而對計算中數據的來源不了解。人口和計劃生育統計屬于社會經濟統計范疇,很多數據是通過抽樣調查獲得,允許有一定的誤差;即使是全面的調查(如人口普查、全局報表),在實施過程中,也會遇到這樣、那樣的干擾或影響,存在著調查誤差,這是無法完全避免的。從某種意義上講,數據存在一定的誤差,這是人口和計劃生育統計的特點之一。
5原因與結果
〔實例10〕最典型的例子莫過于“人口出生率每降低1個千分點,人均GDP提高多少個百分點”的說法。這種說法的依據是利用相關分析法對全國各省的人口出生率和人均GDP的數量變化進行計算,得出二者之間的函數關系式和相關系數。把人口出生率作為自變量,看自變量的單位變化影響因變量(人均GDP)變化的數量大小。
在這個例子中相關分析法本身以及有關的數據都是正確的,然而,用這樣一個函數式來解釋人口增長與經濟增長的相互關系是有問題的。其一,就統計方法來說,相關分析只反映變量之間的相關關系,而不說明因果關系;其二,人口增長與經濟增長固然相互影響,但從本質上來說,是經濟發展影響人們的思想,進而影響人們的生育行為,最終導致生育率下降,人口增長率降低,即經濟增長是“因”,而人口增長是“果”。顛倒了因果關系,不僅邏輯上講不通,數量上的“相關性”也失去了意義。
筆者在多年的工作中體會到,由于人口和計劃生育所具有的特點,人口和計劃生育統計分析方法的應用和統計數據的解釋有別于其它部門和領域對于統計的一般要求。正確地應用統計分析有助于我們認識人口和計劃生育的特點和規律,只有科學地認識和把握人口和計劃生育的特點和規律,才能避免在統計分析中陷入誤區。
社會科學實證研究中的統計分析方法應用
鄭真真(北京大學人口研究所副教授)
統計學的應用隨著微型計算機的普及越來越廣泛,在社會科學實證研究中幾乎是無處不在。有了一定規模的數據和一個統計分析軟件,就可以很方便地進行各種估算和分析。然而由于統計分析方法本身并不像加減乘除那樣簡單,而一些統計分析軟件已經發展到幾乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情況下操作并得到結果,可能出現對統計分析方法誤用或濫用的現象。本文僅對一些統計分析中比較常見的問題進行討論,以引起各方面的重視。
1描述性統計
描述性統計是社會科學實證研究中最常用的方法。準確、全面、正確的描述是所有實證分析的基礎,如果對某個事件或某種現象的描述不清楚或存在偏差,那么其后的所有分析都將是值得懷疑的。一項研究能夠將所研究的現象或對象描述清楚,就是一個極大的貢獻;而描述的偏差可能會引起公眾或學術界對某些社會現象的誤解,甚至誤導政府決策。但是因為描述性統計所用方法簡單易得,往往沒有得到足夠的重視。
均值的局限普遍用于描述樣本集中趨勢的測量之一是均值。它對于近似正態的對稱分布樣本來說是比較好的測量,對于不對稱分布則不然,尤其會受到極端值的影響。兩個分布完全不同的樣本可能會有相同的均值,因此均值在某種程度上抹殺了樣本內部的差異,而往往這種內部差異正是需要我們進行深入研究的、或應當引起人們注意的。為了彌補均值的這個缺陷,一般在報告均值的同時也報告方差,或用直方圖/散點圖的形式描述分布,以提請讀者注意群體內部的差異。
不同群體的可比性在描述性統計中,往往涉及到對不同時期或不同人群的總體描述,以反映社會變化或地區差異。在社會科學中、尤其是人口研究中,不少事件的發生都是與年齡密切相關的,如我國婦女大部分在35歲以前完成了生育,從而導致35歲以上育齡婦女中極高的避孕現用率。在這種情況下,兩個樣本之間存在避孕現用率的差異可能只是年齡結構的差異,而不是年齡別避孕現用率的差異。又如在報告流動人口犯罪問題時,給人的印象往往是流動人口犯罪率高于常住人口,但忽視了流動人口的年齡和性別構成與常住人口完全不同,且青年男性是犯罪率較高的人群。這種對兩個不同群體的比較往往會導致錯誤的結論。
絕對數的使用由于中國人口數量巨大,調查研究也比較容易得到大容量的樣本,所以對任何小概率事件用絕對數報告都會出現驚人的巨大數字,單純對絕對數的強調往往會產生戲劇性的效果。比較合理的方式一般是在報告某事件絕對數的同時,給出該事件的發生率或占研究人群的比例。
小樣本的代表性在一次抽樣的小樣本中求得的率或比例會非常不穩定,與另一次抽樣的結果可能會有較大差距。因此當研究僅限于從小樣本獲得的資料時,應當在報告比例的同時也報告樣本量。
2雙變量統計分析
在社會科學研究中,首先分析的往往是兩個變量之間的關系,如用相關或列聯表等方法。一般在確定兩個變量之間確實有某種關系,如在經過統計檢驗后證實兩變量有顯著相關關系,進行更進一步的分析才有意義。因此,雙變量統計分析在實證分析中占有重要地位。但是,由于在應用中對有些問題的忽視,雙變量統計分析也很容易出現偏差或錯誤。
卡方檢驗的局限在利用列聯表對兩個定序/定類變量進行相關分析時,需要進行統計檢驗來判斷兩個變量的相關是否有統計上的顯著意義。不少研究結果都用卡方檢驗的顯著性報告相關狀況。但值得注意的是,卡方統計量的計算本身是有局限性的,樣本越大,卡方值就會相應增大,因此大樣本的卡方檢驗很容易得到顯著結果。所以一般在報告卡方檢驗結果以說明兩變量是否顯著相關時,還應當同時報告相關強度,即相應的相關系數,如Gamma,Lambda等。
統計意義上的顯著與差別的實際意義在檢驗兩個定距變量的均值差別是否具有統計上的顯著性時,也存在相似的問題。由于樣本量越大,樣本均值分布的方差就越小,因此常用的t檢驗結果就越可能顯著,任何細微的差別都可能有統計上的顯著性。但有時具有統計意義顯著性的差異,在實際生活中可能意義并不大,如同在兩個草堆之間找出一根草的差距,對判斷兩個草堆的大小沒有實際意義。因此,對任何檢驗結果都應當有符合實際的解釋和說明。
虛假相關問題雙變量分析中的虛假相關問題,幾乎在所有關于社會科學研究方法的教科書中都會涉及到,在統計分析方法的教學中也被視為經典問題。但是多少年來,人們仍然在不斷地重復著這個“經典的錯誤”,即認為可見的或統計檢驗結果顯著的相關就是真正的相關;更為大膽的做法是把這種相關關系推向因果關系。我們知道,對于有的變量來說,即使是經過檢驗判定兩者具有統計上顯著的相關關系,也不一定存在實際意義上的關系,因為可能有未考慮到的變量或不可測量的變量在同時對兩個研究變量起作用,有時甚至可能完全是偶然的巧合。例如,火災的大小是以火災損失來衡量的,而參加滅火的消防員人數是與火災大小有關的,火災越大,出動的消防員就越多,但凡是具有常識的人都不會根據出動消防員人數和火災損失兩個變量之間的高度相關,斷定出動消防員越多火災損失就越大,因為火災的規模是決定因素(但很難直接衡量)。在有關人口科學研究中也有報告虛假相關的現象,如人口增長率的降低導致了經濟增長的提法就是一例。因此,在分析相關關系時,應當根據理論、知識、經驗、甚至常識來判斷這種分析是否有意義、是否存在其他變量的作用(稱為外在變量),避免得出有悖于常理的分析結果。有些虛假相關是可以通過統計分析方法判別的,如在控制了另外一些變量后觀察兩個變量的偏相關,或在雙變量分析的基礎上,進一步用多變量分析深入研究。
3多變量分析
回歸分析是多變量分析中應用最多的方法,尤其是邏輯斯蒂回歸更是被廣泛地應用。在眾多應用中,比較明顯的問題是使用方法是否得當和對結果的報告和解釋是否規范、合理(見2002年第2期《人口研究》劉金塘文)。此外還有一些應當引起注意的問題。
分析框架的重要性在社會科學研究中,各變量之間往往存在錯綜復雜的關系,如果在進行回歸分析之前沒有一個清晰合理的分析框架,那么回歸的結果有可能會引起質疑。一般應在報告回歸分析結果之前,介紹該分析的框架,如各變量的定義、各自變量與因變量的假設關系及其理由等,對建立的回歸模型做出合理性論證。有一些變量可能是作為控制變量納入回歸模型的,如性別、年齡等,最好事先解釋清楚。對假設因果關系的模型,應當至少能夠說明:(1)該因果關系在理論上是正確的、在實踐中是合理的;(2)從事件發生的時間上來說,應當是原因發生在先、結果發生在后。如有些回歸分析中,未加說明即把所有與因變量顯著相關的變量都囊括在自變量中,甚至有些自變量與因變量有明顯的互為因果關系,顯得分析邏輯混亂;還有的論文在簡單介紹研究背景和數據來源之后,急于建立因果關系并推出回歸分析結果,然后再根據各變量在回歸模型中的顯著性一一說明,這相當于事后解釋;這些做法都是錯誤的。
在具備“奔4”微機和較易操作的軟件的今天,轉瞬間就可完成一次回歸分析,但是在此之前,需要有大量的前期準備工作,包括文獻檢索和理論框架構建,才能確保統計分析的科學性。
分析方法應用的條件每種多變量方法都有各自的前提條件或假設,如果這些條件不具備或者假設不成立,該方法的應用就成問題。如Pearson相關是考察線性相關關系,多元方差分析只能辨別線性相關因變量的多元差異,線性回歸分析假設自變量與因變量之間為線性關系,因子分析方法也是建立在各變量具有一定的線性相關基礎之上的;另外,在邏輯斯蒂回歸中,每個分類都應保證有足夠的頻數,如果頻數太少就會影響參數估計的穩定性;等等。盡管一般不在報告分析結果時說明各種假設是否成立或條件是否滿足,但是在進行分析時應當自覺地進行考察。如果不能滿足條件或假設不能成立,就對數據進行轉換或調整后再分析,或者改變分析方法。
多變量分析結果的展示和解釋多變量分析的結果一般是通過列表來展示的。現在一種并不少見的做法是直接把統計軟件的輸出直接復制到論文中,我們往往會在文章中看到包括回歸參數估計、參數標準差、檢驗統計值、檢驗顯著性、偏相關系數等等n行m列的大表,使人有目不暇接的感覺。實際上參數標準差和檢驗統計值是提供給分析者的信息,沒有必要列在結果中;如果不是有特別需要的話,偏相關系數也不是關注重點;最主要的應當是回歸參數估計及其顯著性。
在列出分析結果之后,應當對結果的實際意義進行解釋和討論,而不是復述分析結果的數學意義。此外,在多元統計分析中一個常見的問題是分析者對變量作用不具有預期統計顯著性的失望,因此繞開不顯著的變量,甚至對數據或模型進行各種調整以獲得顯著結果。其實,統計分析結果不顯著往往也是有實際意義的。例如在分析我國高齡老人的地區分布時發現,高齡老人比例與當地醫療衛生指標沒有顯著關系,這說明我國醫療系統還沒有具備延長老人壽命的功能;另一方面也說明這些高齡老人的存活不是主要靠醫藥維持的。所以,在解釋分析結果時,只要是在分析框架中涉及并參與分析的變量,無論作用顯著與否,都應當給予充分的討論;對于那些由于知識或信息的限制難以下結論的結果,可以作為問題提出,以便進行更有針對性的進一步研究。
此外,任何方法都有其局限性,分析結果也不會十分完美。因此在討論結果的同時,也應當就此向讀者說明。例如當一個多元線性回歸分析的確定系數較低時,需要指出該模型有限的解釋能力,探討可能存在但沒有納入分析的更重要的影響因素。
不必求最新、只求最合適有些研究生在撰寫學位論文時,常常因為自己沒有應用最新的統計分析方法而感到忐忑不安;在評論某項研究的創新性時,有時也出現把學術創新和應用新方法混為一談的現象,例如認為應用描述性統計方法的研究水平低于應用解釋性或預測性方法的研究。新方法是層出不窮的。但是,出現了新方法并不意味著傳統方法就不再適用,而是各有千秋。統計分析方法是工具,哪件合適就用哪件,能用錘子解決的問題不必開沖床。有時越是復雜的方法,假設條件也會相應較多,應用的局限性更大。因此,盲目追求方法的新穎并不是高水平研究的保證,真正需要注意的是使用最合適的方法。而對所用方法的真正了解,是正確運用統計分析方法的前提。
總和生育率的內在缺陷及其改進
郭志剛(北京大學社會學系、北京大學中國社會與發展研究中心教授)
1總和生育率的應用目的及評價原則
年齡別生育率及其概括性指標總和生育率(TFR)是生育研究中最常用的指標體系。但是現在它們面臨很多實際問題。本文不討論出生漏報導致統計失實的問題,因為其性質并不在于統計方法,而是一個社會問題。本文只局限于這一指標體系內在的有效性問題的方法論討論。一個指標是否有效應該以研究目的為標準來判斷,因此這一討論將結合當前實際工作的需要來進行。
統計指標有兩種功能:一種是對調查對象本身特征的直接描述,另一種則用于推斷估計。很多情況下,統計指標同時承擔著這兩種功能,比如樣本統計量反映了樣本對象的特征,同時又服務于推斷估計總體參數。既然是一種估計,自然會有推斷偏差或誤差。評價不同估計的優劣是看誰的偏差或誤差更小。
那么通常我們應用TFR到底要反映什么?一是為了在控制育齡婦女結構的條件下概括時期生育水平,二是作為終身生育水平的估計。(注:在這一方面,總和生育率與人口的粗再生產率和凈再生產率的性質類似,后兩個指標中只不過又控制了下一代的性別和死亡因素的影響而已。)兩種性質都反映在各年齡組生育率的合計上。通常,不同基數的相對數指標不可以直接相加(注:如男性平均年齡加女性平均年齡沒有意義。)。為什么年齡別生育率可加,是因為設置了假設隊列的概念。TFR主要不是平均的概念(注:早期將其翻譯為平均生育率的確是錯誤的。至于年齡別生育率對婦女其他差別所做的均質假設,其實存在于所有匯總指標之中,而不論其分組有多細,但是都不會因此而稱為“平均××率”。),而是總和的概念(即假設隊列經過所有年齡后生育總和)。因此,TFR一身兼兩任,其內容為時期生育率總和,其形式為隊列終身生育水平。從前一種意義上使用時描述了該時期生育水平,從后一種意義上使用時則是假設隊列終身生育水平的估計(注:但這種估計從原理上不同于一般統計量從樣本推斷總體的情況,但有關評價原則卻是類似的。)。其值實際上涉及了35個實際隊列,并且只有在生育水平及年齡模式長期不變的苛刻條件下,它才真正與實際隊列終身生育水平相吻合(但是隊列仍是泛指的)。盡管這一假設隊列與真實隊列并不能很好對應,但起碼可以及時提供一種隊列終身生育的估計來滿足實際需要。
2缺陷一:總和生育率對終身生育水平的背離
表現A:最早對TFR的批評是由于其劇烈的時期波動。一逢時期突發事件(如中國1958~1961),實際生育量發生了變化,TFR就會大幅度下降。應該說,批評并不是指向其描述時期生育水平的功能,而是指向其作為終身生育估計的功能。因為,這時TFR的下降只是由于時期特殊原因影響,并不意味著終身生育水平真的下降。實際上,時期效應一過,TFR馬上便會出現反彈(即常說的生育補償),然而反彈的水平也并不能標志終身生育水平真的那樣高。總之,TFR短期內劇烈波動時,將其作為終身生育率估計來理解很成問題。其中最引人注目的是,反彈年份的分孩次TFR(i)會超過1,特別是一孩TFR(1)會大大超過1(注:1982年全國1‰人口生育率抽樣調查數據顯示(姚新武,1995),1963年TFR=7.463,其中各孩次TFR都大于1,最高的是TFR(1)=1.568。作為隊列估計,即是說每人生育一個半一孩,顯得很荒唐。)。人口統計學對此采取的對策是,避免采用這些年份的TFR來作為終身生育水平的估計,或者采用若干年份的TFR的平均值來作為終身生育水平的估計,希望將欠年與盈年的誤差相抵消。
表現B:然而,有時即使社會中似乎并沒有什么特殊事件,TFR也會背離終身生育水平。但是,往往只是在TFR提高時才會受到一定關注(注:如1983年左右中國人口學界對TFR的討論。)。理論分析可以證明,這種背離既可以是正的,也可以是負的。特別是在負偏離的情況下,往往可能持續較長的時間。并且,這種負背離實際上正是當前所面臨的實際情況,因此特別需要重視。
這種背離產生的原因是婚育年齡的變化,或者說是隊列的年齡別生育模式的改變。而負偏離則對應著婚育年齡的推遲。與時期突發事件對婚育年齡的推遲的暴發性影響不同,生育模式的自身轉變具有較長時期的持續性、變化上的漸進性、現象的隱蔽性等特征,并且它并不一定伴隨生育補償現象。甚至有時人們根本沒有意識到這種偏離的存在。
人口統計學早就揭示出,晚婚晚育可以延緩人口增長,但這是從長期人口發展的角度來證明的。而晚婚晚育對年份TFR有什么影響,則很少有人涉及。從理論上說,取得同樣的終身生育總量,可以有不同的進程表。即假定各隊列的終身生育數量不變,從某一時期開始各隊列的生育年齡開始推延,這一過程可以持續較長一段時期,直至最終穩定在一個新的生育模式上。我對此做過一些模擬計算,在這種情況下,生育模式轉變時期中每年的TFR一定會低于事先所設的隊列終身生育量,而這段時期兩端及以外各年份的TFR則可以等于事先所設的終身生育水平。這表明,即使將整個轉變過程或更長時期中各年的TFR都加在一起平均,得到的還是—個偏低的終身生育估計。
更普遍的情況是生育模式的變化與終身生育量的變化同時發生,這時TFR下降同時受這兩個因素變化的影響,由生育模式變化導致TFR對終身生育水平的偏離便較難分析。
實際問題:實際工作需要不允許我們等很多年再提供真實隊列終身生育統計,而現在只有TFR一種估計方法,并且我們知道TFR還會經常偏離隊列終身生育水平,因此急需尋找一種更好的估計來取代它。否則盡管當前TFR的值雖然很低,即使不論統計失真問題,我們也不知道這是否僅僅反映TFR發生了負偏離,那么我們憑什么肯定生育率已經下降到更替水平了。我們又怎么能知道,當生育年齡推遲告一段落時,TFR向終身生育水平回歸時會回升多少。要知道更替水平的真正概念是實際上某隊列與其終身生育后代數量的比(注:從這個意義上,凈人口再生產率等于1僅是一種時期估計的標準,并且也服從上述偏離,并不是真正的更替水平。)。
有關改進:Bongaarts和Feeney(1998)提出了去進度效應總和生育率(TFR'''')。該方法旨在提供一種根據時期數據對終身生育水平的較好估計(注:Bongaarts和Feeney(1998)警告說,這一方法不適用于那種特殊時期效應(即重大災害等)的年份。)。郭志剛(2001)對此進行了介紹,并用中國多年生育數據對該方法進行了檢測和評價,結果是TFR''''作為終身生育水平的估計的確大大優于TFR(注:郭震威(2000)認為TFR''''不倫不類,既不是時期生育指標,又不是終身生育指標,是個尷尬的指標。我認為,它只是應實際需要而產生的另一種根據時期生育信息對終身生育水平的新估計而已,其實這沒有什么可尷尬的。統計中凡是不能直接測量的時候,都得采用估計來代替。真正有意義的問題是,它是否比傳統TFR更接近于終身生育水平。)。
該方法基本原理可以這樣來理解:現實中生育模式轉變時,除了導致該年生育數量有所變化以外,還會有其他共生現象,如分孩次的平均生育年齡(MACi)也會變化(注:Bongaarts和Feeney(1998)強調要用分孩次的平均生育年齡,而不能用總的平均生育年齡,因為后者會抹煞實際變化。)。MACi實際上是生育模式轉變的測量值,可以在理論上建立其變化量與時期生育變化量之間的函數關系。TFR''''便是在常規分孩次TFR(i)的基礎上利用MACi的變化信息來調整,得到去進度效應的分孩次TFR''''(i),然后再匯總為TFR''''。經過調整,TFR''''可以在相當程度上修正TFR距終身生育水平的偏離,因此TFR''''更接近于隊列終身生育水平(這里隊列仍是泛指的)。也就是說,我們可以用TFR''''來替代TFR原來所承擔的終身生育估計的功能,而TFR還可以繼續承擔描述時期生育水平的功能,TFR''''與TFR之差可以作為生育推延對當前生育水平影響的估計(注:我曾當面請教Bongarts,問TFR''''方法是否可應用于預測模擬,他毫不猶豫地回答說不能。)。
我認為,盡管TFR''''指標還有繼續改進的余地(注:比如某一年的MACi的計算還要前一年和后一年的數據,因而多少喪失了一點及時性。然而,我自己曾嘗試過另外的計算,比如只用前一年和當年兩年的信息,調整的結果也并不差。),但顯然Bongarrts和Feeney為解決這一估計問題指出了極富于科學價值的方法論途徑。并且,這一新指標不僅可以用于監測隊列終身生育水平,也可以用于分析以往的生育數據(郭志剛,2000),幫助我們更好地理解我國的生育轉變史和計劃生育史。
3缺陷二:總和生育率不能控制育齡婦女的孩次結構
對某些重要因素進行統計控制可以為不同年份或不同地區的比較提供更大的可比性。盡管TFR控制了育齡婦女的年齡結構,但是它并沒有控制育齡婦女的孩次結構。然而,當前許多人口模擬研究都不能再忽略育齡婦女的孩次結構問題,否則會有損其研究結果的有效性(注:比如,與調整生育政策相聯系的人口模擬如果忽略現有一孩的婦女人數,便無法計算由于多年積累在一孩的這批婦女在政策調整時將產生的特殊生育效應。另外,有關生育政策后果方面的研究(如四二一家庭結構)也有類似問題。)。
問題的表現:實際上生育過程是嚴格的遞進事件,也就是說,只有未生育者才能生育一孩,只有生育過一孩且尚未生育二孩者才能生育二孩。而常規生育率則是以年齡別所有婦女總數作為基數,因而沒有容納育齡婦女的曾生孩次信息,也就不能控制曾生孩次這種結構影響。因此,比較孩次結構差別較大的年份或地區之間的年齡別生育率(或TFR),便不能區分其差異到底是出于生育水平不同還是出于孩次結構不同。當其用于人口預測模擬時,如果假定兩地區育齡婦女年齡結構相同,同樣的系列生育率的假設會導致孩次結構十分不同的地區(代表著不同生育政策類型)將會有相同的出生人數,顯然這嚴重地偏離實際情況。因此,面對當前的許多研究需要,基于年齡別生育率的TFR方法無論是用于比較分析上還是用于預測模擬,都會影響其結果的有效性(注:至于分孩次的年齡別生育率,只是對分子(即出生)劃分了孩次類別,但是并沒有對育齡婦女本身劃分孩次結構。其基數沒有控制孩次結構,因而從本質上說也沒有控制孩次結構。)。
替代方法的產生:實際上,計劃生育采取了分類指導原則后,便產生了多種生育政策類型,其顯著特征便是孩次控制上的不同。在不同地區實施不同政策時,育齡婦女的孩次結構便取得了越來越重要的意義。從這一角度出發,導致Feeney(1985)和馬瀛通等(1986)分別以不同思路創建了孩次遞進生育指標體系。
他們的共同點在于采用孩次遞進比作為生育測量的基礎來構建指標體系。如前所述,每年的出生可以劃分孩次。如果再將某一群體生育指標的基數由對應口徑的年中婦女總數換成年初對應(即前一)孩次婦女時,便稱為孩次遞進比(注:實際上可理解為一種概率,如本年年初某年齡組(或孩次間隔組)只有一孩的婦女中在本年生育二孩的比例。)。然后,還可以將孩次遞進比換算成遞進總和生育率。
Feeney的模型突出地考慮了孩次遞進間隔因素,不考慮年齡結構,因而常被稱為間隔遞進模型。而馬瀛通等的模型則突出地考慮了年齡遞進因素,因此常被稱為年齡遞進模型。
這兩種方法不僅可用于在控制婦女孩次結構條件下的比較分析,也可以用于預測模擬(注:應該指出,其實中國人民大學人口研究所的老一輩人口學家早在1970年代所自行創建的標準(或可變)生育率預測法中也已經包含了控制孩次結構影響的思想(劉錚、鄔滄萍、查瑞傳,1981)。)。遞進方法不僅可以在預測中控制孩次結構,而且應用于模擬預測時實際上比常規生育率方法更方便(注:這里的方便指,它只需要每年期初婦女的孩次別人口數便可以直接乘以遞進比便得到對應的生育量,而不需要再計算其中婦女人數。)。由于遞進比的概率性質,還能根本避免孩次別總和生育率出現的那種超過1的現象(注:盡管如此,Bongaats和Feeney(1998)認為這一類應用生命表方法的生育指標仍然沒有真正控制生育進程變化的影響。)。
主持人評論
本期論壇邀請的三位專家都有多年從事人口統計和數據分析的經驗,對人口學研究方法有很深的造詣。王謙副司長通過從多年工作中積累的大量實例,分析了在人口和計劃生育工作中經常發生的統計方法和統計數據被誤用的情況;鄭真真副教授則對統計分析中比較常見的問題進行丁獨到的分析和總結;郭志剛教授對總和生育率指標進行了深入全面的剖析,分析了其內在缺陷和改進方法。
王謙副司長通過10個典型實例說明在人口和計劃生育實際工作中,統計方法和統計數據在五個方面經常被誤用。這五個方面的問題有些屬于統計分析中容易犯的錯誤,帶有普遍性,如,錯誤地解釋變量之間的因果關系,在統計分析中忽視定性分析與定量分析的關系,結論不是由統計分析中得出,使得定量分析只是定性結果的一種點綴。有些問題則由于人口與計劃生育領域的特點而顯得更為嚴重,如他指出的,大部分人口和計劃生育統計指標在村一級或縣、鄉不適用是因為總體規模不夠。統計所研究的是總體的數量關系而不是個別的數量關系,所以統計指標在一定的總體規模下才有意義,這是統計學中的基本概念,但是在實際中卻經常被誤用。我們經常看到的錯誤都是統計學上的一些“基本概念錯誤”,而不是“高深錯誤”。統計學上的概念和方法可能很簡單,也容易理解,但是要在實際工作中正確地、恰如其分地運用并不容易,需要結合研究對象的特點。
鄭真真副教授從另一個角度對描述性統計、雙變量統計和多變量統計分析中經常被忽視的問題進行了討論和分析。她不僅指出了問題的所在,而且告訴大家應該如何做,她所討論的內容是大部分統計教科書上所沒有的,具有很大的實用性,對于正確地應用統計分析方法具有很大的指導意義,具體的問題這里就沒有必要再評述了。她的分析源于多年教學和科研工作的總結和升華,很多觀點具有獨到性,如對描述性統計的重視,多變量分析結果的展示和解釋,不必求最新、只求最合適的方法。
王謙和鄭真真從不同角度對統計分析和統計數據應用中出現的問題進行了分析,郭志剛教授則對人口統計中的一個重要指標-總和生育率進行了深入分析。他指出指標是否有效應該以研究目的為標準來判斷,他從總和生育率對終身生育水平的背離和不能控制育齡婦女的孩次結構這兩大缺陷出發,對問題的表現形式、實際工作中的需求以及改進方法進行了分析和介紹,其中滲透了他自己近年來對這一問題的研究結果和體會。我看完他的文章覺得獲益匪淺,如90年代以來中國的人口調查所得到的總和生育率指標都非常低,這里面有統計漏報的問題,也有總和生育率指標自身的缺陷所帶來的問題,在婚育年齡推遲時,總和生育率會低估終身生育水平。在以往的人口學研究中,對方法論的討論和重視是不夠的。研究方法的創新源于實踐的需求,面對21世紀更加錯綜復雜的人口問題,我們需要研究方法的不斷創新與發展,這是目前我國人口科學發展面臨的一個巨大挑戰。
三位專家的分析和討論有很大的實用性,值得從事人口和計劃生育的實際工作者和學者認真學習,但是畢竟他們不可能把所有的問題都歸納概括全面,這也不是本期論壇的初衷。我們希望通過本期論壇起到拋磚引玉的作用,引起同行對這一問題的重視。中國規范的人口學研究畢竟只有20多年的歷史,有問題是可以理解的,統計分析方法的誤用和研究的不規范在其他學科領域也同樣存在,甚至有可能更嚴重,但是我們不能漠視這種狀況繼續下去,問題的解決需要全體同仁的重視和努力。我覺得目前至少可以加強以下幾個方面的工作:
(1)提倡學術爭鳴,鼓勵同行之間開展批評,這將有利于學科的發展與規范;
(2)編審人員把好質量關,使在雜志上發表的文章符合學術規范,雜志上文章的示范作用往往比教科書要大得多;
(3)加強統計分析方法的教學工作。強調方法的適用性和在實際應用中應該注意的問題。
認識人口與計劃生育統計的特點避免統計方法和數據的誤用
由于工作關系和職業習慣,筆者對各種各樣有關人口和計劃生育的工作報告、分析文章中的統計方法和統計數據比較關注,經常可以發現統計方法和統計數據被誤用的情況。本文通過一些實例,分析由于不了解人口和計劃生育的特點而造成統計方法和數據誤用的情況。
【參考文獻】
1劉錚,鄔滄萍,查瑞傳.人口統計學.中國人民大學出版社,1981
2馬瀛通,王彥祖,楊叔章.遞進人口發展模型的提出與總和遞進指標體系的確立.人口與經濟,1986;1,2
3姚新武.中國生育數據集.中國人口出版社,1995
4郭震威.對“去進度效應總和生育率(TFR'''')方法”的一點看法.人口研究,2000;1
5郭志剛.從近年來的時期生育行為看終身生育水平.人口研究,2001;1
6郭志剛.時期生育水平指標的回顧與分析.人口與經濟,2000;1
7Feeney.1985.Parityprogressionprojection.InternationalUnionfortheScientific
StudyofPopulation,InternationalPopulationConference,Florence1985,vol.4
8BongaartsandFeeney.1998.Onthequanturnandtempooffertility.Populationand
DevelopmentReview24(2):271~291/中譯文:人口研究,2000;1
- 上一篇:農村政策調整新農村建設調研報告
- 下一篇:農經組織登記調研報告