{首页主词},&

導(dǎo)語：醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)問題分析一文來源于網(wǎng)友上傳，不代表本站觀點(diǎn)，若需要原創(chuàng)文章可咨詢客服老師，歡迎參考。

醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)問題分析

摘要：針對(duì)醫(yī)學(xué)科技論文中常見統(tǒng)計(jì)學(xué)問題以及稿件退修和編輯加工過程中遇到的共性的統(tǒng)計(jì)學(xué)問題進(jìn)行分析，并提出可能避免統(tǒng)計(jì)學(xué)方面錯(cuò)誤的方法及建議，便于科研人員撰寫論文時(shí)學(xué)習(xí)借鑒，也為醫(yī)學(xué)期刊編輯處理類似稿件提供參考。

關(guān)鍵詞：統(tǒng)計(jì)學(xué)；醫(yī)學(xué)；科研；論文；問題

醫(yī)學(xué)統(tǒng)計(jì)學(xué)是現(xiàn)代醫(yī)學(xué)研究的重要方法和技術(shù)手段，是醫(yī)學(xué)科研論文中不可或缺的部分，其應(yīng)用水平直接影響科研成果的質(zhì)量[1]。醫(yī)學(xué)科研人員在撰寫論文時(shí)若未能仔細(xì)鉆研流行病學(xué)和衛(wèi)生統(tǒng)計(jì)學(xué)等專業(yè)知識(shí)，或未咨詢專業(yè)統(tǒng)計(jì)學(xué)研究人員，盲目套用統(tǒng)計(jì)學(xué)方法，往往會(huì)造成應(yīng)用統(tǒng)計(jì)學(xué)方法及處理數(shù)據(jù)時(shí)出現(xiàn)錯(cuò)誤，如變量選擇和納入、模型選擇、結(jié)果描述等錯(cuò)用情況發(fā)生。在醫(yī)學(xué)研究設(shè)計(jì)、數(shù)據(jù)收集、數(shù)據(jù)整理、結(jié)果解釋和表達(dá)等環(huán)節(jié)均有可能存在統(tǒng)計(jì)學(xué)應(yīng)用不當(dāng)?shù)膯栴}[2‐5]。就已發(fā)表的醫(yī)學(xué)科技論文來看，研究設(shè)計(jì)環(huán)節(jié)中存在的問題在審稿時(shí)比較容易被識(shí)別，且大部分存在科研設(shè)計(jì)缺陷的論文在審稿階段已濾除，而運(yùn)用統(tǒng)計(jì)學(xué)方法分析資料，應(yīng)用統(tǒng)計(jì)學(xué)軟件實(shí)現(xiàn)數(shù)據(jù)管理和分析，正確解釋和表達(dá)統(tǒng)計(jì)分析結(jié)果等問題則往往比較隱蔽，這部分問題在進(jìn)入編輯修稿階段才顯現(xiàn)。編輯修稿階段是論文出版前的最后質(zhì)量控制環(huán)節(jié)，編輯對(duì)論文統(tǒng)計(jì)學(xué)問題的審核把關(guān)起著至關(guān)重要的作用，因此，需要期刊編輯具有過硬的專業(yè)知識(shí)、嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度及高度的責(zé)任心處理遺留錯(cuò)誤，特別是有些疑難問題往往需要專業(yè)統(tǒng)計(jì)學(xué)人員介入進(jìn)行判斷。已有調(diào)查顯示，1990年—2003年發(fā)表在NEnglJMed、JAMA和Lancet三大頂尖醫(yī)學(xué)雜志上且引用次數(shù)超過1000次的文獻(xiàn)中，有近1/3的文獻(xiàn)存在統(tǒng)計(jì)學(xué)問題[6‐7]。可見統(tǒng)計(jì)學(xué)誤用、錯(cuò)用問題在醫(yī)學(xué)期刊中相對(duì)較多。因此，對(duì)于醫(yī)學(xué)期刊社而言，強(qiáng)調(diào)在論文審稿階段邀請(qǐng)統(tǒng)計(jì)專業(yè)審稿專家進(jìn)行統(tǒng)計(jì)方面把關(guān)十分重要。現(xiàn)就醫(yī)學(xué)論文中常見的統(tǒng)計(jì)學(xué)問題及可能的避免方法分析如下，以饗同道共勉。

1描述性分析時(shí)存在的統(tǒng)計(jì)學(xué)問題

定量資料中的連續(xù)性資料一般采用集中趨勢(shì)加離散趨勢(shì)形式描述，例如均數(shù)±標(biāo)準(zhǔn)差（x±s）及中位數(shù)（四分位數(shù)間距）。目前，絕大部分文獻(xiàn)統(tǒng)計(jì)描述都以均數(shù)±標(biāo)準(zhǔn)差形式進(jìn)行，研究者往往未檢驗(yàn)所研究指標(biāo)數(shù)據(jù)的正態(tài)性，而理所應(yīng)當(dāng)?shù)貙?shù)據(jù)以正態(tài)方式進(jìn)行呈現(xiàn)，忽略了非正態(tài)分布數(shù)據(jù)應(yīng)當(dāng)采用中位數(shù)（四分位數(shù)間距）的形式來描述比較妥當(dāng)，這樣的錯(cuò)誤使用可能會(huì)讓讀者對(duì)數(shù)據(jù)總體分布造成錯(cuò)誤判斷。此外，某些研究中研究者會(huì)采用均數(shù)±標(biāo)準(zhǔn)誤進(jìn)行統(tǒng)計(jì)描述。一方面，可能是因?yàn)檠芯空邔?duì)標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差的具體含義辨識(shí)不準(zhǔn)確，樣本標(biāo)準(zhǔn)差是用來描述正態(tài)分布數(shù)據(jù)離散程度的統(tǒng)計(jì)量，是將方差開平方即得到的標(biāo)準(zhǔn)差；而樣本標(biāo)準(zhǔn)誤是指樣本均數(shù)的標(biāo)準(zhǔn)差，是一個(gè)統(tǒng)計(jì)推斷的指標(biāo)，用于將統(tǒng)計(jì)量推斷到總體參數(shù)。另一方面，由于樣本標(biāo)準(zhǔn)誤一般比標(biāo)準(zhǔn)差小，出于使研究結(jié)果看上去更具優(yōu)勢(shì)考慮，研究者會(huì)使用標(biāo)準(zhǔn)誤代替標(biāo)準(zhǔn)差。

2統(tǒng)計(jì)分析方法不滿足假設(shè)條件

2.1不滿足參數(shù)檢驗(yàn)的數(shù)據(jù)采用了參數(shù)檢驗(yàn)方法

2.1.1不滿足正態(tài)性在進(jìn)行兩組或多組定量資料參數(shù)檢驗(yàn)時(shí)，相比于獨(dú)立性和方差齊性，數(shù)據(jù)正態(tài)性往往容易被忽視。首先需注意，獨(dú)立樣本t檢驗(yàn)或方差分析對(duì)正態(tài)分布的要求有一定耐性。如果原數(shù)據(jù)或經(jīng)變換后數(shù)據(jù)不是嚴(yán)重地偏離正態(tài)分布，且樣本量比較大，仍可以采用參數(shù)檢驗(yàn)方法。但如果原數(shù)據(jù)或經(jīng)變換后數(shù)據(jù)偏態(tài)嚴(yán)重，且樣本量不大，不建議使用參數(shù)檢驗(yàn)方法，推薦采用非參數(shù)檢驗(yàn)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。但當(dāng)樣本量很大時(shí)（如>200），即使呈兩點(diǎn)分布或指數(shù)分布，其樣本t統(tǒng)計(jì)量也近似服從正態(tài)分布[8]。在這種情況下，選用參數(shù)檢驗(yàn)或非參數(shù)檢驗(yàn)均可。2.1.2重復(fù)測(cè)量數(shù)據(jù)對(duì)于重復(fù)測(cè)量數(shù)據(jù)的分析方法，大部分科研工作者首先想到的是重復(fù)測(cè)量方差分析[9],其具有結(jié)果呈現(xiàn)形式簡(jiǎn)單、易于解釋的優(yōu)點(diǎn)，但其前提條件相對(duì)較多且通常不易滿足。比如需要平衡數(shù)據(jù)，這就要求所有觀測(cè)不能有缺失值，否則相應(yīng)的觀測(cè)對(duì)象需要被刪除。此外，重復(fù)測(cè)量方差分析還要求相應(yīng)變量之間的等相關(guān)性以及資料的球形對(duì)稱性（可以理解為復(fù)雜情況下的方差齊性），若這些條件不滿足，參數(shù)檢驗(yàn)的方法將不再適用，只能采用邊際多層模型或線性混合模型等進(jìn)行分析。

2.2不滿足卡方檢驗(yàn)條件的數(shù)據(jù)采用了卡方檢驗(yàn)

兩獨(dú)立樣本四格表資料的卡方檢驗(yàn)要求總例數(shù)n≥40且理論頻數(shù)T≥5[10]。若n≥40，且T為1~<5，采用連續(xù)校正的卡方或Fisher精確概率法進(jìn)行檢驗(yàn)；若n<40或T<1，則采用Fisher精確概率法進(jìn)行檢驗(yàn)。配對(duì)四格表資料卡方檢驗(yàn)要求不一致對(duì)子b+c≥40，否則采用校正卡方檢驗(yàn)。R×C表資料卡方檢驗(yàn)中要求不宜有1/5以上的格子T<5，不宜有格子T<1，否則需采用Fisher精確概率法進(jìn)行統(tǒng)計(jì)分析。

2.3不滿足線性回歸條件的數(shù)據(jù)采用了線性回歸分析

線性回歸模型的前提條件包括線性、獨(dú)立性、正態(tài)性和方差齊性。其中，線性是指因變量的總體平均值與自變量呈線性關(guān)系。可以通過繪制散點(diǎn)圖判斷回歸關(guān)系是否成立[11]。獨(dú)立性是指任意2條記錄互相獨(dú)立。正態(tài)性是指模型的誤差項(xiàng)需服從正態(tài)分布（等價(jià)于當(dāng)自變量X為定值時(shí)因變量Y也呈正態(tài)分布），而在樣本量較大時(shí)可以忽略正態(tài)性要求。方差齊性是指在自變量X的取值范圍內(nèi)，不論X取什么值，Y都具有相同的方差，等價(jià)于殘差的方差齊性。需要注意的是，線性、正態(tài)性和方差齊性通常通過繪制散點(diǎn)圖或正態(tài)概率圖等即可快速判斷，但獨(dú)立性往往容易被研究人員忽視，即納入分析的研究對(duì)象不應(yīng)有多條記錄，如果有部分研究對(duì)象有多條記錄，則應(yīng)只保留一條記錄，否則不能采用線性回歸模型進(jìn)行分析，只能改用混合效應(yīng)模型進(jìn)行分析。同時(shí)，還需注意，如果是多因素回歸分析，則上述線性、正態(tài)性和方差齊性的條件應(yīng)在各變量和因變量之間均得以滿足。

3結(jié)果闡釋時(shí)存在的問題

3.1受制于P值，未按常用界值對(duì)數(shù)據(jù)進(jìn)行劃分

在進(jìn)行多元回歸分析之前，比較可取的是先進(jìn)行單因素回歸分析。如某單因素為連續(xù)型變量，且已知其為結(jié)局變量的危險(xiǎn)因素可能性較大，若將其直接納入模型進(jìn)行單因素回歸分析，則可能發(fā)現(xiàn)其回歸系數(shù)β無統(tǒng)計(jì)學(xué)意義（P>0.05），這時(shí)某些研究者可能會(huì)采用將連續(xù)型變量分類的方式以獲得較好結(jié)果，可能為得到較小的P值而未采用常用的有意義界值進(jìn)行劃分，如在研究血壓對(duì)某種慢性病的影響時(shí)，未按照臨床定義的高血壓界定值對(duì)血壓值進(jìn)行分類，而是以在數(shù)據(jù)分析時(shí)獲得最小P值為目標(biāo)取最佳截?cái)嘀颠M(jìn)行分析，這種方法會(huì)使結(jié)果產(chǎn)生較大偏倚。因此，在實(shí)際運(yùn)用時(shí)應(yīng)盡量按照臨床上常用分類標(biāo)準(zhǔn)對(duì)連續(xù)型變量進(jìn)行分類。

3.2對(duì)沒有統(tǒng)計(jì)學(xué)意義的結(jié)果進(jìn)行過分闡釋

醫(yī)學(xué)研究中常常會(huì)獲得P>0.05的結(jié)果，此時(shí)若以α=0.05為檢驗(yàn)水準(zhǔn)則表示結(jié)果不能拒絕H0假設(shè)，但也不能下結(jié)論說H0成立[12]。如研究某因素與阿爾茲海默病間的關(guān)系時(shí)，通過多因素回歸分析發(fā)現(xiàn)回歸系數(shù)的P>0.05，此時(shí)可以認(rèn)為這個(gè)回歸結(jié)果不具有統(tǒng)計(jì)學(xué)意義，但在結(jié)果討論中不能以此下結(jié)論認(rèn)為該因素與阿爾茲海默病無關(guān)，甚至以此來推翻之前的研究結(jié)論。因?yàn)樵诩僭O(shè)檢驗(yàn)中，利用反證法思想是以假設(shè)H0成立來進(jìn)行推導(dǎo)，若能推導(dǎo)出原假設(shè)不成立的結(jié)果，則可以推翻原假設(shè)而證明H1成立，但如果推導(dǎo)出H0成立，則并不能做出任何判斷，只能說明以目前結(jié)果尚不能拒絕H0，而后應(yīng)該思考是否是因?yàn)閷?shí)驗(yàn)樣本量不夠或是統(tǒng)計(jì)效能不夠，以在將來進(jìn)行進(jìn)一步探究。

3.3有統(tǒng)計(jì)學(xué)意義的結(jié)果不一定有實(shí)際臨床意義

臨床實(shí)踐中，兩組或多組差異有統(tǒng)計(jì)學(xué)意義不一定說明差異具有臨床意義，判斷是否具有實(shí)際臨床意義需要結(jié)合研究背景和相關(guān)臨床專業(yè)知識(shí)[13]。最經(jīng)典的例子是研究某種降壓藥的降壓效果。臨床上一般認(rèn)為要使血壓降低10mmHg（1mmHg=0.133kPa）以上才能認(rèn)為具有臨床意義，而如果研究樣本量較大，即使試驗(yàn)組和對(duì)照組間血壓相差不到10mmHg，也非常有可能得到P<0.05的結(jié)果，從而得出該藥具有好的臨床應(yīng)用價(jià)值這一不正確結(jié)論。再如，臨床研究較重視病人生活質(zhì)量評(píng)價(jià)，尤其對(duì)心理狀況進(jìn)行評(píng)價(jià)時(shí)一般采用相關(guān)量表進(jìn)行測(cè)評(píng)，對(duì)量表測(cè)評(píng)結(jié)果進(jìn)行統(tǒng)計(jì)學(xué)分析時(shí)得出有統(tǒng)計(jì)學(xué)意義（P<0.05），在分析時(shí)直接推斷出某干預(yù)方法比另一種方法更有效，而未考慮研究對(duì)象干預(yù)前水平，可能造成研究結(jié)論科學(xué)性不足。因此，在進(jìn)行相關(guān)療效評(píng)價(jià)時(shí)，不能僅依據(jù)結(jié)果是否有統(tǒng)計(jì)學(xué)意義，生物學(xué)意義才是最重要的。

3.4在不直接進(jìn)行比較的情況下判斷兩組治療效果

優(yōu)劣干預(yù)在試驗(yàn)條件或試驗(yàn)組中產(chǎn)生了顯著效果，而相應(yīng)的效果在對(duì)照條件或?qū)φ战M中不顯著，研究人員有時(shí)會(huì)提出試驗(yàn)組效果比對(duì)照組效果要好[14]。這種錯(cuò)誤推斷很常見。如觀察A藥和B藥的治療效果，采用自身前后配對(duì)設(shè)計(jì)，得到的結(jié)果是A藥治療前后配對(duì)t檢驗(yàn)差異有統(tǒng)計(jì)學(xué)意義（P<0.05），而B藥治療前后差異沒有統(tǒng)計(jì)學(xué)意義（P>0.05）。此時(shí)，只能下“A藥在其受試者中觀察到顯著藥效，而B藥在其受試者中未觀察到顯著藥效”的結(jié)論,但不能就此認(rèn)為A藥治療效果優(yōu)于B藥。要了解兩組治療效果的差異，需要按非配對(duì)t檢驗(yàn)對(duì)兩組進(jìn)行直接比較。另外，還有一種情況，即在進(jìn)行多組均值或率的比較時(shí)，如果已知A組效應(yīng)優(yōu)于B組（P<0.05），而B組效應(yīng)和C組效應(yīng)差異無統(tǒng)計(jì)學(xué)意義（P>0.05），此時(shí)不能按照數(shù)學(xué)邏輯進(jìn)行推導(dǎo)，得出“A組效應(yīng)同樣優(yōu)于C組”的錯(cuò)誤結(jié)論。正確做法應(yīng)當(dāng)是將A組和C組直接進(jìn)行比較。

4可能避免統(tǒng)計(jì)學(xué)錯(cuò)誤的方法及建議

4.1根據(jù)研究目的選擇適宜的統(tǒng)計(jì)分析方法

統(tǒng)計(jì)學(xué)方法的運(yùn)用需要考慮其前提條件[15‐16]。若在實(shí)際應(yīng)用過程中忽視了這些條件，所得出的結(jié)果往往可能也是錯(cuò)誤的。所以在應(yīng)用模型及檢驗(yàn)方法時(shí)需要特別注意其應(yīng)用條件。參數(shù)檢驗(yàn)及大部分模型多要求正態(tài)性及獨(dú)立性[17]。在應(yīng)用前需對(duì)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)，若不滿足正態(tài)性，可以考慮通過對(duì)數(shù)轉(zhuǎn)換、平方根轉(zhuǎn)換及平方根反正弦變換等方法使數(shù)據(jù)轉(zhuǎn)換成正態(tài)以滿足應(yīng)用條件。若無法轉(zhuǎn)換為正態(tài)性數(shù)據(jù)則可采用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)方法。而在卡方檢驗(yàn)中，若不滿足適用條件可考慮采用合適的合并方法[18]。

4.2切勿過分受制于P值P值是最常用的統(tǒng)計(jì)指標(biāo)

[19‐20]，科研設(shè)計(jì)通常會(huì)利用P值得出結(jié)論，但若過分關(guān)注P值，依據(jù)P值處理數(shù)據(jù)或進(jìn)行相關(guān)結(jié)果解釋，有時(shí)會(huì)得出不恰當(dāng)或錯(cuò)誤結(jié)論。P值小于既定檢驗(yàn)水準(zhǔn)不等同于該項(xiàng)結(jié)果就具有臨床或者實(shí)際意義。同理，P值大于檢驗(yàn)水準(zhǔn)也并不能說明該項(xiàng)結(jié)果無效。在實(shí)際數(shù)據(jù)分析及結(jié)果解釋時(shí)應(yīng)客觀分析而不是受制于P值，目前，越來越多地提倡用效應(yīng)值加95%置信區(qū)間來表達(dá)結(jié)果[20]，這樣既能進(jìn)行結(jié)果比較，也可以觀察到是否具有臨床實(shí)際指導(dǎo)意義。

4.3科學(xué)地解釋統(tǒng)計(jì)結(jié)果

不同研究設(shè)計(jì)類型要求的統(tǒng)計(jì)方法不同，結(jié)果解釋存在一定差異，這是一個(gè)在實(shí)際工作中常被忽略但卻至關(guān)重要的問題。首先，需正確理解假設(shè)檢驗(yàn)結(jié)果。“差異有統(tǒng)計(jì)學(xué)意義”并不意味著在醫(yī)學(xué)專業(yè)上就是“重要”的。相關(guān)系數(shù)的假設(shè)檢驗(yàn)只能說明相關(guān)關(guān)系是否有統(tǒng)計(jì)學(xué)意義，既不能說明相關(guān)關(guān)系是否密切，也不能說明相關(guān)關(guān)系是否具有醫(yī)學(xué)專業(yè)上的某種意義。其次，需正確解釋不同研究類型數(shù)據(jù)分析結(jié)果。觀察性研究本身已經(jīng)決定了研究結(jié)論的局限性；實(shí)驗(yàn)性研究能夠較好地控制各種混雜因素，對(duì)于嚴(yán)謹(jǐn)設(shè)計(jì)的實(shí)驗(yàn)性研究，結(jié)論通常較為可靠，但要注意臨床試驗(yàn)對(duì)象是人時(shí)，存在諸多心理（如安慰劑效應(yīng)和霍桑效應(yīng)）以及倫理問題的局限，下結(jié)論時(shí)需特別謹(jǐn)慎。最后，需正確解釋不同單位數(shù)據(jù)分析結(jié)果。對(duì)于研究對(duì)象基于學(xué)校、單位或地區(qū)等水平的匯總數(shù)據(jù)所進(jìn)行的分析，如果在個(gè)人水平上下結(jié)論，就需特別嚴(yán)謹(jǐn)，注意因果推論時(shí)的邏輯性和正確性。

5小結(jié)

隨著醫(yī)學(xué)科研的快速發(fā)展，不論是科研設(shè)計(jì)本身的合理精確性，還是學(xué)術(shù)論文表達(dá)的嚴(yán)謹(jǐn)性，都需要建立在高度嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度及淵博學(xué)識(shí)的理論基礎(chǔ)上。醫(yī)學(xué)期刊編輯在論文統(tǒng)計(jì)學(xué)問題把關(guān)中起著舉足輕重的作用，編輯在退修稿件時(shí)應(yīng)對(duì)統(tǒng)計(jì)學(xué)描述和統(tǒng)計(jì)學(xué)分析中可能存在的問題進(jìn)行全面審核，必要時(shí)協(xié)助作者查找錯(cuò)誤，提出中肯修改建議，如統(tǒng)計(jì)學(xué)描述是否完整、描述是否和實(shí)際一致、統(tǒng)計(jì)方法是否恰當(dāng)、統(tǒng)計(jì)結(jié)果的解釋和表達(dá)是否準(zhǔn)確規(guī)范等[21]。統(tǒng)計(jì)學(xué)作為一門應(yīng)用科學(xué)，在實(shí)踐應(yīng)用中不能脫離醫(yī)學(xué)背景，必須緊密結(jié)合醫(yī)學(xué)專業(yè)的實(shí)際問題分析判斷，學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的最終目的是應(yīng)用統(tǒng)計(jì)思維和統(tǒng)計(jì)方法分析和解釋醫(yī)學(xué)中的實(shí)際問題，是以方法學(xué)的角色介入醫(yī)學(xué)研究領(lǐng)域，也是為醫(yī)學(xué)科研發(fā)展保駕護(hù)航的工具。醫(yī)學(xué)統(tǒng)計(jì)學(xué)中的每個(gè)數(shù)據(jù)都有其特定的專業(yè)含義，而不是抽象的機(jī)械數(shù)據(jù)，計(jì)算機(jī)軟件并不能識(shí)別數(shù)據(jù)的真正含義，無法確定數(shù)據(jù)是否準(zhǔn)確可靠，即使數(shù)據(jù)符合統(tǒng)計(jì)運(yùn)算規(guī)則，也要辨識(shí)是否有臨床實(shí)際意義，這就需要研究者根據(jù)研究目的，結(jié)合臨床研究受眾實(shí)際情況，正確地分析、表達(dá)研究結(jié)果，科學(xué)合理地推導(dǎo)結(jié)論，通過統(tǒng)計(jì)思維的培養(yǎng)，提高醫(yī)學(xué)研究水平，以保證研究結(jié)果的真實(shí)性與科學(xué)性。

作者：王雅潔李亞琴單位：山西醫(yī)學(xué)期刊社山西醫(yī)科大學(xué)第一醫(yī)院

醫(yī)學(xué)科技論文常見統(tǒng)計(jì)學(xué)問題分析

熱門標(biāo)簽

相關(guān)文章

精品范文