貝葉斯推理研究論文
時間:2022-07-17 04:13:00
導語:貝葉斯推理研究論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
人們根據不確定性信息作出推理和決策需要對各種結論的概率作出估計,這類推理稱為概率推理。概率推理既是概率學和邏輯學的研究對象,也是心理學的研究對象,但研究的角度是不同的。概率學和邏輯學研究的是客觀概率推算的公式或規則;而心理學研究人們主觀概率估計的認知加工過程規律。貝葉斯推理的問題是條件概率推理問題,這一領域的探討對揭示人們對概率信息的認知加工過程與規律、指導人們進行有效的學習和判斷決策都具有十分重要的理論意義和實踐意義。
1什么是貝葉斯推理
早在18世紀,英國學者貝葉斯(1702~1761)曾提出計算條件概率的公式用來解決如下一類問題:假設H[,1],H[,2]…互斥且構成一個完全事件,已知它們的概率P(H[,i],i=1,2,…,現觀察到某事件A與H[,1],H[,2]…相伴隨而出現,且已知條件概率P(A/H[,i]),求P(H[,i]/A)。貝葉斯公式(發表于1763年)為:
P(H[,i]/A)=P(H[,i])P(A/H[,i])/[P(H[,1])P(A/H[,1])+P(H[,2])P(A/H[,2])…]
這就是著名的“貝葉斯定理”,一些文獻中把P(H[,1])、P(H[,2])稱為基礎概率,P(A/H[,1])為擊中率,P(A/H[,2])為誤報率[1]。現舉一個心理學研究中常被引用的例子來說明:
參加常規檢查的40歲的婦女患乳腺癌的概率是1%。如果一個婦女有乳腺癌,則她有80%的概率將接受早期胸部腫瘤X射線檢查。如果一個婦女沒有患乳腺癌,也有9.6%的概率將接受早期胸部腫瘤X射線測定法檢查。在這一年齡群的常規檢查中某婦女接受了早期胸部腫瘤X射線測定法檢查。問她實際患乳腺癌的概率是多大?[2]
設H[,1]=乳腺癌,H[,2]=非乳腺癌,A=早期胸部腫瘤X射線檢查(以下簡稱“X射線檢查”),已知P(H[,1])=1%,P(H[,2])=99%,P(A/H[,1])=80%,P(A/H[,2])=9.6%,求P(H[,1]/A)。根據貝葉斯定理,P(H[,1]/A)=(1%)(80%)/[(1%)(80%)+(99%)(9.6%)]=0.078
心理學家所關心的是,一個不懂貝葉斯原理的人對上述問題進行直覺推理時的情形是怎樣的,并將他們的判斷結果與貝葉斯公式計算的結果做比較來研究推理過程的規律。因此有關這類問題的推理被稱為貝葉斯推理。
2貝葉斯推理研究概況
2.1基礎概率忽略現象的發現與爭論
Kahneman和Tversky開辟了概率推理這一重要的研究領域。他們在20世紀70年代初期的研究首先發現,人們的直覺概率推理并不遵循貝葉斯原理,表現在判斷中往往忽略問題中的基礎概率信息,而主要根據擊中率信息作出判斷。他們一個經典性的研究[3]是:告知被試100人中有70人是律師,30人是工程師,從中隨機選出一人,當把該人的個性特征描述得象工程師時,被試判斷該人為工程師的概率接近0.90。顯然被試忽略了工程師的基礎概率只有30%。后來他們還采用多種問題驗證基礎概率忽略現象[4],如讓被試解決如下出租車問題:一個城市85%的出租車屬于綠車公司,15%屬于藍車公司,現有一出租車卷入肇事逃逸事件,根據一目擊者確認,肇事車屬于藍車公司,目擊者的可靠性為80%。問肇事車是藍車的概率是多少。結果大多數被試判斷為80%,但如果考慮基礎概率則應是41%。
這一研究結果引發了20世紀70年代以來的大量研究。有研究支持其結論,如Eddy用前述乳腺癌問題讓內科醫生判斷,結果95%的人判斷介于70%~80%,遠高于7.8%[2]。Casscells等人的研究結果表明,即使哈佛醫學院的工作人員對解決如乳腺癌和與之相類似的問題都出現同樣的偏差[5]。
但也有研究發現,在許多條件下,被試對基礎概率的反應是敏感的。例如,如果問題的措辭強調要理解基礎概率與判斷的相關性[6]或強調事件是隨機抽樣的[7],則基礎概率忽略現象就會減少或消除。另一個引人注意的是Gigerenzer和Hoffrage1995年的研究,他們強調概率信息形式對概率判斷的影響。采用15個類似前述乳腺癌的文本問題進行了實驗,問題的概率信息用兩種形式呈現,一種沿用標準概率形式(百分數);一種用自然數表示的頻率形式,如“1000名婦女中有10名患有乳腺癌,在患有乳腺癌的婦女中8名婦女接受早期胸部X射線測定法檢查,在沒有患乳腺癌的990名婦女中有95名接受早期胸部X射線測定法檢查”。結果在頻率形式條件下,接近50%的判斷符合貝葉斯算法,而在標準概率條件下只有20%的判斷符合貝葉斯算法[8]。
而另一些研究者對此也提出異議,有人認為他們在改變信息形式的操作中,同時也改變了其他的變量。如Lewis和Keren[9]提出這種概率信息的改變使原來的一般性問題變成了當前單個情境的具體問題,因而問題變得容易,被試判斷的改善不能說明他們的計算與貝葉斯計算一致。另外Fiedler認為[10],他們進行頻率形式的操作為所有數據提供了一個共同的參照尺度——即所有數據都是相對于總體(1000名婦女)而言的,依靠它所有的數據變得容易比較。很明顯,接受X射線檢查并患乳腺癌的婦女的數量(8)與接受X射線檢查并無乳腺癌的婦女的數量(95)相比或與接受X射線檢查的婦女總數(103)相比都是非常小的。相反,在標準概率條件下,沒有共同的參照尺度,表面上擊中率(80%)遠高于誤報率(9.6%),但它們是相對于大小不同的亞樣本,而不是相對于總體,不能在同一尺度上進行數量比較。于是他們用4個問題進行了2(數據比較尺度:共同尺度/非共同尺度)×2(數據形式:標準概率/頻率)的被試間設計,實驗結果表明:不管采用哪一種數據形式,被試在非共同參照尺度條件下,判斷準確性都低,在共同參照尺度下,判斷準確性高。所以判斷準確性與數據形式無關。
可見,人們在概率判斷中忽略基礎概率是不是一種普遍現象,不同的研究之間存在較大分歧。這將促使研究者們采用各種方法對人們的概率判斷推理過程進行更深入的探討。
2.2貝葉斯推理問題的研究范式
為了探討上述問題,人們采用了不同的研究范式。從已有的研究看,貝葉斯推理的研究范式主要有兩種,一種是文本范式,一種是經驗范式。
文本范式是實驗中的問題以文本的形式直接提供各事件的基礎概率和擊中率、誤報率等信息,讓被試對某一出現的事件作出概率大小的判斷。如前述的乳腺癌問題,工程師問題,出租車問題等的研究就是采用這一范式。
然而,在實際生活中,人們進行概率判斷需要從自己經歷過的事件中搜集信息,而不是像文本范式那樣被動得到這些信息。經驗范式便克服了文本范式的這一缺陷。經驗范式就是在實驗中讓被試通過經歷事件過程,主動搜集信息來獲得基礎概率、擊中率和誤報率等各種情況的信息,然后作出概率判斷。
例如,Lovett和Schunn[11]為了探討基礎概率信息和特殊信息對被試解決問題策略的影響,利用建筑棒任務(BuildingStickTask,BST)進行了實驗設計。對于一個給定的BST問題來說,計算機屏幕下方提供3條不同長度(長、中、短)的建筑棒并在上方顯示一條一定長度的目標棒,要求被試用建筑棒通過加法(中棒+短棒)策略或減法(長-中或短棒)策略制造目標棒。被試只能憑視覺估計每條棒的長度,迫使他們不能用代數方法而只能用策略嘗試來解決問題。基礎概率是兩種策略解決問題的基本成功率;特殊信息是建筑棒與目標棒的接近類型對選擇策略的暗示性和所選策略成功的預見性:長棒接近目標棒則暗示使用減法策略,中棒接近目標棒則暗示使用加法策略,如果暗示性策略成功表明該策略具有預見性,否則為非預見性。問題設計時,在200個任務中控制兩種策略基本成功率(偏向:一策略高(如70%),另一策略低(如30%);無偏向:兩策略各50%)和暗示性策略對成功預見性的比例(有預見性:暗示性和非暗示性策略成功率分別為80%和20%;無預見性:暗示性和非暗示性策略成功率各50%)。研究者對被試在嘗試上述任務前后分別用10個建筑棒任務進行了測試,發現被試在嘗試前主要根據特殊信息選擇策略,在嘗試后主要依據兩種策略的基本成功率信息選擇策略。說明人們在嘗試200個任務后對嘗試中的基礎概率信息的反映是敏感的。
經驗范式的優點在于,實驗操作過程非常接近人們在日常生活中獲得概率信息以作出判斷的情況,較為真實地反映了人們實際的表征信息和作出概率判斷的過程。所以許多研究者采用了這一范式[12-14]。
但研究范式的變化并沒有能消除前述的爭論,在不同的研究范式下都存在人們對基礎概率信息的忽略或敏感現象,并出現了各種對基礎概率信息忽略或敏感現象進行解釋的理論。
3幾種主要理論
如前所述,人們進行概率判斷時,在一些條件下忽略基礎概率,在另一些條件下并沒有忽略基礎概率。那么,人們是如何作出判斷的呢?哪些因素在影響人們的概率推理呢?對此,不同的研究者提出了不同的觀點。
3.1啟發法策略論
Kahneman和Tversky認為人們直覺的概率推理受認知策略的影響,這是一種依賴于經驗的判斷或猜測。所以,經常會作出錯誤的判斷。主要的認知策略包括“代表性啟發法”和“可得性啟發法”。
代表性啟發法是指人們傾向于根據樣本是否代表或類似總體來判斷其出現的概率,愈有代表性的,被判斷為出現的概率愈大,愈少代表性的被判斷為出現的概率愈小。例如,在他們的研究中,要求被試估計某城市有6個孩子的家庭中,男(B)女(G)兒童出生順序為GBGBBG和BGBBBB(B代表男孩,G代表女孩)的比例,結果大多數被試估計前者遠高于后者[3]。因為前者更能代表整個人口中的比例,其次它看起來更隨機。但從機會來說,兩者的概率應是相等的。
可得性啟發法是指人們傾向于根據某現象在知覺或記憶中容易得到的事例來估計其出現是概率,如他們在實驗中要求被試估計英語中以字母R、L、N、K、V開頭的單詞數和以它們為第三個字母的單詞數,結果絕大部分被試估計前者遠多于后者[15]。但實際上前者是的基礎比例遠低于后者的基礎比例。判斷錯誤的原因在于人們更容易回憶出以這些字母開頭的單詞,而不容易回憶起它們在中間位置的單詞。這與人們的記憶組織有關。
3.2自然抽樣空間假說
Gavanski等[16]認為判斷一個事件出現的概率時,人們從什么范圍抽取一樣本有一種自然的抽樣傾向,他們稱之為“自然抽樣空間”,如果直接從自然的抽樣空間中抽取的樣本對判斷事件的概率是無偏差的,則被試容易作出準確的判斷;但若要求被試從非自然抽樣空間中抽樣才能正確判斷事件的概率,則被試容易作出錯誤的判斷。如前述乳腺癌問題,被試從患乳腺癌的人群中抽樣來判斷接受X射線檢查的概率較為自然,因為被試更容易認為患乳腺癌的人要接受X射線檢查。但實驗任務是要求從接受X射線的人群中抽樣來判斷患乳腺癌的概率,這與被試的自然抽樣方向相反,導致被試對問題進行了錯誤的表征,對照貝葉斯公式,被試的錯誤是把P(H[,1]/A)表征為P(A/H[,1]),剛好與問題的要求相反,從而作出了錯誤的判斷。
3.3頻率效應論
Gigerenzer和Hoffrage[8]同意自然抽樣的觀點,但他們所指的“自然”是人們加工概率信息的自然方式,認為人們是通過事件的頻率而不是標準概率(百分數)來獲得環境信息的,雖然兩種信息形式的意義相同,但人們對具有同等意義的不同外部信息形式會產生不同的心理表征。他從進化論的角度出發認為,人類進行概率推理已經進化了一種認知算法規則系統,它不適合加工以百分數表示的標準概率信息,而適合加工以自然數表示的頻率信息,因為標準概率是在概率論發展以后才被人們認識的,而頻率在人類進化的早期就被認識了,所以人們對事件的頻率容易編碼而且幾乎是自動的,而對標準概率難于編碼。因此,它們預言當問題的陳述從標準概率形式轉變為頻率形式時,對條件概率的直覺推理會得到顯著改善,并在前述的他們的實驗中得到了支持。如果被試在判斷中是忽略基礎概率的,那么在標準概率改為頻率形式時也應表現出來,但他們的實驗表明加工頻率信息的被試判斷的準確性明顯高于加工標準概率信息的被試。然而,正如前面所述,他們的結論也受到其他研究的挑戰。
3.4抽樣加工理論
Fiedler[10]認為對概率判斷最根本的影響既不是抽樣方向也不是概率信息形式,而是抽取不同樣本所得的數據需要進行不同的認知加工。概率判斷中的認知加工分為兩個過程,一是歸納加工過程,即利用記憶中或知覺到的樣本進行的概率估計,如旅行前根據自己的經驗估計某個地區為晴天或雨天的概率。然而,由于受許多主觀(如個人偏好、期望等)和客觀條件(如過去的經驗是在一定時空下獲得的)的限制,根據可利用的樣本來估計概率會存在許多潛在的偏差,所以,要作出正確的判斷就必須調整抽樣過程中潛在的偏差,這是一個元認知控制過程,通過它,不同來源的樣本得到整合并運用于最后的概率判斷,這需要運用大量基于規則的元認知操作,包括使用邏輯規則、概率演算、統計學知識或元認知知識。如變換在不同尺度上估計的數量、顛倒條件概率、對來源于有偏差的樣本進行矯正等。
判斷者之所以忽略基礎概率而不遵循貝葉斯原理,是因為他們缺乏元認知手段,不能調整在抽樣過程中潛在的偏差。為驗證此結論,他們用4個問題(在此僅以乳腺癌為例)在計算機上設計了A、B兩種卡片盒,分別讓兩組被試自己搜索信息,告知被試A卡片盒的每張卡片正面標明是否患有乳腺癌的案例,背面告知是否參加X射線檢查,B卡片盒中每張卡片的正面和背面與前一個卡片盒的卡片內容相反,設計時設定基礎概率、擊中率和誤報率。屏幕的左邊行顯示正面內容,右邊小窗口顯示反面內容,被試點擊左邊行后才出現右邊窗口的反饋信息,確認后左邊行變成灰色,右邊窗口消失。信息搜索完畢時,屏幕底部顯示一刻度尺,用于被試標示判斷接受X射線檢查的婦女患乳腺癌的概率。這樣,看A卡片盒的被試明顯覺得乳腺癌的擊中率高,非乳腺癌的擊中率低,但做判斷時需要進行問題角度的轉換;而看B卡片盒的被試明顯了解到接受X射線檢查的婦女中患乳腺癌的案例很少,并可直接運用于問題判斷。結果表明:從B卡片盒獲取信息的被試判斷準確性高,從A卡片盒獲取的被試判斷準確性低。從而驗證了他們的結論。
4小結
貝葉斯推理在過去近30年中得到了較為廣泛的研究,特別自Kahneman和Tversky發現人們直覺的概率判斷忽略基礎概率現象以來,出現了許多理論和研究方法的更新,這些都深化了對這一問題的研究。這些研究既揭示了人們概率估計中常見的認知錯誤,也為人們進行貝葉斯推理至少提供了以下啟示:首先,必須注意事件的基礎概率,基礎概率小的事件,即使某種擊中率較高,其出現的總概率仍然是較小的。如現實生活中中獎的機會等就是小概率事件。其次,應該對信息的外部表征作理性的分析,不應受一些表面特征所迷惑。如擊中率的高低并不決定該事件出現概率的高低。第三,不能過分相信經驗策略(如代表性啟發和可得性啟發)。雖然經驗策略有時能減輕人們的認知負荷并導致正確的概率估計,但也在許多情況下會誤導我們的判斷。如不要因為輿論經常宣傳癌癥對人們生命的威脅就認為癌癥致死的概率比心臟病致死的概率更高。當然,貝葉斯推理問題仍然值得做更進一步的研究,如人們對概率信息的內部加工過程及其特點,對基礎概率、擊中率或誤報率的敏感或忽略及其所依存的條件以及研究方法和手段的改進等。
【參考文獻】
[1]MellersBA,McGrawAP.HowtoimproveBayesianreasoning:Acommenton
GigerenzerandHofrage(1995).PsychologicalReview,1999,106(2):417-424
[2]EddyD.M.Probabilisticreasoninginclinicmedicine:Problemsandopportunities.In:
KahnemanD,SlovicP,TverskeyA.ed.Judgementunderuncertainty:Heuristicsandbiases.
CambridgeUniversityPress,1982.249-267
[3]KahnemanD,TverskyA.Subjectiveprobability:Ajudgementofrepresentativeness.
CognitivePsychology,1972,3:430-454
[4]KahnemanD,SlovicP,TverskyA.Judgementunderuncertainty:Heuristicsandbiases.
Cambridge,England:CambridgeUniversityPress,1982
[5]CassecellsW,SchoenbergerA,CrayboysT.Interpretationbyphysiciansofclinical
laboratoryresults.NewEnglandJournalofMedicine,1978,299:999-1000
[6]Bar-HillelM.Thebaseratefallacyinprobabilityjudgements.ActaPsychology,1980,44:
211-233
[7]GigerenzerG,HellW,BlankH.Presentationandcontent:Theuseofbaserates
asacontinuousvariable.JournalofExperimentalPsychology:HumanPerception
andPerformance,1988,14:513-525
[8]GigerenzerG,HoffrageU.HowtoimproveBayesianReasoningwithoutinstruction:
Frequencyfomats.PsychologicalRewiew,1995,102(4):684-704
[9]LewisC,KerenG.OnthedifficultiesunderlyingBayesianreasoning:Acommenton
GigerenzerandHofrage.PsychologicalReview,1999,106(2):411-416
[10]FiedlerC,BrinkmannB,BetschT,WildB.Asamplingapproachtobiasesinconditional
probabilityjudgments:Beyondbaserateneglectandstatisticalformat.Journalof
ExperimentalPsychology:General,2000,129:399-418
[11]LovettMC,SchuunCD.TaskRpresentation,StrategyVariability,andBase-RateNeglect.JournalofExperimentalPsychology:General,1999,128(2):107-130
[12]GluckMA,BowerG.Fromconditioningtocategorylearning:Anadaptivenetwork
model.JournalofExperimentalpsychology:General,1988,117:227-247
[13]EstesWK,CampbellJA,HatsopoulosN,etal.Bae-rateneglectsincategorylearning:Acomparisonofparallelnetworkandmemory
storage-retrievalmodels.JournalofExperimentalPsychology:Learning,Memory,and
Cognition,1989,15:556-571
[14]MaddoxWT.Base-rateeffectsinmultidimensionalperceptualcategorization..JournalofExprimental
Psychology:Learning,Memory,andCognition,1995,21:288-301
[15]TverskyA,KahnemanD.Availability:Aheuristicforjudgingfrequencyand
probability.CognitivePsychology,1973,5:207-232
[16]CavanskiI,HuiC.Naturalsamplespacesanduncertainbelief.Journalof
PersonalityandSocialPsychology,1992,63:766-780
- 上一篇:黨政競爭上崗工作意見
- 下一篇:黨委企業工作意見