博弈論的方法范文

時間:2023-08-17 18:15:29

導語:如何才能寫好一篇博弈論的方法,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

博弈論的方法

篇1

所謂“博弈”(Game),是指某些個人或組織作出相互有影響的決策,它不僅包括撲克、橋牌等游戲,也包含現實生活中大量的合作和沖突現象。博弈論又稱“對策論”,研究的核心是決策主體的行為發生直接相互作用時的決策以及這種決策的均衡問題。

博弈論的原始思想萌芽于2000多年前,中國春秋戰國時代的典籍如《孫子兵法》、《孫臏兵法》中都充滿了博弈的案例。“田忌與齊王賽馬”就是我國耳熟能詳的博弈實例之一,但這不過是博弈思想的雛形,現代意義上的博弈論則是20世紀的貢獻了。一般認為,1944年同馮·諾伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作發表的《博弈論與經濟行為》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,標志著現代博弈論的開始。50年代,博弈論巨匠輩出,納什(Nash)提出了非合作博弈論,塔科爾(Tucker)定義了“囚徒困境”,從而奠定了現代非合作博弈的理論基石。60后代,澤爾騰(Selten)將納什均衡引入動態分析,創立了“精煉納什均衡”的概念;海薩尼(Harsanyi)則把不完全信息引入博弈論研究,隨后出現了不完全信息博弈論。至此,博弈論的理論構架基本完成。

博弈論可以劃分為合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的區別主要在于參與人能否在行為時達成有約束力的協議,達成則是合作博弈;反之,不能強制他方遵守協議,各參與人只能選擇自己的最優戰略,則是非合作博弈。合作博弈強調團體理性、效率、公平和公正;非合作博弈則強調個人理性、個人最優決策。我們談到的博弈多指非合作博弈。

博弈有兩種劃分:從參與人出場的先后順序來看,博弈分為靜態博弈(static game)和動態博弈(dynamic game)。靜態博弈指博弈參與人同時選擇行動或非同時行動但對前者行動一無所知;動態博弈指參與人行動有先后順序,且后行動者能夠觀察到先行動者的選擇。從參與人對其他參與人的知識來分析,博弈分為完全信息博弈和不完全信息博弈,前者指每一個參與人對其他參與人的特征、戰略和支付函數有確切的了解;后者則恰好相反。將兩種分析結合起來,我們就有四種類型的博弈:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。

1.完全信息靜態博弈:納什均衡

完全信息靜態博弈講的是,假設博弈中所有參與人事先達成一項協議,規定每個人的行為規則,那么,在沒有外在強制性約束時,參與人是否會自覺遵守協議。如果參與人自覺遵守該協議,則構成一個納什均衡:給定其他參與人遵守協議的情況下,沒有人積極偏離協議規則。換言之,如果一個協議不構成納什均衡,它就不可能自動實施,因為至少有一個參與人會違背這個協議,不滿足納什均衡要求的協議是沒有意義的。“囚徒困境”(Prisoner's Dilemma)和“性別戰”(Battle of theSexes)是任何一本博弈論著作都會提到的納什均衡特例。

2.完全信息動態博弈:子博弈精煉納什均衡

動態是世間萬物的基本特征。完全信息靜態博弈只是一種獨特的理想狀態。在現實中,當后一個參與人行動時,自然會根據前者的選擇而調整自己的選擇,而前者也會理性地預期到這一點,所以不可能不考慮自己的選擇對他人的影響。1965年,澤爾騰通過對動態博弈的分析,提出了“子博弈精煉納什均衡”的概念,它要求任何參與人在任何時間、地點的決策都是最優的,決策者應該隨機應變,而不是固守前謀。這就推導出子博弈的概念。當參與人的戰略在每一個子博弈中都構成納什均衡時,則形成“子博弈精煉納什均衡”。也就是說,組成“子博弈精煉納什均衡”的戰略必須在每一個子博弈中都是最優的。

3.不完全信息靜態博弈:貝葉斯納什均衡

不完全信息靜態博弈指的是,參與人共同行動,沒有機會觀察他人的選擇。每個參與人的最優戰略只能是在給定自己的類型和他人類型依從戰略的情況下,最大化自己的期望效用。在項目投標中各承包者的標價高低之爭就是一個應用例證。

4.不完全信息動態博弈:精煉貝葉斯納什均衡

在不完全信息動態博弈中,后行動者觀察前者的選擇并獲得其偏好、戰略空間等信息,修正自己的判斷;而先行為者也知道自己行為的效用,會有意識地選擇某種行動掩蓋或揭示自己的真實目的。“黔驢技窮”就是一個不完全信息動態博弈的例證。

國際機制理論的理性主義流派概述

當前,國際機制的研究在理論與實踐層面都對國際關系理論學者形成沖擊,引起他們持續的濃厚興趣,并表現出非凡的整合能力,對國際機制研究的不同思路和方法加以整理和批評已經成為學者們重視的工作。德國著名國際機制理論家沃科爾·利特伯格認為,國際機制理論有兩種理性主義流派:新現實主義國際機制理論和新自由主義國際機制理論。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)

新現實主義國際機制理論的基本出發點是行為體之間的權力資源分配極大地影響著機制的出現、某問題領域機制的存在及其性質,特別是合作中的利益分配;國家會考慮無政府狀態下的相對權力,對國際機制的效率形成制約。這些觀點都體現在霸權穩定理論中。利特伯格認為,霸權穩定理論是“基于權力的國際機制理論的經典理論模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International

Regimes(London:Cambridge University Press,1997),pp.86.)而克勞福德認為,霸權穩定理論是新現實主義對機制產生最權威、最普遍認同的解釋。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸權穩定理論的基本機制理論主張是:霸權國家建立了自己的霸權體系,并制定該體系的基本原則、規則、規范和決策程序,霸權國的實力與威望是其他國家接受這些國際機制的重要前提;霸權國利用這些機制維持霸權體系,最大限度地獲得自己的利益;同時,為了維持該體系,它愿意向體系內的其他國家提供“公共商品”(Public Goods),容忍“搭便車行為”(Free-rider);霸權國的衰落或急劇變化,則該體系的國際機制發生相應變化。

新自由主義機制理論在過去10多年影響巨大,成為分析國際機制的主流理論。其基本機制理論主張是:國家是追求絕對收益的理性自我主義者,只關心自己的得失;承認權力在國際機制中的作用,但認為國際機制是國際關系中的獨立變量(independent variable),強調國際機制在幫助國家實現共同利益中的重大作用;活躍在特定問題領域的國家擁有只能通過合作才能實現的共同利益;不確定性是國際機制形成理論的核心,世界政治存在廣泛的不確定性。國際機制幫助達成政府之間意愿的契合。行為體相信這種安排會幫助達成互利的安排。換言之,沒有國際機制,則協議無法達成。國際機制正是通過降低不確定性來促進國際合作的。新自由主義機制理論是國際機制理論的主流學派,其影響也最大。該派理論用相互依賴的概念將現實主義和自由主義結合起來,具有重要的理論整合意義。

博弈論與國際機制理論

在過去十多年里,國際機制理論在國際合作的分析中獨占翹楚,而博弈論在分析社會、經濟和政治現象中應用最為廣泛。兩種理論都以探討無政府狀態下的競爭與合作問題為核心命題。這種平行并非巧合,因為機制理論從博弈論中借取了許多知識能量。理解促進合作的戰略邏輯是解釋無政府狀態下國際機制起作用的關鍵。在討論霸權、問題聯系、相對收益和相互依賴時,博弈論的解釋力有目共睹。這些恰恰是國際機制理論討論的重心問題。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International

Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)

早期的博弈論分析國際合作的總體問題,其目標在于探究國際合作在無政府狀態下如何發生,但對國際機制的特殊作用關注不夠,國際機制在合作中的作用沒有得到突出和明確的分析。克拉斯納、基歐漢等使用博弈論分析國際機制的作用,促使現實主義和自由制度主義的國際機制理論逐步成熟。

篇2

關鍵詞: 混合無線網絡; 網絡選擇; 博弈論

中圖分類號: TP391.41

文獻標志碼: A

文章編號: 2095-2163(2016)06-0141-03

0引言

近年來,隨著人們對無線網絡連接需要的日益增加,適用于不同工作情況與使用環境的無線網絡接入技術得到了飛速的發展。這些技術的提升進步滿足了人們隨時隨地能夠接入到無線網絡中的理想訴求。人們使用的無線網絡連接設備,如筆記本電腦、平板電腦、手機等,往往同時配備了多種滿足不同通信需求的無線網絡接入技術,如適用于近距離通信需要的Zigbee、Bluetooth,以及適用于中遠距離通信需要的WiFi、WiMax、2G、LTE等。而且,同一地區被多種無線網絡覆蓋的情況也大大增加了,如辦公室、商場或者是家中,這些區域往往普遍配設有無限局域網絡與蜂窩網絡,而蜂窩網絡常常也是由多家移動網絡服務商各自優化后、且分別提供的,如中國移動、中國聯通等,如此這般的多種無線網絡接入技術共存的情況被稱為混合無線網絡。綜上可知,在此背景環境中,人們所能選擇的無線網絡的數量也必然增加。根據使用環境的各異以及用戶需求的不同,人們在選擇移動設備所要連接的無線網絡時將會綜合考慮多種因素,如網絡的穩定性、網絡能提供的帶寬以及使用網絡需要付出的代價等。網絡選擇中的基本問題就是研究在多種無線網絡共存的情況下,人們(設備)如何根據自身的需要,選擇出最合適的無線網絡,以及在選擇過程中設備更換無線網絡的行為趨勢。為了分析解決混合無線網絡中不同無線接入技術的選擇問題,目前已提出了多種方法,如文獻[1-2]提出的最大化用戶效用的選擇方法,文獻[3-5]提出的基于多種屬性滿足的決策制定方法等等。博弈論作為一種數學工具,常常用于研究分析在人們根據自己的情況選擇出最有利的策略時,參與者的行為變化趨勢以及不同參與者之間相互影響的情況。在無線網絡的研究中,由于博弈論在分析無線網絡設備選擇不同通信策略時其所獲得的收益情況與各個設備行為特點上的優勢,越來越多的工作利用博弈理論來解決混合無線網絡中的網絡選擇問題[6-7]。本文總結了目前一些利用博弈理論來解決混合無線網絡中的網絡選擇問題的文章,給出了博弈理論在解決這類問題時的一般方法。

[JP3][BT4]1博弈論的基本概念以及網絡選擇問題的博弈模型[JP]

[BT5]1.1博弈論的基本元素

在博弈理論中,博弈是由博弈的參與者、參與者所能選擇的策略的集合、每個參與者選擇某種策略時所獲得的收益而構成的優選進化過程,過程中包含著3個基本元素,現對其進行如下定義描述。

1)參與者。博弈中能夠選擇自身策略的單位,可以是某一個體、也可以是某一群體,其目標是通過選擇某種策略以使自己收益最大化,當目標為削減成本時為最小化。

2)策略集。策略集中包含了參與者能夠選擇的所有策略,每輪博弈時參與者將在其中選擇一個以指導自己的行為。

3)收益。參與者選擇某個策略時所能獲得的效用,該效用由參與者選擇的策略與其他參與者選擇的策略共同決定。

[BT5]1.2博弈結果描述方法

具體地,針對存在多個參與者的博弈描述中,每個參與者將根據收益的大小采取不同的策略,同時某個參與者采取的策略也將影響到其他參與者的收益。當博弈重復進行的時候,各參與者是否可以最終達到某一平衡狀態,即參與者是否可以找到一種最合適的策略,使得博弈終止。博弈是否能夠終止,以及何時達到終止是博弈論中的重要研究部分。下面將調引最常用的描述博弈終止的狀態定義,即納什均衡狀態。

納什均衡狀態用于描述這樣一種情況,即在一個博弈中,所有的參與者都選擇好自己的策略后,如果任意一個參與者都不能在其他參與者保持所選策略也不變的前提下,通過改變自身采取的策略使得自己的收益增大。這時,就可說系統達到了納什平衡狀態。

如果博弈的參與者用集合N={1,2,…,n}來表示,參與者可以選擇的策略用集合S來表示,參與者i所選擇的策略用si來表示si∈S,那么s*={s1*,s2*,…,sn*}為納什均衡,當且僅當對任意的i∈N,存在:

[HT5SS]ui(s*i,s*-i)≥ui(s'i,s*-i)[JY](1)

其中,s*-i表示除了參與者i以外其他參與者所選擇的策略,ui()為參與者的收益計算函數。并不是所有的博弈均存在納什均衡;同時,有的博弈可能存在多個納什均衡。

[BT5]1.3網絡選擇問題的博弈模型

網絡選擇問題存在3種博弈情況。對于每種博弈情況,現做出分析概述如下。

1)用戶與用戶之間的博弈。這種情況下,博弈的參與者均為需要使用無線網絡的用戶,多個無線網絡用戶將分享若干個無線網絡接入服務,每個用戶所能選擇的無線網絡接入點就是用戶所能采取的策略。用戶通過選擇不同的無線網絡接入點來最大化自己的收益或者最小化自己使用無線網絡服務所需支付的代價。

2)無線網絡服務商之間的博弈。這種情況下,博弈的參與者為能夠向用戶提供無線網絡服務的各個網絡服務商。各個無線網絡服務商通過采取不同的自費策略來吸引更多的用戶選用自己的無線網絡服務,從而達成最大化自己收益的目的。

3)無線網絡服務商與用戶之間的博弈。參與者分別為無線網絡服務商與用戶。服務商通過選擇不同服務資費標準與服務對象來最大化自己的收益,而用戶則通過選擇不同的服務商來最大化自己可能獲得的網絡效用。

[BT4]2博弈論在網絡選擇問題上的主要研究情況

[BT5]2.1用戶與用戶之間的博弈

文獻[8]將網絡選擇問題描述為各個自利用戶之間的非合作博弈,并使用擁塞博弈模型來研究用戶的行為情況。在該博弈中,用戶可以在多個可用的無線網絡的不同頻段中選擇其中之一進行連接,在選擇某個網絡后,該用戶將會造成一定程度的網絡擁塞,同時用戶需要為其造成的擁塞支付費用,而費用的高低將由網絡當前的擁塞程度決定。作者形式化地給出了網絡擁塞程度的描述以及用戶所需支付的費用。實現過程是將該用戶的網絡選擇情況用一組布爾值來設定其表示,如表示用戶u是否選擇了a網絡的布爾值bua。當用戶u選擇了網絡a時,bua=1,如果沒有選擇網絡a,bua=0。此后,研究利用整數規劃的方法求解了該博弈的納什均衡策略。

文獻[9]利用演化博弈模型來研究用戶的網絡選擇問題。演化博弈在傳統的博弈理論中加入了種群的概念,種群用于表示一組相同類型的用戶,種群中的用戶可以改變自己的策略以使種群的總體收益增加,或者使種群中其他用戶改變自己的行為,以達到收益均衡的目的。項研究利用了演化博弈中的復制動態來研究一群同類用戶的行為變化情況。復制動態用來表示種群中選擇不同策略的用戶的比例的變化情況,數學上是利用常微分方程來構建表示, 其對應公式為:

[HT5SS]x?i(t)=xi[fi(t)-(t)][JY](2)

其中,xi表示種群中采用策略i的個體占種群全體的比例,xi=ni/N,ni為選擇i策略的用戶的數量,N表示種群中用戶的總數量。fi(t)表示參與者選擇策略i所獲得的收益,(t)表示該種群中所有參與者獲得的平均收益。

文獻[10]描述了裝備有多種無線網絡通信技術的設備,在不同網絡之間切換服務,以達到自身獲得的網絡吞吐量最大的目的。文章給出了2類不同的無線網絡技術的帶寬分配模型,全面分析在了每種無線網絡技術下用戶的行為變化情況,給出了用戶最大化自身收益的算法,并證明了在同種無線通信技術內部切換無線網絡基站的情況下,系統存在納什均衡,即用戶在經歷有限的基站選擇變化后,所有用戶均將達到穩定狀態,而無需繼續改變自身的選擇。

[BT5]2.2無線網絡服務商之間的博弈

文獻[11]提出了一個由4部分組成的用于分配管理無線傳輸資源系統框架,其中包括網絡層分配、容量預留機制、用戶接入控制以及連接層分配。作者將帶寬分配問題描述為不同接入網絡之間的博弈,同時在系統達到納什均衡時,網絡總效益最大。

文獻[12]將2個獨立的無線局域網之間的接入控制問題描述為多階段的非合作博弈問題。該博弈中的參與者為2個無線局域網,而策略集則為用戶發出的網絡接入請求。博弈的結果給出了2個網絡最大化自身收益時,網絡接入請求在2個無線網絡中的分布情況,

文獻[13]描述了在多個無線網絡共存的環境中,存在一個移動著的用戶。為了保證負載平衡以及減少用戶在各個網絡的交接,作者提出了一合作博弈的方法。參與者為區域中各個可以被用戶連接的無線網絡,其策略集為用戶使用每個網絡的優先級。每個候選網絡的收益為當前網絡負載、預定負載界限與網絡懲罰權重的函數。博弈的目標是使每個候選網絡的收益值最大。

2.3無線網絡服務商與用戶之間的博弈

文獻[14]利用將無線網絡服務商與用戶之間的競爭描述為雙方博弈的方式,提出了一種防止擁塞的控制機制。作者提出框架包括2個博弈,其中一個為接入控制博弈,另一個為負載控制博弈。接入控制博弈利用了經典的囚徒困境模型,參與者為各種用戶-服務商對。每一種服務請求代表了每個參與者具有2個策略選擇的博弈。服務商可以接受或者拒絕服務請求,而用戶可以選擇繼續接受服務或者停止接受當前服務商的服務。作者討論了該博弈的純策略納什均衡的存在情況。在負載控制博弈中,用戶在不停止傳輸的情況下選擇是否離開當前服務商,而服務商也可以選擇是否終止提供服務。文章表明當服務商同時運用2種策略時,得到的收益將會達至最大。

[BT4]3結束語

本文總結了當前利用博弈理論分析解決混合無線網絡中網絡選擇問題的一些代表性工作。值得注意的是,在利用博弈論解決該問題時,不能僅停留在判斷是否存在納什均衡的層面上,還需對如何達到納什均衡進行研究。博弈論分析了混合無線網絡中的參與者在為了最大化收益時的行為情況,為提出更加有效的網絡選擇方案作出了有益、且實用的貢獻。

參考文獻:

[1]

BARI F, LEUNG V. Use of nonmonotonic utility in multi-attribute network selection[C]//Processings of Wireless Telecommunications Symposium 2007. Pomona:IEEE, 2001:1C8.

[2] NGUYEN-VUONG Q T, GHAMRIDOUDANE Y, AGOULMINE N. On utility models for access network selection in wireless heterogeneous networks[C]//Processings of Network Operations and Management Symposium 2008. Salvador: IEEE, 2001:144-151.

[3] WANG L, BINET D. TRUST: a triggerbased automatic subjective weighting method for network selection[C]//Processings of Fifth Advanced International Conference On Telecommunications 2009. Venice:IEEE, 2009: 362-368.

[4] BAKMAZ B, BOJKOVIC Z, BAKMAZ M. Network selection algorithm for heterogeneous wireless environment[C]//Processings of IEEE 18th International Symposium on Personal, Indoor and Mobile Radio Communications 2007. Athens:IEEE, 2007: 1-4.

[5] BARI F, LEUNG V. Automated network selection in a heterogeneous wireless network environment[J]. Network, IEEE, 2007, 21(1): 34-40.

[6] STEVENSNAVARRO E, WONG V W S. Comparison between vertical handoff decision algorithms for heterogeneous wireless networks[C]//Processings of Vehicular technology conference 2006. Melbourne:IEEE, 2006: 947-951.

[7] ZHANG W. Handover decision using fuzzy MADM in heterogeneous networks[C]//Processings of Wireless Communications and Networking Conference 2004. Atlanta:IEEE, 2004: 653-658.

[8] MALANCHINI I, CESANA M, GATTI N. Network selection and resource allocation games for wireless access networks[J]. IEEE Transactions on Mobile Computing, 2013, 12(12): 2427-2440.

[9] NIYATO D, HOSSAIN E. Dynamics of network selection in heterogeneous wireless networks: an evolutionary game approach[J]. IEEE Transactions on Vehicular Technology, 2009, 58(4):2008-2017.

[10]ARYAFAR E, KESHAVARZ-HADDAD A, WANG M, et al. RAT selection games in HetNets[C]//Proceedings of INFOCOM 2013. Turin:IEEE, 2013:998-1006.

[11]NIYATO D, HOSSAIN E. A noncooperative gametheoretic framework for radio resource management in 4G heterogeneous wireless access networks[J]. Mobile Computing, IEEE Transactions on, 2008, 7(3):332-345.

[12]CHARILAS D E, MARKAKI O I, VLACHEAS P T. Admission control as a noncooperative multistage game between wireless networks[C]//Processings of Systems, International Conference on Signals and Image 2009. Chalkida:IEEE, 2009: 1-5.

篇3

關鍵詞:冷彎薄壁不銹鋼;廣義梁理論;非線性材料;受壓構件;屈曲荷載

中圖分類號:TU973.13

文獻標志碼:A

文章編號:1674-4764(2013)04-0068-11

不銹鋼材料具有華麗的外觀、優異的抗腐蝕性能、良好的力學和工藝性能、較高的比強度與比剛度、較低的維護費用等諸多優點,在建筑結構領域已獲得較廣泛的應用,如廣州國際會展中心不銹鋼屋面板、天津港四號卡子門不銹鋼空間網架結構等,結構新穎,造型美觀,具有顯著的經濟效益與社會效益[1]。受材料造價或建筑造型需要等因素影響,不銹鋼通常被加工成薄壁構件并冷彎至各種形狀,此類冷彎薄壁構件的穩定問題較突出,在結構設計時必須謹慎考慮。

與普通碳素結構鋼相比,不銹鋼在化學成分上增加鉻(Cr)和鎳(Ni)等合金元素使其耐腐蝕性能得到極大改善[2],在材料受力性能方面亦表現出顯著不同:不銹鋼材料沒有類似普通碳素鋼的屈服平臺,其應力應變曲線表現為典型的非線性特征,并具有低比例極限和良好的應變硬化性能[3]。這也就意味著即使不銹鋼薄壁構件失穩時應力(應變)水平較低,材料也極可能處于非線性階段,其屈曲性能將受瞬時彈性模量控制并表現出相應非線性特征。處理此類問題需構建三維本構關系,運用荷載增量法確定平衡路徑,最終得到構件臨界屈曲應力[4-5],與彈性穩定分析相比有較大區別且更加復雜。目前中國關于不銹鋼薄壁構件穩定性能研究較少,缺乏科學的理論分析和設計指導,極大阻礙了不銹鋼結構的應用與發展。

本文基于廣義梁理論(Generalised Beam Theory,以下簡稱GBT)基本原理針對不銹鋼材料進行修正,根據流動法則、變形法則定義其瞬時彈性模量,利用Quach模型定義其非線性應力應變關系,并以荷載增量形式給出修正GBT平衡方程、邊界條件及特征值計算公式,最后將提出的修正GBT法計算結果與試驗結果進行對比驗證。需要說明的是,受瞬時彈性模量影響,計算包含迭代過程,需借助軟件(Maple、C++或Matlab)完成,因此提出公式嚴格來講屬于準解析的計算公式。

1非線性材料GBT計算公式

1.1傳統GBT的基本原理

傳統GBT理論主要用于線彈性薄壁構件穩定性能分析,按以下步驟進行[6-9] :

1)截面分析。構件截面劃分為連續折板,屈曲模態分解為一系列截面基本變形模態的線性組合,根據弗拉索夫假設和各基本模態單位翹曲、橫向位移構造位移函數,計算截面剛度系數矩陣。

2)構件彈性穩定分析。考慮構件的長度和邊界約束情況,建立GBT平衡微分方程和邊界條件,利用有限差分法、有限元法或伽遼金法求解此特征值問題,最終通過線性組合求得此構件屈曲應力及相應屈曲模態[10-11]。

目前已有依據GBT理論編寫的穩定分析程序GBTUL[12],計算精確迅速,成為繼有限條法、有限元法后研究人員處理薄壁構件彈性穩定問題的主要計算方法,被科學研究和工程設計領域廣泛采用。然而,傳統GBT理論只能用于構件彈性穩定分析,對于非線性材料的穩定問題尚不能予以有效解決。Goncalves和Camotim利用GBT法對不銹鋼薄壁構件屈曲性能展開研究[13],得到矩形薄板、C形卷邊截面和矩形閉口截面構件在均勻受壓時的屈曲模態和穩定曲線,但其本構方程采用Rasmussen模型,此模型經證實不能準確反映不銹鋼材料應力應變關系[3],且文獻[13]中的GBT公式缺少必要推導過程,不同模態下構件屈曲應力計算過程不明確,結果缺乏試驗數據驗證。本文基于傳統GBT理論及Goncalves和Camotim初步研究成果對GBT方法進行修正,使其適用于非線性材料構件的屈曲性能分析。

1.2應力應變關系模型

不銹鋼是典型的非線性材料,應力應變關系模型精確與否對確定本構關系有著至關重要的影響。這方面的研究成果較為豐富,其中Quach等人提出的三段式模型[14]能夠準確反映不銹鋼材料的應力應變關系,是目前可供選用的最佳應力應變關系模型[3]。本文選用該模型描述不銹鋼材料的應力應變關系,即:

1.3瞬時彈性模量

傳統GBT理論采用彈性模量矩陣描述材料各方向本構關系,彈性模量矩陣在計算過程中保持不變。然而,非線性材料的應力應變呈非線性關系,隨著應變的發展,彈性模量不斷折減,構件剛度不斷退化,固定的彈性模量矩陣不能反映材料真實本構關系。因此,需將彈性模量表達為應力(應變)的函數,以反映非線性材料在特定應力(應變)狀態下的本構關系,即“瞬時彈性模量”。通過定義瞬時彈性模量矩陣對GBT法截面分析、構件穩定分析進行修正,使其能夠正確描述構件屈曲狀態,并最終根據平衡方程求得屈曲應力。本文基于小應變彈塑性理論確定材料瞬時彈性模量ij,假設材料屈服面服從Mises屈服條件,采用J2流動法則[15]和J2變形法則[16]2種理論的瞬時彈性模量ij中各分量表達式為:

3結論

提出適用于非線性材料的廣義梁理論屈曲荷載計算方法,并對不銹鋼薄壁受壓構件局部屈曲、畸變屈曲和整體屈曲3種失穩模態的屈曲荷載進行計算。經驗證,本文提出的修正GBT法具有較高精度,可用于確定非線性材料屈曲荷載,同時應注意以下2點:

1)傳統彈性計算方法不適用于不銹鋼等非線性材料。由于未考慮瞬時彈性模量變化,忽略了非線性材料的剛度折減,傳統彈性計算方法的計算結果明顯高于試驗值,不能用于實際工程設計。

2)與流動法則相比,按變形法則理論確定材料瞬時模量,所得計算結果精確又偏于安全,且公式形式簡潔、程序編寫容易,可為研究人員、設計人員參考采用。

參考文獻:

[1]王元清,袁煥鑫. 不銹鋼結構的應用和研究現狀[J]. 鋼結構, 2010, 25(2): 1-12,18.

[2]Gedge G. Structural uses of stainless steel-buildings and civil engineering [J]. Journal of Constructional Steel Research, 2008, 64(11): 1194-1198.

[3]朱浩川, 姚諫. 不銹鋼材料的應力-應變模型[J]. 空間結構, 2011, 17(1): 62-69.

[4]Tvergaard V, Needleman A. On the foundations of plastic buckling [J]. Developments in Thin-Walled Structures, 1982, 1:205-233.

[5]Hutchinson J W. Plastic buckling [J]. Advances in Applied Mechanics, 1974, 14: 67-144.

[6]Schard R. Generalized beam theory-an adequate method for coupled stability problems [J]. Thin-Walled Structures, 1994, 19: 161-180.

[7]Davies J M, Leach P. First-order generalised beam theory [J]. Journal of Constructional Steel Research, 1994, 31(2/3):187-220.

[8]Davies J M, Leach P, Heinz D. Second-order generalised beam theory [J]. Journal of Constructional Steel Research, 1994, 31(2/3): 221-241.

[9]Davies J M. Generalised beam theory (GBT) for coupled instability problems [C]//Courses and Lectures International Centre for Mechanical Sciences, 1998:151-224.

[10]Schardt R. Generalized beam theory-an adequate method for coupled stability problems [J]. Thin-Walled Structures, 1994, 19:161-80.

[11]Schardt R. Lateral torsional and distortional buckling of channel-and hat-sections [J]. Journal of Constructional Steel Research, 1994, 31(2/3): 243-265.

[12]Camotim D, Silverstre N, Goncalves R, et al. GBT-based structural analysis of thin-walled members: overview, recent progress and future developments [C]//Advances in Engineering Structures, Mechanics & Construction, 2006: 187-204.

[13]Goncalves R, Camotim D. GBT local and global buckling analysis of aluminium and stainless steel columns [J]. Computers & Structures, 2004, 82: 1473-1484.

[14]Quach W M, Teng J G, Chung K F. Three-stage full-range stress-strain model for stainless steels [J]. Journal of Structural Engineering, 2008, 134(9):1518-1527.

[15]Handelman G H, Prageb W. Plastic buckling of a rectangular plate under edge thrusts[C]//National Advisory Committee for Aeronautics Report 946, 1948: 479-506.

[16]Bijlaard P. Theory and tests on the plastic stability of plates and shells [J]. Journal of the Aeronautical Sciences, 1949(16): 529-541.

[17]童根樹. 鋼結構的平面外穩定[M]. 北京: 中國建筑工業出版社,2007.

[18]Silvestre N, Camotim D. Second-order generalised beam theory for arbitrary orthotropic materials [J]. Thin-Walled Structures, 2002, 40(9): 791-820.

[19]Bradford M A, Azhari M. Buckling of plates with different end conditions using the finite strip method [J]. Computers & Structures, 1995, 56(1): 75-83.

[20]姚諫, 夏志斌. 鋼結構——原理與設計[M]. 北京: 中國建筑工業出版社,2011.

[21]Rasmussen K J R. Numerical modelling of stainless steel plates in compression [J]. Journal of Constructional Steel Research, 2003, 59(11): 1345-1362.

[22]Lecce M, Rasmussen K J R. Distortional buckling of cold-formed stainless steel sections: Experimental investigation [J]. Journal of Structural Engineering, 2006, 136(4): 497-504.

[23]Silvestre N, Camotim D. Distortional buckling formulae for cold-formed steel C and Z-section members: Part I: Derivation [J]. Thin-Walled Structures, 2004, 42(11): 1567-1597.

[24]陳紹蕃. 鋼結構設計原理[M]. 北京: 科學出版社,2005.

[25]Rasmussen K, Hancock G J. Design of cold-formed stainless steel tubular members. I: Columns [J]. Journal of Structural Engineering, 1993, 119: 2349-2367.

篇4

【關鍵詞】博弈論;發展脈絡;理論體系

博弈論是研究在利益相互影響的局勢中,參與人如何選擇自己的策略才能使自身的收益最大化的均衡問題,是研究聰明而又理智的決策者在沖突或合作中的策略選擇理論。無論是人類社會的發展變化、社會經濟制度的變革,還是人們的日常生活,我們都會經常碰到利益相互影響的博弈問題,也會經常使用博弈去選擇策略,不管是自覺的還是無意識的。博弈論的思想極為深刻,內容十分豐富,引起了眾多經濟學家的極大興趣,贏得了經濟理論界的廣泛關注。

一、博弈論發展脈絡

博弈思想在人們日常生活中早就存在,但這只是停留在經驗上,沒有形成理論。在我國,有文獻記載的最早博弈思想,可以追溯到2000多年前著名的田忌賽馬的事例。在國外,1500年前巴比倫猶太教法典中的婚姻合同問題,也包含著明顯的博弈思想。博弈論應用到經濟分析中,是在19世紀中期,博弈論體系的產生、發展、繁榮,則是近幾十年的事。

現代博弈論思想在經濟上的應用可以分為以下幾個階段:

1、萌芽階段

最早的包含博弈思想的經濟學文獻,是1838年法國經濟學家古諾(Cournot)提出的寡頭市場產量競爭模型。而1883年法國經濟學家伯特蘭德(Bertrand)提出的寡頭市場價格競爭模型,把古諾模型里寡頭廠商的產量競爭變成了價格競爭。1913年策梅羅(Zermelo)提出的關于象棋博弈的定理是博弈論的第一個定理,提出的逆向歸納法是博弈論的第一種有一般意義的分析方法。這一階段,還有很多學者涉及了博弈論的研究,但都是零散的研究,沒有形成體系。

2、產生階段

一般認為,博弈論作為一種系統的理論產生的標志,是1944年馮?諾伊曼(von Neumann)和摩根斯坦(Morgenstern)合著的《博弈論和經濟行為》一書的出版。該書在總結以往博弈研究成果的基礎上,給出了博弈論研究的一般框架、概念術語和表述方法,提出了較系統的博弈理論。在此階段,還涌現出許多著名的博弈理論家,提出了一系列重要概念和理論。例如,1950年納什(Nash)提出了均衡點的概念,1950年塔克(Tucker)介紹了“囚徒困境”博弈,1953年夏普里(Shapley)提出了合作博弈里著名的“夏普里值”,這些概念和理論共同構成了現代博弈論體系的核心。

3、發展階段

從20世紀60年代開始,博弈論進入一個發展和完善的階段。1965年澤爾騰(Selten)提出了子博弈完美納什均衡的概念,1967-1968年海薩尼(Harsanyi)建立了不完全信息博弈理論,1974年奧曼(Aumann)提出了相關均衡的概念,1975年澤爾騰又提出了顫抖的手均衡的概念,1982年克里普斯(Kreps)和威爾遜(Wilson)提出了序貫均衡的概念,1991年弗登博格(Fudenberg)和梯若爾(Tirole)提出了完美貝葉斯均衡的概念,這些都進一步發展和完善了博弈的理論。

4、繁榮階段

20世紀90年代以來,博弈論開始受到經濟學家真正廣泛的重視,并被看作重要的經濟理論和經濟學的核心分析方法,開始貫穿幾乎整個微觀經濟學、產業組織理論,在宏觀、金融、環境、勞動、福利、國際經濟學等學科中也開始占有越來越重要的地位,大有以博弈論為基礎重構經濟學大廈的趨勢。尤其是1994年納什、海薩尼、澤爾騰這三位博弈論學者共同獲得諾貝爾經濟學獎,使博弈論作為重要經濟學分支學科的地位和作用得到了權威性的肯定,也表明了博弈論已在主流經濟學中占據重要地位。

二、博弈論理論體系

博弈論涵蓋的內容很多,從總體上可以分為合作博弈和非合作博弈兩大類。如果博弈中存在有約束力的協議,就是合作博弈;相反,如果博弈中不存在有約束力的協議,就是非合作博弈。合作博弈主要研究的是在有約束力的協議作用下,參與人采取符合集體理性的行動達到博弈均衡后,各參與人的收益分配問題。而經濟問題中遇到的多是在個體理性基礎上的決策,這使得基于個體理性的非合作博弈在經濟研究中廣泛應用。對非合作博弈的分類,主要涉及博弈的過程和博弈的信息結構兩個方面:

1、博弈的過程

從博弈的過程來分,博弈論可以分為靜態博弈和動態博弈兩類。如果所有參與人同時選擇策略,或者決策雖有先有后,但后行動者并不知道先行動者的選擇,這樣的博弈稱為靜態博弈;如果參與人的行動有先后順序,而且行動在后者可以觀察到行動在先者的選擇,并據此做出相應的選擇,這樣的博弈稱為動態博弈。

2、博弈的信息結構

博弈的信息結構又分為關于收益的信息和關于博弈過程的信息兩方面。在關于收益的信息方面,如果各參與人完全了解所有參與人各種情況下的收益,稱為完全信息;而至少部分參與人不完全了解其他參與人的收益,稱為不完全信息。在關于博弈過程的信息方面,如果輪到行動的參與人全部能夠看到在他行動之前行動的所有參與人的行動,就是完美信息;而至少部分輪到行動的參與人不能全部看到在他行動之前行動的某些參與人的行動,就是不完美信息。這里,我們可以看到,完美信息和不完美信息實際上是只針對動態博弈的,而靜態博弈中所有參與人可看作同時選擇策略,所以不存在完美信息和不完美信息的問題。

這樣,根據上述博弈的過程和博弈的信息結構兩個方面,我們可以將非合作博弈分為完全信息靜態博弈、不完全信息靜態博弈、完全且完美信息動態博弈、完全不完美信息動態博弈、不完全信息動態博弈等類型。掌握了博弈的分類情況,針對每一個具體的博弈問題,我們就可以將其歸于某一特定類型,根據這一類型的分析思路來解決這個博弈問題。

參考文獻:

[1]奧斯本,魯賓斯坦.博弈論教程[M].北京:中國社會科學出版社,2000

[2]弗登博格,梯若爾.博弈論[M].北京:中國人民大學出版社,2010

[3]王文舉.經濟博弈論基礎[M].北京:高等教育出版社,2010

[4]謝識予.經濟博弈論[M].上海:復旦大學出版社,2012

[5]張維迎.博弈論與信息經濟學[M].上海:上海人民出版社,2004

篇5

【關鍵詞】博弈論;水利工程;工程項目管理;應用探討

近年來,隨著我國科經濟實力的不斷發展壯大,國家用于水利工程建設的投資和力度不斷加大,而水利工程項目一般都具有工程復雜、施工難度比較大、技術要求高、工期長等特點,這些決定了項目管理工作具有較大的難度。面對項目管理中的難度,近年來,水利建設單位引入博弈論原理進行項目管理,在水利工程項目管理中具有很好的現實效果。

一、博弈論分析

所謂博弈論是指研究決策主體的行為之間發生相互作用時候的決策以及這種決策的均衡問題,通俗來說就是當一個主體的行為決策受到另一個行為主體的制約時,最終綜合雙方的意見得出最終決策方案,這種就是我們所指的博弈論。在水利工程項目中運用博弈論就是將監理單位與承包單位之間的行為決策相互作用,確保最終的管理方案具有可行性和科學性。

博弈論可以分為很多種,一般有合作博弈和非合作博弈,兩者之間最大的區別就是雙方在相互作用時,其最終結果是否一致。一般我們使用的都是合作博弈論,這種方式強調合作效率、公平、公正,體現了合作雙方的理性、個人最優決策,通過雙方的努力合作,最終得出的結果也是有效的。根據博弈論不同的角度還可以將其分為靜態和動態博弈。這種劃分方法主要是依據參與人對有關其他參與人的特征和戰略空間等掌握的知識程度來劃分,可以分為完全信息和不完全信息博弈。在水利工程項目管理要根據實際情況使用不同的博弈方法,建立有效的博弈管理模型。

二、水利工程項目管理內容

工程質量管理是指為了確保合同所規定的質量標準,項目各方采取的一系列的質量監管和控制的管理方法、手段和措施。水利工程項目質量管理包括很多方面,如施工、材料購買、工程變更、工程設計、施工圖紙等各方面的管理,只有對工程項目各個環節進行管理才能確保有效控制工程質量,使工程質量達到相關合同標準,確保工程質量和人們生命安全。

在水利工程項目中需要很多勞動人員的參與,如工程設計人員、工程現場施工人員、質量監督人員、項目委托單位等各方面的工作人員的管理。在進行人員管理時,單位要提高工作人員整體素質,讓工作人員掌握博弈論理論知識,方便工作人員更好地開展工作。

三、博弈論在水利工程項目管理中的應用探討

下面以監理工程師和承包商之間的關系建立博弈模型。

首先分析兩者之間的單階段博弈論模型,主要參與者是監理工程師和承包商。監理工程師的戰略選擇是認真監督和不認真監督,承包商的戰略選擇就是保證工程質量符合相關標準,或者不確保工程質量,在施工中出現偷工減料現象。在博弈論模型中,監理是否認真直接影響著承包商施工質量,如果監理單位認真監督,那么承包商就不敢偷工減料,反之,如果監督不認真,承包商在施工中就可能出現偷工減料現象。當監理工程師不認真監督時,承包商偷工減料給業主帶來的損失就會增加,假定A和B是監理工程師不認真和認真監督時所消耗的工程成本,C是監理工程師在監督過程中發現承包商偷工減料現象,并且按照勞動合同進行的索賠。假設B

假設α表示監理工程師認真監督的概率,β代表承包商偷工減料的概率。我們假定β是已知不變的,監理工程師選擇認真監督(α=1)和不認真監督(α=0)的理想收益分別為:πG(1,β)=(-A+C)β+(-A)(1-β)=Cβ-A;πG(0,β)=-Aβ+0(1-β)=-Aβ。解πG(1,β)=πG(0,β),可以得出β=A/(β+A),由此表明,如果承包商偷工減料的概率小于A/(β+A),此時監理工程師可以選擇不認真監督;如果承包商頭功減料大于A/(β+A)這個概率,監理工程師則需要認真監督,確保工程質量。根據這種推理方法,我們可以對承包商偷工減料進行不同程度的假定,然后計算出承包商偷工減料的概率,從而判斷監理工程師的最終選擇。

由上述博弈論在水利工程項目管理中的應用研究,我們可以得出,各項目單位在進行項目管理時該采用什么樣的工作態度和工作方法,這些都是根據其他相關博弈行動參與者情況所決定。本文主要是例舉監理工程師和承包商之間的博弈模型,在水利工程項目管理中,監理人還需要在水利工程中基于博弈論對工程質量進行有效監管,監理工程師、業主和承包商三者都是水利工程項目的博弈參與者,需要建立三者之間相互決策的博弈模型。其中監理工程師與承包商之間的博弈關系是最為重要的,在進行項目工程管理時,要根據承包商偷工減料概率判斷監理工程師的選擇。這種博弈模型對于加強水利工程項目管理具有重要的作用和意義,能透過表面現象深入到各個環節的管理工作中,不僅能樹立單位的良好形象,還能為單位爭取更多的經濟效益。

結束語

綜上所述,在水利工程項目管理中應用博弈論分析方法具有重要的作用和意義。運用博弈論進行工程項目管理,可以通過表面現象對工程項目進行深入的管理,這種管理模式能幫助單位實現最大化的經濟效益,建立監理人與承包單位之間的博弈模型,從而規范工程項目施工單位和建立單位的工作,避免出現工程項目質量問題,實現質量與效益共贏的局面。

參考文獻:

[1]王國強 周書杰.基于博弈論的監理人水利工程施工階段質量控制[J].水利經濟,2010(02)

[2]王賀瑤.博弈論在水利工程項目管理中的應用分析[D].沈陽農業大學:水利水電工程,2009

[3]姜國輝.基于博弈論的跨流域調水工程水價及項目管理研究[J].西安理工大學:水文學及水資源,2010

作者簡介:

篇6

關鍵詞:博弈論;本科;教學改革

中圖分類號:G642 文獻標志碼:A 文章編號:1673-291X(2012)22-0251-02

現代經濟學、管理學的最新發展中有一個引人注目的特點,那就是博弈論在經濟學和管理學的教學、科研以及在社會各個層面的應用中受到越來越多的重視。所以,許多高校的經濟與管理專業都與時俱進地將《博弈論》作為本科學生的一門必修課程。然而,由于《博弈論》發源于運籌學,對數學理論的要求較高。盡管博弈論中許多案例(例如“囚徒困境”、“性別大戰”等)具有較強的趣味性,但一旦從形象的案例講解轉入到抽象的理論推演,學生難免會遇到較大的學習困難。因此,如何使學生既掌握基本理論又能夠加以運用,就有必要對大學本科階段的《博弈論》課程從教學內容和方法上進行深入的探討。

一、博弈論課程的教學特點

1.教學過程通常淺入深出。談及博弈論,人們往往會想到“囚徒困境”、“田忌賽馬”等經典案例,這使得博弈論的內容顯得比較生動,也易于吸引人們的注意力。因此,通常博弈論的教學會以簡單的案例分析為切入點,以激發學習者的興趣。但隨著講授內容從純策略的納什均衡分析,逐漸向合作博弈、演化博弈、重復博弈等較為復雜的博弈分析過渡時,往往會涉及到一些較為復雜的數學定理和推演方法。這使得博弈論的教學體現出淺入深出的特點。

2.需要較好的數理基礎。早期,博弈論又被稱為對策論,它是現代數學的一個新興分支,也是運籌學的一個重要組成部分[1]。因此,經過科學抽象化的博弈理論,一般采用嚴謹的數學語言來進行表述。例如,對問題的描述是以集合的形式表達,對關系的刻畫是以函數形式表達,并通過嚴謹的數學證明得到最終的結果。這需要本科生在此前具有較好的高等數學、數理統計和運籌學基礎。

3.應用范圍廣泛。由于真實的社會中存在各種各樣的矛盾沖突,使博弈理論可用于經濟、政治、外交乃至戰爭等廣泛的領域。博弈論可以將生活中的經濟現象進行數學的抽象,并通過嚴謹的數學推導,揭示該經濟現象的發展趨勢和可能產生的最終結果[2]。例如,演化博弈理論,有助于理解生物種群之間的進化行為;信號傳遞原理,有助于理解軍事中的策略互信行為;委托—理論,有助于理解勞動力市場的抉擇問題以及二手車市場的交易問題。

二、博弈論教學中存在的問題

1.案例支撐還不夠豐富。博弈論的教學必須以案例作為引導,這需要課程案例具有以下特征:(1)案例必須緊密聯系現實;(2)案例要能充分體現一方面的博弈思想;(3)案例需具備一定的參與性,使學生通過情景模擬的方式深刻地感受到博弈的法則。盡管在博弈論的教學中已經累積了一定量的案例,但仍顯得不夠豐富。特別是對于經管專業的本科生而言,需要把理論的學習融入對經濟活動實踐的研究和認識之中,以提高學生分析經濟現象以及解決經濟問題的能力。

2.數理推演比較枯燥。博弈論中的數理推演較為復雜。國外學者普遍認為,要理解博弈論的數學精髓,那么測度論、隨機過程、實變函數與泛函分析、數學分析、拓樸學等知識是非常必要的[3]。例如,在納什均衡存在性的證明,就需要用到Katutani不動點定理[4]。而現在許多高校經管專業本科生都是文理兼招,由此導致學生的數學功底不一。因此,教師講授難度較大,學生也不易理解。

3.實驗與實踐教學重視不夠。博弈論實踐性較強,需要運用實驗教學手段來使學生作為直接利益主體參與決策,并引導他們分析博弈結果背后的內在驅動機制,從而達到幫助學生理解知識和提升學生解決問題能力的目的。但是,許多學生受傳統“填鴨式教學”的影響,參與的積極度有限;同時,實驗教學的重要性也有待于進一步認識和深化。這使得實驗與實踐教學不充分,即使學生掌握了理論模型,也難以用于實踐,導致“學”與“用”脫離。

三、互動式教學的應用探討

從上述分析可見,將互動式教學引入博弈論課程具有鮮明的意義。第一,通過親身參與,有助于學生理解博弈基本思想;第二,有助于學生掌握理論模型,并促進學與用的結合;第三,有助于活躍課堂氣氛、提高教學效率。筆者在博弈論課程中,嘗試性地進行互動式教學探索,主要包括以下幾個方面:

1.盡可能地為博弈論中的基本思想尋找可供學生參與的游戲。例如,運用“猜數字”游戲來呈現重復剔除劣勢策略的思想、運用“山地攻守戰”游戲來講述共同知識的含義、運用“模擬選舉”游戲來分析中間人選民定理。在實際教學中,筆者通常會按照既定游戲規則讓學生分組參與,并記錄下游戲過程和結果。而在對博弈結果進行歸納和分析時,還往往采用情景再現的方式,讓學生體會博弈中的奧妙,進而加深對理論的理解。

2.提升學生參與的積極性。這就需要任課教師深刻理解博弈的主要內容,恰當地設計游戲規則使得其趣味性更強;同時,需要賦予一定的游戲獎勵,來提高學生的參與熱情。①教育是一個興趣導入的過程,然后才成為科學獲知的一部分。要在一堂課里面始終吸引學生的注意力并不容易,這就需要教師合理掌控行課節奏,使趣味教學貫穿于課堂進行的始終,而不是頭重腳輕。通過合理的實踐教學安排,使學生感到博弈論的學習,是在“玩中學、樂中學”的氛圍中進行的。

3.注重思想傳授,淡化數學推演。互動式教學的目的,在于讓學生理解博弈論的重要思想,能夠運用該思想去分析一些現實問題。對于一些較為復雜的數學推演,只是簡單介紹其基本過程,② 而將其內涵的思想融入互動式教學,引導學生運用知識來解決現實問題。

篇7

關鍵詞:博弈分銷渠道;渠道沖突

中圖分類號:F713.3 文獻標識碼:A 文章編號:1674-7712 (2012) 18-0052-01

一、博弈論概述

(一)博弈論的提出。作為理理論的組成部分,美國數學家馮·諾伊曼(John von-Neumann)和斯卡·摩根斯頓(Oskar Morgenstern)創立了博弈論(game)。1944年,由2位學者合著的《經濟行為與博弈論》,奠定了博弈論的基本框架。在1950—1954年,納什(美國數學家、統計學家)發表了多篇博弈論的論文,第一次指出了合作博弈和非合作博弈的區別,并提出納什均衡(Nsah equilibrium)。在這之后,博弈理論的主流地位由非合作博弈占領,非合作博弈被愈來愈多的人所熟知,在實踐中得到愈來愈多的運用。

博弈論又叫對策論,它的目標是通過預測各個參與者的反應和行為,選擇實現組織目標的最優決策方案。在完全競爭的環境下,博弈論可以幫助企業規避風險,對顧客、競爭者、中間商、供應商的決策行為進行理性的分析。因此,它經常被作為研究主體行為相互作用及均衡狀態的方法,來指導企業的營銷決策。

(二)博弈論中的“囚徒困境”收益模型。大家熟知的“囚徒困境”,反應的是博弈論中大家熟知的經典案例:有兩個非法攜帶槍支的罪犯,被警察抓到,按律應各判入獄一年。但警察還懷疑這兩人有別的罪行——合伙搶劫銀行,但是目前沒有證據證明這一點。于是警察隔離審訊兩個罪犯,這樣就可以防止他們事前溝通;并采取了“坦白從寬,抗拒從嚴”的政策,誰要是告發同伙,可以無罪釋放,并得到一筆獎金,而同伙就會被處以重罰。

二、營銷渠道活動中的博弈現象分析

(一)渠道沖突中的博弈分析。在渠道沖突中的表現形式上,最常見的沖突就經銷商之間的降價、傾銷和低價拋售。廠家價格體系的混亂主要由下面2個原因引起:一是不同區域市場之間的“竄貨”;一是同一市場上的經銷商之間爭奪客戶。這2個原因都跟降價有關。我們都知道,降價傾銷對廠家和經銷商都是不利的,對廠家來說,會引起價格體系的混亂甚至整個渠道體系的混亂;對經銷商來說,會讓他們的利潤減少,甚至無利可圖。但是為什么還是會出現降價銷售呢?運用“囚徒困境”的模型,可以非常直觀的解釋經銷商之間降價傾銷的根本原因,并且能通過對降價傾銷根本原因的分析,找到制約降價傾銷的管理方法。

納什均衡最后的結果是每個經銷商的利益都受到了損害,這其實不是雙方想要的結果。但為什么雙方寧愿選擇降價,也不愿意選擇對雙方都有利的做法呢?這就是“囚徒困境”反映出來的一個深刻的問題——因為雙方的不信任以及經銷商過分強調自己的個人利益和短期利益,使得個人理性偏離了集體理性。但因為每個經銷商都是獨立的實體,都會想辦法追求自身的利益最大化,因此,降價傾銷現象必然。要解決這個問題,就必須有外在的力量對經銷商的這種行為進行干預。

(二)渠道成員的激勵與控制博弈分析。針對上面2個經銷商的短期行為,如果引入一個外界力量——制造商,讓制造商參與管理,情況會怎樣呢?假定制造商制定相應的政策,對渠道體系中的成員進行有效的管理,明確規定,誰擅自降價,就會處以重罰,并把處罰所得用來獎勵遵守規定的經銷商,讓降價銷售的經銷商認識到,降價不僅不能給自己帶來額外的收入,而且還會小于不降價的所得。

三、加強渠道管理的建議

(一)為減少銷售渠道沖突,制造商必須介入,加強對經銷商的管理。從前文的分析中我們可以看到,不管是什么類型的經銷商,由于利益的驅使,他們的行為都會受到機會主義利益的影響,采取降價銷售,擾亂整個渠道的價格體系,從而影響到整個渠道的穩定,出現表二中第一種結果。制造商應該在品牌經營方面做好各種工作,提升自己品牌的知名度和名譽度,保證產品的熱銷,做好企業的可持續發展工作。

(二)由以上的對經銷商的激勵與控制的博弈分析可以看出,經常性激勵是控制渠道的理想選擇。額外報酬是對經銷商激勵的一種最有效的方式。額外報酬是在經銷商執行特定活動時,制造商給予的附加利益。為提高額外報酬的激勵效應,一方面應盡力了解不同經銷商的不同需要和欲望,另一方面要制定科學的考核指標。

博弈論最明顯的特點是有自己的嚴格性和準確性,并且能做到與現代科學技術的發展保持同步。現代企業之間的競爭與以往相比,顯然更明確、更直接、更激烈、更集中,而且高層次化。博弈論可以根據企業營銷行為在不同的社會經濟環境下的變化而改變,對企業新出現的行為特征加以概括,在此基礎上找到問題的解決辦法。

參考文獻:

篇8

[關鍵詞]博弈論與旅游學價格戰對策

一、博弈論及旅游價格戰的博弈模型

1.博弈論與旅游學。博弈論又稱為對策論(GamesTheory),是研究具有斗爭或競爭性質現象的理論和方法,它既是現代數學的一個新分支,也是運籌學的一個重要學科。它較好地解決了對競爭等問題的可操作性分析,近年來不僅成為經濟學中激蕩人心的一個研究領域,也為其他許許多多包含競爭現象的問題提供了精細的分析技巧。隨著博弈論在各學科中的普遍應用,旅游學中的各分支學科也在不同程度上開始了應用博弈論方法進行分析的探索。

2.旅游公司價格競爭的博弈模型。價格競爭是行業重復建設、對行業總體市場容量過度樂觀、企業數量發展過快的結果。近年來,由于國家產業政策的支持,旅游的產業規模急劇膨脹,旅游公司數量增長幅度大大超過了旅游人數的增長幅度,從而造成供求失衡。旅游公司為爭奪市場份額,紛紛把降價作為爭奪客源的主要手段。按照博弈論的觀點,在非合作博弈條件下,降價是企業的合理選則。現用博弈模型分析如下,假定在旅游市場有兩家經營同類產品的旅游公司:A和B,還假設他們同時行動,并只有兩種選擇:降價和不降價。從而得到表1的旅游價格戰博弈模型:

(R——對雙方合作的獎勵,P——對雙方背叛的懲罰,S——給笨蛋的報酬,T——對背叛的誘惑)

運用畫線法可求得該博弈的得益數組(420,420)所對應的策略組合(降價,降價)為本次博弈的納什均衡。由于納什均衡是一種非合作博弈均衡,雖然雙方選擇(不降價,不降價)要比降價好,但是參與博弈的雙方都是以追求自身利益最大化為目標,每一方都不能保證對方會不降價而自己也采取不降價來共同分享利益,為防止對方降價而自己不降價給自己帶來損失的情況發生,最終雙方選擇的是均采取降價的納什均衡(420,420)。于是你降我也降,你再降我也再降,重復博弈的結果就是價格大戰越來越激烈。這從博弈角度說明了價格競爭的必然性。

實踐證明,即使公司能夠簽訂都不降價的行業自律協議,也是無法有效避免降價競爭的發生。因為策略組合(不降價,不降價)不是納什均衡,行業自律協議不具強制性約束力,即使在短期內能夠維持在脆弱的自律平衡狀態,機會主義或其他因素也會很快將此不穩定均衡狀態破壞掉。這在博弈理論中已有嚴格的證明。二、應對旅游惡性價格競爭的對策

在市場經濟環境下,自由競爭是市場經濟活力的源泉。價格競爭是市場競爭的一種重要方式,特別是在供需失衡的行業中,當供大于求時,價格競爭將更為激烈。然而過度的價格競爭對行業的發展是不利的,以下對如何避免過度價格競爭做一探討。

1.通過改變博弈模型的結構消除過度競爭。據前所述博弈模型,旅游公司之間的價格戰博弈只要符合兩個條件:1)T>R>P>S;2)R>(T+S)/2,各公司的最佳選擇都是該博弈唯一最優的“納什均衡”(降價,降價)。要避免出現旅游惡性價格戰,可以通過改變博弈結構,使博弈方的收益值不再符合該博弈模型的兩個條件。

一種方法是博弈雙方主動改變博弈策略,將公司目標從“收入”調整為“利潤”。以表1的旅游價格戰博弈為基礎,根據旅游業的特點,不妨假設選擇“不降價”策略時,旅游企業的利潤率是30%,選擇降價策略時,旅游企業的利潤率是20%,則得表2。

以利潤為目標的旅游價格戰博弈不再符合原博弈模型的兩個條件,博弈的最終結果發生了改變,不再是唯一的(降價,降價)。其中純策略納什均衡通過劃線法容易找到為兩個,即(150,150)和(84,84)。目前博弈論界正在研究表2所示的(不降價,不降價)這樣的最優納什均衡出現的條件和機制,一旦找到,就可以為避免惡性的價格競爭提供一條途徑。由于其中的研究頗為復雜,此處不再贅述。

另一種改變改變博弈結構的方法是旅游監管部門作為新的當事人參與博弈,也有可能會使旅游公司避免出現惡性價格戰。但這需要旅游監管部門加強執法力度,對降價的公司給予足夠大的懲罰才能奏效。

2.持續創新同樣是旅游行業獲得較高利潤,避免過度競爭的有效途徑。旅游企業可通過開發特色旅游新產品而避免產品雷同。比如近幾年的老年旅游市場的開發;以高中學生為對象,在假期舉行的高校游;以各種興趣為對象的攝影游、徒步游、探險游等。

3.除此以外,政府還可通過深化體制改革,硬化企業投資約束,從而消除產業過度進入,達到供求平衡,避免過度競爭。

總之,這些策略需要旅游企業根據市場環境的變化及自身實際情況適時進行創新、調整和選擇。

參考文獻:

篇9

關鍵詞:博弈論; 無線傳感器網絡; 路由算法;網絡模型

中圖分類號:TN92-34

文獻標識碼:A

文章編號:1004-373X(2011)09-0045-03

Game-theory Based Routing Algorithms for Wireless Sensor Network

LIU Shu-la

(Department of Electrical Engineering, Xi’an Aerotechnical College, Xi’an 710077, China)

Abstract: The various routing algorithms aiming at the characteristics of the specific sensor network are discussed based on the introduction of the game theory concept to establish the network model. The design principle and classification method of routing algorithms for wireless sensor network are summarized. The characteristics, performance difference and application scope of the algorithms are compared in detail. The research status quo of wireless sensor network routing algorithms is described. The research focus of the future research is pointed out.

Keywords: game-theory;wireless sensor network; routing algorithm; network model

0 引 言

由于無線傳感器網絡(WSNs)自身的體積、成本、重量和壽命等特點決定了無線傳感器網絡最主要的使用方向,再加上自身電源的有限性也限制了它們的計算以及之間的通信能力,因而需要在網絡的可靠性和延長網絡生存周期之間進行均衡。所以,設計合理的路由協議對降低及平衡網絡中結點的能耗,延長網絡的存活時間有著重要意義,同時也是WSNs網絡協議研究的重中之重[1]。

博弈論是一個相互依存的理論和不確定性條件下的決策。博弈論有三個組成部分:參與者集合,參與者行為集合,策略集合。當博弈執行時,一個參與者的策略就是一個完整的行動計劃。參與者可以以自我為中心,以謀取最大利潤。因此,一個參與者的分布式策略,往往可以提供一個優化的解決方案博弈[2]。

本文研究了基于博弈論路由模型的建立方法。依照博弈論對結點問題的解決方法,以期幫助與解決無線傳感器網絡的問題。

1 博弈論模型下的無線傳感網絡路由算法

無線傳感器網絡中的一個關鍵問題是路由遙感數據的問題。無線傳感器網絡有效的路由選擇算法包括減少多跳次數、簇狀構造、定向擴散和隨機化算法。然而,在中繼結點之間有可能會有合理的干擾,中繼結點通過拒絕參加從其他結點或其他網絡的結點轉發數據包來保存能量。這樣,就可以通過提供激勵來鼓勵路由合作,以討論博弈論在無線傳感器網絡中的應用[3],如圖1所示。

圖1 博弈論在無線傳感器網絡中的應用分類

文獻[4]用博弈論分析了一個博弈的結果,這些已部署的傳感器屬于不同的簇頭,可以獲得轉發的合作激勵。當傳感器向屬于不同簇頭的傳感器提出請求服務時,其他的傳感器可以根據自身資源來選擇支持或拒絕其請求。它完全可能會自私地拒絕提供支持,以保存自己的資源。在這樣的博弈中,沒有一方的簇有義務為其他簇的結點提供服務,納什均衡的結果可確定其是否屬于不同的簇的非合作結點。為了避免這樣的情況出現,可使用令牌作為激勵來鼓勵屬于不同簇的結點之間的合作。兩個簇組織i∈{A,B}部署傳感器{si1,si2,…,sik}可組成2K個矩形網絡結點。令牌的使用可以促進每個簇在時間周期T內完成合作協議。當屬于一個簇的結點a請求屬于另一個簇的結點b幫助時,它可發送一個綁定令牌的請求。如果請求獲準,結點b將接受令牌;否則,結點a仍然保留該令牌。一個實用的傳感器結點的功能可由請求的數目由結點sik提供和接受,通信信號發送數量由sik負責,它可以提出請求的總數 [5]。

一個可靠的路由,需要廣泛選擇同時協作數據匯聚工作的傳感器結點數量,以增加網絡信息量和通信資源以及能量消耗的有效合理利用。它們的算法以傳感器為中心,并使用博弈論作為研究方法。在這個方法中,傳感器作為合理優化合作,可以尋找最佳的網絡架構,以實現傳感器行為的最大化收益。傳感器收益被定義為傳感器行動的收益減去獨自的損耗[6-7]。

建立相關的能量存儲路由是收益最大化的關鍵,一系列的傳感器都是路由活動的參與者,當匯聚結點發送一個查詢給這一系列傳感器時,它可被用來檢測結點匹配的遙感屬性。通過用一個值vi來代表匹配程度可以抽象出這樣的算法思想。如果vi=0,則意味該查詢不匹配任何屬性,這確保了高價值數據不惜成本通過可靠的多路徑路由。發送結點通過選擇最佳系列傳感器可將數據傳到接受結點。每個傳感器結點建模作為中繼接受數據包時,只有一個鄰居結點,因此,形式上只有一個鏈路可以連接任意的源結點和目的結點。一個結點策略可以采用二進制向量形式{li1,li2,…,lin},lii=1/0來代表一個傳感器結點si選擇發送或者不發送數據包給結點sj。由于每個接受數據的結點均可作為一個激勵到匯聚結點,故其收益的一個可靠路徑功能和信息的預期值也在該結點,這就決定了其理想的結果在數據匯聚樹。如果一個傳感器結點選擇其他樹的結點,則將導致次優行為,這會從其他結點減小收益。因此,這就形成了博弈的納什均衡的可靠查詢路由。由于網絡不可靠,傳感器網絡會因整個網絡目標最大化自己的收益。“路徑弱點”的路徑度量會評價各種次優路徑。該路徑的弱點決定了有多少結點獲得偏離當前路徑到最優路徑。負偏差表明結點si更多地從策略和配置路徑受益;正偏差意味著結點可以有更好的表現。它們也可以展現一組版本稱之RQR,所有路徑結點分享在路徑上的最差結點的受益。而不是選擇一個鄰居結點,以便在原始博弈中最大化自己的收益。結點在TRQR模型中可以通過最大化收益來妥協。一個重要發現是在假設結點成功概率p∈(0,1],并在結點i和j之間的路徑損耗cij=c時,對于所有的i,j最可靠的路徑就是RQR博弈均衡的路徑。而對于均衡p,均衡路徑也成為最簡單路徑(MCP)。在合理的網絡目標情況下,結點希望自己的收益最大化,而TRQR則較低,因此其繼承了在MRP網絡中路徑不可靠的缺陷。

2 博弈論的收益

相比于無線傳感器網絡中使用經典的博弈論來研究能量效率,在多級無線傳感器網絡中的數據包轉發問題也可以適用改進的博弈論。改進的博弈論應用可以容許參與者采用預先設定好的行為和策略以及只使用本地信息[8]。

假定一個多級(異構)無線傳感器網絡中任意兩個不相鄰的兩類可以通過多條路由通信,那么結點可以自主和通過它的活動鏈接來優化吞吐量并采取優化策略。結點如果多次參與與其他結點的博弈,那么在重復博弈中,結點在給定圈中的行為將受其他結點的影響。因而,重復博弈提供了一種方法來懲罰那些由于沒有相互合作而減少了在博弈末期的收益的結點。這可以通過降低聲譽和減少獎勵來在博弈末期降低收益。合作的回報,可以通過檢驗在博弈末期的重復局數的收益來實現。努力提高合作時間的結點可以獲得更高的聲譽,更快的累積獎勵將被包含在可靠路由中。每一級的簇結點可決定是否轉發數據包。博弈結束時只有兩類保持活躍,其中一級類結點被認為是無效結點將首先被消耗。

為了發展合作/叛離矩陣,引入激勵合作機制,可在發送或轉發數據包時,一類消耗電池能量β和獲取激勵γ,如果此類拒絕轉發,它們將獲得φ且同時沒有成本。事實上,各類中的所有結點均可被假定為兩種策略與編譯:合作和缺陷。它們可從非合作參與者獲得值α乘以合作結點數量的收益。有兩種情況:在移動類之間轉發數據包和包轉發在空間分散的固定類。引進一個PG策略的方式如下:合作并繼續合作直到其他結點缺陷n(n≥0)次,然后缺陷永久。該策略的收益是整個期間δ(0

圖2 基于改進博弈論的WSNs靜態和動態博弈的穩定收益

3 結 語

本文討論了通過博弈論相關概念來解決無線傳感器網絡(WSNs)中的多種路由算法問題。總結了多種兼顧結點能量與結點分布的傳感器網絡路由算法。其中基于博弈論的無線傳感器網絡非均勻分簇節能路由算法[10]是一種比較高效節能的網絡分簇算法。而其不足之處在于它隨機選舉簇首的方式破壞了網絡的負載均衡性,而這可能會導致網絡壽命的縮短和傳輸吞吐量的降低;基于博弈論的非均勻分簇策略,可以解決結點能耗分布不均的難題。

參考文獻

[1]TONG W T, CULLER D E. Taming the unde relying challenges of reliable multihop routing in sensor networks[C]//Proceedings of ACM SENSYS. Los Angeles, CA, USA: ACM, 2003: 14-27.

[2]范如國,韓民春.博弈論[M].武漢:武漢大學出版社,2007.

[3]MILLER D, TILAK S, FOUNTAIN T. ″Token″ equilibria in sensor networks with multiple sponsors [C]// Proceedings of the Workshop on Stochasticity in Distributed Systems. San Jose, CA: WSDS, 2005: 5-13.

[4]KANNAN R, IYENGAR S S. Game-theoretic models for reliable pathlength and energy-constrained routing with data aggregation in wireless sensor networks [J]. IEEE Journal of Selected Areas in Communications, 2004, 2: 1141-1150.

[5]RAICU I. Local load balancing for globally efficient routing in wireless sensor networks [J]. International Journal of Distributed Sensor Networks, 2005, 1: 163-185.

[6]DAI H, HAN R. A node-centric load balancing algorithm for wireless sensor networks [C]// Proceedings of IEEE Global Communications Conference on Wireless Communications. [S.l.]: IEEE, 2003, 1: 548-552.

[7]CROSBY G V, PISSINOU N. Evolution of cooperation in multi-classwireless sensor networks [C]// Proceedings of the 32nd IEEE Conference on Local Computer Networks. [S.l.]: IEEE, 2007: 489-495.

[8]SADAGOPAN N, SINGH M, KRISHNAMACHARI B. Decentralized utility based sensor network design [J]. Journal of ACM Mobile Networks and Applications, 2006, 3: 341-350.

[9]HARVEY N J, LADNER R E, LOVASZ L, et al. Semi-matchings for bipartite graphs and load balancing [C]// Proceedings of Workshop of Algorithms and Data Structures. [S.l.]: WADS, 2003: 294-306.

篇10

一、博弈論及其起源

博弈論又稱對策論或競賽論,是研究具有對抗或競爭性質現象的數學理論和方法,它是現代數學的一個新分支,起源于20世紀初。1944年馮?諾依曼和摩根斯坦合著的《博弈論和經濟行為》奠定了博弈論的理論基礎。簡單地說,博弈論就是研究決策主體在給定信息結構下如何決策以最大化自己的效用,以及不同決策主體之間決策的均衡。

張維迎教授對博弈論的定義是:“研究決策主體的行為發生直接相互作用時候的決策以及這種決策的均衡問題”。也就是說,當一個主體,比如說一個人或一個企業的選擇受到其他人、其他企業選擇的影響,而且反過來影響到其他人、其他企業選擇時的決策問題和均衡問題。

博弈論研究個體如何在錯綜復雜的相互影響中得出最合理的策略。在充滿競爭的商界里,經驗、競爭戰略和博弈論就好比是企業管理的術、法、道,掌握博弈之道的企業管理者往往比不懂博弈之道的更加理性和高明。從馮?諾伊曼創立博弈理論至今,博弈論已經從早期的靜態博弈發展到動態博弈,并在商業、法律、心理學等領域都得到廣泛的應用。人類的很多活動,特別是經濟活動都是相互依存的決策過程。這種由多于一方組成并且相互依存的決策過程就是博弈,它并不僅僅指競爭,也包括合作。例如,企業的決策與國家政策之間的相互依存。有的時候,合作其實要更加復雜。動態博弈就是隨著時間而變化的決策互動。在前一刻最優的決策,在下一刻可能不再為最優,時間為博弈添上了動態。有關博弈論的策略性互動理念可追溯到中國古代軍事學家孫武的孫子兵法,其中“知己知彼,百戰不殆”的思想,就道出了博弈論研究中決策者之間互動的重要性。各方的策略互相影響,而決策的結果亦依賴于各方的策略。比如,任何一家公司在開拓市場的時候,總要考慮市場上的其他對手和潛在對手,這些都是博弈。

二、博弈論在現代企業管理中的應用

隨著博弈論在經濟學中的發展,越來越多的博弈論理論應用于現代企業管理之中。以下是幾個博弈論在企業管理中應用的實例。

(一)“囚徒困境”與價格策略。“囚徒困境”模型的具體內容是:兩個罪犯作案后被警察逮捕,分別關在不同的屋子里審訊,警察告訴他們,如果兩個人都坦白,那么每人判刑6年;如果兩個人都抵賴,每人判刑1年;如果其中一人坦白,另一人抵賴的話,坦白的人釋放,抵賴的人判刑15年。通過分析我們知道,每個囚徒都有兩種戰略:坦白或者抵賴。在這個博弈中,納什均衡是(坦白,坦白)。盡管從總體上看,(抵賴,抵賴)是對雙方都有利的結果,但是事實上結果卻并非如此。

“囚徒困境”這個模型給我們的啟示是:互利是合作的基礎,合作帶來效率的提高;但嚴厲的制度是維護合作的保證。現實生活中為什么沒有出現(抵賴,抵賴)這個最好的結果呢?就是因為沒有嚴厲的制度做保證,犯罪雙方為了自己的利益,防止對方選擇坦白,他自己只能先選擇坦白,結果就是雙方都坦白。

“囚徒困境”模型是博弈論中的經典范例,它是完全信息下的靜態博弈。現實生活中許多經濟、政治、軍事、社會以及日常生活中的博弈現象都可以用這個博弈模型來解釋。例如,我們熟悉的國內此起彼伏的價格大戰。我們在生活中經常會遇到各種各樣的價格大戰,今天我降價,明天你讓利,價格大戰此起彼伏,沒完沒了。由于過度的價格戰,使許多廠家基本上沒有利潤,甚至虧損,最終影響企業自身的長遠發展。最經典的例子是2000年的彩電價格聯盟事件。2000年6月,9家彩電巨頭在深圳召開價格聯盟會議,要求各聯盟成員不得降價,否則要受到處罰,但墨跡未干,與會成員就紛紛違反協議,競相降價,因為聯盟中沒有一個成員會相信對手真的會認真履行協議中的承諾。在這里,他們就面臨著一個“囚徒的兩難選擇”問題。我們知道,雖然都不降價對于各彩電巨頭整體是最好的選擇,但是他們的理性開始起作用了,作為理性經濟人可能會想到在自己履行承諾的情況下,萬一其他商家降價,其結果必然是自己的市場被對手占領,那么不如自己先降價,就可以搶占先機。所以,最終的選擇就是先降價,那么彩電價格聯盟便就此宣告破產。

(二)“智豬博弈”理論的應用

1、團隊建設與激勵理論。“智豬博弈”也是博弈論的一個經典案例。它的具體內容是:豬圈里有一頭大豬、一頭小豬,豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有一定單位的豬食進槽。如果是小豬按動按鈕,則大豬會在小豬到達食槽前把食物全部吃光,如果是大豬按動按鈕,則大豬到達食槽時只能和小豬搶食剩下的一些殘羹冷炙。既然小豬勞動不得食,則小豬不會主動按按鈕,而大豬為了生存,盡管只能吃到一部分,還是會選擇勞動(按按鈕)。那么,兩頭豬各會采取什么策略呢?答案是:小豬將舒服地等在食槽邊,而大豬去按按鈕。

在這個案例中,對小豬而言,無論大豬是否按按鈕,等待總是最好的選擇。而大豬知道小豬是不會去按按鈕的,只能自己親自去按按鈕。這個“智豬博弈”的模型給我們的啟示是:選擇優先戰略。在這個模型中,等待就是小豬的優先戰略。

在企業團隊建設中,如同“智豬博弈”的事情時有發生,稱為“搭便車”現象。因為,對團隊的績效激勵通常來源于團隊的集體績效,那么弱者(小豬)主動勞動,可能換來集體績效的提高非常有限,并不能得到額外的獎勵,那么弱者就會選擇等待。而強者(大豬)為了得到額外的獎勵只能選擇主動勞動來提高集體績效,而所得的績效獎勵又不得不與弱者共同分配。這樣久而久之,強者(大豬)也就沒有主動勞動的動力了,結果也許是離開,尋找激勵機制更好的企業。因此,在現代企業人力資源管理中,進行激勵制度設計時,團隊的領導者應根據內部目標管理對工作進行分解,確定每一個團隊成員所產生的績效高低,并予以相應的獎勵或懲罰。那么,始終等待的人將不能獲得任何獎勵,甚至會因為工作表現不好而受到懲罰。因此,團隊績效激勵的分解是解決“搭便車”的一種有效方式。回到“智豬博弈”的案例中,這樣做相當于把投食按鈕和食槽放在了一起,且把投食量減少,那么誰按動按鈕(勞動),誰就可以吃到食物,而不勞動者不得食。“智豬博弈”的模型告訴我們,要建立高績效的團隊不能把重點只放在團隊績效的管理上,還要重視團隊成員的角色匹配和績效分解,讓每一個團隊成員都能夠真正地充分發揮作用,進而促進整體團隊績效的提高。

2、公司治理中大小股東之間的博弈。我國上市公司基本上是現有企業改制的結果,自然形成“一股獨大”的股權結構。盡管大股東的出現有益于監督公司的經營管理,但我國多數上市公司在改制中與生俱來的大股東、董事會和總經理三位一體的格局,使得在大、小股東的博弈過程中保護小股東的利益更為迫切。然而,由于我國資本市場不完善、法律制度也不盡合理,小股東的利益自然得不到很好的保護。在這種情況下,小股東的理選擇便是“搭便車”行為的出現,當自己的利益受到侵害時,無奈的小股東只能選擇退出市場。為什么會出現這種局面呢?下面從博弈論的角度來分析。

在經濟學中,公共品是指其效果不能獨享的商品,例如大氣質量改善、道路改進等。這些效果往往不能由出資人單獨享受,這個時候就存在所謂的“搭便車”現象,每個人都希望別人出資提供公共品,自己不用付出代價就可以享受成果。而在公司治理中,“監督”是公共品,如果一位股東的監督引起公司績效的改善,所有的股東就都能受益。由于監督是有代價的,所以每個股東都希望其他的股東進行監督,而自己坐享其成,這就是股東之間的“搭便車”行為。在這種局勢中,大小股東之間存在兩個純策略納什均衡,即(監督、不監督)和(不監督、監督)。作為理性的投資者來說,大股東只有選擇監督,小股東選擇不監督,這也是標準的“智豬博弈”,大股東相當于“大豬”,小股東相當于“小豬”。小股東不參加監督卻能分享監督的成果,這也與我國證券市場的實際情況是吻合的,即80%以上的小股東從來沒有參加監督。

一般金融理論認為,公司股東根據它所持有的股份比例得到公司的收益。但是,研究表明,大股東往往會得到與他們所持股份比例不相稱的,比一般股東多的額外收益,這部分額外收益就是大股東利用控制權謀求的私利,也就是大股東對小股東進行侵占獲得的收益。在世界上大多數國家的公司治理中,集中的所有權結構是一種普遍現象,而隨之產生的大股東侵占小股東行為也成為困擾各國公司治理的核心問題。我國上市公司大股東侵害小股東的行為也日益受到廣泛的關注。

由于小股東“搭便車”現象的存在,從根本上講是由于監督成本的存在。要解決小股東“搭便車”的問題,就要解決小股東的監督成本問題。如果企業提出“你監督我買單”的策略(“買單”包括監督成本和激勵機制),在這種情況下,小股東會選擇監督,但是監督成本如何界定以及激勵機制如何設計,這都有待進一步探索。另外,還要加強大小股東之間的交流和溝通,使大小股東之間的非合作性博弈轉變成合作性博弈。在合作性博弈的基礎上,大小股東之間就不再是考慮監督與不監督的問題,而是注重監督后所帶來的共同利益分配問題。

而對于大股東利用其控制權對小股東進行侵占的行為,我們應該從以下幾方面來改善。首先,在法制方面。進一步完善《公司法》和《證券法》等相關法律法規,建立有效的獨立董事制度。逐步完善我國司法體系,增強對小股東的保護力度。為保護小股東利益不受損害,在法律方面還應做好兩方面的工作:一方面促進中小股東投票權的行使。由于小股東的持股數量小,股權分散,往往很難發揮其投票權,可以采用累計投票權和委托投票權以及限制大股東的表決權等方法,在一定程度上平衡大小股東的利益關系;另一方面進一步完善小股東的訴訟制度和民事賠償制度,若這方面制度不完善必導致司法和監督部門在執法上缺乏必要的手段和力度,法院也無法對小股東的訴訟請求予以受理,這樣不僅損害了小股東的利益,也縱容了大股東的獨斷專行。其次,在政治方面。關鍵是黨和政府應恪守職責,努力為企業創造良好的經濟運行大環境,而不應干涉公司的自主經營權。再次,在經濟方面。繼續把企業改革作為整個經濟體制改革的中心環節,致力于建立現代化的企業制度;同時推進國有資產管理體制的改革,實現國有股自由流通,改善我國上市公司的股權結構;強化機構投資者的作用,治理內部人控制。進一步培育我國的資本市場,保證股票交易的順利進行。當小股東不滿意公司的業績時,就可以順利地“用腳投票”從而保護自身的利益。最后,在會計方面。盡快出臺相關會計法規,完善我國的會計規范體系,提高我國信息披露的質量。