博弈最優策略匯總十篇

時間:2023-08-17 17:52:32

序論:好文章的創作是一個不斷探索和完善的過程,我們為您推薦十篇博弈最優策略范例,希望它們能助您一臂之力,提升您的閱讀品質,帶來更深刻的閱讀感受。

博弈最優策略

篇(1)

1.引言

美國諾貝爾經濟學獎第一人薩繆爾森說過,“要在現代社會做一個有文化的人,你必須對博弈論有大致的了解。”博弈于我們的生活中無處不在,凡是兩個及以上的行為人進行決策的過程,都會涉及到博弈,因利益而發生沖突或對抗是人類社會的一個普遍現象。大到國家政治、生死之地、存亡之道,小到人生棋局、日常生活、賭博游戲,謀略型對抗都是最為常見的局勢。本文將用博弈論的觀點解釋商家選址問題,為什么賣同類商品的商家會緊挨著布局。

2.什么是博弈

所謂博弈,就是策略性的互動決策。任何一個博弈,至少包括三個要素:

2.1一組局中人(一個局中人集合);

2.2局中人可以采取的行動(出招);

2.3局中人可能得到的贏利。

標準的博弈論,假設人們不會有道德、良心和情感上的考慮,所有的一切都唯一以是否符合自身的利益作為行動選擇的標準。任何一個博弈中,每個人的贏利不僅取決于自己如何“出招”,也取決于別人如何“出招”。正是這種戰術上的互動,使得博弈充滿了趣味、新奇,甚至驚險、刺激。而所謂博弈論,就是一套研究互動決策行為的理論,它實際上也可以看做是一種思維方式,即謀略型思考問題的方式。

3.最優反應與納什均衡

最優反應是指,給定對手選定一個策略,則我選擇某個策略比選擇其他策略都要好,那么選擇這“某個策略”就是我對于對手選定策略的最優反應。

納什均衡是這樣一種狀態,在該狀態下每個參與人所采取的策略都是對于其他參與人的策略的最優反應。以二人博弈為例,納什均衡就是一個策略組合(甲的策略,乙的策略),甲的策略是對于乙的策略的最優反應,而乙的策略也是對于甲的策略的最優反應。

4.商家選址問題

不管我們出門旅游,還是城市購物,您會發現,賣同類商品的賣家經常會緊鄰在一起。最大的快餐連鎖店肯德基和麥當勞,也經常會集中在一個地點,甚至相連。好多人都會想,這不是增大了自身的競爭嗎?用博弈論的觀點,我們很容易解釋這個問題。

4.1商家選址模型

設兩地A、B的距離為1000米,兩個商家甲、乙要在此選址開店。設兩地間均勻分布著1000名顧客,每個顧客都將在距離自己最近的店鋪消費。那么這兩個商家將如何布局他們的店鋪?

設商家甲將在距離A處x米開店,乙將在距離甲y米出開店,如圖1所示:

將該模型中,商家的支付系數越大,則吸引的顧客越多,設計支付矩陣,如表1所示:

由表1支付矩陣,我們可以得出,當x

同理,當x=500米,甲選在中點時,乙的最優策略也是選在中點;

當x>500米,甲選在距離B地較近處時,乙的最優策略是距離甲左側y米處,所得支付系數為:x-0.5y,當然,y=0時最大,即緊挨著甲的左側開店;

在上述模型中,兩個商家會發現,如果自己擺在中點以左(或右)的位置都是不好的,因為對方可以通過擺在緊鄰自己的右(或左)邊,即可獲得超過1/2的顧客消費者,而自己只能獲得少于1/2的顧客消費者。只有自己安置在中點位置,這才是最好的,因為無論對方緊鄰自己左邊還是右邊,自己始終可以得到1/2的顧客,其他位置不可能得到這么多顧客,于是,兩個商家就緊挨著將店鋪都開在了中點上。

5.現實問題解釋

上述的商家選址模型的博弈,還可以用于政治選舉中拉票活動的分析,也可以用于解釋為什么賣同類物品的商家都緊挨著布局,為什么有麥當勞的地方大多數都會有肯德基。在上述博弈模型中,(中點,中點)是一個納什均衡,兩個商家都已選取了他們的最優反應,甲選擇中點是對已選擇中點的最優反應,而乙選擇中點是對甲選擇中點的最優反應。只有在這樣的策略組合下,博弈的雙方才能得到一個穩定的結果,即達到了納什均衡。

參考文獻:

篇(2)

中圖分類號 F830 , O225 文獻標識碼 A

1 引 言

均值方差投資組合選擇的目標是,在終值財富的均值給定時使其方差最小.文獻[1]第一次用計量數學方法研究了該問題,并給出了求解投資組合策略的理論框架.近年來,由于人們對經濟問題的持續關注,均值方差投資組合選擇問題已成為數理金融研究的最熱點問題.文獻[2]研究了動態多個時代的均值方差組合問題.文獻[3]在隨機LQ的框架下研究了連續時間均值方差組合問題,通過隨機LQ得到了最優策略和有效邊界.文獻[4]研究了馬爾柯夫調制市場上具有資產負債的均值方差組合問題,獲得了最優策略和有效邊界.

在研究中,發現已有文獻對均值方差問題的研究,大多只從投資者的角度出發,獲得最優投資組合,而沒有考慮市場不確定性對投資者的影響.在實際中,投資者肯定會受到市場不確定性因素的影響,因此從投資者和市場2個角度同時考慮才更符合實際.這就是隨機微分博弈問題.隨機微分博弈屬于博弈論的范疇.博弈論雖然古已有之,但文獻[5]的發表才標志著隨機微分博弈時代的真正到來.隨機微分博弈,假設市場是博弈的“虛擬”對手,通過投資者和市場之間的雙重博弈得到最優的投資組合.它如今已成為數理金融學、管理學科的研究熱點.文獻[6]在跳-擴散金融市場中,利用隨機微分博弈論研究了風險最小化的投資組合策略問題.文獻[7]利用隨機微分博弈論研究了Markov調制模型下的期權估值問題.文獻[8]研究了兩個具有相關但不同投資機會的投資者之間基于隨機微分博弈的最優投資問題.文獻[9]在冪效用和指數效用下研究了具有負債的隨機微分博弈.文獻[10]在冪效用和指數效用下研究了基于再保險和投資的隨機微分博弈.

已往文獻對隨機微分博弈的研究大多數都是基于效用的,很少研究基于均值方差準則的隨機微分博弈.基于已往文獻對均值方差問題和隨機微分博弈的研究,本文嘗試把這2個問題結合起來研究.另外,目前資產負債管理已經受到理論界和許多金融機構的重視,有越來越多的學者對其進行研究,這里不再一一列舉.因此本文在文獻[9]基礎上研究了基于均值方差隨機微分博弈的資產負債管理.目標是當終值財富的均值一定時,在市場最壞的情況下,投資者選擇一個最優的投資策略最小化終值財富的方差.應用線性二次控制理論求得了最優投資策略、最優市場策略和有效邊界,并分析了負債對它們的影響.本文的創新點是:在資產負債管理中引入了均值方差隨機微分博弈.通過本文的研究在實踐上可以指導投資者在具有負債和市場出現最壞情況下,選擇恰當的投資策略使自身獲得一定的財富而面臨的風險最小;同時在理論上豐富和發展了資產負債管理和隨機微分博弈.

2 模型設定

2.1 金融市場

參考文獻

[1] H M MARKOWITZ. Portfolio section [J]. Journal of Finance, 1952, 7(1):77-91.

[2] D LI, W L NG. Optimal dynamic portfolio selection: multiperiod meanvariance formulation [J]. Mathematical Finance , 2000, 10(3):387-406.

[3] X ZHOU, G YIN. Markowitz’s meanvariance portfolio selection with regime switching:a continuoustime model [J]. SIAM Journal on control and optimal, 2003, 42(4):1466-1482.

[4] S X XIE. Continuoustime portfolio selection with liability and regime switching [J]. Insurance: Mathematical and Economics, 2009, 45(1):148-155.

[5] R ISAACS. Differential Games [M]. New York:Wiley,1965.

[6] S MATARAMVURA, B OKSENDAL. Risk minimizing portfolios and HJBI equations for stochastic differential games [J]. Stochastics An International Journal of Probability and Stochastic Processes, 2008, 4(3): 317-337.

[7] T K SIU. A game theoretic approach to option valuation under Markovian regimeswitching models [J]. Insurance: Mathematics and Economics, 2008, 42(3):1146-1158.

[8] S BROWNE. Stochastic differential portfolio games [J]. Journal of Applied Probability, 2000, 37 (1):126-147.

篇(3)

創新是企業永續發展的源泉。企業技術創新戰略模式的選擇是技術創新活動的起點和創新績效的根本保證。在創新過程中,企業面臨著競爭對手和潛在競爭者的威脅,其技術創新戰略模式的選擇本質上就是多方博弈的結果。實踐證明,中小企業技術創新戰略模式的選擇要根據外部環境和企業的內部條件,特別是企業自身的技術儲備和技術創新能力,才能實現技術創新戰略的成功實施從而提高企業的競爭優勢。

一、企業技術創新戰略模式的基本類型

技術創新戰略模式是指企業對技術創新經濟活動的帶有全局性、長遠性和方向性的謀劃。依據技術來源技術創新戰略模式主要劃分為自主創新和模仿創新。

1.自主創新是指企業依靠自身的努力產生核心技術或概念的突破,并在此基礎上完成創新的后續環節,實現科技成果商品化的創新行為。

自主創新戰略模式首先強調技術突破的內生性,即企業在研究開發方面的核心主導技術必須是企業依靠自身的技術力量而獲得的。其次,自主創新戰略模式強調技術與市場開發的率先性,第三,自主創新戰略模式強調知識和能力支持的內在性。在研究開發、設計、生產、銷售等創新鏈的每一環節都需要有相應的企業自身積累的知識和能力支持。

2.模仿創新是指企業通過引進、購買等合法手段,吸收和掌握率先創新者的核心技術和技術訣竅,充分吸取率先者成功的經驗和失敗的教訓,在此基礎上對率先者技術進行二次創新,進一步開發和生產富有競爭力的產品,參與市場競爭的一種創新行為。模仿創新決不是一種純粹簡單的照搬行為和拿來主義,而屬于一種漸進型的創新行為。

二、企業技術創新戰略模式選擇的博弈分析

在博弈論中,從參與人對有關其他參與人(競爭對手)的特征、戰略空間及支付函數所具有的知識角度劃分,博弈可分為完全信息博弈和不完全信息博弈。本文應用完全信息靜態博弈中最優策略均衡和重復剔除的最優策略均衡模型,對企業技術創新戰略模式的選擇進行博弈分析。

1.技術創新戰略模式選擇的最優策略均衡分析

由于每個參與人的效用(支付)是博弈中所有參與人的戰略的函數,因此每個參與人的最優戰略選擇依賴于所有其他參與人的選擇。這種不論其他參與人的策略如何,能夠使自己的支付(效用)對自己最為有利的策略叫最優策略。

假定A、B為同一行業并生產同類產品的兩企業,同時都面臨著是否進行自主創新的戰略選擇,技術創新戰略模式的支付短陣如表1:

表1 技術創新戰略模式選擇的支付矩陣(I)

表1矩陣中的數值表示A、B兩企業分別選擇對應技術創新模式的利潤水平。根據最優策略的定義描述,企業A的最優策略為自主創新的戰略模式。因為對企業A來說,針對企業B的兩種策略,假如B選擇自主創新,A選擇自主創新戰略模式時利潤為10個單位,而A選擇模仿創新只有6個單位的利潤;假如B選擇模仿創新,A選擇自主創新時利潤為15,而選擇模仿創新時利潤只有10單位,所以A當然選擇自主創新的戰略模式。即不論B選擇哪種策略,自主創新是A的最優策略。同理,企業B的最優選擇也是自主創新的戰略模式。因此上述支付矩陣中,支付組(10.5)構成了一博弈的均衡點,從而構成了最優策略均街。即A、B兩企業均選擇自主創新的戰略模式。

該博弈模型的均衡解是(自主創新,自主創新),在知識產權制度和市場競爭較完善的情況下,A、B企業都有自主創新的壓力和動力,創新行為得到有效激勵。假定A、B兩企業規模、市場競爭實力等相當,則博弈雙方的市場份額基本保持不變,但產品附加值得以提升,博弈雙方的收益和利潤率提高,能夠在整個社會范圍內形成鼓勵創新的氛圍,從而促進社會整體技術水平和技術創新能力的提升。

2.重復剔除的最優策略均衡分析

最優策略均衡是一種理想情況,在現實企業市場競爭中,博弈雙方的實力有時有較大的差異。如規模較小的企業市場份額小,創新效率低,面臨的創新風險大,創新的動力則明顯不足,下面運用“智豬博弈”(Boxedpigs)加以說明。

在“智豬”博弈中,有一大一小兩只可以做出理性選擇的智豬在一個食槽進食,食槽有一個電鈕,每按一次電鈕可出8單位食物,但按電鈕要付出2個單位的成本。大豬和小豬都有兩種策略可供選擇:一是等待對方按電鈕;二是自己主動按電鈕;針對兩種策略,可能出現四種不同的結果,各自得到的收益不同。

應用該模型分析,假定A為大企業,即“智豬博弈”中的大豬,B為小企業,即“智豬博弈”中的小豬,此時就會出現智豬博弈的行為,是否“按電鈕”則表示企業是否選擇自主創新行為,矩陣中的數值則表示扣除自主創新和模仿創新成本后企業的創新收益。博弈支付矩陣見表2。

表2技術創新戰略模式選擇的支付矩陣(II)

顯然,這個博弈沒有最優策略均衡,盡管“模仿創新”是小企業的最憂策略,但大企業沒有最優策略,其最優策略依賴于小企業的策略。我們用“重復剔除嚴格劣戰略”的思路來求出均衡解。首先找出參與人的劣策略,并除去這個劣策略,重新構造一個不包含這個劣策略的新的博弈;然后再剔除新博弈中的劣策略,直至唯一的策略組合,即為均衡解。稱之為“重復剔除的最優策略均衡”(Iterated dominance equilibrium)。

對小企業而言,給定大企業選擇“自主創新”,小企業選擇自主創新時,得到1單位收益,而選擇“模仿創新”則得到4個單位收益;給定大企業選擇“模仿創新”,小企業選擇“自主創新”,得到-1個單位收益,而選擇模仿創新則得到0個單位收益。因此不管大企業選擇何種策略,小企業的理性選擇都是“模仿創新”。在剔除小企業“自主創新”這個策略后的新博弈中,小企業就只有一種策略即“模仿創新”。此時“模仿創新”已成為大企業的劣策略,再剔除,剩下的惟一策略組合(自主創新,模仿創新),即矩陣中的(2,4),就是這個博弈的均衡解。該博弈模型表明,如果小企業和大企業都是理性的,則小企業選擇模仿創新戰略模式,而大企業的最優策略只能選擇自主創新創新的戰略模式。

三、中國中小企業技術創新戰略模式的現實選擇

1.中小企業及其技術創新現狀

中小企業是一個企業規模形態的概念,是指相對于大型企業而言,一些規模較小或處于創業階段和成長階段的企業。我國中小企業具有數量眾多,投資主體多元化,產業分布面廣,目前我國中小企業總數占到企業總數的99.6%,創造的最終產品和服務價值占中國國內生產總值的58.5%,上交稅收占48.2%。中小企業成為創造社會財富和提高整個社會財力的主體之一。

雖然我國部分中小企業的技術創新具有創新速度快、創新效率高等一些優勢,但總體來看中小企業技術創新普遍存在著技術創新人才匱乏、創新資金投入不足、技術設備落后、以及一些宏觀政策和法律環境等許多制約因素。2001年青島市中小企業創新狀況調查表明,中小企業科技人員的比例較低,而企業研發人員比重更低。近有70%的企業從事R&D的人員占據科技人員總數的5%以下。有關調查表明,我國企業平均的R&D經費投入強度平均為0.5%,其中大企業R&D經費投入強度是中小企業的兩倍多。可以看出,我國中小企業技術創新能力和技術水平與大企業相比有著一定的差距,同時在市場競爭中,大企業整體在規模、市場份額等方面也表現出更強的競爭優勢。

2.中國中小企業技術創新戰略模式的現實選擇

基于上述的博弈模型分析,可以給我們深刻啟示:目前在提倡企業自主創新的同時,不能一概而論,并不是所有類型的企業都適合進行自主創新。同時鑒于對中小企業技術創新現狀分析,筆者認為,現階段我國中小企業技術創新戰略模式的現實選擇應以以模仿創新為主,充分利用外部創新資源,通過合作創新,提高中小企業技術水平和企業創新能力,最終實現創新的最高境界――走自主創新之路。

日本、韓國的經濟發展、三洋、聯想等企業的成功經驗已證明,模仿創新是一種廣泛采用的技術創新模式。選擇模仿創新戰略模式的企業在技術方面,不做原理技術的開拓探索者和率先使用者,而是做有價值的新技術的積極跟隨學習者,將自己的研發活動集中在特定的領域,以最低的成本獲取最高的產出。從市場開拓方面來說,模仿創新企業可以充分利用并進一步開發率先創新者的市場領域,享受自主創新者開辟的新市場投入的諸多外溢效應,最大程度地避開了市場“沉默期”,減少新市場開發初期需求和市場行為的不確定性風險。

模仿創新是以模仿為基礎的一種創新活動,目的在于通過增加企業的知識儲備和技術積累,實現二次創新。但模仿創新有也其局限性,如模仿創新的時滯性,由于模仿創新者產品的推出較率先創新者在時間上有一定的延遲性,因此,在這段時間內,可能有大量其它模仿者進入該產品領域,往往市場競爭會越來越激烈;模仿創新的被動性,模仿創新者在技術上易受制于人,難以在市場競爭中占據主動地位,甚至會陷入技術追趕陷阱不能自拔。因此從長遠考慮,我國中小企業技術創新戰略模式應盡早從模仿創新過渡到自主創新,自主創新是企業技術創新的最高境界,也是中國中小企業提升自主創新能力和增強企業活力的源泉。

參考文獻:

[1]銀路:技術創新管理[M].北京:機械工業出版社, 2004 70-83

[2]劉東:微觀經濟學新論[M].南京: 南京大學出版社,1998 27-36

篇(4)

一、引言

企業作為一種以盈利為目的的經濟組織,在環境問題日益嚴重的今天,如何使他們在獲取利益的同時能更多更好的承擔環境責任成為社會的關注焦點。而金融行業作為國家經濟發展的命脈,它也越來越多的承擔環境責任。2002年10月,由世界銀行下屬的國際金融公司和荷蘭銀行提出了赤道原則(the Equator Principles,簡稱EPs),它將實行赤道原則的銀行在項目投融資中的環境與社會的標準基本確定,為金融企業在承擔環境責任和維持盈利之間平衡點的尋求提供了支持。

二、利益相關者視角下聯盟博弈模型

利益相關者理論從企業的角度來考察企業與其利益相關者之間的關系,在環境問題逐漸突出的今天,金融企業在其承擔環境責任和維持盈利水平之間的平衡點,是它們與其利益相關者相互博弈的結果。從聯盟博弈的角度,以金融企業的利益相關者為參與人,對它們在金融企業承擔環境責任時進行的行為進行博弈分析,以期證明博弈均衡的存在,即金融企業在承擔環境責任和維持盈利之間的平衡的存在性。

(一)金融企業利益相關者分類

在利益相關者理論和在金融企業承擔適度環境責任的條件下,參考徐徹在《基于利益相關者視角的企業社會責任管理研究》一文中對于企業的利益相關者的分類,我們將金融企業的利益相關者分為支持型利益相關者、威脅型利益相關者、利弊兼有型利益相關者、無關緊要型利益相關者這四類。

(二)聯盟博弈模型的構建[1]

1、參與者

A――支持型利益相關者

B――威脅型利益相關者

C――利弊兼有型利益相關者

D――無關緊要型利益相關者

A:支持型利益相關者――在承擔環境責任時,對金融企業造成正面影響力大而對企業負面影響力小。比如說:公司股東、新能源企業、綠色投資策劃等等。對于這類利益相關者,金融企業要采取參與的戰略,使其能夠參與到金融企業承擔環境責任的運營中來,讓雙方都能獲得利益。

B:威脅型利益相關者――在承擔環境責任時,對金融企業造成正面影響力小而對企業負面影響力大。比如說:傳統的能源消耗型企業或污染型企業等。對于這類利益相關者,金融企業要采取防范的戰略,盡量避免它們采取一不利于金融企業承擔環境責任的措施,最好是能將其轉換成其他類型的利益相關者。

C:利弊兼有型利益相關者――在承擔環境責任時,對金融企業造成正面影響力大而對企業負面影響力大。比如說:金融企業的顧客等等。對于此類利益相關者,金融企業要采取合作的戰略,使其能盡量采取對金融企業承擔環境責任有利的行動而減少對其的不利影響。

D:無關緊要型利益相關者――在承擔環境責任時,對金融企業造成正面影響力小而對企業負面影響力大。比如說:非以上舉例的利益相關者等等。對于這類利益相關者,金融企業要采取監控的戰略,因為它們有可能會向不利于金融企業承擔環境責任的利益相關者類型轉化,這也是金融企業要極力避免的情形。

2、參與者的策略及其相應支付

(1)A――支持型利益相關者

:積極行為;消極行為和不行為;對應的支付為(5,-1)

(2)――威脅型利益相關者

:積極行為;:消極行為和不行為;對應的支付為(1,4)

(3)――利弊兼有型利益相關者

:積極行為;:消極行為和不行為;對應的支付為(3,1)

(4)――無關緊要型利益相關者

:積極行為;:消極行為和不行為;對應的支付為(4,0)

其中,以上所說的積極行為是指有利于金融企業承擔適度環境責任的行為,消極行為是指不利于金融企業承擔適度環境責任的行為,不行為是指對于金融企業承擔適度環境責任不作為的行為。

為使以上假定能更加符合金融企業承擔環境責任的現實,考慮到不同類型的利益相關者的不同行為會產生不同的效力。同時結合前面金融企業利益相關者的分析矩陣中不同利益相關者對金融企業的不同影響力,我們假定以上參與者的策略若出現,所有參與者支付減去3;若出現,所有參與者支付減去1;若出現,所有參與者支付減去2。

3、聯盟博弈矩陣及其最優策略分析

在支付矩陣中,是所有參與人的集,是聯盟集,IS是指除了聯盟以外的剩余參與人集,V是對策的特征函數,MN1表示各行的最小值,表示各列的最大值。為了計算特征值,當矩陣的MN1中的最大值與中的最小值相等時,根據矩陣的最大最小值原理,該支付矩陣就構成了一個鞍點,該鞍點的支付是對策的最優解;當矩陣的MN1中的最大值與中的最小值不相等時,根據策略的優超關系來確定最優策略。

(1)單人聯盟博弈支付矩陣和最優策略

在金融企業承擔適度環境責任時,通過單人聯盟博弈支付矩陣和最優策略分析可知:不論金融企業的支持型利益相關者選擇積極行為還是消極行為和不行為,威脅型利益相關者、利弊兼有型利益相關者、無關緊要型利益相關者的最優策略都是消極行為或不行為。因此,在單人聯盟背景下,金融企業承擔適度環境責任的最優策略是支持型利益相關者選擇積極行為。

(2)雙人聯盟博弈支付矩陣和最優策略

在金融企業承擔適度環境責任條件下,雙人聯盟博弈支付矩陣和最優策略分析表明:金融企業的利弊兼有型利益相關者和無關緊要型利益相關者的行為具有隨機性,但其支持型利益相關者會選擇積極行為,威脅型利益相關者選擇消極行為或不行為。因此,在雙人聯盟背景下,金融企業承擔適度環境責任的最優策略是支持型利益相關者會選擇積極行為,威脅型利益相關者選擇消極行為或不行為。

(3)三人聯盟博弈支付矩陣和最優策略

在金融企業承擔適度環境責任背景下,通過進行三人聯盟博弈支付矩陣和最優策略的分析,我們可以知道:聯盟之間的策略選擇具有相對性,當一個聯盟選擇消極或破壞性的政策時,另一個聯盟會選擇積極的策略,說明在給定對方行為選擇的情況下,自身的策略選擇是唯一的。

三、總結

通過借助于金融企業利益相關者的分類,和聯盟博弈模型的構建和分析,我們可以知道在金融企業選擇承擔適度環境責任行為時,各類參與者存在最優策略和博弈均衡。所以,金融企業在承擔環境責任和維持盈利之間的平衡是存在的。

根據以下三個博弈矩陣和特征函數的定義:

因此,這是一個實質性的博弈,并且存在三方聯盟優于雙方聯盟,雙方聯盟優于單人聯盟的情形[1][2]。所以,金融企業在承擔環境責任和維持盈利之間的平衡不僅是存在的,而且存在最優情形。

通過以上博弈均衡結果分析,目前我國金融企業承擔環境責任仍存在以下的不利因素:第一,在各種聯盟博弈中,對于支持型利益相關者來說,它們的最優策略均是積極行為,但在實際中,因為要預先承擔支付成本、回收期限等風險,不會很主動的選擇采取積極行為。第二,在雙人博弈中,就威脅型利益相關者的利益來說,它們的最優策略是選擇消極行為或不行為,但這對于承擔環境責任的金融企業來說,勢必存在更多的阻礙因素。第三,在三人博弈中,要在給定對方行為選擇的情況下,自身的策略選擇才才是唯一的,這讓各個利益相關者的行為選擇充滿著隨機性,不利于金融企業制定合理的方案來承擔環境責任。

四、對策建議

通過以上分析,并結合我國金融企業承擔環境責任的現狀,并進一步促進我國金融企業更好的承擔環境責任的平衡性發展,現提出以下對策建議:

第一,政府應加強相關支持法律制度的建設和對我國金融企業承擔環境責任承擔的規范監督作用。在以上博弈模型分析中,我們可以知道金融企業的利益相關者對于金融企業承擔環境責任行為的選擇有著影響。政府可以利用其對金融企業及其利益相關者的強制力,對金融企業承擔環境責任提供良好的外部環境。[4]

特別是在雙人博弈和三人博弈中,對于威脅型利益相關者和利弊兼有型利益相關者的最優策略選擇(消極行為或者不行為),政府可以采取更強有力的手段,比如說制定合理有效的法律制度和獎懲措施、建立監督機構、加大稅收力度等,增加它們采取積極行為的支付水平,并且弱化它們的不利影響,這也是金融企業更好的承擔環境責任的核心所在。

第二,我國金融企業應加強其在市場表現中的運營戰略選擇。聯盟博弈的結果讓我們知道三方聯盟要優于單人和雙人聯盟,這使得金融企業在承擔環境責任時可選擇戰略的影響因素更多,在一定程度上提高了金融企業在承擔環境責任時的運營風險,但也增加了它們的盈利機會。所以,金融企業在其運營中,對于不同類型的利益相關者要采取不同的戰略,比如說支持型的戰略是參與、威脅型的戰略是防范、利弊兼有型的戰略是合作、無關緊要型的戰略是監控等,這將更有利于我國金融企業承擔環境責任平衡性的發展。

第三,加強我國金融企業自身對承擔環境責任行為的創新發展。對于金融企業自身來說,它們的最優策略是采取積極行為。它的積極行為主要可以從內部和外部來說,內部積極行為是指從企業內部文化、企業形象等方面采取的有利于承擔環境責任的行為,外部積極行為是指金融企業在業務拓展和市場開發等方面有利于承擔環境責任的行為,比如說投資風險比較大的新興綠色產業或方案、碳金融市場的開發等。[5]

參考文獻

[1]淮建軍,劉新梅,雷紅梅.我國房地產市場管制中四人聯盟與對抗的博弈分析[J].系統工程,2007,25(12).

[2]李勝.兩型社會環境治理的政策設計――基于參與人聯盟與對抗的博弈分析[J].財經理論與實踐,2009,30(161).

[3]張維迎.博弈論與信息經濟學[M].上海三聯書店,上海人民出版社,2006.

[4]吳椒軍,張慶彩.企業環境責任及其政策法律制度設計[J].學術界,2004(6).

[5]馮蕾.基于低碳經濟視角的企業環境責任研究[J].長春師范學院學報(人文社會科學版),2010,29(5).

篇(5)

一、前言

大學生就業一直是高等教育界乃至整個社會共同關注的話題。近幾年我國經濟進入新常態,在經濟下行壓力和產業結構調整的大背景下,就業壓力問題更加突出,結構性矛盾更加凸顯。與此同時,高校畢業生人數逐年增加,2017年高校畢業生將達795萬,較去年增加30萬人數,這在一定程度上導致我國當前就業形勢更加嚴峻和復雜。基于此,本文借鑒“產學研合作”研究的方法,提出大學生就業UIG合作機制,并進一步探討了UIG合作機制中相關利益主體的博弈分析,試圖緩解當前就業難問題。

二、大學生就業UIG合作創新體系中的利益主體

政府在大學生就業UIG合作過程中發揮宏觀指導作用,政府主要通過制定相關方針政策起作用,它是引導大學生就業的重要力量。就業政策就像是“看得見的手”,不僅可以彌補勞動力市場這只“看不見的手”的不足,而且能夠引導和促進“看不見的手”,在大學生就業過程中更好發揮作用。政府具有資金和政策的優勢,政府應制定相應的政策法規,地方各級政府也必須高度重視,發揮政府的組織優勢、資源調控優勢、公共管理優勢,形成政府、高校和企業的協同運作,在稅收、信貸、經費等方面積極發揮調節作用。企業在大學生就業UIG合作具有實踐作用。企業作為人才的需求方,應利用自身對市場的聯系,及時反饋市場對人才的需求。這樣,高校才能快速調整培養模式,向企業輸送急需人才。此外,企業應為畢業生提供實習平臺,參與人才培養的過程來,這樣培養的人才,有助于企業未來的發展。高校就業率是評價一個學校的標準,社會對就業率的強勢關注在一定程度上促進了高校對大學畢業生就業工作的重視。高校作為勞動力市場的供給方,每年向企業和政府部門培養和輸送大批優秀人才,應該打破傳統人才培養模式,在產學研合作的基礎上,促進校企合作培養人才,實現企業需求與人才培養之間“零距離”,社會需求和崗位要求“零距離”,實施教育與上崗就業之間“無縫連接”,結合市場需求、企業要求和大學生自身需求,積極推進人才教育模式的革新,進行頂層設計。高校學科專業結構需要同社會、經濟發展規律相適應,根據不同的辦學層次、類型和定位,形成特色專業,使培養的學生能夠符合現有市場的要求。政府也應該在高校教育體制改革上給予一定的支持,確保新的培養模式的能夠進行。其次,針對大學畢業生,高校就業指導需要有效“補位”。高校應促進校企合作,讓企業加入高校人才培養中來,利用企業的資源和平臺,從而實現畢業生有效、快速的就業。

三、大學生就業UIG合作創新體系的博弈分析

政府、企業、高校三者之間的利益既存在一定矛盾,也有協調的一面。由于涉及政府、企業、高校三者之間的利益博弈,為簡單起見,本文在“經紀人”和不完全信息假設條件下,采用博弈(EvolutionaryGame)方法,分別討論政府與企業、企業與高校、高校與政府之間的利益博弈,以此來解釋大學生就業UIG合作創新體系的可行性。

(一)政府與高校的利益博弈分析

政府與高校博弈的收益矩陣如表1所示。通過對政府與高校博弈的收益矩陣的分析可知,對高校而言,無論政府選擇“支持”或者“不支持”策略,“作為”是高校的最優選擇(理由:1>-1;6>3)。同理,對政府而言,無論學校選擇“作為”或者“不作為”策略,政府都會選擇“支持”策略。因此,策略組合(作為,支持)是該博弈的納什均衡,此時,雙方也達到帕累托最優狀態,即最優均衡策略,其均衡報酬為(6,4)。政府和高校的博弈過程和結果表明,在大學生就業UIG合作方面,政府與高校的利益目標基本一致,政府關注大學生就業問題,有利于社會的穩定和發展,而高校重視畢業生就業率對自身以后的招生和長期發展十分有利。因此,政府和高校會達成共識,共同努力,來解決大學生“就業難”問題,從而實現雙贏的效果。

(二)高校與企業的利益博弈分析

高校與企業博弈的收益矩陣如表2所示.通過對高校與企業博弈的收益矩陣分析可知,對企業而言,無論高校選擇“作為”或者“不作為”策略,“配合”是企業的最優選擇(理由:3>1;5>2)。同理,對高校而言,無論企業選擇“配合”或者“不配合”策略,高校都會選擇“作為”策略。因此,策略組合(配合,作為)是該博弈的納什均衡,此時,雙方也達到帕累托最優狀態,即最優均衡策略,其均衡報酬為(5,4)。企業和政府的博弈過程和結果表明,在大學生就業UIG合作方面,企業與高校的利益目標基本一致,企業需要符合自己發展的人才,而積極與高校交流,有利于企業科研成果轉化為產品,是企業在市場立于不敗之地。高校重視畢業生就業率對自身以后的招生和長期發展十分有利,而與企業合作,可以共享其資源和平臺,將有利于高校科研的發展。因此,政府和高校會達成共識,共同努力,來解決大學生“就業難”問題,從而實現雙贏的效果。

(三)企業與政府的利益博弈分析

企業與政府博弈收益矩陣如表3所示。通過對企業與政府博弈的收益矩陣分析可追,對政府而言,無論企業選擇“配合”或者“不配合”策略,“支持”是政府最優的選擇(理由:1>-2;6>1)。同理,對企業而言,無論政府選擇“支持”或者“不支持”策略,企業都會選擇“配合”策略。因此,策略組合(支持,配合)是該博弈的納什均衡,此時,雙方也達到帕累托最優狀態,即最優均衡策略,其均衡報酬為(6,5)。企業與政府博弈的過程與結果表明,在大學生就業UIG合作方面,企業與政府的利益目標基本一致,企業一方面能夠招聘到符合自己發展的人才,另一方面參與大學生就業UIG合作,在一定程度上可以獲得政策支持,這有利于企業的長期發展,而政府通過在大學生就業UIG合作發揮積極作用,可以降低社會失業率,有利社會的穩定和發展。因此,企業和政府會達成共識,共同努力,來解決大學生“就業難”問題,從而實現雙贏的效果。

四、研究結論

在大學生就業UIG合作過程中,政府、企業和高校三者既有協調的方面,也存在一些矛盾,總體上,三者之間利益目標基本一致。本文基于博弈論的視角,利用數值模擬討論了三者在大學生就業UIG合作過程的利益博弈,得到其最優策略,從博弈結果可知,大學生就業UIG合作在理論上具有很強的可行性,是一種多方“共贏”的模式。

參考文獻:

篇(6)

一、博弈論下的貨幣政策博弈分析

貨幣政策博弈分析即利用博弈論方法分析宏觀金融博弈問題。因而,博弈論是宏觀金融博弈分析的方法論基礎。納什(Nash) 在1950年和1951年發表了兩篇關于非合作博弈的重要文章,從一般意義上定義了非合作博弈及其均衡解,并證明了均衡的存在,基本奠定了現代非合作博弈論的基礎。因而,該均衡以后被博弈理論稱為“納什均衡”。即是指由所有的參與者的最優策略組成的策略組合。在這種策略組合中,給定其他參與者的策略,沒有任何單個參與者有積極性選擇其他策略,也就沒有人主動去打破這種均衡。相反如果一種均衡或制度安排,如果不是一種納什均衡,即不是所有參與者的最優策略組合,那么,這種組合就不能成立或者至少不能持續。合作博弈強調團體理性、效率和公平。而非合作博弈強調個人理性、個人最優決策。其結果可能是有效的,也可能是無效的。現實中,大量的經濟博弈問題是非合作博弈。非合作博弈理論的發展為其在經濟研究中的廣泛應用創造了條件并推動了合作博弈的進一步發展。

納什均衡假定博弈參與者在選擇自己的策略時,把其他參與者的策略當做給定的。而不考慮自己的選擇如何影響博弈對手的選擇。這個假定在靜態博弈下是成立的,但在動態博弈下卻不成立。在靜態博弈中,所有參與者同時行動,不可能在自己采取行動前觀察到其他人的行動,因而就無暇反應。但在動態博弈中,一方行動在先,另一方行動在后,后者自然會根據前者的選擇而調整自己的選擇,前者自然會理性地預期到這一點,所以不能不考慮自己的選擇對其他參與者的影響,由于決策者不考慮自己的選擇對他人選擇的影響,納什均衡允許了不可置信威脅的存在。1965年澤爾騰(Selten) 將納什均衡的概念引入了動態分析,定義了“子博弈精練納什均衡”的概念,將不可置信的威脅策略從納什均衡中剔除出去,從而解決了完全信息動態博弈均衡求解問題,將不可置信的策略變成可置信策略的行動,即經濟學中的“承諾行動”。如果當事人不履行其承諾時將為之付出相應的代價,這種承諾就是可置信的,否則就是不可置信的。該概念的提出,對利用博弈論方法研究貨幣政策問題奠定了基礎。

二、納什均衡在貨幣政策效應中的應用

在理性預期條件下,我們考察一期的貨幣政策博弈均衡。假定中央銀行的目標成本函數為:

其中:π為通貨膨脹率;y為實際經濟增長率;y*為中央銀行期望的經濟增長率。

根據盧卡斯供給曲線:y=yn+α(π-πe), α>0

其中:ynt為潛在經濟增長率;πet為公眾的預期通貨膨脹率; α表示非預期通膨脹對經濟的影響程度,即總供給曲線的斜率。

假定α=1,即:y=yn+(π-πe)

同時假定中央銀行對貨幣增長有完全的控制能力,公眾的預期完全理性;不存在真實供給沖擊和貨幣流通速度變化的影響,通貨膨脹率π等于貨幣供給增長率m,通貨膨脹預期πe等于貨幣供給增長率me;中央銀行期望的經濟增長率與潛在的經濟增長率相等。有:

令公眾的目標函數為避免由于預期誤差導致的通貨膨脹之害,因此可把公眾的效用函數定義為:U=-(m-me)2

篇(7)

中圖分類號:TM925.07 文獻標識碼:A 文章編號:1009-914X(2015)05-0282-01

1 引言

近年來, 隨著網絡應用復雜度的不斷提高, 網絡攻擊方法層出不窮。各種網絡攻擊方法中, 木馬攻擊是最具危險的手段之一。一旦計算機系統被種植木馬, 就將長期潛伏, 對系統的保密性、可用性造成致命傷害。本文提出了一種在新型木馬檢測系統中, 基于不完全信息博弈理論的計算機木馬檢測策略選擇方法, 為解決準確檢測木馬問題提供了新的思路。

2 計算機木馬檢測系統構成

本文成果應用的計算機木馬檢測系統由主機信息檢測模塊、網絡信息檢測模塊和智能決策模塊三個模塊組成。

主機信息檢測模塊對主機的文件、進程、網絡連接、加載文件等信息結合白名單檢測、端口關聯等檢測方法, 按照檢測策略進行檢測。網絡信息檢測模塊基于網絡協議的分析, 對宿主主機發出的數據包進行層層剝離, 準確獲取數據包信息, 同時根據各種信息特征進行統計, 從中發掘可疑網絡流量信息。智能決策模塊將網絡和主機獲取的數據根據攻擊特征進行逐項分析, 然后對分項結果關聯形成檢測結論, 最終顯示給用戶。

3 木馬檢測與反檢測博弈行為分析

3.1 木馬反檢測的一般方法及分析

木馬必須的功能包括隱蔽啟動、網絡外聯。木馬反檢測方法大體有隱藏進程、隱藏模塊、隱藏網絡連接、隱藏文件、隱藏服務、隱藏啟動項、穿透防火墻。

3.2 木馬檢測的博棄行為

在木馬檢測過程中, 自始至終存在著對抗雙方檢測與反檢測的博弈。木馬檢測系統要制定應對不同等級木馬的檢測策略。從檢測到的可疑程序中將這些正常程序甄別出是系統的重要工作。在計算機被種植木馬的環境下, 檢測工作是一個雙方不完全信息動態博弈的過程, 檢測系統必須逐步尋找最優策略, 以達到檢出目的。

3.3 不完全信息動態博棄

根據隨機博弈的思想, 檢測系統的每一個部分檢測的結果概括成一種“狀態”。雙方在該部分的收益取決于各自采用的策略。通常, 一個兩方隨機博弈用如下七元組描述(S,,, Q,,,β),其中:

一般的木馬檢測博弈過程如下:在某個檢測模塊工作的時刻t, 博弈處于狀態∈S。,木馬從反檢測策略集中選擇策略, , 系統從檢測策略集中選擇策略, 然后木馬得到一個收益= (,,), 系統得到收益= (,,),然后博弈進入第二個狀態∈S。

根據不完全信息動態博弈理論, 當期收益不僅取決于當前狀態和這種狀態下木馬與檢測系統選擇的策略, 還取決于雙方針對對方類型所做的概率分布判斷。根據隨機博弈理論, 木馬的收益應該為= (,,), 假設此時木馬對不會被檢測出的概率判斷為μ, 根據不完全信息博弈理論,其收益為= (,,,μ), 同理, 假設此時檢測系統對木馬是否判斷出被檢測出的概率判斷為λ, 此狀態下其收益為= (,,,λ)。

4 基于動態博弈的木馬檢測策略選擇

木馬檢測環境下, 針對一個特定的狀態, 策略選擇過程為:

(1)首先確定檢測系統和木馬的策略集;

(2)當前狀態下, 確定針對檢測系統不同的策略, 木馬對被檢出的概率μ分布;

(3)根據木馬實現技術水平的高低確定木馬類型, 然后檢測系統確定木馬類型的概率分布ν,在此基礎上根據木馬在當前狀態下采取不同的策略下, 確定木馬判斷出被檢出的概率分布λ;

(4)確定木馬的收益函數。為了長時間牢固控制主機(I), 木馬需具備反檢測手段(T), 由此確定木馬的線性收益函數為:=(I-T)(1-μ)(1)

(5)確定檢測系統的收益函數。檢測系統的收益函數與木馬反檢測水平(T),檢測系統獲取的信息(),木馬判斷檢測系統會采取的檢測方式信息()相關, 由此確定檢測系統的線性收益函數為:=(γI-T-)(1-γ)(2)

假設檢測系統對木馬類型的判斷概率是,則對n類木馬, 系統在該狀態下的收益為:

(6)計算納什均衡解, 確定木馬檢測策略。要達到納什均衡解必須滿足兩個條件:檢測系統采取的策略要實現自己的收益最大化;要使木馬的收益盡可能高。

成立的策略'為其最優策略,其中表示確定檢測系統所有策略下的最大收益,'為選擇該策略下的木馬的判斷概率。

對檢測系統而言,使得條件:

成立的策略'為其最優策略,其中'表示系統在木馬自防護策略下的最大收益,'為選擇該策略下的系統的檢出判斷概率。

5 示例與仿真

以主機信息檢測部分為例,使用簡化策略進行仿真分析。

(1) 確定雙方策略集

在主機信息檢測狀態下,檢測系統的策略集。

(2) 確定木馬對檢測系統策略類型評估的概率μ分布

根據木馬反檢測能力的高低分為三類,高級木馬,中級木馬,和初級木馬,根據經驗,木馬對檢測系統策略評估正確的概率μ分布如表1。

(4)確定木馬在當前狀態下的收益

根據經驗確定控制主機I值,反檢測T值表。

(6)計算納什均衡解

木馬的最優策略是;根據式(3)及表3,檢測系統的最優策略是。

6 結論

木馬檢測策略是木馬檢測系統的關鍵之一。本文提出了一種基于不完全信息動態博弈的木馬檢測策略選擇的方法,該方法基于對抗的動態性及對抗雙方信息不完全的特點,把信息獲取和不完全信息動態博弈有機結合,示例與仿真初步驗證了模型的有效性。

參考文獻

篇(8)

在我國農業產業化過程中訂單農業是居于主要形式的,其未來的發展對我國農業產業化進程至關重要。在訂單農業中最為關鍵的就是農戶與農業加工企業間的關系,“農+企”的關系構成了訂單農業的核心。目前在我國訂單農業中農戶與農業企業間的關系并不是很穩定的,在一定范圍中存在著履約率低的現象,這嚴重束縛了訂單農業在我國的進一步發展。

一、訂單農業中“農+企”關系的現狀介紹

訂單農業目前出現了履約率較低的現象,究其原因是復雜的。主要表現在:當原料市場價格高的時候,哪家企業出的價格高,農民就把農產品賣給那家企業,不履行合同中規定的義務,進而會出現幾家企業甚至地區間企業搶購原料的無序競爭狀態;當原料市場價格低的時候,企業又不愿敞開收購或壓級壓價收購,變相不履行合同,造成訂單農業執行難,產生大量的經濟糾紛,束縛了當地訂單農業的進一步發展。

二、訂單農業中“農+企”關系矛盾的博弈分析

我們就以農產品加工企業和當地的種植農民之間的關系作為例子,運用博弈論的知識來對此加以分析:假定在這場博弈中有兩個博弈的參與者,一個是種植農戶,簡稱博弈參與者A;另一個是當地收購并且加的企業,簡稱博弈參與者B。同時假定在這個博弈過程中雙方享有的信息是平等的,不存在任何一方占有信息優勢。對于參與者A和B來說,都有兩種可供選擇的博弈策略:履約和不履約。由此,可得關于A,B博弈參與者的收益矩陣:(見表1)

表1 A、B博弈參與者的收益矩陣(注:b>a>d>c)

由上表中關于博弈參與者A,B的收益矩陣可知,當博弈參與者B遵守合同時,A遵守合同獲得的收益為a,不遵守合同獲得的收益為b,因為b>a,在此情況下A作為一個理性的人來講會選擇不遵守合同;當博弈參與者B不遵守合同時,A遵守合同獲得的收益為c,不遵守合同獲得的收益為d,因為d>c,在此情況下A作為一個理性人會選擇不遵守合同。這樣,對于博弈參與者A來講,不管博弈參與者B采取何種博弈策略,它的最優策略是不遵守合同較為有利。同樣,對于博弈參與者B而言,最優策略也是不遵守合同較為有利。

綜上,在該博弈里,對于博弈的參與雙方而言,各自的最優策略都是不遵守合同,這樣得到一個納什均衡博弈結果,此時雙方的收益為(d,d)。由收益矩陣可知,該博弈的最優均衡結果是雙方都選擇遵守合同的策略,相應的收益為(a,a)。因而,此種博弈的納什均衡并不是最優的納什均衡結果。

三、增加外部干預措施后的博弈分析

導致前面博弈沒有取得最優均衡結果的根本原因是:博弈雙方的利益分配得不合理,增加了博弈雙方的違約動機。如果我們能對博弈棋局的外部采取干預措施來改變博弈雙方的利益分配格局,進而降低博弈雙方的違約動機,就有可能使雙方的收益達到最優的均衡博弈結果,即雙方將都從干預中獲益。

下面我們就以對博弈參與雙方的違約行為采用高額罰金進行處罰的干預方式作為例子來分析利益雙方的博弈行為。

假定在博弈的一方遵守合同而另一方違約的情況下,違約的一方將面臨高額罰金(假如該罰金為),同時該罰金的所得都用于補償遵守合同的另一方的利益損失。此時違約的一方所獲得的收益為,遵守合同的另一方的收益為,其他情況則保持不變(收益矩陣見表2)。

表2 收益調整后博弈參與者A,B的收益矩陣

下面分析的不同取值對博弈雙方最終博弈結果的影響:

1.當時。在此條件下我們很容易得出結果:對于博弈雙方AB來說,不管對方采取何種博弈策略,它都會選擇不遵守合同的博弈策略。這樣,最終博弈雙方的均衡結果與先前的博弈結果是相同的,此時該種干預措施的效果是比較差的。

2.當時。對于博弈的參與者A來說,當博弈參與者B遵守合同時,它遵守合同獲得的收益a要大于不遵守合同獲得的收益,從理性人的角度來看,A會選擇遵守合同的博弈策略;當B不遵守合同時,它遵守合同獲得的收益要大于不遵守合同獲得的收益d,此時A同樣會選擇遵守合同的博弈策略。即不管B采取何種策略,A都會選擇遵守合同的博弈策略。同理,對B加以分析,也會得到相同的結果。這樣,最終博弈雙方的均衡結果是最優納什均衡,即大家都選擇了遵守合同的博弈策略,最終收益為(a,a)是最優的,即該種干預措施對利益雙方都是有利的。

3.當時。分析結果是此時博弈雙方無最終的均衡博弈結果,也就是說此時的博弈結果是不確定的,因而此時該種干預措施的效果也就是不確定的。

綜上所述,適當增加干預條件,當罰金值滿足的條件時,經過收益調整后的博弈雙方就會得到一個最優的納什均衡,此時雙方也將會從該博弈中獲得最大的收益。

四、對策與建議

我們論證了:通過外界的干預措施來降低博弈雙方違約的動機是解決先前的非最優均衡博弈結果的有效方法[4]。具體的干預方法和措施主要有:

1.增加博弈雙方的違約成本,降低違約動機

(1)可以設立一個中介機構,比如稱為農產品交易中心,通過以該交易中心為中介,來完成雙方的交易(這有點像期貨交易中的清算所的作用,具體見圖)。這樣不論哪一方都不會輕易的違約,因為保證金會作為它們違約的代價。同時也避免了違約金被長期占用的情況,雙方履約完成后保證金會自動退回雙方。而且,交易的雙方可以互相選擇交易對象,有利于農戶維護自身的權利,改善了單個農戶與企業之間訂立合同時所處的劣勢。

設有農產品交易中心的訂單農業示意圖

(2)建立農戶和企業的信用檔案。如果發現農戶或者企業在履約時出現違約的現象,可以在它們的信用檔案中加以記錄。對有違約現象等不良記錄的農戶,從信用社或銀行獲取貸款時,將增加貸款的審核條件,在貸款利率、期限和貸款使用途徑等方面有更嚴格的要求。通過這種方式,增加相關農戶和企業違約的成本,提高履約率。

(3)通過設立農戶自律組織來增加雙方的違約成本。通過協會的形式來規范農戶自身的行為,同時當農戶面臨農業企業的變相違約時,可以以協會為主體,采取集體性的措施,維護自身的權利。當然,對于農業生產中介組織這個領域,目前我國的發展還處于起步和探索階段,要真正在實踐中做好還是比較難的。

2.通過更為科學的合同定價來降低博弈雙方的違約動機。通過分析,我們會發現導致種種利益矛盾的另外一個根本的癥結是合同中所采用的固定價格機制,而這與市場中相關農產品價格的波動是有沖突的,這也導致了雙方利益關系的不穩定甚至出現利益沖突。

(1)將合同中的固定價格轉化為浮動價格。如果把合同中的固定價格轉化為浮動價格,這樣農民和企業之間就不會產生因為市場價格變化,而導致雙方之間的利益沖突。主要是通過期貨交易,來達到對該農產品的價格進行套期保值的效果,鎖定該農產品的未來價格。

(2)在合同中設立附加條款,避免合同雙方利益的過度不平衡,進而可以減少雙方的違約動機。比如可以在合同中規定,當市場價格處于合同規定價格的10%(或者是其他比例數額)波動范圍內時,雙方交易的價格仍以合同規定的價格為基準;超過波動范圍時,此時雙方交易的價格就以另一種計價方式來計價。這樣,避免了因為市場價格的大幅度變化,出現一方獲得較大收益,而另一方則面臨著相應的大幅度虧損的不利局面,有利于提高合同雙方的履約率。

五、結束語

從上面的分析中可以看出,導致當前“農+企”關系面臨困境的主要原因是其中的制度設計和執行方面存在著缺陷。所以,對于這種由于制度缺陷原因而導致的困局我們應主要從糾正制度缺陷方面入手來加以解決,即通過改變博弈雙方不合理的收益分配格局,以此來降低雙方的違約動機,實現最優納什均衡。

參考文獻:

[1]祝宏輝:新疆番茄產業實施訂單農業生產方式的效果評析[J].農業技術經濟.2007(3):89-95

[2](美)朱?弗登博格,(法)讓?梯若爾.博弈論[M].北京:中國人民大學出版社,2002

[3]楊鵬飛:發展農業產業化之我見[J].內蒙古農業科技,2003(6):153-154

篇(9)

引言

隨著我國在全球經濟一體化格局下的逐步深入,投資市場日益火爆起來,越來越多的投資人將手中的閑錢作為資本投資項目,這樣,作為投資人主要的咨詢對象投資公司之間的競爭更加激烈。

投資人經常把資金交給投資公司去投資,源于投資公司的道德風險就成了投資市場發展的一大問題。委托關系實質是在合同不完備和信息不對稱的情況下的行為關系。從投資人與投資公司在投資項目中所扮演的角色看,二者的關系很明顯為一種委托-關系。由于投資人作為委托人不能夠直接地、有效地控制作為人的投資公司的行為,因而投資人只能夠通過外部的激勵機制間接地影響投資公司的行為。

投資市場道德風險是指投資人與投資公司簽訂合約后可能會采取隱蔽行為,在人(投資公司)與委托人(投資人)信息不對稱的情況下,投資人難以準確地判斷投資公司是否高努力工作,投資公司就是利用這種信息不對稱采取“搭便車”的行為,從而損害投資人的利益。在投資市場中,投資公司承接項目后,一部分投資公司為獲得豐厚的收益會高努力工作,這樣就減少了項目失敗的概率;而另一部分投資公司會不再高努力工作,反正損失會由投資人來承擔,并且自己還會得到最基本的傭金,我們就將這種行為稱為道德風險。目前,關于這方面的討論一般限于定性分析,具體的數量模型分析較少。本文討論的就是建立在這種道德風險下的博弈問題分析,以及均衡狀態下雙方的最優博弈策略,最后建立投資人的激勵優化模型,使投資人的期望效用達到最大,并確定其最優決策。

一、投資人與投資經理的博弈模型及均衡分析

1.投資人與投資經理的博弈模型

假定投資市場是一個完全競爭的市場,于是投資人的期望利潤為0。另設投資人的效用函數為;設投資經理的效用函數為。圖為該博弈問題的博弈樹。

由圖可見此博弈為三階段動態博弈,第一個節點表示投資經理,分支表示其選擇(高努力與低努力)。第二個節點表示投資項目自然的選擇,即項目是否投資成功。第三個節點表示投資人,分支表示投資項目失敗后投資人是否對其進行審核。其中終端括號表示投資公司(投資經理)的最終效用與投資人的最終效用。

有關雙方博弈順序如下:

(1)合約雙方(投資人與投資經理)簽訂項目合約,合約規定了:投資經理的基本傭金A(無論投資經理是否能投資成功,都會得到的報酬)、獎金B、罰金F。

(2)投資經理選擇自己的風險狀態,即可選擇高努力,又可選擇低努力,投資經理知道自己的選擇,而投資人是不知道的,只知道其選擇高努力與低努力的概率為1-t和t。并且在高努力情況下其花費的成本為 ,低努力情況下其花費的成本為eL,易見eH>eL。

(3)投資經理高努力情形下項目投資失敗的概率為α,低努力情形下項目投資失敗的概率為β,明顯β<α。若項目失敗,投資人會損失S,且投資人只會給投資公司(投資經理)最基本的傭金A作為投資公司的報酬;若項目成功,投資人會盈利T,且投資人會給投資公司A‘作為投資公司的報酬,其中A‘=A+B,B為投資人給投資公司成功投資項目的獎金。

(4)若項目投資失敗,投資人會以概率q對投資經理是否高努力進行審核(假定審核一定可以發現投資經理的努力狀態),且審核的費用為D。若審核的結果為投資經理低努力,則投資人要對投資經理處以罰金F。

(5)支付最終分配。

2.博弈模型的均衡分析

按照博弈的行動順序,當投資人發出信號時,他預計到投資公司會根據其信號修正自己類型的判別,因此選擇一個最優的類型依存信號戰略;同樣,投資人也知道投資公司選擇的是給定類型和考慮信息效應情況下的最優戰略。因此,投資人使用貝葉斯法則修正對投資公司的類型進行判別,然后選擇最優策略的行動。

令q為混合策略意義下使投資公司認為高努力與低努力之間是無差別的審核概率,此時,投資經理高努力與低努力的情形下的期望效用無差異。即

若投資經理是風險中性的,為計算方便,簡化的設,則

因此,只要投資人將審核概率大于q,投資公司就會為追求更高的期望效用而選擇高努力。

同理,當投資公司努力的比例達到一定值時,投資人對項目失敗的投資公司的審核與不審核是無差異的。為此,我們引入一個條件概γ,表示投資項目失敗的條件下投資人認為是由于投資公司努力程度不夠造成損失的概率,由貝葉斯法則,得

這種情形下,審核與不審核的期望效用是相等的,則

若投資人是風險中性的,為計算方便,簡化的設,則

從而

易見,當投資人認為投資公司低努力的概率低于此值時,考慮到審核費用等因素,投資人會選擇不審核。t與F成反比,即罰金越高投資經理低努力的概率越小。由此,求得罰金的臨界值為

對于投資人而言,應該采取激勵機制將道德風險發生的概率控制在t值以內。因此根據求得的F這個臨界值來確定罰金,當罰金大于此臨界值時,投資公司會為追求更高的期望效用自然會選擇高努力。

二、激勵契約

投資人在設計合約時,應該全面的考慮到投資人與投資經理雙方的博弈策略,從而設計激勵契約,既要保證投資經理樂于資人投資,又能激勵其高努力完成自己的投資項目,且使投資人的期望利潤最大。

為計算方便,簡化的設,建立如下激勵模型:

通過這個結論,可以看出在最優博弈策略的基礎上,投資人期望效用最大化時投資公司的獎金B和基本傭金A滿足上面線性條件。由(3)式可知,當成功概率1-α、投資公司平均收入K、努力成本eH一定的情形下,獎金B與基本傭金A成反比,即給投資經理的基本傭金越低,投資經理就會更加努力投資項目從而獲得更多的獎金。由(5)式可知:當成功概率1-β、努力成本eL、罰金F一定的情形下,B與A成反比。即傭金越低,投資經理就會更加努力投資項目從而獲得更多獎金。因此為了保證投資經理高努力工作,要相應的控制基本傭金和獎金,投資人通過支付不同的基本傭金和獎金對投資經理起到激勵作用。

三、結論

由于在投資市場內部存在著被稱之為道德風險的市場失效行為,使得一部分投資公司承接項目后低努力工作,從而導致項目失敗的概率更大。本文建立了雙方的博弈模型,討論了均衡狀態下的最優策略,得到投資人將審核概率和罰金控制在一定值之上能有效地控制道德風險發生的結論。最后,建立了投資人的激勵契約,得到獎金 和基本傭金 的最優線性關系。在實際中,投資人通過設置不同的傭金 和獎金 ,激勵投資經理努力工作,降低投資失敗的概率,有利于投資工作的正常運行,具有一定的現實意義。

參考文獻:

[1]張維迎:博弈論與信息經濟學[M]. 上海:上海人民出版社,1996

[2]徐新邱苑華:道德風險與基于委托-理論的最優保險契約模型[J].系統工程理論與實踐,2001,(3):26~30

篇(10)

博弈論是研究決策主體的行為發生直接相互作用時的決策以及這種決策的均衡問題。博弈思想起源于20世紀50年代,最先出現在馮•諾依曼和摩根斯坦恩1944年合著的《經濟行為和博弈論》。1950~1954年,納什發表了一系列論文提出了著名的“納什均衡”概念,為非合作的一般理論和合作的討價還價理論奠定了堅實基礎。隨后,澤爾騰對納什均衡做出了發展,引入了動態分析方法。海薩尼在博弈論的研究中引入不完全信息下的分析方法。克萊普斯和威爾遜等分析了動態不完全信息條件下的博弈問題。博弈論已被應用于經濟學、軍事戰略、計算機科學等當中,從90年代開始,被廣泛應用于商業中。而涉及到投資和引資行為中的博弈研究尚處于初步階段。用博弈論研究方法來分析投資和引資行為中的策略抉擇,在當前具有十分重要的意義。

一、 投資和引資行為策略的博弈論基礎

招商引資行為中的“不求所有,但求所在”充分體現了引資策略的博弈特征,投資利益分配中的“非你既我”則充分體現了投資策略的博弈特征,從根本上決定了其可博弈性。各投資方和引資方不同的目標和利益追求必然導致對弈者出現利益沖突和行為不一致現象。但各對弈者理性地采取或選擇自己的策略行為,使得在這種互相制約又互相影響的依存關系中,盡可能地提高自己的利益所得。

投資和引資行為中的博弈包括五個要素:(1)對弈者(player):指博弈中獨立決策、獨立承擔結果的個人或組織,這里可分三種情況:投資方之間,引資方之間,投資方與引資方之間。(2)策略集合(strategy set):指對弈者在給定信息集的“相機行動方案”。在招商引資過程中,引資方競相采取不同政策(如稅收優惠、融資支持)進行抗衡。投資方通過各種策略排擠和壓制競爭對手,爭奪利益范圍。而投資者與引資者存在既依存又斗爭的利益共享與利益爭奪關系,共同組成一個利益博弈互動系統。(3)規則(rule):博弈規則本身是由演進力量決定的社會構造之物。為了進行博弈,對于有關的博弈規則人們必須具有共同的預期。博弈分析的目的是使博弈規則預期均衡。就投資和引資行為中的博弈而言,國家和當地的法律、法規、制度結構和博弈方制定的契約是博弈正常進行的保障。(4)報酬(payoff):指對弈者從博弈中所得到的“收益”(確定“收益”或期望“收益”),它是各博弈方追求的根本目標,也是他們行為和判斷的根本依據。(5)均衡(equilibrium):指所有參與人的最優策略的組合,博弈論中的均衡注重均衡本身的產生。在投資與引資行為博弈中由于多主體的參與可能存在多個均衡。

二、投資和引資行為博弈方法的解析

(一)目標函數的確定

確定各類行為主體的目標函數,必須把各類行為主體作為對立的利益主體,以局中人的角色互相博弈[5]。引資方所選擇的策略目標函數是以壯大自己的經濟實力、競爭力和可持續發展能力(因主體而異)為中心,力圖增加資本存量,提高引資效率和增加就業機會,促使技術進步和經濟的快速增長。資本是以追求剩余價值為目的,投資方要求把資本放在安全可靠、利潤豐厚的地方和產業之上,以獲得長期利益為目的,追求預期利益最大化為目標來確定自己的目標函數。在博弈當中,個人效用函數不僅依賴與自己的選擇,而且也依賴于他人的選擇,可以說,個人的最優選擇是其他人選擇的函數。在進行目標函數的選擇時,不確定性和風險必然導致行為主體的收益與預期之間的偏差,但可通過目標的互相協調進行平衡。

(二)目標的協調

從發展變化的觀點觀察,投資和引資行為是存在時間動態變化的。在局中人無法限制對方通過自身努力爭取目標的實現時,各局中人相對位置的變化不可避免。對弈中的投資方相對位置的變化可能源于投資何地、何時投資、投資量多少等等;而引資方相對位置的變化可能源于何種方式引資、何項目上引資、引資量的多少等等。他們追求的目標實際上是自己在社會決策過程中角色的改變(如主動權和獲益權的控制)。在了解各自可能的獲益、對手的習慣以及獲益的期望等等(當然得充分考慮信息的可獲得量和度)后作出自己的最佳決策。當局中人的目標之間發生沖突或矛盾時,能夠通過協調相互之間的關系,保持目標上的協調,達到博弈的均衡狀態。

(三)工具的選擇

一般情況下,引資方采取的引資工具包括直接引資措施和間接引資措施。直接引資措施是通過直接與投資方接洽、商談等既定的活動來實現目標,如由政府部門領導前頭的引資團的直接招商引資活動。間接引資措施指通過影響、引導投資主體決策的變量來達到目標,如優惠政策的出臺、投資程序的簡化、辦事效率的提高等。投資主體擁有的投資資金是他投資活動賴以進行和實現的前提條件。投資方采取的投資方式與工具包括項目投資方式(固定資產投資、流動資產投資和無形資產投資)和金融投資方式(固定收益投資工具、浮動收益投資工具等)。鑒于目前政府和企業以及其他投資者的投資目標仍是以項目投資為主體,本文的分析是以項目投資中的投資者為博弈中的一個對象。

三、投資方和引資方行為博弈分析

投資方和引資方作為不同的利益主體,以博弈局中人身份存在于這個利益博弈互動系統當中。引資方與引資方(投資方與投資方)的相互對弈有一個時間順序,一方做出某項決策時必然會對另一方的決策有一個預期,并受他之前別人決策的影響;同時反過來又會影響他之后別人的行為,他們的相互博弈就構成一個完全信息博弈。投資方與引資方之間的博弈更為復雜,在目前情況下,招商引資中引資方常常處于被動或劣勢地位,在實現自身目標驅動下對本身的具體戰略、目標和政策傾向有明確的呈現,這樣,投資方通過觀察引資方行為可獲得大量信息,并進而選擇自身的策略,兩者相互對弈就構成了一個不完全信息博弈。投資和引資行為中的對弈過程如圖1所示。

為了分析的方便,假設存在兩個投資者和兩個引資者,投資者已決定把資金投入某地,引資者決定吸引資金。他們在每一時期都相互遇到,并且他們的策略只有投資于何地或吸引那方投資問題。在給定其他人策略的條件下,每個對弈者選擇自己的最優策略,所有參與人選擇的策略一起構成一個策略組合。考慮到互動系統的復雜性,本文可分情況進行分析。

(一)混合策略博弈

在圖2所顯示的元博弈中,設投資參與人集合N,標記為i=1,2;引資參與人集合M,標記為j=1,2。每個投資參與人的策略集合為A=(a1,a2),每個引資參與人的策略集合為B=(b1,b2),收益函數Ui=(qk)由得益矩陣確定,其中qk=(ai,bj),k=1,2。納什均衡最優解為

Max∑∑Ui(ai ,bj)si 式中si∈Si ,ai∈A , bj∈B si表示混合策略。

如果只進行一次博弈,博弈雙方沒有一個確定性的具體的策略,最優策略納什均衡并不存在,一方的策略選擇依賴另一方行動偏離的概率。

根據投資方和引資方的行為分析(最優達不到尋找次優甚至次次優),可求得進行重復博弈的解(成為動態博弈問題)。假設投資方1首先采取觸發策略,在重復博弈的開始選擇投資到引資方1所在地,引資方1也只吸引有利益獲取的投資方1的投資,投資方2只能選擇投資于引資方2所在地。在這個階段博弈中各自選擇了合作伙伴,當期的總收益為U1(a1,b1)+U2(a2,b2)。同理,當投資方2首先發生偏離時,投資方與引資方都會將資金投入引資方2所在地,引資方沒有吸引資金的優勢,這時當期的總收益為U2(a2,b1)+U2(a2,b2)。這樣就證明了在重復博弈條件下,投資方和引資方在“序貫理性”下存在許多策略抉擇。由于受隨機擾動沖擊,演化動態總是處于變動之中,在存在博弈協調情況下,投資和引資行為會自發產生。

(二)競爭策略博弈

在最簡單的情況下,改變上面元博弈的得益函數,會導致博弈結果的改變(如圖3)。

在競爭策略博弈中的納什均衡為(a1,b1)和(a2,b1),投資方1與引資方1合作,投資方2與引資方2合作,從而找到了目標利益的結合點。從中可分析出,引資方之間必然會發生競相吸引、鼓勵外商投資現象,這解釋了為何發生招商引資過程中盲目競爭現象,也解釋了投資方為了利益范圍的爭奪時有發生的原因。在競爭壓力驅使下,引資方通過改善投資環境,投資方通過高效的管理手段和先進的技術投入等來不斷加強自己的競爭優勢,競爭不斷升級有其必然性。

(三)子博弈精煉納什均衡的復合

在圖4中,各博弈方不存在改變自己策略的動力,這種均衡策略組合存在而且是唯一的,博弈存在“一致性”預測下的確定解。投資方1與引資方1合作的策略組合(a1,b1),投資方2與引資方2的策略組合(a2,b2)構成占優策略均衡(dominant-strategy equilibrium)。在重復博弈中,純策略組合µ1[a1/b1],µ2[b1/a1],µ3[a2/b2],µ4[b2/a2]構成子博弈精煉納什均衡。這樣就證明引資方與投資方之間是相互依存、互惠互利的利益共同體,形成了博弈雙贏系統。當然,在整體利益既定的情況下,引資方與投資方為了各自利益的最大化,又具有相互矛盾的利益爭奪關系(如圖1)。可以說,雙方在對利益的爭奪過程中實現利益的共享(雙贏)。

四、 長江三角洲引資大戰的博弈分析

長江三角洲是我國城市發展水平比較高的地區,城市間合作水平和協調機制建設不斷提高和進步,城市間合作程度也在不斷加深。但是,本地區在吸引外資上存在著激烈的競爭,城市之間為外資獲取權的博弈此起彼伏,其中,由于引資動機過度膨脹而出現的非理性競爭導致了非帕累托最優的時時出現,這帶來的一個明顯的后果是阻滯了本區域發展戰略目標的實現。如上海為了降低商務運營成本,吸引外資的流入并阻滯內部資金向周邊城市的外流,并想通過各種手段創造與周邊城市更加有利的競爭條件,2003年4月以“嘉青松”地區為試點,劃出了嘉定57平方公里、青浦56.2平方公里、松江59.89平方公里為“降低商務成本試點區”,因其總面積為173平方公里,被人們稱為“173計劃”。針對上海的“173計劃”,江蘇就出臺來了“八市沿江開放戰略”,同一期間,浙江也出臺了“環杭州灣開放”方案,可以認為這個新的“經濟特區”的劃定是上海、江蘇和浙江三地在引資上全新競爭形式的開始,這也是引資方與引資方之間為吸引外資而進行博弈的進行和結果。對此我們可以從以下四個方面進行分析:

(一)由目前長三角地區發展的情況可知,上海的“173計劃”帶來的一個明顯效應是長三角地區各城市為招商引資而形成了“蝸角爭利”的態勢。由此可見,“173計劃”已經失去了通過降低商務成本達到吸引外資的目的,使本來處于焦灼狀態的長三角城市之間的競爭更加白熱化,同時為未來的協作關系的深入發展埋下了許多隱患。如果上海市財政局、市外資委、市工商局等六部門在做出 “173計劃”這個決定時,充分考慮到周邊其它城市的強烈反應,他們之間的博弈進行就不會是現在“既不利己也不利人” 的結果。

(二)投資方(一般是外商)與引資方(長三角地區各城市)之間的博弈由于引資方強烈吸引外資的決心而處于被動和劣勢地位。鑒于此,投資方可以在各個引資方提供的優惠政策程度上掌握博弈的主動權,他們完全有機會在引資方之間做出有利于自己的策略選擇。因此,他們是這場博弈的最終得益者和最大收獲者。從這個結果來分析,長三角各城市應該端正態度,具備博弈分析的一般知識和心態。

(三)投資方之間的博弈的進行則主要取決于他們所投資項目在優惠政策基礎上的獲利能力與地租成本的權衡,他們會為自己的投資項目找到一個最佳的投資地,通過對不同的策略選擇的最優抉擇來攫取大量的超額利潤。

(四)在這個博弈的進行過程中,外商是擁有完全信息的一方,他們可以利用引資方的非理性競爭而選擇最有利于自身的博弈策略。由此可知,從這個博弈的進行過程來分析,這場引資大戰是一個典型的不完全信息博弈。

五、 結論

從投資與引資行為的博弈分析中可得以下結論:

(一)投資方和引資方鑒于自己利益得失的考慮,相互利用對方優勢條件和互相競爭最大化利益是交融在這個系統中,系統內利益的沖突并不必然只導致競爭,利益的重合也并不必然只導致合作。

(二)各主體對博弈行為的把握程度的深淺(取決于決策需要的信息和分析信息能力)、目標的差異、采取的路徑手段的不同(歸功于競爭力和決策權、對弈者的習慣等),博弈的運行過程和結果存在多種可能性。雙方力量的動態發展必使非均衡狀態走向新的均衡狀態。投資與引資行為博弈的復雜性決定了其主體決策不像平常簡單的靜態事物那樣僅僅存在一個均衡點,多主體博弈往往存在多個均衡點。

(三)理性預期下主體做出的投資決策(引資決策)以及他們的經濟活動在實際生活中并非一定遵從最有效原則,而是在“邊做邊學”中把握整個博弈局勢。各博弈主體如果增強了彼此進行博弈分析的能力,充分認識到預期效果與未來實際效果、預期利益與未來實際利益之間存在偏差。在利益發生矛盾或沖突下通過信息反饋過程可達到協調的結果,雖然沒有達到帕累托最優,但經濟活動效果比對著干(悖理的)好一些。

(四)公平、公正和利益互惠原則是維系這個博弈互動系統的保障,也是爭取利益最大化的基本準則。

[參考文獻]

[1]張維迎.博弈論與信息經濟學[M].上海三聯書店、上海人民出版社,1996.

[2]李雪松.博弈論與經濟轉型[M]. 社會科學出版社,1998.

[3]付曉東,胡鐵成.區域融資與投資環境評價[M].商務印書館,2004.

[4][美] H?培頓?揚.個人策略與社會結構[M].上海三聯書店、上海人民出版社,2004.

上一篇: 初中地理教學感悟 下一篇: 高中歷史備考策略
相關精選
相關期刊
久久久噜噜噜久久中文,精品五月精品婷婷,久久精品国产自清天天线,久久国产一区视频
在线视频国产一区不卡 | 亚洲大片在线观看网址 | 中文字幕精品亚洲无线码 | 亚洲中文影片在线看 | 日韩一级一欧美一级国产 | 中文字幕无线码中文字幕网站 |