本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
; g# [* ]* q! t5 \, `- q
v$ C6 X1 x# `/ Z6 p j. _严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);$ P: t% p7 F& T/ t$ Z, l. l+ m
以下三个定义:
& t3 j" ]% ]' t6 r 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 H X# N1 v3 d4 Z3 c8 [
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ v5 x: R* t3 ]( ` 所谓的双方优势策略则是指双方利益总和最大的策略。 2 o5 l' _; Y0 \& t8 O6 y% M& l
[编辑本段]严格优势策略举例分析
' h: W s1 E1 E/ k( y& V( Q9 P 一、经典的囚徒困境
' g4 O% T/ }. |8 a: R" z! c. L' u9 D 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) y' a/ i4 E7 O8 `# n8 j 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) d! X8 j& l6 E. @ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 f5 ~0 ?1 f, z; K% Z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
7 p" T* x% O8 \/ C, y2 r 若二人都互相检举(互相“背叛”),则二人同样判监2年。4 F* @$ A& `9 T6 y
0 q' H" z5 K$ [, \$ _0 v; Q
用表格概述如下:
/ \) F* g( { a% |& ~. f* A. V4 S' o/ E' u2 g& R6 L
甲沉默(合作) 甲认罪(背叛)
. _" K Y5 {' v1 _2 z7 o- l& B乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 / A% V! v6 V6 @6 D% K# I% e
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 * v: \) \) e2 D1 b
8 g* h3 N, s: k* H 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, I$ e+ y- E7 @% g5 \& ]9 T 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
# e, [2 D5 L, `' [ a) @ 若对方沉默、背叛会让我获释,所以会选择背叛。 1 T1 b. \% O9 O1 C, S0 a7 i3 ?% I( D
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 o- T3 y$ N8 s
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! p9 h, E* n, i Q. D1 s 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - c! O1 a8 D6 k0 h! c# j! ^
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 b+ m1 P2 e+ x9 j5 ?, Y
[编辑本段]二、智猪博弈理论
* F: m1 x* a& D& V4 {/ ~, G3 M 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + a- T+ K3 T: z8 D# b) K$ m
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 G( E4 p! @& k# p) N3 v8 P/ v: V
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- V0 M* l& ^* l. W( O$ ~ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, j2 b1 a& P5 I1 ?( E “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / W6 |" e* F* M7 W, a
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
m: P( T6 y3 S 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。6 h: U6 M! w3 Y, d/ e
' V2 w" X% ^/ Y( B, t# r! `三、关于企业价格策略" l' z' }) Q! n/ h& @
1 W } t2 C& F! x* B
5 O' a+ @7 q0 W, d5 {! Z3 S5 { 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 ?& ~( l& E+ n) Y+ I S. S& W
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 g* U( |: S0 r$ `+ ~ 以下三个定义:
8 x1 }* Z( `1 d' ^ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, Y' K) C; r- ~! s 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- B/ ~9 M4 U6 L4 U& J) {1 R( ] 所谓的双方优势策略则是指双方利益总和最大的策略。 $ d# r0 U! {7 @9 [/ h! u# l( ]( o
[编辑本段]严格优势策略举例分析
3 h" D i0 N: U8 P* p# j& w6 m$ S4 j 一、经典的囚徒困境
* K) H; S5 U9 s9 x! f 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 a+ O& a" o! `* N# p 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, j% K) X4 g" }2 D; ~" g* n 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 w' ^: n$ }0 ]4 [; T7 f( i$ B" x6 S
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! G" d& l) X1 |7 e, \4 T& a' b5 s
若二人都互相检举(互相“背叛”),则二人同样判监2年。, d% }, s4 r. N0 p/ G; W
# Q; Q. p- c9 J! K
用表格概述如下:; o. G7 J" u) K+ M
% s! }( R/ \2 w. {/ Y
甲沉默(合作) 甲认罪(背叛)
% S1 Y( A2 w3 a7 |' z( Z乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
1 ]( P" u1 q6 {乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
) h. J7 M1 W' z0 X4 u. |7 U6 X$ z' i3 J( x7 u; u+ p
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + s6 x# [7 L' K6 O0 v
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ A5 n. M5 v% p. R7 `" n5 n7 d" P) I 若对方沉默、背叛会让我获释,所以会选择背叛。 , W: g( L7 M2 R8 W Q
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : ^/ y, |* V: o& G% G0 s* [8 a
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 m! }. E$ j1 {/ }4 q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 T# w5 k \9 ?+ ~- k; z 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, F$ r" N3 J# K" s# d- W$ ?[编辑本段]二、智猪博弈理论
4 f$ q) c. G; m5 y 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
{, D$ ~3 F* [9 s: }% R 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 E2 z5 W; m& Y% D1 b 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 O: r% m1 c, {5 z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; J- o% P8 |$ o) S+ n i0 @ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 u0 i" |3 m3 {) t$ f+ H& a 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! F# Y2 V) Y/ ~* E
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 ]/ _5 \2 G( J9 ]5 ~6 \
0 ]. n9 i8 Y" Z/ X- {
三、关于企业价格策略7 G- ]: u& u$ w
% V( [& v' i8 x; y
6 B- B- Y' \7 f3 [4 N
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 H# J8 C2 ]* P) B2 V% F- y( h; a
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' D/ Z) ?1 s5 P 以下三个定义:
* v) ~6 B. Z* m6 V8 k 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ O' n: L/ g% T3 | 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' V- k% n' W1 r2 o
所谓的双方优势策略则是指双方利益总和最大的策略。 ' n. Y- ], b1 A' k" L5 Q
[编辑本段]严格优势策略举例分析5 p' r' S' m$ }' a7 W
一、经典的囚徒困境
7 X. [( C; o6 c, H! h 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & B, h" D( b& ^+ s2 Y+ m
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . w5 @3 g9 k. T( M
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& O4 ]$ J' i( b. I: R 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
" q$ v$ P4 z$ [* v c) Y" \ 若二人都互相检举(互相“背叛”),则二人同样判监2年。5 X6 }# r% s! N& T& {
# H5 X( t, o" } I
用表格概述如下:% L" _( ?8 p, V* b
+ }% ~1 d: x( O! M$ }9 p 甲沉默(合作) 甲认罪(背叛) 0 n) w' I) a2 E- A/ _2 r2 [- o6 M: b
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* F1 i; T- n% ] O0 B( A2 |乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 ~' C+ p0 B7 ~! A* r. [
. H, Z0 y9 T" o; H8 N. B" M! ~ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 i9 l4 A/ O4 F. k E 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 v3 ^! E" I9 o 若对方沉默、背叛会让我获释,所以会选择背叛。
+ o' j6 O0 S4 Y5 f. D 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 V5 ], u( v1 O* E! ?& c 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% e( ?: i! K) V; w2 m3 X4 u) I 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 U% V, D$ J9 m! s% } 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。% v& r& U. l7 R ~. f( T( S
[编辑本段]二、智猪博弈理论2 L7 j% O2 F. U5 }$ v) {
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 u& i( ?* O [7 c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + h" l# f H& G0 h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 a: K9 d/ q. I& Q 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
K0 y8 j% [8 W) E( | “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . ?4 t1 D; R9 j3 x* x; L" o" Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( ?6 u% q3 f5 ^/ c1 t- h
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& |$ [7 Q; _6 V, s% Q V$ p# c! V. {- n: B
三、关于企业价格策略( s2 ]. e0 Q. T; s1 S$ J7 m
+ v9 G' W4 T; g5 w- |
0 E+ W4 T. S' F; ~4 A V& X
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 m4 w* J. m' }5 J4 |9 x
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) b" z' M% _. ` 以下三个定义:$ c0 r! T" C0 ]& r
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ w5 P( M8 p; z1 p0 s 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) B Y0 a* p: Q; e8 Q 所谓的双方优势策略则是指双方利益总和最大的策略。 ! a: y2 `' C1 T& O4 m% `
[编辑本段]严格优势策略举例分析
# c2 N; c ]1 J3 E; g 一、经典的囚徒困境
' h8 D7 C S" e; x0 d# K) s 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
0 p/ t0 C4 J3 F' E$ Q9 A! |7 h 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 H& {+ g0 G _+ i O) X 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
# f& S6 x: S' W- D/ H9 q/ k 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# T( q1 X4 E0 G 若二人都互相检举(互相“背叛”),则二人同样判监2年。4 i7 F0 N4 G. \! x+ s9 ?
, _, s2 |" Q4 k; Y& P3 o0 _
用表格概述如下:: M. K: @7 z( T# ~5 r
% i; J k: z' H y1 G# |+ B 甲沉默(合作) 甲认罪(背叛)
; ^$ {% U( c0 [, S7 e乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ z8 _4 [6 B" W4 h+ z
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 " k( q y M) w; k Q$ z, L
% M+ C/ N8 m8 Q0 s8 e6 p) n7 Z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * U5 a. N r1 q: @8 g6 j3 n3 ~8 t
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 i, n' _8 e- A# c0 Y: o% n# ~ 若对方沉默、背叛会让我获释,所以会选择背叛。 & s# S* |0 _# ~3 C/ o# O
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 i( Z& x) B5 A9 g
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' C; m) {6 w) M# | 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 N( [4 V" }% o6 z4 A. ~# q( | 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. q4 |5 W1 Y6 ]5 u7 }7 j( x( D9 L8 M x[编辑本段]二、智猪博弈理论' D/ a8 }; s# ?; a
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 J, ]' ]6 s" f: `# G7 @
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 k8 p1 R* q9 @6 u, q6 @
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . b; N) w0 d1 x0 O3 Y& M
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( K* j; _' E9 |' T7 I “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" w1 Y% B8 L/ M1 m7 N; z 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * c, \) T5 K9 q( l
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 F |0 n' U8 W1 J1 F- J; u
. f$ `3 j* h* j9 B三、关于企业价格策略
/ Q( N; B/ Z. U6 Q; l. w+ s; ?) Y! F$ w9 J
a$ i. M, \. E Z( L6 c) S8 `
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& H, x4 I) o& s5 A) o, q$ a* T 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |