本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
K. q) t0 b' T H0 u1 j5 J$ G7 N- F9 G. C1 s0 @5 `4 u6 }( v
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
G$ r4 ?, S9 N8 `# h 以下三个定义:/ ]& M' [# U- a3 B" ]
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; L. W4 w& c, R 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ V+ P0 E' F3 }( a' x/ W# }( x
所谓的双方优势策略则是指双方利益总和最大的策略。 8 k! x# e$ J- F$ b3 J
[编辑本段]严格优势策略举例分析
4 u) \" W! e. `' I 一、经典的囚徒困境 ; U" R9 [% F2 o1 q
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 s. X% a; J p/ }) }: ^
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 _( G% q& g8 ]6 V; D9 v% H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . b$ C1 q$ J" L% p1 h0 g, p
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 w8 j9 Q( Z% f4 x* Y; m- c
若二人都互相检举(互相“背叛”),则二人同样判监2年。
& W8 U( J% m7 X1 f
0 o. ^) v: q G8 w+ J y* y) z6 D# i用表格概述如下:6 l- V6 C. R1 t9 z6 t
0 b; U; _1 d) V2 L$ T/ Y
甲沉默(合作) 甲认罪(背叛)
1 \& X6 i. J8 ]7 |乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 # k/ P8 y, S1 e. Q" V4 p! Q: Q8 J
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 q4 m# A4 G/ K- {$ |3 B' Y
+ G- u& \: R: C% u 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 J2 w0 l$ V( _# s- |) K
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
1 k& L& j! F$ Z. c4 r# S 若对方沉默、背叛会让我获释,所以会选择背叛。
8 J" }1 D4 e9 S) d. v" L 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 }' @$ ?, V% g; q# A4 s8 C! f
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : t2 J9 h1 _. y2 {( m4 e( Q& D
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) [( P. g: L1 e
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) W( J: _5 p! W: i* n7 o6 W+ M6 w L* K[编辑本段]二、智猪博弈理论% o, A- j2 t, |* o% Z9 k
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 Y0 c2 o! S7 j7 U8 Q
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" U& z6 l$ l6 L! S 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 i+ `% A0 k1 u1 J& P1 r
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; q3 H8 b7 U3 ` H, O0 `' e “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! [6 f& ^) w& z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 5 ?8 f) X5 c* W
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- e' L+ {! n% m3 ^+ r1 {# n
4 T+ a7 p+ p* {5 j F; {三、关于企业价格策略9 f0 v2 v; i4 t; Q3 A
1 P9 t& X5 n* k2 g
8 R8 e2 m2 G- G2 [; a
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& I$ ?8 O }# L) G8 J/ U 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
. f0 Q# R; Z$ Y6 M. }* R6 m 以下三个定义:& O; j; D6 B- ?! `. i
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & c4 M( \1 j! {
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 {$ A( I9 _ `# j 所谓的双方优势策略则是指双方利益总和最大的策略。 2 I, X% i a6 @: @' V7 x4 S, q
[编辑本段]严格优势策略举例分析5 X7 E# }$ t5 h" S+ N$ I% d! n
一、经典的囚徒困境 0 P) {) g+ P$ U+ A' V$ b
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ L" q8 Z1 X! b3 m) [9 Q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + a1 i. z* \4 `" \6 @/ Q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( M5 F1 c' \( g, a, N# _' I# Q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 l" C0 v; p6 d3 r! R$ ~4 h) q 若二人都互相检举(互相“背叛”),则二人同样判监2年。4 ^ [: w9 y# Z6 e, T& C' Q
2 a8 \8 g1 w: i2 K9 m# c用表格概述如下:9 C D* _7 b3 v3 q! q+ F$ H
l. h! _& N$ d2 Q9 j; |9 }; O 甲沉默(合作) 甲认罪(背叛) F5 e* r7 e0 t9 o3 i1 U2 \% Y% b
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; [! D1 E& T1 x t2 P. U乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 |- Z f: @3 `, M6 k( k# i& k
6 a, |, l p2 j- g: v# \. S
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 b, [& y g/ y! b8 v
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , n q* ]/ L; I" F% }
若对方沉默、背叛会让我获释,所以会选择背叛。
& g! y2 D; r: y* X2 A 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * W! F9 s0 x3 n
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' _& W- T3 x' V2 h( z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
0 Z9 `* N6 C8 f 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ U# ?0 m! k/ i; U1 v
[编辑本段]二、智猪博弈理论
( I; S! \; n: n4 E: Y+ { 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 C# O6 F0 q7 H, S6 c$ O
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * i* E+ s, T) i
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ v3 l$ b g# I# J- U2 P 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 N* j# y8 h4 \5 k0 { “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' ]& U0 W# j" [' P& Q 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
# @5 {! J2 H( N. k1 _ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& c, t1 O3 W. Y
1 ?0 o O/ ^3 p+ J* v三、关于企业价格策略
3 c3 b, `/ W" ~& A% H- U( J
3 o5 \- ?: N" B
3 h0 p6 `4 N( n0 G; A- g- X0 k7 _ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 [5 [" g! u4 R* w 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);0 v: c: g9 t) _; F3 q: A
以下三个定义:" r+ J, J! i B0 h7 P% R1 Y, f- m
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 P# w3 k6 ?: h7 H _ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) V& f! S- j+ E! z
所谓的双方优势策略则是指双方利益总和最大的策略。
8 i4 ^2 I+ t3 U7 T) C[编辑本段]严格优势策略举例分析: V. n/ t2 u0 D0 G& {8 o
一、经典的囚徒困境
. n4 ^" [3 J6 f- } 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
a5 I4 Z0 ?$ Z m; G 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 8 \* D& ]/ \) @
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 H% ^* a. s r
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * l5 f8 a" ?9 @& Z2 X; a
若二人都互相检举(互相“背叛”),则二人同样判监2年。+ L/ b' [) ~5 h, M6 D7 C: K) v& E) ]
0 [5 q9 n1 E" n* n* z5 Y& R
用表格概述如下:
& q; @1 _: S) L1 [+ j7 Y% [) e
9 v( d3 a% c+ l% a 甲沉默(合作) 甲认罪(背叛) - {' R* ]- R$ a0 r) u8 U5 G
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ ]( c2 Z0 v2 n% K" `% R
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & ?1 y5 \5 o* Q P1 ~& v
, v$ p U6 r2 g4 W
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 - x4 d9 V$ s1 r: N, M3 N
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 |4 H: l2 m; f6 d; A) Q' a
若对方沉默、背叛会让我获释,所以会选择背叛。
7 |4 e" G* I' f& {. P1 i 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ [. `4 t3 P8 ^2 m% ?$ F2 M: s0 G& L9 w 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 U4 U( B) K+ G! e; y 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 G5 Q9 R( l* f' K 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。 ~; Q# S% Y2 r% Y$ q
[编辑本段]二、智猪博弈理论
2 \, ~) @( T1 |6 M, U9 b 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ P4 p3 i3 e" o" g3 ^& H$ v8 D% r
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 z# P# V! L9 k8 i6 q8 C
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
7 B- l7 [: j$ ` 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : t) Q5 F j6 L# W7 l$ ?
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; S* m/ y) L& E4 Z- U8 H 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: O: k2 l8 ]+ Q) \6 b0 Z: N( D 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 v6 @. @; }$ r3 ]
8 h& N# X; M2 o! a# [三、关于企业价格策略
6 ~. [7 v. c6 w" G( Z. \8 {. L" R& L; J4 W. _
9 y1 Y; ~! F8 G4 Z: p 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? : r4 H! I- s) ^+ T1 a3 d5 u
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' Q" z* `) c8 y; G/ [8 L% K
以下三个定义:! ^6 ?- X# `: u/ \, D4 `2 ~* t$ u
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( e" a2 h; i% ?6 s+ r5 h 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . \& k3 h/ `5 f& R+ Q
所谓的双方优势策略则是指双方利益总和最大的策略。 ( ^" D2 p n! W @2 u# i
[编辑本段]严格优势策略举例分析
8 [) L* i* {8 }8 E* b3 f9 K- p 一、经典的囚徒困境
5 a0 j5 c- J# N' g8 p1 E ] 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 c; L! K7 |" X8 ^. b
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: E C7 @5 O8 n
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
- L# X# Q: R: g3 c: [! K 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 I. S' m9 R9 T1 g# W3 { 若二人都互相检举(互相“背叛”),则二人同样判监2年。4 d% ^9 A1 ~ E, c! M
9 p3 a, t( J, d2 r5 ^
用表格概述如下:
9 u5 G( @. w% C9 m. `4 W) T, C* l! w
甲沉默(合作) 甲认罪(背叛)
' v2 h4 c) C: ?1 N! t' n8 w乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
' _9 v0 u9 n4 A5 C. y D乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 r. A* L1 p1 ?: B' R2 {2 v
) I7 S: ^6 @0 z3 P 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 X$ U+ @3 Z# h6 N6 o# g6 h# o
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 k8 H4 |/ u; Z+ E# M/ U% G
若对方沉默、背叛会让我获释,所以会选择背叛。
6 G0 K) N& K1 H J% C 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 - F9 j6 O- f: b
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 / y( M5 a6 }0 c) j0 q$ O4 ~4 Y
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! W- ?% e7 J( Q3 X9 k% Q
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# v- `) `4 o1 a2 \[编辑本段]二、智猪博弈理论
6 \. a( R" a* G 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ e9 ^" m) I4 E 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! `& B. `5 |# o: ], j
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ q* O4 O) e$ t- b! v2 S2 R) k5 @# U 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " y# n. l9 n4 w% O
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : i$ E1 r8 u( `. {
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ R" w3 k- Q( l: `! U! K 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. W6 H) Y3 ?- s
: v& G* V8 O% @. K/ u3 Z* \; \
三、关于企业价格策略
1 O% |5 v. y6 ], a5 E1 O. a! g
2 Z- k8 |( L1 C. X9 o! S( M* t
8 d5 V L! M, D$ ]# V* |: g 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* q# T# r1 {3 p7 B' s0 N6 |7 A2 K6 _ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |