本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
# b% X: I+ I# D7 `9 p
" q) R3 O& d0 i. D% w$ O4 P" [严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, C1 _, A4 V2 S- m, [! @' p7 v
以下三个定义:" v' G3 d' Z3 I4 Z3 a% }
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' s% ~: M4 k0 r! B8 }' }1 ~ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 }0 b% L5 G! g* @/ m' s+ g
所谓的双方优势策略则是指双方利益总和最大的策略。 3 F/ N7 x1 j" r) c
[编辑本段]严格优势策略举例分析4 m% F3 \! J$ x
一、经典的囚徒困境
& j" f! p/ h4 R6 Q. o r( ` 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 X& G/ [, K" T8 b- A6 k! d' v
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & s; C( }. w. f7 @7 B, G9 ~
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 k( N% f6 E6 T* |6 u! u 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ G5 n! O. X1 k2 E6 f0 b* }" Z
若二人都互相检举(互相“背叛”),则二人同样判监2年。5 H, {1 Q3 G+ }3 D
D5 u/ z$ p9 z( w% {+ i! K用表格概述如下:7 E. z( ^5 X' b' {5 K
4 O9 {3 k8 o5 t
甲沉默(合作) 甲认罪(背叛)
4 f u( i) ~: y5 F! a+ S) s乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! g; v( j d, P n" V乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 , I$ W) ]% u+ ~/ y u
! K! T8 d0 W, d( I0 I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 s3 A3 p" v# ^0 @8 a9 \" R) b
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - W4 T# [. r0 s
若对方沉默、背叛会让我获释,所以会选择背叛。 ' P% u# `* i( x
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 m: _/ K; i+ z 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
: v7 X8 }" r* q k/ i9 [' P 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 M8 w* Z$ U5 d 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 r! }9 C$ L* G' i[编辑本段]二、智猪博弈理论# S/ u4 _1 N6 O! p* \+ N- J' I
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * j+ Y4 r/ p* ^ I
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* d' z, s8 l8 L% Q* C0 Y6 R. t 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 * `# ?( R; u4 x/ a2 n
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 `- x/ J' u5 W% j u) p/ A7 E
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& s+ q0 H, p5 s+ S9 u. O { 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
M; a$ r6 d$ J5 S% _1 c( H' [ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
y! w+ f, }/ N* g. i) @& o- K: J
0 d* ~& @% E0 g三、关于企业价格策略
9 n) a% F; i) { `; H8 D- H9 A) [$ n$ e# P
5 T z5 S* W! N1 p, M0 J+ ^
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" P6 l; S T: P* ~. N [* c 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( l7 Y/ X$ d7 A& M( Q+ r9 U% r 以下三个定义:
3 w# G6 T' D$ `% t 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
~' D3 \5 X$ O" Q' j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! Q' }& e8 C; b0 P
所谓的双方优势策略则是指双方利益总和最大的策略。 % p& ^& B0 p6 M- v( Q4 G" J
[编辑本段]严格优势策略举例分析: U. d3 e/ _" {& F* h
一、经典的囚徒困境 ' m- D& O5 j* l9 F6 D! M$ s6 e8 D
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 @& G$ f6 `& q8 _# g 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& S o+ e# r8 ^* {; u$ X8 \ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + u$ O* M$ `; k5 N/ z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* f* t* W3 F0 e% _3 p; j3 ~ 若二人都互相检举(互相“背叛”),则二人同样判监2年。7 ]4 d4 o7 q" q k
( i- y; U# p' ~0 B4 s
用表格概述如下:
7 u/ R: S, l, q% X; u+ f1 a- ~0 O& _
( w+ s9 m c' ] 甲沉默(合作) 甲认罪(背叛)
7 W% f8 O! Y, E5 f6 r u, l乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & g' t9 |7 L7 V8 d0 \
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
+ f4 ]! y* P* E$ ^' Q
# R/ Q6 r! M( b0 z% [( r. ` 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 L3 O! \* U: v: c
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; S( d* a+ m) _" }# [- m5 U* N+ |
若对方沉默、背叛会让我获释,所以会选择背叛。 ( R; L4 P: O. {5 p- x6 Y2 |4 K3 U& P3 Z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 F$ @3 U, h, S; e/ m+ \" ` 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 C2 B( x/ _3 `
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : ^+ ~8 ]! r# @' B1 }
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 t o4 [: C4 h8 ]
[编辑本段]二、智猪博弈理论
5 ?; Y- g# c8 J J5 j5 v7 X9 `5 S7 ~ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# p! @3 E$ M [) N' Y- [ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 B. }+ T5 z* S& h 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
z" G3 l9 z: V g. r! G/ B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 Q8 S) ?0 T; Y) W9 j* W/ r1 o0 \, | “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ S9 A* f6 z3 k8 o) ^ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; Y- _9 F+ Y n! R 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 Z0 O6 B4 u+ R7 Z9 Z/ A
2 G3 X e; {( n4 b6 p, p
三、关于企业价格策略, W" q) Q! L" d. J2 d" X
' \7 ~" Z1 X8 o# n! h 9 p1 |, c2 R5 o5 }
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* g- q% v2 t- N( B 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, d4 Q- v8 b& ^& x0 T% H' o 以下三个定义:
5 i0 A7 s/ W: W7 S' n0 L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' }+ ^; Z- e8 M7 U/ A) n0 ]/ e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, x8 S5 t6 @; S 所谓的双方优势策略则是指双方利益总和最大的策略。
* _) j/ ?& C" \: d8 H) y7 l3 t[编辑本段]严格优势策略举例分析" z/ H4 c1 T* D" p
一、经典的囚徒困境
' E6 {& g5 Y3 [! s# y6 N3 r7 W 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 B0 U+ B9 e, U+ e
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 `" j- I# m- F$ l 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 F+ d& o7 L/ h5 i) a& [ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ; s* \/ }6 R. J
若二人都互相检举(互相“背叛”),则二人同样判监2年。% E4 \4 C# w5 `2 C1 v4 {) Z P( |
. ]5 A& d; e8 u6 \% S
用表格概述如下:
, o; l5 A. ^8 J3 w: W* Z/ z( p/ f. m0 X/ v/ B( t5 `: @
甲沉默(合作) 甲认罪(背叛) ( b! _$ j8 Q$ O" @5 q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 X* B V8 |) r
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ( |% U6 q: F; V4 @/ w
1 l4 {5 o* c# q9 s1 a
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 \) u- V* x- O) g
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + L% Y; H% \+ z7 J
若对方沉默、背叛会让我获释,所以会选择背叛。 6 O! T9 _# F/ |4 A% B. o. O
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 z/ _0 w5 J% K. W, k! e
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 Q2 L! C! t) ], k! R
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + U( [1 g; u- f4 m9 ]6 ?% V
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 C- _& Q1 L4 r
[编辑本段]二、智猪博弈理论
+ U+ O& H; ?# u- f+ _, t. l 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 H5 U/ r% A& J2 s Q 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 i9 k" `7 Z. G) `! F' l5 z
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 D: z$ X" e) {9 C6 v, q 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 T7 A: x3 _% {% X4 x' ?! |
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" n0 L4 K# F; I4 p1 x6 s0 c; e 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " [! b U. Z d: E( |5 Y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 `+ Y6 t- ^, Z5 r. B % b6 i% P. Z* l' h$ g& _3 }
三、关于企业价格策略
' e6 a$ c3 c! l% S, \4 T3 u3 L9 n, \
) v$ x8 a6 x4 r& @( ]: i# { 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 J# Y0 A; O4 I# S
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 e* H! a: e1 [& E4 j6 e
以下三个定义:
/ d8 f) o7 c; |% L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ `. G( \9 h" Q* |+ W$ l" ^! ` 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( W- @- T( X* W( w& w# Y E( L 所谓的双方优势策略则是指双方利益总和最大的策略。 % C$ X1 V0 ^5 u& V8 F
[编辑本段]严格优势策略举例分析$ ~9 _- T5 w0 @) f: v
一、经典的囚徒困境 9 }) D1 j9 P# b- W# V
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( ?! c# X& V9 j! ~
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' G- M; B1 c8 G/ g! R 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 m2 l6 Z9 j- J8 A3 d3 m8 x 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ _' c2 K7 ] `, ~ 若二人都互相检举(互相“背叛”),则二人同样判监2年。8 _" n/ E( V, _
" Q& H6 v, D, c3 }# v' r用表格概述如下:0 C7 q5 K! L" B
3 l% \+ {2 W' g- y$ ], Q7 k 甲沉默(合作) 甲认罪(背叛)
$ {: g% ]" d N7 Z+ D. a- d/ F乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * K- i, q# \# I
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 s# S7 p' E, ?9 x. S+ K& G! l5 A/ G" q' W7 n% n
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; c# x" d" G, L% c/ C; l/ Q
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : E: u! h1 o& i$ h H
若对方沉默、背叛会让我获释,所以会选择背叛。 3 ~! a% Q+ d A" O9 t0 J1 |
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 O9 u# P( g4 C/ I6 D8 ]; d
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 / w& Z( M' x! `3 o; d
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 0 D2 ~4 [& W2 ~9 N% O% F$ ^! g$ {% I
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& E" Z4 d+ `' l* ][编辑本段]二、智猪博弈理论/ \2 B8 _) Y' ^3 S0 S3 h9 k
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 I( m3 ?. T* h0 j2 j+ y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
# }4 \& a) u1 w% ?: r 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 A. k. Q7 T3 u+ c% h3 ?$ t
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) e; {/ [3 r* v- f: H4 F “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 @9 G# e( L* x, F
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- R! G9 J1 ]8 @/ u4 d& n 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 K9 B1 J( |: V! Q6 I9 z& j
_0 _& [% B4 p/ v+ g' ^9 C三、关于企业价格策略
+ D) u/ i* b5 x' O3 K0 U
2 g. J( p4 e9 n6 l ' N$ [" m' C( C! K9 L: j: j
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 `) ?6 J5 ^% L, G( |- a- k 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |