本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
- e- n* M" K; j3 c+ U: n- ?; R; i+ [: n, P, i* a, u' Z
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& U" w1 z& v+ u! u- A 以下三个定义:* P; X! e4 k: u0 u' Y2 R, C
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" `# z' ]6 K* m7 c( i" Y# j! a 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , S" W2 h5 T* G/ {7 O5 {6 l
所谓的双方优势策略则是指双方利益总和最大的策略。
# t+ F4 i/ U) C, N[编辑本段]严格优势策略举例分析
: h9 `/ C' Y# H& C$ W0 v6 E' i 一、经典的囚徒困境
- b. K6 }7 _% o: w* G 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 G `9 t* _2 o. I8 Q/ M3 A 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 g* d8 e5 P5 g
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' y- P8 L& q9 m& l: D2 ~ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & u. y& t# b# _! d
若二人都互相检举(互相“背叛”),则二人同样判监2年。' R$ M4 J0 j$ t2 {. o5 v; Z
g+ u9 W- C3 `' e用表格概述如下:7 O1 ]- d5 n0 A h, l: }
$ m$ i7 f' X9 a 甲沉默(合作) 甲认罪(背叛)
; w+ B6 x1 ]; |$ ~3 u6 I7 y& a4 d( v乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & O6 p) H/ A( D/ b
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: }4 U5 S; t: Y$ R) y* z
9 w% y# o: B: E! `: W& _ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; y4 c* L! A7 A5 N
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ! d1 B% q7 W; I6 \% l
若对方沉默、背叛会让我获释,所以会选择背叛。 # m) N1 R$ h- D) U
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) F3 O8 p- ^2 ]9 C" P) e
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; G& p! g0 `' i7 H' l' u1 @+ @ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 l3 M+ e. A4 C' Q$ F* A
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- @6 {* a2 O) |4 w( B- Q[编辑本段]二、智猪博弈理论
+ v, [: U# y, m5 c 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( D/ N: {4 o! W) T8 s 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: e2 B+ T+ j1 F# D' w/ E 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " W' D5 @# C5 X6 o* Q4 W
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 E9 p7 b3 Q9 ]: a) B* ~ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 T! r. f# p: J2 {) W 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( v% _( k5 C/ R5 p" s 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& y$ ]0 x. v" L1 Q$ E3 [8 X " ^2 {0 l9 y# l( T
三、关于企业价格策略
: F) Y8 {, [5 w: c' \/ E
+ ]* [, V. Q$ C$ X
W9 S9 d( I# x% f5 Y 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& `$ K2 G& O* d6 m& h' H 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 Y9 g' t2 m; ~( a# O 以下三个定义:# o7 h% |( t, X
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 j. J x- L7 K
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 P q! Q) X0 S/ m U4 f 所谓的双方优势策略则是指双方利益总和最大的策略。 % }3 k/ g% z3 }7 e. z
[编辑本段]严格优势策略举例分析
: A/ l& r4 b$ k& l$ G 一、经典的囚徒困境 / D. r1 }" W, ]$ c0 D! Z+ b
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / M0 [2 T7 Q0 A. r
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' X( O2 M( g9 B2 X1 A7 T9 f3 y$ N o
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 n7 E' d( Y* o5 U; |) r4 ~
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% B& S+ A: D/ w( D5 j" r _. \. C1 U 若二人都互相检举(互相“背叛”),则二人同样判监2年。
$ a! Z: [! H: O
& g! {# h7 c4 H" [0 C用表格概述如下:* a, @) J0 f7 t. o$ b
9 ~' B$ C; H! i! ^, i' G
甲沉默(合作) 甲认罪(背叛) ' ]$ \/ E$ N0 {( D. V0 O8 m
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 [, m1 ?# }. @! U
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; E5 A/ B+ X v; p8 W: |
L3 G4 L5 q, R6 f8 M: F- h6 e
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: ~- z2 h* a( g8 C, H 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' ~: v- h$ ]/ i* R8 u& d 若对方沉默、背叛会让我获释,所以会选择背叛。 0 d3 K0 r4 s$ u0 V; B! w" R
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( a9 d' b6 I1 C5 G
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * _0 e( \! m/ W, d4 ]4 m& [. P
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* h" ~0 [6 N2 j- ]( D! V+ f g4 z 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" V2 P+ {, y4 p/ E3 K
[编辑本段]二、智猪博弈理论, S$ B+ e# @0 W& f& n! x6 z* e( S
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( M4 |6 f5 L" V! q& q% p& W) M
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 \) H n, \+ B% f( s- S
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & M# r6 \& s# e! ~, o3 t
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 S% e4 X4 V6 D4 i( B9 ]' N9 ^ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* W$ L5 W7 B. R8 l& s 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ w; |& y* R2 ?2 p& H1 T! { 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 \" W. I: K5 \3 T 9 b& |" `$ t+ W* Q9 w }9 A
三、关于企业价格策略
$ X2 L& D5 j9 b" p5 v# ~- A I
y, `* `% f; \/ w9 p
: X& j' Q ?0 I( A& L 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. B9 k$ O7 w1 b, u* E1 k 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* S% o4 ?) x/ r# I: }- \; O
以下三个定义:6 ~2 x3 ^; K; r/ m- B' u
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( A7 Y. O/ r- A8 T8 m2 T
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! g8 u2 i1 z5 x4 o, H: T1 u# U 所谓的双方优势策略则是指双方利益总和最大的策略。
3 n/ Q8 S; |! ^1 I6 s& X" y2 X[编辑本段]严格优势策略举例分析1 s6 t& h0 P6 Q; }3 y
一、经典的囚徒困境
# }' a9 ? y! H! }- F" n$ f 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " ?3 l% {, p$ k/ l
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% h# Z. s" ^; \3 Z/ b# } 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 z* \9 _( z3 M8 O, q9 m: F, B$ {
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# {7 @* O5 }4 V 若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 ]$ ^+ r8 G2 ] 6 i" W! `2 H6 c" _4 ?/ r$ b
用表格概述如下:
4 D4 b% Q; S, z6 l# p' X& A7 h+ i: G& f3 t) d2 X. {
甲沉默(合作) 甲认罪(背叛) 6 K* a, K' P! `8 r d
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
+ m* c. f1 a- I2 ]6 I乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- m0 t( \; R/ i& E* [+ a" Q# ^$ H/ z& o6 b( W+ Z) t* D
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 S, X8 n! K8 C1 f* D$ n: ?, K 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 t- T" a+ {! M0 s
若对方沉默、背叛会让我获释,所以会选择背叛。 m9 p1 ]% }( }! \4 O" h1 u O% O4 \
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * |4 f. o7 B U; }* ^
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ y1 D Y: H$ J' ` 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! D# ? S- U1 a# W7 A G' {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% P: m, k3 P- Z2 E: s; y+ Q% h[编辑本段]二、智猪博弈理论( `3 Z& |- P" f
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- D! q1 r1 b; m8 s, j! F. f 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) Y+ o% X6 m- ]; M
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 x8 T- I/ z/ `; G( H$ l
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( i$ X' q/ x5 |2 D# _: Z7 [ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' t4 x( p3 s5 j: T9 U: g
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. o% ^; b, q" Y- d1 i v 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 {9 V% c5 h B4 p; t% B$ e% J
n- ^0 y" u$ {. I# B n三、关于企业价格策略
! E! l3 m' H5 S) ]" w% A
$ g9 e6 N, C9 _+ W0 X
2 M( \+ u0 _9 R8 Z" ] 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 K( H ~) v C. I# M 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: n0 }; s( A. h# i) ~( ^; E/ y: W 以下三个定义:" Y: J* }' g# L0 ?. U
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 q" F" j/ J J" s( o' k/ ~
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( G2 e' H$ h, e6 L8 C! X8 M: c 所谓的双方优势策略则是指双方利益总和最大的策略。
- I% Q- b3 u- L! C6 V" F[编辑本段]严格优势策略举例分析 c! |# Y- v; @/ C
一、经典的囚徒困境 ; D5 L1 V! P Q6 w$ N
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: o2 A* i# `9 O1 [% I# t: }
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
5 u0 O1 S: I, [; r% Y! f) \ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 C" _) g" k/ S# ^
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 m1 u/ l U8 W% e1 G
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: n- ~# C% c/ I$ |% W% c 0 `$ v4 U* |. u3 W$ z, M! I- Q/ ~
用表格概述如下:4 N. f$ y2 \ y2 v, Q! ]
1 q: O9 T) A! W* i& o6 c 甲沉默(合作) 甲认罪(背叛) # E. S* S' E& W, c/ S3 ~4 `
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
7 \/ H; d; a4 f: ~$ L k9 P6 W& t乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ T* g2 e# S# r! _; x e, K1 m& _% }1 b; d" F+ l. Z
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ b+ i; D3 G, q* v
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # z9 [: v$ X. z3 y8 t
若对方沉默、背叛会让我获释,所以会选择背叛。
- q7 d1 q1 g% `# Y0 T 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : [ b& F$ _! A
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 k8 } S" G4 P } 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : P! Q6 ^' [* B0 U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! [, {+ Y8 E; t& U4 F
[编辑本段]二、智猪博弈理论
! E$ @6 w' y2 o% r) O- T/ X 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! A7 n, v- Q6 X5 v. b* m6 i
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& ]; x4 \: _ w; [9 F. z 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " C y k) n( X8 ]) t u5 S
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * ]3 E0 `, C! `) y) B
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . X3 D+ P+ I3 |* @2 S6 `- @0 X
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& n7 `1 r: T3 G& W5 \& A 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% m) C- o3 r$ }6 |
# [5 {' s: M! y& r( B
三、关于企业价格策略
5 o" D: s5 T& ^2 n5 `; J# T# Z: a+ `& y) `" m q/ k: q$ l
! a$ J: B. R. `# [) `" H
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ X2 U/ y: j! O6 w( s 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |