本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 " W- `" [. _; Y4 ~. G
* X* M" G% R( h L5 `; u" P0 w
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 q+ E4 ?$ a/ d# d 以下三个定义:* `3 [& N1 d& \
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & E' P+ d; i# r" G
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 + `4 |7 y- q$ O, {2 R
所谓的双方优势策略则是指双方利益总和最大的策略。 % C9 q* ~: b4 o
[编辑本段]严格优势策略举例分析
+ X2 S* }* P% j7 \' J 一、经典的囚徒困境
2 b! q% `9 s( o. Q; ]: N 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, _% y5 a. I5 B& ? 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: $ q9 A. z6 x0 D H0 G
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 |: n# m( f2 u( s' g6 @
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
7 d5 o' h3 z$ `8 d1 [5 [ 若二人都互相检举(互相“背叛”),则二人同样判监2年。3 P6 v+ W8 n3 ?# i$ H0 \
3 d* ]. h& g* g7 P
用表格概述如下:
3 j; {, r5 P+ S( J7 F' O& ]
: F: r* R8 t! K* F" P+ g 甲沉默(合作) 甲认罪(背叛)
, T7 E/ p! B- S& Z w( v# P乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 ^( ?8 n2 E8 y9 j乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 8 _ [+ ]/ z# D# Z
" `( h& H2 I% d5 R0 C 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' d3 v' S( X4 s, y8 _: N. G 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- G3 i1 x# V# ~/ k# D 若对方沉默、背叛会让我获释,所以会选择背叛。 ! m, d; m4 @* B$ V, m- z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ N3 G& s) [3 c1 ? 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 Q+ Y4 `2 C0 t' a 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% D5 P1 L0 L, L 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" L7 I: H- Y5 f[编辑本段]二、智猪博弈理论0 }8 ~* J; |0 d1 T, [/ x
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 v9 R% `; a. j4 @2 g 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 \' t! ?- i4 S) K% W8 r A 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ a3 ^; D' b" r! w/ b, y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 P7 T9 N- Y+ v9 f" h( d+ |- x* f& t
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 _+ u/ V, l5 i 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 3 f! ]# O+ a& s: v# S; t% `9 J7 A# F
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. d+ |, ]1 o/ \ ! I4 C. m2 S v% n. g0 l
三、关于企业价格策略1 t o" d* h8 x' e: b* {
8 s( r9 y7 F& v+ P1 j+ A3 Y
0 v) m# g3 V6 t6 \3 L9 m8 I
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( E" j3 Q; J' x8 d g" E
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% S( G+ L) e( [% |1 |1 a: y 以下三个定义:
L8 O- j! b6 `+ U) u 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 [) b/ Q" y1 x! k3 P9 r
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * K2 Z6 L- {4 H+ q$ N3 P0 W3 U
所谓的双方优势策略则是指双方利益总和最大的策略。
' F% F% X5 ^; ~4 \: w! a. u0 K[编辑本段]严格优势策略举例分析6 z% c4 M$ Z- C. W, b# k. h+ I
一、经典的囚徒困境 " r' F0 }4 w2 o. Z
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! B- X9 s: g( O$ A' h z
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 E+ Q& H, S3 c, x' Q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" { Y" W- W" P 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 ?0 d: O# G. e3 H 若二人都互相检举(互相“背叛”),则二人同样判监2年。
: M& J3 J' ^7 E6 `, |6 T: \ * J: t0 H$ ?6 b: O( D
用表格概述如下:3 W# h0 w4 v. a4 G* T% M' V& r
3 T; o$ m: Y6 {: B
甲沉默(合作) 甲认罪(背叛)
$ z, p& o X' x, u; G乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
( {9 @9 x! z6 a7 q$ T& O5 y乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 # p5 T8 e$ I, s. ?' M
" Q! ?+ r1 Z4 g* F1 U) O2 m5 U& d
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! o. M4 i' Q4 O7 `, \
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 \" a6 n" L1 R+ G& t
若对方沉默、背叛会让我获释,所以会选择背叛。 * x) Z1 y0 h1 W1 z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 @: ^6 l# p5 K/ L7 g2 V9 e
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 u. i4 N- j& @, ?! t! I9 u 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 " s, p8 E- B3 B, e( |- N
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) `( z: G- C+ j. ~2 n5 n1 H8 P" p) I
[编辑本段]二、智猪博弈理论5 U& o& g; B$ W, S
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 T6 I: M9 _" B+ `+ P
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 c+ e6 M+ X* v
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 E7 W% X# t( f0 u' x& V' q7 E 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
5 U2 R" Q9 f% w0 S# P- K4 X “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 B3 Z* S ^. X
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # {6 x6 {, j( q* u1 r1 z7 Q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: [. Z! k$ {8 y% P6 x Z8 u4 A I. W# U$ ^2 W6 B
三、关于企业价格策略
+ v/ ~! p D' Z1 A; I1 |
4 J; u- S' H8 ]- r' H" D B& B/ {+ e# T. Y: U5 L9 N
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) d( D2 Y/ e; Q2 h- q9 @
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 [4 [, r8 C+ ^1 ?8 h ^9 Q$ W
以下三个定义: ~; }% H! c8 M& X' o4 X
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 . Y; [- n2 Z2 p/ O
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 n2 o9 i+ o4 V7 s 所谓的双方优势策略则是指双方利益总和最大的策略。
9 _4 F \: Y0 s* [. R0 o) B1 g[编辑本段]严格优势策略举例分析$ U* T$ l1 Y* Y5 `1 Q- P$ P( Q
一、经典的囚徒困境
: w/ V# j$ O3 ~7 k7 V4 P" y 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * O; o) [5 o7 `, Z2 e* S
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & h' G0 g! {/ h, {
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" ?8 |$ }+ }$ [2 p( ^$ E1 ? 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# B$ x: d" [, [ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
. N) i- N: Q- B
* S' W2 `. {6 u' f2 ~! p& R; p用表格概述如下:
! N# Q7 O) J1 ?9 p @' ~ w$ x, _4 U0 M( J. f2 E1 O
甲沉默(合作) 甲认罪(背叛) 7 b8 ]3 ^6 Z2 p5 ~) v
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 I6 x: R1 s* C* ?5 t/ R1 E' d9 ^乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 0 k+ ]$ t7 k" H* g E! e! x( ?
+ Q# P: h1 I* Q1 c+ d/ i8 d, f! n 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. E* ^' C. V/ ~1 S 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 s2 u7 F% S/ A S3 Y0 D
若对方沉默、背叛会让我获释,所以会选择背叛。
5 W+ h) A: o* k4 J N. Z0 N5 |8 @; q 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # Z9 q1 {5 m9 v* X" N2 I
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ {+ C9 T# d, x1 } 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 |; } V: D1 V/ B3 i 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ A, b ?# y$ o) D; u3 K[编辑本段]二、智猪博弈理论1 ^" v) u s9 V' g
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 s* H( D4 y7 s* ]; i
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : a8 m3 c8 ?7 r7 ^; e
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; U! H+ _9 e1 h1 M9 b
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 q& ^' T ^( @3 O/ X
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 a* g2 ?; W1 E: S3 u$ H
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 ^( v* Y' }" o8 R9 M; r0 J) q 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% [* G1 `; Y4 U" q e$ F* U
% w( l+ h8 q8 d* C三、关于企业价格策略5 I6 i x( v, V8 m
2 r( B1 A% h5 B$ G% x! |4 R3 Z6 ?
B! U4 z' M' f* H* g 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ s: r# U( J; e" v 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! d3 T& C5 d9 s
以下三个定义:$ S3 n* ~. k8 ]. W6 J( ?, ]
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ ]# g5 h2 |- J
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% o/ j* \, t: c& D Y 所谓的双方优势策略则是指双方利益总和最大的策略。
: ?' X& P3 m# e[编辑本段]严格优势策略举例分析
% M8 [; G: @5 h/ { 一、经典的囚徒困境 : s( W8 K7 g, o4 W* H1 k
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 U! ]" {' }% @6 h9 X
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 ]) Q; F7 }) Z5 i( r% G/ G
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ m: A; m# c# j- j J3 ]2 n2 d 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 B) z, ?- v2 {( z$ d y
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: c. c# U) W5 ]7 g2 z
/ a* b1 J) [+ o- f用表格概述如下:
) u" `) Q; U6 {* c) ]; h6 u( x
$ c! o: E8 @9 D4 C! E3 m 甲沉默(合作) 甲认罪(背叛) 1 q1 J3 c( }" ]) g4 h$ T( E
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' r0 A! Z1 h( {5 [ \
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
e/ S. Z+ ]2 w9 ?! B
' q, k6 T$ h+ b+ a 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ n& G1 r4 K$ q9 [/ u$ m& n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& l: K) b3 T0 {. c0 E' [; D0 @# a6 Y 若对方沉默、背叛会让我获释,所以会选择背叛。
" v' d) k T- ?% T 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + v; `* {* c1 E: t$ i9 H% a2 V/ Z f
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 5 I! D a( ~, V# ?/ }% `
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + d" z1 O& }$ w6 Z, T: ~* F
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 `" ]/ m7 e/ E' l# }8 Z9 K[编辑本段]二、智猪博弈理论/ {, Q6 X+ r3 o4 ]& n" y
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - @1 s- X. @. J4 j( F# n! q( l9 ]
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; L$ I3 u1 ~' ?" s( _" A5 b, v
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 X/ N) w$ Y. h 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
$ W* V* n( ?; U" [ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 Z/ T1 w- |7 ?' f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: K+ Y& |/ ?1 X, `! R# i 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# G0 q$ X6 O" J* {4 t ~
/ J1 m P( w$ T8 g三、关于企业价格策略; ~9 o" Y5 ^ h( A1 y
* z. n1 c. F' M2 n' a/ }+ U
6 C U& @3 c# }0 W/ y; |5 Y: ^1 ]
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 5 I1 Q: {7 q0 Z7 l7 B
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |