本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
) j; ?0 w' b) F6 @
" p: q. P1 o3 C/ o严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* L X4 B s# {/ G1 i: i$ G# U4 L 以下三个定义:; h* X& P) |4 U# K, [
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 c+ i5 H" V6 U" O3 {8 G) G4 g
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * V$ E3 D2 E1 T# M' o$ J2 r
所谓的双方优势策略则是指双方利益总和最大的策略。 2 j# l* ^! l" J
[编辑本段]严格优势策略举例分析, f" l2 s7 H, Q2 \4 z+ M3 P& Q L
一、经典的囚徒困境 0 G, c8 @5 b- H. n6 t
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 U" T' i' B0 x) R 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 4 v5 R, j$ E4 b* o' D" x
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 {8 ]" d! e; H+ D) t% q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' R2 ^( ^+ A, P2 E2 l
若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 w& U8 A8 \* f* g, C9 L" F 0 @' |; P2 @5 m7 l
用表格概述如下:
, r8 k- x; S- y* g( f1 c4 l/ v7 G/ c: [) p7 p; Y) t3 H% Z, ^
甲沉默(合作) 甲认罪(背叛)
1 Y9 j' f* { i9 A/ S乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' |* e; n4 e) i/ V- M* y5 W
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- V$ P5 \; E5 w3 C: [/ `( D7 b9 [2 y3 D; y' I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; ~9 D! V `# v( `& A/ ?: ~$ u K4 u
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: h" E* Q( z! Z0 H# f' g% Y
若对方沉默、背叛会让我获释,所以会选择背叛。 . V: _) ]0 Z4 E9 f6 @
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' n% w$ H3 Y: b- C5 f
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- X" r) ~, @' P7 z" D! e( i 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 f! H% k' j4 A1 k
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 X' }! C# l ]: b5 g8 C+ U1 W[编辑本段]二、智猪博弈理论
, |: j# n# s" V# Y; u3 r% ^5 K) [ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
8 @. p' i6 i! ?! j- D 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
6 ^3 q: R+ R. D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) c7 G: B1 `1 r, ]; ~: X 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 P* _5 q! L$ e2 |
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% w8 [, h6 _" P0 | 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) b) F8 m' J% I+ B 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! t% q, B( s- B$ V U. }+ ?
1 S! o& A& |; i, A: @' d1 C0 a: O三、关于企业价格策略, E, Z7 m, l" D1 Q" d% [' P- {
: z) n) I2 i" x5 c& a) y
; s0 L, A0 ~6 o) e } B1 w( G, ]5 ^
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 i1 \5 n; V! u( | 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 ^3 i9 ^- u4 m* C1 Y! e 以下三个定义:
5 Z B4 d' _1 Z5 l2 V- |+ Y$ g 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " f& t" [6 F U! I4 i4 }9 v
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 K: C) S8 f. Q( U. w
所谓的双方优势策略则是指双方利益总和最大的策略。 0 k; v6 h! p% ?8 |& T
[编辑本段]严格优势策略举例分析' Y p& @- T K. {& c, k
一、经典的囚徒困境 4 z1 p2 { G( r7 v# p5 i4 @* S3 _2 E
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 | F6 \# @2 y" [3 E" Q
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) B; X m* d8 ?" H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
G2 _* i3 S8 h! K: o1 q4 y 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: b& \- t" @( K& d- ]2 ^+ W( G+ F4 ^ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
0 ?" o s1 m E
7 f+ L/ N$ J1 i' a6 S3 u用表格概述如下:
u6 y( \; C+ C( g
% c Z9 ]- j1 B" w0 j$ E 甲沉默(合作) 甲认罪(背叛)
+ I l# w0 H+ a" r乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
( r$ Q: ^" ]9 C! p K$ b( {3 s. s5 }乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: q" w0 X1 _) W1 b& f7 I6 C% `: b, h: X4 s6 k* Y' p4 z
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 q/ K% n5 c" ]8 S# o" l7 J( x
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 T" w0 T4 z. H9 T2 W7 N 若对方沉默、背叛会让我获释,所以会选择背叛。 6 _; Q1 ^" _( K, W% z. v: W
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 l* Y, z# _6 k. a 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - j3 S! G- x$ B2 J. C1 \
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ' g* t; b6 u8 ]; y6 m. X4 Y
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ T8 @' v$ d% U: Y% x# b) Q
[编辑本段]二、智猪博弈理论3 S: {- x9 l6 p, M7 [+ Q
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
8 Q* B' n1 b9 ~. ]8 O 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* e, h3 N. x, K9 q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( y+ G& ?- ?5 `5 F4 p- E9 | 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) H. H- X$ n' D! _& r c( e9 z, K8 |# U6 a “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / d/ b# w! j) D% z3 e0 R. c# v
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 f4 I3 j3 h7 v. c& y9 o7 K# U 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- A3 v; Q! U, a$ A% N& ~9 C5 I! @
) e* N( i* g/ @5 e0 Y Q
三、关于企业价格策略
+ A0 @1 i: X% D
9 v6 \0 U4 \" G a : O1 F8 S% ?2 l: C# \ s9 c$ B
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! i ]. C! X+ G# {7 z3 A
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 o$ ]2 R1 N Q' n6 K" p6 a 以下三个定义:
0 @ d8 G* ^/ C% m& j! s 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * G: [+ G! n1 ^. Y6 s6 _
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) {! f1 U* e" K6 L8 l; @5 v' N 所谓的双方优势策略则是指双方利益总和最大的策略。
: T1 [2 O# |2 n1 T[编辑本段]严格优势策略举例分析
X& X& |* k( i# s 一、经典的囚徒困境
* t& k; I3 B/ v* ` 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ i1 r, z& Y9 J( p0 H8 t 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 @1 n* a I' m. r" B9 ]3 C 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 n" j' J g. }3 `+ o* { 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* j; P& t2 _# K) t/ l6 n0 x; S A 若二人都互相检举(互相“背叛”),则二人同样判监2年。( V) L5 S8 o7 M
2 J! |% U4 j% f用表格概述如下:: Z7 B% I5 t* w& Q5 t
% @- t4 H6 O4 ~' H& s6 M
甲沉默(合作) 甲认罪(背叛) ; e' k. c5 e6 m" ?" Q5 J
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 # |0 B0 S, r5 J, z
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 p3 U. v" U) a) I
6 z& c3 c" K2 D- R- O f g
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ q5 R% q j) o 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 \6 g* J E5 ~ 若对方沉默、背叛会让我获释,所以会选择背叛。 ! G W3 x0 M+ v6 @* i3 K
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : x; Q. J3 D. t( s
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' `8 \1 E ]& e) b" L& I: }+ D, m4 k
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 g. g, D7 C$ ~2 X4 i7 v 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。: y% o- m# L6 Q0 i4 u T+ |
[编辑本段]二、智猪博弈理论
! I' J2 D; m2 d, [8 e% ` 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : g0 l2 K, {1 y; _ v
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 ^8 g( Q; u+ ` 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ l/ J6 a6 n! c0 h1 X; `' T 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, L! ~8 R+ u9 e2 C “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: m2 {" K1 T; v& W4 ~8 I 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 i/ v0 p6 h1 {" ^
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! D4 X4 T" L8 {. _' i; g# ?2 v
, T! D" L& G( Q. s
三、关于企业价格策略) E* U& d' `) R# Z" B p: S' C
% @" [% _6 x4 h& R: @
& z2 X" d i$ h- t: s 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . I+ x& `, m) y9 Z# N3 `+ Q% B
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: @& D2 \# {( Q' g4 U) M 以下三个定义:
0 Z3 l0 m3 F/ R5 z7 o 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 L3 u) U4 [& L: G& |
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 Q8 Y" w& G% H6 l; T2 W
所谓的双方优势策略则是指双方利益总和最大的策略。
+ j/ K; I" g2 B! O/ D[编辑本段]严格优势策略举例分析6 @; x" I9 D8 c* Q
一、经典的囚徒困境 # s, C" r o$ O& H( X5 U* B
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 ]: A; O! q( ]1 K$ p 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & |; Z; H3 T% P( A ]
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 " \- i& D5 a$ D2 w0 x* e% d R$ `
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 t; O, q" I& R$ D: S, t6 {
若二人都互相检举(互相“背叛”),则二人同样判监2年。' P; ]# ^" E8 a
j& \6 M* n. k, H8 G/ U9 Z
用表格概述如下:" R: S8 ]" F/ {; h- J9 S2 w
5 X% f+ y) J! S4 T& q8 B2 U; \
甲沉默(合作) 甲认罪(背叛)
' c" V! Y2 {% [5 |& D6 c( W7 s7 I乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; Y8 U4 k& m2 h: s# i( m2 p乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 A/ ^* b |$ j. l' D5 `& ] \% \8 j/ z5 c' H; r$ `! h
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) O3 ^9 n7 L% D% p% f 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 P: o8 Y' j" e# Q2 ] 若对方沉默、背叛会让我获释,所以会选择背叛。
8 D- t9 G4 C, P" S/ t 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' D% g# p+ R" p8 K" n+ _
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; J: p) `6 |. p5 Z5 b( A$ n 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - K7 X1 f4 f% i' p7 X9 A; z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
9 ]/ e. @1 ?: ?# I" n- T: K[编辑本段]二、智猪博弈理论& z! J, C2 D1 K
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 }1 z, ?* M- Z* c8 \* J& Y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : R# s/ o2 j _3 ^2 k
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 e- ?# d! V! b, z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- d( u/ F' |/ S6 _ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' t3 s' |* X5 K3 D0 t
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 @/ T) x8 G5 R, h* s 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' P. i x( ^ F- I. _% Q. [5 u
7 n, w5 Y0 z* V3 E: @) ] s; T三、关于企业价格策略! f, A0 p; s; J7 M! V Q. Z) b; V
* b+ o3 C1 u$ R( ]5 x " x' A1 M/ r; a! q8 l" Q
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 E# Z- {$ H- g' e" O7 k 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |