本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 7 N r" g; Q4 @
' O$ N. n9 p; l$ X" ?
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 M) ?; E6 j7 M: g9 s 以下三个定义:) P/ y" y/ ^; c3 T ^9 v0 _) f8 Q
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 i. [( _- k4 ? T; W2 G+ s* K
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 L5 J: H8 t8 H6 o7 f5 A' @+ T 所谓的双方优势策略则是指双方利益总和最大的策略。
5 f: H2 ]/ T$ G1 f! t: d[编辑本段]严格优势策略举例分析
3 F7 A# `( u, S6 z- D 一、经典的囚徒困境 " ~( i! p2 B1 c$ f+ U
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: l$ f& X8 b8 s. A) a 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
# x$ n6 ], i; m. U 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 F) }3 t6 }2 ?* C: X 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 n7 n0 r, @2 C$ L% b 若二人都互相检举(互相“背叛”),则二人同样判监2年。 N1 e% }( ?) n2 b9 P: W% G
3 E! r+ `1 ? a: r' e: B# Z" u
用表格概述如下:! b' u- E) H" V* {
5 Y7 O& }+ O. A5 W1 } 甲沉默(合作) 甲认罪(背叛) 4 d$ q* B! r- u9 U& g1 q0 P( t7 A
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; j5 i1 |* X' X, g4 ~乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 0 K6 M. B/ i( k
8 P0 P7 J% l9 q" ^+ f 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 x, _6 ~! e! d% n& e% k; ? 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" m* a3 |; `9 L 若对方沉默、背叛会让我获释,所以会选择背叛。
! J* X4 E7 r" G! ~ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 Q: A0 u0 I z& i. p" P0 S# S& X 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! M9 g5 x, h/ O& C7 C8 m 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- f' V. V0 o' }; A: _3 x2 X 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。& _% L$ m. f& t% t
[编辑本段]二、智猪博弈理论 G8 j' z' D& X# G$ E" [
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 . H# d" q2 l4 N" X/ G# f
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 M) d p8 \% t8 k! X 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # t9 Z0 D# U) H# x
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# y* G0 w, ^2 A$ |' {9 }( @2 S- d3 a “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 J* z5 w0 @/ A3 N3 A7 A
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 a, N1 o6 @1 W( b
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) x- L2 A& o( x% w. r2 U& l; H
: C# r ]+ g: J) a5 M" o3 k: q' b
三、关于企业价格策略
4 S+ w& Z1 Q' _0 y# B) x5 T. q' H+ e6 } f7 H% K( s3 j
! H) Y7 N. J+ x: u3 E& s 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / O/ e S* I B1 R6 ?) @5 x
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 s S6 S, `: D5 o 以下三个定义:! D' W0 ~* u5 l0 p) v' q
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & `) m* g4 I0 c. u- M8 x+ e9 J
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ b( o/ g$ L6 x) |3 H 所谓的双方优势策略则是指双方利益总和最大的策略。 / r; y C3 t6 ~, C: N9 p* n% A
[编辑本段]严格优势策略举例分析
. {+ }8 C3 D4 }% f' b# [; _6 ^$ K 一、经典的囚徒困境
3 l7 o+ S! a& c+ k* m7 E6 L 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% Q+ A" [4 R( Q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 v0 p4 v- f) J
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
8 f7 ?. V% s+ V' F% D- b 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 a( T1 ^9 a" v& R$ c. g 若二人都互相检举(互相“背叛”),则二人同样判监2年。' w; C8 R, _' q1 Y# {! u `
6 a3 Z; s+ n0 z5 f9 h9 d6 h5 ~用表格概述如下:- E2 q2 F, r1 T8 s- t# H& G: X
& N) n$ R2 g, I3 x7 L9 \$ g6 q
甲沉默(合作) 甲认罪(背叛) ! y3 |% _5 ^7 h3 r5 r5 _
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 5 B4 | U! j/ u$ F4 R! J
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 u1 h' h3 g g& \+ ~( e) ?
& Y" C5 B( s- s: F: d, I; D 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 H& G$ f, }8 J6 l4 N; F 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
) ^( b, c: i5 @& M$ l9 |" o+ h 若对方沉默、背叛会让我获释,所以会选择背叛。 9 {) |! f# N ]$ T$ ~6 G
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 Z1 s. J' t" U: L+ H4 ` 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 {1 M3 N9 q: f: x6 c 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 O8 U. m. G8 f" }' D3 x1 N 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, r# F. ?: o+ L2 V7 G[编辑本段]二、智猪博弈理论( o1 A# P" h+ |4 l4 h
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 A2 `* q9 |' e' m. d 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, t- N: G6 X3 q! B. d( O 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 [; j e) A _. x1 ^! k2 a
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; h8 n0 L- t( x# X# j5 B6 I “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! L& \ R, T3 K* {* L! g 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 A% H0 V! p8 x$ w, L* M W, D 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! T6 T, I* r; q: T
5 f/ W$ p$ _4 ]
三、关于企业价格策略1 T/ g9 b1 X! [3 a: M
# c1 P1 |3 i- C3 r4 J5 E
$ i2 r4 J, N; G! y. Z( ^. H 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 \ ?" G' u2 R. c
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 f8 M4 S- E4 f
以下三个定义:( y6 y z9 V" [" M
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" t' d# \7 T# s2 y. l- \ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 D% m* X7 K! ]2 X" r/ t0 n7 p 所谓的双方优势策略则是指双方利益总和最大的策略。 3 d9 d& t! E# M) W" d2 F# V: c
[编辑本段]严格优势策略举例分析) X0 _0 z5 h8 |1 t- H \- q8 `) j, g
一、经典的囚徒困境
1 z P6 g( o# h9 h- d 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , L5 X: B; y7 r) T
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 L6 D0 F( q8 h% ~9 v N7 t 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 h* j: }" k/ {8 _0 |
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ _, }1 D2 Z0 A% k- m$ Z& o
若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 ~2 H, y+ X/ N6 n- ?6 a
/ ]! ~& X# a8 {5 N用表格概述如下:
0 m7 N6 Q( l- [
! Q" p$ V9 `, V' V( ]4 u! | 甲沉默(合作) 甲认罪(背叛)
; k2 [/ c. L; B ]乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 % n5 ?2 p% h/ S3 m& M2 d
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ g# |5 A1 x* J
6 g) C$ E+ k% [% S5 p 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" M: _" A. r9 ]' F" R. f 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! n, b% V# _# i, t( ` 若对方沉默、背叛会让我获释,所以会选择背叛。 6 c ~8 P0 m v* d9 s( _
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 l7 K3 o) o0 l: m+ j
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' ?4 G, ]6 t( |1 H' s, ^
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 V/ b! C: R( z$ n6 R+ ?9 b5 Q
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( S1 @: v* h2 L. D1 t/ e; o; x* ]: \[编辑本段]二、智猪博弈理论
; w+ p4 b" r' E 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' x. c' i4 @, F+ J; e* W4 o0 j 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 z8 F8 y" z% Y1 Y' d% Y: X0 h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 V" y. N) ~3 i; k1 K$ z3 L6 A
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' A, O, z" P" F: ?
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! K3 b/ u. b. B! b 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) O! D' G. H* c9 B0 C. x; R 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 k A ^7 N/ f5 l+ u) X
0 {" f3 j' I i
三、关于企业价格策略- @6 m/ X! @9 e; C V% D1 m
6 k$ x) [* X6 k2 W # ^: [7 t. F/ i+ w/ H0 v, w
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" D: \& O |* ^- p0 U+ j+ q: I 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 i& v8 l/ A9 C: z1 d/ R" \% T# e 以下三个定义:
6 f- Z" |; `" _3 P. s 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 S7 u6 V) I" l/ ] 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 n$ A( ]! E0 m8 q" v4 b
所谓的双方优势策略则是指双方利益总和最大的策略。
) Y3 O1 F0 F! w[编辑本段]严格优势策略举例分析
6 t- b2 }+ T( f* ` 一、经典的囚徒困境 2 f s6 ^* Y; \9 s) K9 e) ?' A- S1 u
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 E& w7 ^+ m- b% h9 Z( { 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) r4 J9 z6 m0 [7 D D5 s
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 l/ t+ k) n& C N( y, T6 [ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 p" g ?: q+ r/ a4 j" r% _
若二人都互相检举(互相“背叛”),则二人同样判监2年。
! N! x( B' c5 ^. M- x# Q$ A) V0 s5 q) q, j + r3 e8 a {0 l( ]% W
用表格概述如下:0 l8 ~) M8 t* R, S8 f
2 d3 u: P4 @& \; S 甲沉默(合作) 甲认罪(背叛)
2 O! u( q% ?2 r乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* Z: c" X2 ]# `6 ?/ W乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ v5 I. a) j7 T/ f: `; t" E. Y
% X2 n D* v* y, w7 O$ K' a 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 [" T# O$ O! L+ B- {# Y! ^ } 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* R& u- z% ]) C8 a$ o 若对方沉默、背叛会让我获释,所以会选择背叛。 q* \" r f/ c2 L8 A
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 A& |/ `( S+ z6 j
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 Z! p4 N" x9 {4 a" ^ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 H5 J' i4 j. q5 m2 o 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 l8 o; z+ N! D& Z1 S' |+ J2 }# c; r
[编辑本段]二、智猪博弈理论, X, M- l2 I$ A( V# `
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( e* i- `- u' {. r+ ~ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 C+ Z! j* }( I 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 L' L* u# z( O, r3 E+ G6 }
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 9 T7 V* G2 m3 n. h+ R. s( O
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; p, o+ O; ~" X7 a/ G 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 \3 [9 W& m0 g5 J8 [$ m0 c" W) K l 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 E5 p% G& Z n' o! ?" f7 b7 z
7 L% w5 @% I) }2 B, B6 `' V+ @三、关于企业价格策略* t) V& b1 K8 ?( ^7 _4 J
4 u, t2 P/ [- T/ c S n9 F: F
5 r( ^: y# E# l- j- ?0 K 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: _- C( K6 L/ F% B( G5 f; _& G 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |