本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
3 G1 U1 p3 M( c5 I$ a# c. V
% m) e; ]& `& _' G" I严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 l: n$ `' y% M9 z- |9 s 以下三个定义:; r: s7 \) ^0 K) h
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; q8 f9 G+ s4 f4 V 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! d9 | d" U* a; g% x$ n
所谓的双方优势策略则是指双方利益总和最大的策略。
: \* D3 U# ?6 E+ F" C) P# f[编辑本段]严格优势策略举例分析( G) p0 Q: r; \! f; J
一、经典的囚徒困境
x; `* m9 g- K/ d% K% n 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " e/ Q. p2 s8 q1 F9 H7 R
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / R) e( E- c( h2 R, f
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! Y8 t. n$ r- Z 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ g3 h# _" f% s( Y% s4 { 若二人都互相检举(互相“背叛”),则二人同样判监2年。2 u3 e* a- d+ b( ~ S, c/ j+ j" A
9 h! z4 g! [' @/ c# Q) m0 H/ S! j
用表格概述如下:$ Z, C4 |, y' i h+ R9 U8 A
5 x/ ~3 \, k8 i) S, M8 z 甲沉默(合作) 甲认罪(背叛)
r# m# t8 w8 r5 O2 d乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 l3 B) [" R0 C! Y5 L4 k) _. I
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
S6 K! }- K2 E" K3 \ `: T4 i# |' _) H' c E7 `
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- u: S- Q* \( z. H% P, W- W 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / z, J1 N# J4 B" }/ N
若对方沉默、背叛会让我获释,所以会选择背叛。
0 v: D2 y" y& f" o% Z: w 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" V2 S$ ]$ w1 |: d3 V: H( S, K 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ d- _/ {( P* A) ?! \2 k 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 i3 g8 f l2 |( U$ L% U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) \3 i$ w: X; _5 F* k[编辑本段]二、智猪博弈理论" G' `: Z% g4 K4 ?7 ]
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ P) ~1 _* x, V
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 D& E, k1 q; N. |
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 x& B. m3 i3 ?7 l 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 K+ `! \4 e$ s7 V0 X “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
) _5 o. V: F! k* C; K7 R* d 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - r. l/ U! \# Z; A: M% R
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 X1 O7 s# c; M5 b$ }( P, p
" ]; w5 A1 M3 r5 A三、关于企业价格策略0 L6 f$ H/ u e" B4 o
* A' \& M2 Y% n" u! V0 I
' O0 u' { i" P1 Q2 a( | 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ b5 |3 e3 j: H/ B% A0 H 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ o$ t" i2 ^/ y" ]3 R 以下三个定义:
" G: P, O6 A# _; N+ R* i2 f 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% E$ R+ n" S" q 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 z( C( l( ^( U( O. l
所谓的双方优势策略则是指双方利益总和最大的策略。
/ R$ m. j8 G* e, t' Y7 X[编辑本段]严格优势策略举例分析
% e. V) `" M! o1 A; m 一、经典的囚徒困境 1 z% p: s# I5 Q( r
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % {( r0 P4 B" o9 l
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 h# {- A. B, x7 z; Z9 K( h 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . z5 g# x; q" U( t$ r0 F
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & {+ B8 t$ n# F! C7 N6 d
若二人都互相检举(互相“背叛”),则二人同样判监2年。
0 ~, @/ c6 Q+ E1 d
2 m. \/ z" {; E0 j/ U用表格概述如下:
5 Q( x( n# t) g: Z0 `1 o( w% D2 D7 N: d# q* B; e
甲沉默(合作) 甲认罪(背叛)
c$ u0 t0 h! u* m( A0 o2 s乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
# J/ Q+ q/ I4 D' H3 ]& z! @) v乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
2 e( ^% R' S; \; }: A0 r. z( ?0 X4 |: M0 E% ~! J" x2 N
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 h5 S) k9 z; t 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " r3 M1 B- d3 v7 O( y
若对方沉默、背叛会让我获释,所以会选择背叛。 ~! n- o1 R: M9 ?7 ?
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 I- W4 C1 M7 }4 V. {
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 6 e' h2 {; i3 i4 H" p" ]
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * S8 ~3 r" i) B
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。: s9 e' o) {: v3 y
[编辑本段]二、智猪博弈理论
: k+ z% e' I, V 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! A9 g( a3 B2 k3 Q% {3 ?0 P& G4 i# E
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; _5 b( Q! C X/ d/ M 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % e8 U; w. K3 z8 i( y: [, l
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
* O9 u: G5 z {1 a& b “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" n2 [% {' d# ]# W$ _3 H: |: V 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* \1 u# H$ c$ t9 L 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 B1 _: N$ Y) T h; y
! C7 m5 i3 w( ` g- c8 y
三、关于企业价格策略, t) W: ]* O3 H, m% o; Y% w& _
# z; D: `2 f: }" x. `
0 p% I9 ^0 \. X+ }6 b' ^. \7 v2 W
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 R, W1 L* q Q3 i. t( c6 O 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
. f7 ?$ a' M2 ?6 p2 i& @ J- J5 m 以下三个定义:9 m" P3 P5 q. b7 p* Z7 n
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ L' w$ k+ F* d8 d 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# B. Q. }$ j4 A" [ 所谓的双方优势策略则是指双方利益总和最大的策略。 + i5 v* O" K. S& N, P- F! q
[编辑本段]严格优势策略举例分析+ M! u0 O1 ^+ D6 V* {; \- ?
一、经典的囚徒困境
$ B! V/ `0 E# L& W7 B& U4 W 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( _8 `/ T* E! u) u7 G/ A 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 a: M; p, ?) A* f) }
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
n; V% i) z' k; V+ W 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 N" }: ]8 \9 k& M L! p 若二人都互相检举(互相“背叛”),则二人同样判监2年。" k C5 c; K( ]' K! Q F
# o E, H' M' m3 `5 d
用表格概述如下:+ [/ m$ F+ X( P2 E
4 ]5 Z, F' e7 p) n2 G# P: S% Q 甲沉默(合作) 甲认罪(背叛) ' `6 o2 V3 e8 ~" `) q# C& J
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 n- A% ]0 \6 U5 m3 |
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 i% _. R6 z- H" ^$ {! Y1 l
! a0 [# f5 D7 ~( F X
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 h- n5 I; P0 K& C
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, q4 e5 r, W( @4 V# a- B" E 若对方沉默、背叛会让我获释,所以会选择背叛。 $ c* @% O$ K" }: H" ^
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 l8 q8 C) f4 B9 R; G5 d/ _ T
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' W" M2 a3 K1 P7 o3 ?
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * p6 O- V. C* D" w
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ r4 x6 f: o; d& C# D8 l) E[编辑本段]二、智猪博弈理论
7 u2 h+ H, `0 I4 f: E 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- C ]2 g3 w3 n, a: }5 a+ P 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 U5 P& S8 b% S! D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . @& V$ b W& F/ m* f0 r( R
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( w! r% U$ K+ t' J. D0 K# z, d
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" D) J: e" U+ J$ e0 H 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 s* P, _+ {# V4 F: b! r# g
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 M: c9 s _ b' B) L
& }1 }" y- [4 Z
三、关于企业价格策略
0 h2 i9 I' R' v8 j3 i/ j$ \# ~# K; [/ Q
" Z' A$ t3 j; P 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? R) U3 [0 K. H
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 }$ m1 Z- ^& x) _# I+ `
以下三个定义:
6 z& W' ?7 d1 {" w3 f3 z* U9 Y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( V! `( f- F+ I0 j7 ~8 M( v 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( W( t- C: l& f6 x9 `% e7 |3 Y8 x+ H1 r
所谓的双方优势策略则是指双方利益总和最大的策略。 , Q! g! B, Q: {- ^% k
[编辑本段]严格优势策略举例分析% Q8 h4 Y5 l8 G( `4 m# W
一、经典的囚徒困境 # ~' i2 O6 M# X/ u8 q- k
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / }+ q9 P. J, x0 X0 o: @1 Q
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . \! G7 ~+ V3 S, ^: }7 z! G
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 O, R+ n8 @+ V9 Y$ s# Y0 O
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 K! p2 E) K% P7 O
若二人都互相检举(互相“背叛”),则二人同样判监2年。2 C# B1 [7 h6 ^, M
$ J- ~+ _! D: r3 k3 ~
用表格概述如下:! g% A1 c3 I! H1 t* T3 @
( h8 ?5 u+ |6 @, _# W 甲沉默(合作) 甲认罪(背叛) # N( V# q6 N! s* k8 {5 p3 z8 ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 . Q/ ?" l! o+ O/ P; h) z; |6 Y
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
+ g9 c7 {5 F1 [1 V( |* ^$ a% q m: t5 d3 F" y/ x; d, W f
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 4 Y% q, d1 Y7 l
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 R* o! Y- m" j, b
若对方沉默、背叛会让我获释,所以会选择背叛。
; |: Y0 }: l3 P5 B$ ]# _$ m6 K 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 O: w/ E+ H1 {3 x 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + X5 ]% K# d0 t- @( F3 g% r
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ {% c, o2 W$ f8 [+ A) O/ T+ R# \) @ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 s9 e# n) C9 p
[编辑本段]二、智猪博弈理论+ D6 F* V$ g8 M) U4 c* H$ R- c2 N
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
8 v( X8 Z/ `. x2 e$ G9 Y! R 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 C% o; K+ p- q0 J# B
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; W" I0 V8 _- E: v 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% k! i1 q1 e7 t5 Q “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; X. |, r! P6 K4 W4 e7 j
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 Z0 \. Q. q7 X9 D 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 F) M8 a+ \2 C8 }) S % {4 x( U. t3 |; R; @7 s
三、关于企业价格策略
) b0 F1 f8 P1 d) f0 j
6 n2 q/ z0 D3 O- b5 E( t$ t0 x& v
% E; p6 H' L* q3 l) e4 Z/ s 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / r6 s$ N* l* q+ r2 t, q
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |