本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
6 J: i4 y. R; @9 H0 y/ A( l/ X& a! M: s* p2 U' Y1 P9 m
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 \9 I6 }7 ]0 W* Q* ^" J
以下三个定义:" U$ L$ ^ F3 |1 L/ ~
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & u# _ E- H; _& N8 m. h
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 / l0 P0 L8 P3 E, ^3 ^1 G
所谓的双方优势策略则是指双方利益总和最大的策略。 * [! C Y" V! W1 V# A% C0 C6 H( ^
[编辑本段]严格优势策略举例分析& b& P& ~# ~, H! Q- z& b7 E) i( Q' \- v
一、经典的囚徒困境 * e( h9 s. j X
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, {3 k* u0 C: U$ ]% x$ O 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 [3 v/ {# f; W 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 l- M9 ^: Z Q0 q9 W9 W
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 }* V* D( S- w5 |5 l/ I1 U* \ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 R4 y6 I7 e; P% k * t' ?( I6 o6 q$ z6 m& j
用表格概述如下:* e. H+ [. O: u. @
7 }1 L* I0 t% m$ c9 K
甲沉默(合作) 甲认罪(背叛) 9 J4 _6 e1 v* y2 s( p. r3 @( Q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ! l' H; W. ^& Q2 ?3 @2 V# h
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 {5 B1 a2 P! J/ {1 C9 Y/ D$ H' J
8 ~/ U5 v4 I2 m! | 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * p; q# G1 R! R' I2 m7 L
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ S5 k/ R" }$ s6 Q# m 若对方沉默、背叛会让我获释,所以会选择背叛。 7 v) b8 W3 T& r2 O% Y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , b: J( O- V3 B1 ]7 z- L
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# \2 ~; w4 I1 e. ]- R0 B- ` 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" f* P* ?2 M! a, h. i0 \ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# t9 Y6 D. ^5 w0 q. t' v
[编辑本段]二、智猪博弈理论7 L' l+ f7 }7 d- ]# X, {
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & J5 i9 x( N( f% V
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ P# O( C7 k% p9 b 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, c7 Q# l* R j% ~1 [. q# N2 s 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 z4 i7 S2 ~3 C
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- L" C# g1 T1 g 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. V( B) Z# |' H/ b; U# c0 a# m 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! U7 f6 J5 v" d: O. W) r
! c+ N7 U. e# E三、关于企业价格策略' K0 R9 n7 C! k
8 ?, g3 w3 C! ~6 f7 K4 }; f0 z - h9 z) ~: ~; @" H/ h6 V6 S
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ q. Z4 F4 Y# M ]4 a9 w
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 [* U6 f) t( o1 ]# a c2 t2 C5 P 以下三个定义:
# P# M' z; u+ y3 z! t& w7 y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 C4 V8 r0 o1 m1 u 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% `1 d1 c- G1 [! Q l- C7 L 所谓的双方优势策略则是指双方利益总和最大的策略。 . M2 D; M4 H0 z& [
[编辑本段]严格优势策略举例分析2 B+ C5 g: F+ V# ?: P! M1 ^: I" n5 }
一、经典的囚徒困境
6 B( k* J# q; @; c: a h# R 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, A: O! @/ j; X- ~( C3 w' R 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
+ P. a7 F* a% |4 ]' q# e 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
/ d" F6 u/ x4 \0 A1 a6 t; _ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ t. y; U) L! ?0 \4 m* D 若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 e; W# n) l k; s" \2 s 8 s) O9 [1 t5 q
用表格概述如下:
8 W* A0 v0 l1 M+ p( D" m5 O9 S/ w1 B; Y' |# Y" ?" V
甲沉默(合作) 甲认罪(背叛) 0 a* q! h4 v: o' E8 V
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* g. X% r' v$ ` y- `乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 [# G" @) ]5 ?9 h' [: B
0 i1 r* l* C5 V2 q9 D 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 e& g0 q/ u4 ~' J: r: E5 V
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& w% i' z* W2 _! K- p 若对方沉默、背叛会让我获释,所以会选择背叛。
3 _0 v/ ^3 q1 h* I# l/ @! ] 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. }7 g8 O! n( [! c 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 {( V. F2 X; t5 s 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" S7 L q/ ]5 E* A2 n5 f7 g8 ~1 M/ E 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) i N8 h% w5 c- ?: X[编辑本段]二、智猪博弈理论
' L0 E0 v: T8 N1 F 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / O, K" O0 L: G. a! s' g6 \
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . j7 p3 S# e+ |, A2 ]* f
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# i8 B$ m- f# Q6 E) _4 j. B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( u7 Y/ `, ?5 [! E/ K1 z) ~ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& @6 h" y& h% c- p4 {$ B& \# B8 a 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( y) }. ~2 k2 n. o
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) F( @ h; W! F- @: ]
* \& i- N+ R0 t" O7 F三、关于企业价格策略$ Q; j- d& s) ?( L
: C) W* I6 M/ S! X- K n0 y8 R
$ T& i# a/ R* j 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 Y& g$ @# W8 ?+ e9 G J$ |4 G 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
; q( M0 x6 x0 L* T) ^( x: N 以下三个定义:
0 P" P8 d: d; k D 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 s! U" y( A* o1 Z F: ^ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( |6 U9 T8 f# q( Q
所谓的双方优势策略则是指双方利益总和最大的策略。
2 q& s1 E2 c2 l+ v+ _& a7 X3 G[编辑本段]严格优势策略举例分析
& L# K, g; O+ S% ]) Y+ @ 一、经典的囚徒困境 : B1 D. i! t. q8 e' w
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' _) O8 {9 m( k3 ~& k! v
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) i0 i) b4 h6 y# G7 R$ @ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
, I! [2 R6 D. R/ H% @ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ S2 w6 @& b% y# {$ A, o1 t7 \ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 P- o/ o; q0 H
, p' @9 s/ X9 a) u用表格概述如下:) F: k6 o$ S- C# m$ G
& T* h7 l3 I2 A1 M/ p
甲沉默(合作) 甲认罪(背叛)
* _4 ~) S' ~0 g) L7 b乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* j: p4 S) ~8 l" Z% k乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
+ x; M+ C" b5 `/ \" \) W
$ a. R4 l, C. I' p( D" Z" w5 h( X 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) }1 r0 F! V4 c. |1 m5 c
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 4 P+ N1 j& G0 u! ?& o" f; @( x$ P
若对方沉默、背叛会让我获释,所以会选择背叛。 # C# a0 Z- _' a9 X0 ~& E# b
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 s/ b7 U$ k0 J$ ]' Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 6 l: C# X* ~: ?$ {3 a: A
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ {+ }) b, j( @7 K* P+ j& Z( t 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( \( s. H4 w k5 D
[编辑本段]二、智猪博弈理论
/ C& j! Y( D- ~7 C! w0 p 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 E+ {# t) V8 J+ V) \' o0 D
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ {! j6 n4 K1 Q, b5 z2 J$ V 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ R; j" G" V9 R8 f 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 ]0 s4 f2 `, X% G/ g' F/ s+ b
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 Y- H0 t6 N5 p) X
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 Q) r& |$ W" G! N1 l; y6 ?6 p
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 K- L" P$ ?! Y
3 `$ W& T+ V3 _0 M三、关于企业价格策略
5 T2 H8 p5 G! J# R" X
7 W6 v8 m ]6 x: C0 ] 8 d8 W3 |% C8 I, w
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
Q0 |* y) X T5 H x 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& X6 J3 z/ E" g3 y' ~9 Q3 {- M, V 以下三个定义:1 G" e' I) _9 Y5 p
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 R( R) o) |$ \, x' b" i* V 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 n' S' U6 E. A$ E& I' K. z+ [ 所谓的双方优势策略则是指双方利益总和最大的策略。 ; q( }) R* Z" Y& \* C6 ^+ W
[编辑本段]严格优势策略举例分析& k5 @2 ?* L5 h
一、经典的囚徒困境 - Q& v5 z( m% g
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * ~7 j9 V/ Q/ y& {# G0 j$ `
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " g1 A. J# X" O* s0 \
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 C7 r$ v# n9 x* ^" _( t+ Y 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ V$ Y% C& N. y* u 若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 i: H1 Z0 C- X! _" i9 O* b. s K7 `0 m* v) m/ _
用表格概述如下:9 {" I M$ F/ s
8 x+ `4 c/ @: \- g' F
甲沉默(合作) 甲认罪(背叛)
7 Z' D9 f- _- s* k; U; ^1 C$ @& x乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ I; {; }% l) v; J乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ r9 b0 H2 ?1 f9 q2 x$ {' V
) k" a# ]* W- ]) d" z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! a' K! S" J* n- w$ k( C 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 V8 [8 U2 j# ^# P
若对方沉默、背叛会让我获释,所以会选择背叛。 2 ]& K2 n3 z3 {- Q
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- R: @; E6 x$ z% T* t3 m/ F6 Q- m 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 P! D- W# \; o( b 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 o/ a7 n! J( x
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 v0 y# L D8 h0 Q& q: I
[编辑本段]二、智猪博弈理论) U4 Z g( R' x) F
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 N/ ~) X5 S0 M& Y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; E6 z; ^0 q: }0 z" w 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . e6 [! \& x2 r+ u) C& N
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- z$ v" n3 g; W “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ Z; C" a& A$ K9 s6 y( p 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- Z. n* f; T& ]' \+ y% \4 R 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 H6 a6 B# v' r. W
$ |7 d, V* ^2 ~. c1 j6 R3 a9 d
三、关于企业价格策略
3 Y I$ ~& D& g7 P( {% w6 P* t8 n8 p5 Z, f" X' H
/ f. Y# ^ T9 @ T$ o) R
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; H/ ?2 G5 w' p1 \- ? 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |