本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 0 _: i% k1 }: H8 {1 t
" o t) \3 P1 T' o# d
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 }% P; }. V' Z! q! m! p 以下三个定义:( W9 v, p5 a8 N) `8 `" \
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ) v! S5 H& a8 K& u4 g$ K: g- n
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( p0 J! e7 E! Q9 r/ L: C
所谓的双方优势策略则是指双方利益总和最大的策略。 ) D1 i% a Q* V( r' H5 q! y
[编辑本段]严格优势策略举例分析
0 E: ?4 V3 T' e3 I+ |+ X& ~5 F, W 一、经典的囚徒困境
2 r r m0 E' Y9 M6 ?3 U$ _) Y" g 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 i, G( J8 E' K/ k$ y k
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) y% x N8 U% v2 X: N' F
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 h; N/ V4 }7 f1 B i+ u5 z 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 c: p' V4 ?. g$ y2 j 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 h3 e& D2 J. @7 O5 _1 W/ F6 J 3 C4 P. j" ^" U6 N
用表格概述如下:+ T* X* I& j! g {# R" t) p1 C
( `9 i1 I# K4 n: \5 S3 h* S' e$ T
甲沉默(合作) 甲认罪(背叛) % d% a- {& D' U$ X/ e! J$ |2 X
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 3 M4 w& a5 s/ {! Y( {+ y, J
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" k* O# y. B6 r' S
" @3 a6 {% X+ P/ l 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 G/ R4 Z3 ~- X+ \ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: \3 A0 L# I0 C. ?1 ]* K. Q- m
若对方沉默、背叛会让我获释,所以会选择背叛。 # }2 h7 A9 w+ y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 R! K$ M2 H9 }! U 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # z) @* a% M* y$ u8 T+ ]4 }
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 [/ T0 m' v; h2 d0 i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 ~; L7 Q4 ^( S8 n
[编辑本段]二、智猪博弈理论
. U5 a. y4 }3 H' n 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 u- Y7 |1 U" {+ m 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! h, z9 P0 p& K) b3 j7 F# u 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! [5 x, n* R) K
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- ~. y) F' A6 G “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, Q$ [( v5 J6 l3 j+ r/ p% U' B7 L 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 e, @2 O3 D9 Q$ I5 h$ @6 e
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) x% _9 V) ~) T0 z2 s% E
( p- h& P; q X% K3 @! e3 S5 P
三、关于企业价格策略
& q5 D3 _$ ?6 h( k" E% k! \3 Z
7 K, z0 z8 R/ c8 K ! F# v+ a0 @, i- n
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; T# t/ V" Z& h* Y, G ^* n 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& `6 ]3 t( n7 Q9 m, j 以下三个定义:
: L# X$ p% E( u' n) z. n5 D 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 p1 g1 H; Q+ s 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; I& g+ N* \7 ~ N( o 所谓的双方优势策略则是指双方利益总和最大的策略。
& B. v% v% @, r; n& ~# o- B[编辑本段]严格优势策略举例分析1 T% g! w# \- `# ]' ?& P8 C6 ^
一、经典的囚徒困境 1 j, K* n4 G( _( I6 m
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
8 S/ x8 |2 s' `. J7 ? r 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # j3 |" `9 ~) w: Q8 E
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" m0 K: l h% V% z0 m* [; X 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' o1 @) Q @9 j. \4 H- f( f. V
若二人都互相检举(互相“背叛”),则二人同样判监2年。; R/ f2 ^6 R! a1 S2 H
, H' h% i* S" n3 @$ Q( F5 H* o用表格概述如下:
$ v- s. u- U c8 \! y' d
# D9 @1 k s) y2 r 甲沉默(合作) 甲认罪(背叛) " H9 w/ l3 G4 s# G" U+ a
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 5 x3 ~* D! N5 s6 v% f4 g( {. r* H5 F4 O
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 % C) M0 o4 Q% Y* N$ I
" _/ U- ~* r% r* T2 o
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 u9 a( d8 y0 E' w/ [7 k/ Q
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: . o9 W+ r( @5 h* t6 [7 x+ m0 G7 T! D# s
若对方沉默、背叛会让我获释,所以会选择背叛。 6 p& ~. G5 t0 ^ Y9 N5 R8 \4 g$ r
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 R* D7 E( z+ B, S6 j
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% ^, a( ~+ H' e! z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. } e" f& ? ~1 \ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! Y" u- r: |' I: m' J' X& q
[编辑本段]二、智猪博弈理论
- ?% w7 ?- B' f! G, v0 Q 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
) C/ _# ]$ r& Y Z( [& _5 V 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + I1 `9 U+ A! M) h, a7 c/ K% k; c. x
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( W$ ~: \2 \2 p/ K1 K# e7 Q" Q/ e: y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # x# Q4 D! K- v
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # ?# P+ D9 w2 ~, j
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 B$ k- T+ e) D* V
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 k2 g4 ?% X, f( v" i# E0 ] 7 m8 P; }9 }6 w8 Q: I
三、关于企业价格策略
" y% W1 p# v7 _2 z6 a& o
. d; \+ F) M. w" b) @- N * |: T+ r3 p! T1 z8 ]/ y' h
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" J1 b2 y {! ~( B Q 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" V6 Y% O: @9 {5 `" c4 q, G 以下三个定义:
F( w1 J, o; e7 \5 ]# P. N7 u8 _ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' a8 s: }, M" ?9 |9 N" Q J 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 U7 w4 b* L j! u. Y e6 t
所谓的双方优势策略则是指双方利益总和最大的策略。 % B& E p" S- j1 s: V( k3 u
[编辑本段]严格优势策略举例分析4 z1 b( S. D6 h6 N1 ?0 P$ b
一、经典的囚徒困境
8 E% s6 k6 q+ }8 {, l+ @$ z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ p; `1 }9 W& V' n9 z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% t T+ r* b9 ^, ^ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 ]6 | b0 D: `3 `
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* H* Y/ X9 X E& I. C7 P3 P 若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 l1 ^, O: z# e; ^
+ I B* r4 p8 B5 I2 y2 o用表格概述如下:
8 I9 i* C+ Q+ o G" `+ o
! H5 A6 S3 }. x) p4 ?5 t 甲沉默(合作) 甲认罪(背叛)
|2 F% \3 w$ a, V/ n2 C2 k乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 S9 [; O3 I0 h' i& [7 O乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ ~0 X& X0 G' T- p1 d
8 m& J# M1 D7 I7 C8 ]% i 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : m1 K% I- ]7 \" s8 d! J
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 q6 N7 B- s4 @2 l" O. J 若对方沉默、背叛会让我获释,所以会选择背叛。
1 b6 w) G6 i3 Q 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * S4 m$ g' v" k, j4 C5 K0 ]
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 v4 T* u X. [0 H$ Z- w- M 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 $ `( H$ K6 ]3 t' g( L; K% f, T
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* x) x0 S5 L( l' k5 p1 ][编辑本段]二、智猪博弈理论
0 [$ { Q, W' u 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ C' e1 v$ A7 X6 `! r4 B. D 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 X2 J3 Y7 I' j7 V( I 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , N$ U p/ q, |) k R( b
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 V. z- R w) ^5 b “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 R o' m$ ^$ q8 K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
0 f! _ N5 C% t" M { 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' n6 x6 m4 [ E' n1 \) D0 { . S! b" s+ E% |1 E$ J3 H' a) x8 g
三、关于企业价格策略! t- P4 n6 y+ z( Y6 I+ W
& F- K6 A; b& K* V" D9 C- |8 D2 T* X 7 z- Q% H5 d& }- {* K
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 R5 n+ ^; C% c# h! g+ j1 O 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);6 ~( M. V% W4 i% W( P& W. ?
以下三个定义:9 t3 }2 n& W4 d2 w; O
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 V8 L) P( G8 H
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" n0 Q" X/ s! p5 F, ^ 所谓的双方优势策略则是指双方利益总和最大的策略。 - x C# o* o% F" r9 M/ J
[编辑本段]严格优势策略举例分析/ t, R2 W S" i! Z
一、经典的囚徒困境 - w1 \, y3 p/ ~- l
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. a4 w7 {& H: A 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - d/ E4 }7 O; o( c8 d
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! K) |; P0 |5 X7 W* M' }. U8 W
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( V0 F+ { P" S+ S 若二人都互相检举(互相“背叛”),则二人同样判监2年。& M2 y/ W6 ^% f& N, s% H) }
^, v5 g) v( z1 j; a. ]用表格概述如下:
6 ~4 ~# ` |" D! J
) B" i1 [/ L9 K* h! F 甲沉默(合作) 甲认罪(背叛) / L3 \7 X% ^3 _ G0 m$ l+ g
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
9 Y3 K% {$ [- _) ^乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, M: o0 R1 L( o$ j/ [5 L' \( Y0 n- n% j
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & n) i" r! t3 s; t( c3 q1 w# h
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; _' m) L+ X1 D# U8 d8 o 若对方沉默、背叛会让我获释,所以会选择背叛。 8 |/ Z1 z; ?" j% H( {
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% _7 I: P! z/ [4 p7 P r, i 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 s* n2 d, l, [3 @ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 $ z- ^8 m" v q5 Y9 n
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。& H1 e$ m# P4 S, i, O$ |0 ] }, ]. x/ X
[编辑本段]二、智猪博弈理论 M4 g/ D. S% C. O5 |. l
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 F5 |! y$ M" w& ?" B
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % ?) @9 R( N# e' m
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. O `% V9 R% R4 ^# M- | 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ b% _) `( m. N1 p “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# h4 F/ c5 s/ h1 t8 Y0 S, f$ L1 D 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
' u x d8 u- P 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* m2 c9 X+ _+ Z3 K- U) L' t4 T 6 a' J S! d4 G2 l8 P5 k! h
三、关于企业价格策略
M; i" s _/ z" x1 ]
1 f L7 y9 P8 _5 t( d8 s% c9 V 4 _) l9 ^4 n( f; _1 ~* Q( e
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 ^/ m& ^4 F, M: X6 c 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |