关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑   W( P( A1 b$ o
3 I2 b$ v7 E+ M7 R6 ^  E
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
  y9 [. Z+ F# X* n" h, x/ g  以下三个定义:
& T7 h  ~' A/ _7 o6 B2 M  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- K  z: W) `' y* S  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 e' O8 Y# h% u: I: U
  所谓的双方优势策略则是指双方利益总和最大的策略。  ) Q' U( Y. Q1 U# o3 g+ H( n) ]+ Y
[编辑本段]严格优势策略举例分析6 z8 Z0 j/ j" g( ]2 D' S+ d
  一、经典的囚徒困境
$ e8 h; N4 g% ~( \# U  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 ^1 I$ E# Q2 i: G3 e9 p  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 b" r( [$ X/ d2 g  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% N/ j  j( m* w: d5 \  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! a! N" F0 I" p7 e  若二人都互相检举(互相“背叛”),则二人同样判监2年。0 |, b' e5 s* C$ v8 j
  9 f) S: O- K" {$ Q
用表格概述如下:& A5 e; L. H+ I8 p& ^0 J( h
# T2 O! S7 ?6 s8 g9 ]! u! |0 n
    甲沉默(合作)  甲认罪(背叛)  
1 O2 b! a3 R) J) p" M* c7 j; L乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
0 S6 R  W& ]! h( D! O乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  + o. h* J6 j0 K  _
" W  @8 N; E" b) C1 k: I- D( k+ y
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 - v* R6 D* Q+ [! e
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( }, |& i/ S% [: \* s  若对方沉默、背叛会让我获释,所以会选择背叛。
: i/ v2 Z/ k2 T  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; `$ L6 F. w$ m6 F- Q  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 j( S5 o) w" l  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 v& v. x; S5 E* V8 u& l0 @  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' x! H0 q, D% M" c[编辑本段]二、智猪博弈理论
, a. s, t  r8 |3 @% [  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 L) d3 H+ J9 b
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 h# u8 b1 P) T' O, H6 [9 i# N7 o
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 $ K  w) h$ I& F0 ]& k8 j
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
  s, y0 }7 @& ]3 [" P- y  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" U/ A  k' ?6 m5 Q$ x0 e' e) \  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( X  ^- `) y9 ~) d( h  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% v; |% h& P. G/ x5 j  @/ g  
% ?  b8 Y% @5 ^7 {) o三、关于企业价格策略3 Z/ C' A4 p  \$ V
5 Y/ O  {, v, J. y( n
  
" ?# B" |: M4 g  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; v$ g0 Z7 e* i/ z2 \0 X! V
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);  K/ r; U3 w5 c
  以下三个定义:
6 S( [, P9 R1 L. o! z0 `% \  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ E+ y! g, M4 b( x5 p* }. _  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- M& l7 M; r) J9 `9 i  所谓的双方优势策略则是指双方利益总和最大的策略。  
3 @- U# N- J; e[编辑本段]严格优势策略举例分析
/ x/ Q/ B; S& g. |6 Q- J  一、经典的囚徒困境
3 R2 g# ]2 i& S& o9 _" w  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 s& B( r* M% q- o/ D: t  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) a3 Y: `0 N; A6 L' P+ l  {  k0 I  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& Q: H$ t4 V6 z1 d+ h5 Y) a/ r  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . d* V+ y5 Q0 \
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
- @6 \0 a+ X0 T: z- a- R  
7 h0 H: G4 w: {4 F用表格概述如下:
% Q) E4 c3 W* ~9 {0 Q# R: i" z; }  D* W1 S8 u8 m1 b' A( V
    甲沉默(合作)  甲认罪(背叛)  
0 H3 }9 y% t' X' x2 ^. w; O乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  4 ~2 f! E/ e- u1 l, `" `
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 @+ G5 o5 Q, C& Z" h4 ~' S0 ]  A
% q' u$ m( h0 R8 g  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % J* R0 w7 y! g* s- N
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
. @  m# e+ @# e  若对方沉默、背叛会让我获释,所以会选择背叛。 " B5 U2 i6 Y. f
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 q! F+ @. ?0 C0 R* x  g
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% r4 ?$ ^/ v$ e( A1 ~+ U4 [+ _  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ [" ~0 Q/ t0 C  S  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 f( F" L* i* ?[编辑本段]二、智猪博弈理论
9 d. }& S( p4 o: ?) V( U1 S  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 U1 y/ [. J/ ?9 C* H& H: j
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 b: k% {+ r: T1 H  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . k1 X- `; ], I! U& q! [9 {# O
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 D4 h: \1 w: T6 j  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% Q4 h+ \- H' o1 O1 |1 x6 _  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 3 H" {, E  _0 }# o' N" r
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 R% R% w8 y7 Q  " k9 T3 }# @& \8 Z  Q' e' c
三、关于企业价格策略( h0 r4 K3 I$ |6 O4 r1 R/ w3 @+ R! W) [
8 s9 R# K- H( G+ y
  " x: s9 v& e7 r5 V5 ?: n' e
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?   O5 f' s. @% Z
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; n8 z2 q  b( \- Q
  以下三个定义:4 x4 [. i1 W" h7 z0 y. E- f
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # y4 q' w. _( `3 m# I
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( l5 \. ]% }! \! E) _" c8 X; u
  所谓的双方优势策略则是指双方利益总和最大的策略。  " D! r# G1 S5 E. p
[编辑本段]严格优势策略举例分析
5 p3 p9 ?- c. @  p( e: H6 C  一、经典的囚徒困境
$ p' M& e% i. x2 T  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! K8 h" @& U- b( b' x6 h
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 z/ c' b* i# a+ W4 |. \
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * ~2 H: O' @" y- A3 s+ L
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . y% @8 M# T1 q! S0 L5 f1 Z
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
  X! n$ a8 W# |' A  1 o% {  ~: ]/ z+ m9 G+ [
用表格概述如下:+ b: H8 U9 T* |. e0 I

- b. h6 H" e( g( H( l6 D    甲沉默(合作)  甲认罪(背叛)  ; R5 _1 p' N9 v0 F) w
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  2 c/ |7 z. I3 W
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ; ~1 A# s% G2 F

+ l( `" ~0 Z; B" a9 g; Q/ q  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % c# J5 N& e) j
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 y  |* ]& @" B1 x  若对方沉默、背叛会让我获释,所以会选择背叛。 $ ?, E: \) z5 T7 P1 Y! M1 T
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: C0 N# h" P6 C- C  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- L2 q+ r6 `  i3 r! v2 o! N6 b  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# s# E$ ^$ h" l" ]; ^  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* C+ C4 m5 A0 O8 Y
[编辑本段]二、智猪博弈理论5 Y5 l- m4 r- U3 Q. @) M
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 k1 T" g! S& r' }+ Y* l0 R  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
6 R8 g% r& L  O  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 H5 Z/ r3 C- f6 {8 ]8 t# b' ]
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% \7 d" f0 O0 ]( M6 t, i# o  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
+ b5 Z; L9 J( o% f$ `( W  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 : P. H6 a/ f5 S' o5 P# z* T1 N
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 }( m) Z+ p' I: \7 d
  : e" B* [. @1 b+ c' r
三、关于企业价格策略
5 E8 l; ]. I% x! c# p5 o; \: O# |
. Z/ C- x; E8 ~4 x7 ^9 d1 }  ' L2 N$ |/ n% ~/ U. U- k/ \0 b" u( n, J
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 n7 @( t% c$ |7 z( }  Q  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ u- ^! n2 [# l$ l# m' {- T/ y( u% A  以下三个定义:
6 c* h% u& h0 L  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 E& \3 c, r0 p  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * @# f2 [! l0 C9 j2 i
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ M  q9 M: k" J% y* _[编辑本段]严格优势策略举例分析
8 \$ ?. K* O3 p# D  一、经典的囚徒困境 0 t6 M$ c" p& o% S
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( n: m9 ]1 c+ ~, L" k! N: L  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 M6 C0 Y7 @, h4 M  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 " j2 V+ Q% h" ~- D, j
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , W+ B& y$ w* o0 v6 G. X4 j3 ~
  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 R# L! j0 h" c# v4 Z4 Z
  # b/ j+ a! B3 h! N
用表格概述如下:7 p9 N: }/ _( X2 A/ L5 K  F
/ f( e+ S' U4 p# {- \" f
    甲沉默(合作)  甲认罪(背叛)  : @2 X' M$ S% I9 _9 ~
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
" B7 E& G; b1 D) F, Y  g4 O6 U& u乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
7 }5 U' d+ X; s  o
9 Z) F) D4 a8 _& _  N  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. i9 |% c1 D& Z% X- u$ r4 b  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / g6 g$ k! S. i* C; V5 v' c2 A
  若对方沉默、背叛会让我获释,所以会选择背叛。 : h# G, F" v& k/ K
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 k5 V  {# e& B  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 [3 l2 u8 }& x4 ~. a2 `8 q* ]
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% g' j2 V- c$ |! `- t  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" j- L) ?, U/ B; o[编辑本段]二、智猪博弈理论
7 r+ z' O" I# V& M' D  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# d9 L0 S! y% g5 Z3 Y% g3 A  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / x, G/ A8 F( v  R! Z
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 B3 l( h, v. y/ g4 R
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # ~. [8 G2 k9 E4 |; o
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 d# X  `3 @; F9 B4 G* P  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. K- G$ y& ?7 D' u1 \) j  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 O& O: k$ s5 r4 C. C" V- g  
- Q2 |; q/ c$ u+ G三、关于企业价格策略
# E& p9 w5 f$ W+ J9 f% i# t- M8 w4 U
, t  T# E' d  j% C  x1 r  : e7 d5 {& Z, b* E( O) I* ?
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? - }! c1 T7 L- D
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )