关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 + Z% r7 K9 z5 C3 f' _& J" G' a/ _
$ P) J  i5 M0 J1 Q
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 w5 x. t. E( X; \7 c0 Z/ F" }
  以下三个定义:
4 U4 ]0 G# e$ j  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : W$ \" _3 m8 G+ ~
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# H0 O$ N+ o' @4 U0 m  所谓的双方优势策略则是指双方利益总和最大的策略。  3 x( U! C9 z' \$ E
[编辑本段]严格优势策略举例分析2 ]# q( d) n$ _) R3 f& `
  一、经典的囚徒困境
7 Y3 B, K& \  a& l9 J% g1 `  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ Z1 N9 M" l. Y6 u$ O: k  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: $ k* W  X. H* L" Q7 Y5 G: M( f
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - i$ n$ F1 j* K- V0 N% x; z; T+ D8 A
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: }* e7 n4 j* d3 k$ w' ^  若二人都互相检举(互相“背叛”),则二人同样判监2年。
% E. ^/ t5 o5 C# Y4 p0 }  & A; V; W- \) a
用表格概述如下:
0 m- s$ M- C4 r+ E; f( ~! h8 l% A8 C  O/ w4 f$ ?# O
    甲沉默(合作)  甲认罪(背叛)  8 ^# Z: f( }  u* o" a
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
  h; h! M; |  [6 x8 b乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ c1 W) ^3 V* l) g  c9 [
/ m4 }8 `3 H+ r4 H3 n5 x
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ S2 `. m/ \& s6 [% Z9 N5 l  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
  Z7 D$ ?3 }5 q" [0 y  若对方沉默、背叛会让我获释,所以会选择背叛。
& |  Y6 f. k$ n$ W+ Z; x5 {  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) r! P4 {; c1 U% J; ^6 l( `+ `
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, S5 a9 {3 G% S. d3 x3 \  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ I" R0 F; e% I; R  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。; e+ j- Z5 O4 \8 I8 [
[编辑本段]二、智猪博弈理论: u/ d1 a2 N  f* N
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ M( B- ?4 Q3 T& B* c1 Y
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 b9 X) u  n1 d; E4 J
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 X7 Y1 G0 c& x
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / n$ g) s# L, Q$ F, q& z
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% Z1 o% y0 G/ G" _  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! i; ]1 [' [$ S  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; v, `' X( S6 e4 ]9 m. b3 a
  
* W& {2 ]' T; S5 a, m. t三、关于企业价格策略, n  D2 S# `2 v8 L) c
) \( j$ G6 G# h6 m+ d; Y+ W
  
9 t7 K% t* v0 w4 P' y+ A4 E  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 y0 }$ u. i7 M  @( ]6 j; p
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 O( e$ _: ~% ]7 X8 y# ?4 z% J
  以下三个定义:
) d! ?9 |2 T" }% ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' Y2 q0 C  s4 B  X( \; G" t  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 i: j6 i  T+ u$ f, Z9 [
  所谓的双方优势策略则是指双方利益总和最大的策略。  ! M& l) i2 \6 ^
[编辑本段]严格优势策略举例分析. o, V" B9 U# Q3 m
  一、经典的囚徒困境
2 [8 g' T/ \% J% {- f  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) u0 [; u- ~6 F6 W4 ~3 l+ N! ~, s  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
! M0 y8 \$ z! r( _# [3 g  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! U& b8 ?1 S5 o& Z" N. o- {8 F  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! x. r! U% U8 w' B/ G- o) d* V  若二人都互相检举(互相“背叛”),则二人同样判监2年。  ?; I4 ~' M9 Z0 Z3 S! V
  - `. L9 D& i0 r: D- H# z7 e
用表格概述如下:8 M+ i; V0 ?1 N

& O0 X% Z6 C( x4 q; j: Y    甲沉默(合作)  甲认罪(背叛)  ) q+ l" S9 E- x3 _' |
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  / r4 n* _% G; c& Y" t
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
  k' i( V) z  ^7 u& n  x  @
1 @, @' E/ |3 G! O. h  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 q9 E( w8 k& v0 c4 z7 D; S  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( U  R$ c% J% y; V  若对方沉默、背叛会让我获释,所以会选择背叛。
/ l- x2 E: M6 R  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * ~( Z  p2 v6 \' {/ P
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # G+ c/ o* p9 |6 r3 X" [% C
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: D& _3 b, d- A' g  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# x5 Z* U: u" Q7 H+ V! |8 M[编辑本段]二、智猪博弈理论
( t4 a4 R8 C  m+ b. ~0 L) {  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / D2 _2 @3 K8 r0 k' b- z
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& k4 V  r' @8 ?( j' o9 M% }  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, D3 M$ B8 i3 ?( r2 s$ G) l  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ) `3 e1 U* H$ |8 Q; s
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 ~' \8 V* U# t. x, W3 [
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; B$ J  J6 Q( _, Q  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。  E" P3 N8 S  ^2 `3 }
  . f- P- Y* i5 _  a
三、关于企业价格策略
0 N; L- P: O/ D  ?4 l1 S
6 v0 Z$ D$ ?4 Q: |8 c( W' J  9 e4 C* q+ ?6 k( b: U( p6 r
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 5 o# }9 J$ H9 ?. k7 e  K
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 Q$ X( H: E% d9 d: k- }3 R  以下三个定义:$ `1 r9 ^* j9 T7 E! y
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- ]8 |8 w! i% S8 ^7 O2 Y( U  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 " ~, c" h! \* z0 i* r
  所谓的双方优势策略则是指双方利益总和最大的策略。  
) h' P/ b$ J3 Z4 C0 v$ D, J[编辑本段]严格优势策略举例分析
* u6 ^6 D$ j$ W( o9 T* p: e: H  一、经典的囚徒困境 % A% A& n! `( ^+ S( y7 R1 O
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# F" I1 O* e* A7 Z* ]4 N- l/ o  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 l" w6 r7 g/ F2 n! e! d! y
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 F; |' [6 R4 O; N
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ Z1 N6 T, W# }  H1 Y: y/ m
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
, `3 {0 x. m# r$ q6 _  
7 E* \; |! ?  Q9 g8 h& t: {用表格概述如下:) r- U" M+ b- _

: G/ q8 m2 D9 h# [4 f$ j0 ~    甲沉默(合作)  甲认罪(背叛)  
& S+ u' a( S; Z0 z乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
& a* a# O, w1 e8 `乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  8 {$ }- {/ O1 T, J
- Y) R3 p! Z, F$ q
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: u, y- f, c; K0 r  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* G9 \4 P% i  ?7 a  若对方沉默、背叛会让我获释,所以会选择背叛。
2 E) k$ n4 G6 a; v( m& G. C: a  T  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 ]/ x$ ^( Q: c# n& U3 a! K  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. K7 r. H: \# V" m- L9 G9 ^4 Z3 |  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- f- h1 U# `/ X0 |  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 _' _' ^3 }4 Q4 a[编辑本段]二、智猪博弈理论
/ f* v1 \2 l9 r# @+ f  \: E( l  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 k1 M! C7 K( K& _% ^  w' w  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / N3 a9 c1 ~6 F8 e1 J9 F% Y, o
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ ^* O3 |( {( S8 _  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; t6 C8 z. Y( F: F  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, {6 ]% S7 V6 t& a, J1 p) k5 ?0 W  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 C6 r7 u6 c5 Y8 l7 j4 C6 d% y
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。* T2 i% l% v+ e) N
  ' }' @& ^  {2 A$ _; o& A
三、关于企业价格策略
* G6 c6 ]$ E# O  {' S. r# u7 B4 W) N% h/ A5 }
  ' v( N7 O- S* ]% u4 S* J) d5 X
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 C" m. I0 D# H8 I# y6 q3 u, Y  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ x' r6 E( {; g, [8 h  以下三个定义:: C# [3 Z6 [0 p+ |: b, m3 K0 Q
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ m9 k& J8 I/ |, ^" w/ I# b4 F  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" I2 W  n  B6 E' f8 s4 m  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 G; T; b5 K3 k2 t& e) r" O/ n[编辑本段]严格优势策略举例分析
: N! |" B3 d8 q8 w0 h  一、经典的囚徒困境 / y  i4 _- u, a# q/ E
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ) \" F9 n) O4 o+ b) T$ w) ?
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& e+ G, i3 ?! g  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 L5 b2 g+ e+ h1 v" H  Z$ \9 b  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
0 E% c0 |* g2 i! c7 O+ t; R& H4 ]  若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ M/ E+ k2 i) W7 B  
* V) ?. a3 p- S6 f用表格概述如下:  w% g( Y3 H$ q, l  N9 C* r
1 _2 O0 v0 [& X* P
    甲沉默(合作)  甲认罪(背叛)  
7 ~) A1 u& c9 J" |- N- r, \# v乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  0 W# ]8 C  u: y* W- I
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
% x. A5 B! A  z4 v8 _, n/ g6 `6 |# m9 K# U  ^# Y' }, P
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" s# f% q1 K! J  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ \9 R0 `" R- W, k; i! v- ]2 t
  若对方沉默、背叛会让我获释,所以会选择背叛。 7 Q! l5 h9 v( R: @/ f6 J$ ?6 X
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ o  i  |2 y2 K  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 C. ~8 z$ ]+ j  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 , G& n) Q- a# M
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ z. d% }, ^9 s  }- @$ a[编辑本段]二、智猪博弈理论
0 ?) B0 p# w% n8 Z( A  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 0 t0 t& q% l! a) |4 w. Y; x
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 k& Q/ }$ F0 d  `
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 5 a3 t" {6 l0 S5 i
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 k: ]4 @' Q. ~/ H" q
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 I4 s0 z4 {+ N
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" B4 a/ n3 A4 ?3 X- J1 x3 }0 s- P  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. b* {5 k( I  s. O) y9 x
  
' [$ U! |* Q- x; v$ h三、关于企业价格策略0 C" r! b6 E& H4 m7 b9 C! h/ o
' `6 A8 C! u( \
  5 ?1 {5 l7 t$ f  K5 B7 \$ H
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? & |2 D! J5 y4 y# q
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )