关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 6 O' J8 G. D$ i

# u0 L  K; @9 r0 O严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
. }& U2 a6 }3 d! O. ]  以下三个定义:
, M& w8 b$ s, @. K5 @  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   g* W! r4 X" q; m
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 d* N# u" g1 @  所谓的双方优势策略则是指双方利益总和最大的策略。  
5 @4 x) v; p8 e+ H[编辑本段]严格优势策略举例分析
9 f/ X6 t) j% `/ Y1 ^  一、经典的囚徒困境
4 E0 w% @3 L1 E# Y. x6 x: X  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 F! T/ n/ f1 G# T, Z+ F) g0 z
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 4 k+ [6 `' F1 P, n$ o
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 x7 [& S* H1 f5 q1 K6 D$ f  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - ?; R5 E$ p  v/ x. R9 w
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
; n, X% D5 G& s3 e5 x  * o: f' z3 o  r( v' [
用表格概述如下:% U. `- ^( J  J' g' f: {: e

3 W$ s- h8 ^2 r( a; e. M    甲沉默(合作)  甲认罪(背叛)  , h1 \3 E3 T9 p8 O+ P* p: C5 b, i
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
2 R0 ?0 |) {6 n乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
9 r0 g6 N" h4 w/ a: {- Q! ]& N  U2 b' e5 h$ E4 H$ i' d, q
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 t9 D2 O9 `) }; a! |  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( }. f" m* E. u4 `7 M: _4 @  若对方沉默、背叛会让我获释,所以会选择背叛。
& Y  A! `- Z& j, J  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 p5 B1 W* O, x% b! f- l! a  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( V$ q. B! O0 o& u6 z9 r% }  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   ?! j$ T- J. D0 R% d% y
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* i$ W' i3 W& C) [6 d
[编辑本段]二、智猪博弈理论
# A& T6 T+ R6 ?* [4 ]% s% E9 v  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 |8 P! U  J- l! t. s2 l$ Z1 }  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, U8 U  {  }! C9 B7 Y- C, R4 j  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
  h  u4 x$ b3 X, Q  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / Q6 H- ]" f: o
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。   v- t& ?2 P  ~/ Q1 G
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
0 l" G" c, Q9 g  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ U% V+ @2 K  F; Z" @% C3 q  3 e# N: J) P& _: o8 y, B
三、关于企业价格策略4 a. e: h5 J1 h9 i$ a; e& H" ]
2 \: o& [8 J3 l7 [0 @* y0 i( Z
  - \& z0 s7 M  F2 U/ g
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / T0 {' x7 A/ J# u& K
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% L( z, f5 o! J6 m$ m  以下三个定义:
5 j! E1 }3 j+ p! x' A, |$ ?  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' X8 u: ]/ U9 }- M& d
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( V! J% E% W; p3 K9 D
  所谓的双方优势策略则是指双方利益总和最大的策略。  
$ u5 ~2 B% X* T[编辑本段]严格优势策略举例分析' ?8 h* k# Y$ `+ D( i; J  D
  一、经典的囚徒困境 ; L/ F! g4 E5 R/ E
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 C7 f7 R) m  c3 _+ I% [' R2 w
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + m/ O- e0 X) W( d* j9 K$ g
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 l; A; ]% P' W
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ {7 `/ H, g) Y1 t# y/ y  若二人都互相检举(互相“背叛”),则二人同样判监2年。
3 @% \: P' S" Z) X  + ~9 v, S$ |/ j% W$ O
用表格概述如下:
# u& z' i( q5 h* ]0 L
. \0 @% n! K# s6 C' ~% t$ {    甲沉默(合作)  甲认罪(背叛)  
* @) g5 e' @2 O- A/ r1 B$ g8 q乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
8 Q+ V4 Y  C, _0 e' {乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 }, r% r+ t% I" Q# N  w$ i; t( W( a' l  B, j- Z, G
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 _  F( Q4 F8 |9 a8 k: M( A  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 N+ l* r9 p" `2 @$ z% j% U, q4 _7 n& l
  若对方沉默、背叛会让我获释,所以会选择背叛。 2 t3 Y7 V# r* ~( P& a
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * J6 G3 }% r( G/ [8 e
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
  ^6 v; P# W# r+ L  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 C% R$ z9 v6 b" o  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! B; X( v* Y2 A( v[编辑本段]二、智猪博弈理论
* z7 P6 |2 a* {2 l* w; a  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ X& \& b+ V( {) _2 i/ \6 Y  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 A8 w9 G. h7 G) C5 p: A& l  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% {/ x3 y, Q4 @) z7 H3 a  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ) ^' Y! s1 M$ t% q0 h
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * ?0 z  g4 ]: q; {% ?
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 O& T/ F% b: L; h& Q  V  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, h7 w1 f* f: K8 }
  
3 X! O) R# I# ^$ ^三、关于企业价格策略
2 g9 k: a) N- c$ x: t; p# N( Z! R+ b( \5 q  z. B" H
  
: g7 M# j: ?5 ]) h  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / z3 j- w! v9 m" i# G
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) w% Q* W6 N3 J% T3 p1 F/ N
  以下三个定义:
3 w; K3 J" P: K9 F& S  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " o# q% g, z: ^/ P7 N
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 y8 W  k- R( F1 o1 A5 _2 }" {
  所谓的双方优势策略则是指双方利益总和最大的策略。  9 J9 x6 K) n7 I! }* n/ m4 W
[编辑本段]严格优势策略举例分析# _0 G$ M3 V  g8 E) T
  一、经典的囚徒困境
: U) z4 Q: i* ?7 f  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 m( y0 C( ]- D  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 p( O1 j' [3 N3 z
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( `0 S  N( F- {' ?
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: k8 B, C. |9 l: v# T" j* `2 f/ _  若二人都互相检举(互相“背叛”),则二人同样判监2年。+ J+ T* B2 S. w: E. i+ I
  
0 w" @; P! M2 H! T9 N5 f4 u4 O用表格概述如下:
7 R- U  V+ z2 X: ~
$ Q1 A& ]1 Y  B7 C, |& X: ?. l    甲沉默(合作)  甲认罪(背叛)  5 E$ C$ ^. ^' Z1 K* F1 [3 u2 [9 i
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  + e& `( z  t0 ^# _, u* Q  }
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
  U9 v! h0 H' v( ^. p) H5 e( X" ^7 x* ^) t# A# W
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( v6 f' p& j9 ]% b% `: s6 G4 \  @  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 c8 ~) S. d; g6 [' l6 S
  若对方沉默、背叛会让我获释,所以会选择背叛。   N& V6 ]% U6 `! u6 `4 N
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 r2 ]. b1 \. Z! C% a  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 q; I/ J7 A; p, f  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 M# m. Y6 K9 |& \8 X
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 H. X8 n. v  P9 ]
[编辑本段]二、智猪博弈理论+ P) u, _. o0 T3 H
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 h5 z/ a. t9 M; W
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。   c4 [" o$ j6 [  a0 l+ M
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ) J8 |( m4 }/ }
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & \+ d5 ~: ]& f: Q1 B
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( B# W8 T1 c0 }2 \" P3 `- C2 c# T
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- Z4 ^3 S# a  t. I  n  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
- A/ l# q) O, l7 ~* Q2 E  1 m6 V1 G6 N5 v$ |8 k0 Q% Q9 W
三、关于企业价格策略
1 r. l8 {. T7 d( N' w
& R" I4 C- O& G' y  
' c5 }; |! u* \# k7 ]  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 G" I2 z3 [: O  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 s% e/ [3 @3 S9 p* H4 X3 h! z1 O: l
  以下三个定义:+ d) c9 S- g  ^: Z! l6 S, x! N" B, ^
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& P' `: U3 b, y$ l  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% e' [& d  g# ]9 ]: s  所谓的双方优势策略则是指双方利益总和最大的策略。  
" e0 }- {# v  q+ V2 I. H[编辑本段]严格优势策略举例分析, }. z: a: Q" ^9 L/ k
  一、经典的囚徒困境 - @9 [( z8 ~& P8 z- G; m
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # Y. b2 }: q: M1 W
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 H4 f- J* M# A6 y! A  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 i: [9 x: g" |7 L$ h: K! ?: H
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 z$ Z( t5 `$ u1 W7 f
  若二人都互相检举(互相“背叛”),则二人同样判监2年。2 b/ Y9 G1 ]8 w3 O. Q1 X
  . h: q) |; y0 j8 f) K5 U8 Y0 v
用表格概述如下:" Y9 e$ i2 k& s: t4 V. o! _5 L* v

1 e. U, d- P, h  {" {! h    甲沉默(合作)  甲认罪(背叛)  9 g) f* y. q% J
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  7 h$ y/ p  H3 ?; c$ r
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 ^. @( c8 J7 x1 u. k9 V
1 a" ?$ @: N4 ?# P8 [  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, `8 S6 X9 }  q/ v" H7 N7 G  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ X% {, o" M$ P  |- z( h9 S: c  若对方沉默、背叛会让我获释,所以会选择背叛。 9 Z! c. T1 [3 O9 X) w
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' B# f  F: s4 W3 b$ Z
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
) y7 k, }/ C: b/ L" y) U& H  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 f6 H! Q( H' i) b( q6 W  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 M/ X$ V2 Z- k1 {3 d" {[编辑本段]二、智猪博弈理论
- T9 X3 x+ ~( R8 x4 l" S  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ' Y# \# N+ G- F% Y3 }4 v/ f
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 n& C; N' i& {9 \( x
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; K- a) U7 C2 i7 a4 j* H
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , H7 U7 L+ f" B! h; S
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& R( H2 N; N7 I0 Q4 N6 Q0 F) D" Q  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& \9 p( e% T7 e$ N) V6 D  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ Q0 a1 x% j4 l& H: j/ j3 z; m0 O  
2 J3 d4 X8 @& t3 \4 M; O/ P0 C/ @三、关于企业价格策略
1 ^! i/ N; Z$ Q/ w1 }; _: A1 {  r1 U1 y3 H; i
  
; I- z5 d0 \9 F9 K0 p  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / e  F$ l: X0 R. U
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )