关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
' K; m( K  c% e, A7 k% Y; P, }* I: I( N; P# l5 f' x( z; m; Z) {9 k! Q
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);( G: n8 M- J- J) v$ k. Y
  以下三个定义:' w4 Q% R3 h6 W8 J8 K' B0 g
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* t' l# r7 r0 y# r0 o7 P$ M  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) |/ t' r( R( ^! @' s9 j  所谓的双方优势策略则是指双方利益总和最大的策略。  / e. z5 r9 K( \$ r' o7 Y
[编辑本段]严格优势策略举例分析
# E  h5 a" @* }' D6 k: l! a  c  一、经典的囚徒困境
/ J$ ?  \0 o* z5 _1 P4 J  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
* p' ?4 @5 o4 s* e, l. h" M  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 f0 R, e5 R2 [9 N" T8 q  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. K2 C* M! [# S2 |7 l  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! X" |, s. Z: e: |/ G  e# v- k
  若二人都互相检举(互相“背叛”),则二人同样判监2年。+ H, u% u8 N' F$ |* }5 H+ O
  
$ W0 h: z) i0 V; S; j4 t& ]用表格概述如下:
* ^. r! S6 B' t5 K0 P( h! w" J; G3 i3 g- U# ]& G+ C: F! H
    甲沉默(合作)  甲认罪(背叛)  4 s2 w- J* D7 Q2 h6 d3 E  ?; U( S
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
5 N4 U3 |/ n% D/ G" d2 o5 ]! ?乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
. t0 ]5 }4 O) N" S9 |% J# S/ I& s3 t% Q1 P. ?. A* x2 o
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 t! O3 ?" }. A* w
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( W* c8 ^" d- T0 C
  若对方沉默、背叛会让我获释,所以会选择背叛。
. R+ j" B  R/ p+ h$ i6 Z  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 x- s8 y4 \7 @
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 / O$ F+ U5 _7 p- g; P) c9 b
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( |9 y( U" _1 p7 u: T* E* y' K4 `# P  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
/ ^  I2 m4 I5 G) ?$ {[编辑本段]二、智猪博弈理论
6 I$ _8 I9 P/ X# j- S4 u  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: }, h* w9 [! ^2 r0 u% Q& K! u% ^  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
6 a* e$ _9 T0 n( R& t1 s4 t6 l  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ X; d/ s2 `2 t  N  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! @6 R1 N5 X  W( m6 G: D5 b
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - ~7 Y0 d  q0 v& L  h
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 3 m4 n8 a$ g# f; S) E0 s
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, t; K' R/ K* F: G  
6 `8 z: T5 C7 M" E/ `三、关于企业价格策略
9 f& o9 t; p% U. X# ^2 v( ^- V8 {$ M" D
  0 {6 Z: t1 O* L/ M8 v  V2 y6 k2 Z
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" e+ S/ |* A. s  C$ I/ z  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 s8 _: O. j( n3 _8 ^+ g2 p1 _  以下三个定义:4 }, T& p* D( e: t
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 a& y7 I: q8 ?% Y/ [/ l2 ~  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . K; q: [: Z; v* r2 W1 Y$ o' J& i
  所谓的双方优势策略则是指双方利益总和最大的策略。  ' D# P6 N) P% u0 ^$ d
[编辑本段]严格优势策略举例分析
6 b- K1 g4 L# b6 l+ R0 h  一、经典的囚徒困境
: `# f- e$ L- s  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. i* u/ p) Y7 d. O  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % ~$ J, z. J; j
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - \1 v/ h& B8 k$ _4 R$ x; d
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( [& ?. `+ n% l1 I4 B  若二人都互相检举(互相“背叛”),则二人同样判监2年。
; S5 |) F- p2 `9 J  2 A& X8 f  v  Z* s& c1 l* ]
用表格概述如下:: @4 D7 Y& q# u, H
9 u: b  }3 `- w- d; ^
    甲沉默(合作)  甲认罪(背叛)  6 ?5 R* S8 u3 ^$ f+ L
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ( ~6 v; e% B5 ?/ t& d4 v
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
' R, y- o/ _3 x, d( D7 A* s6 ~* I0 f& g/ ^, m6 |9 i4 h: B( u
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ \, t' G1 q5 }" W  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + G: d  c& h) b( }% h9 H9 h
  若对方沉默、背叛会让我获释,所以会选择背叛。
& i) N4 B# o7 q8 K% \# G9 |" j2 w# N  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 [8 H; G8 Z/ L3 `, l  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % d. f( Y$ o2 S* v
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. J$ L& \. h: a% b7 N  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ S8 W& O. w; N  O8 z
[编辑本段]二、智猪博弈理论* ^- b- a" a: C7 x- p+ S  q: U0 ^4 C
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( b# k8 g/ b1 @
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 N/ y9 L. n& e, H3 W  {+ K
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 N8 O: @7 b7 G) n
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 |" I1 @: a6 n) G# Q9 d
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。   {9 r: k* }* T/ v. [/ N
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . M' O+ H* l3 r4 E4 L
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- g6 T( L8 B' D0 D
  9 m4 U3 C6 J0 D0 i1 m) W2 F/ C4 _
三、关于企业价格策略( U$ L/ d, G% t/ u6 y% @
/ ?9 l( k  _2 ]; T! Q; Z
  - ?9 K0 Y0 P9 W
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + ]( B6 ~, _( ?4 B5 ]/ ^
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);# U4 q( i/ M9 \8 N' j* I) {
  以下三个定义:
! [' I: t& P7 i  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' H2 F' o4 _: z" F1 U; L0 j+ s
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # Z9 b2 L0 @& p4 I9 Q5 r/ ~
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ p5 m6 Y" e, S2 p% ?[编辑本段]严格优势策略举例分析+ h. L9 [3 F1 {' z8 m4 h. {
  一、经典的囚徒困境
4 ^5 r. K& K+ D  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, x, m  U# c  u1 R  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : C% F, B0 s5 [
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ C  F- b& S2 w6 |2 h
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
7 E% a! N2 X7 _  若二人都互相检举(互相“背叛”),则二人同样判监2年。* p& Z- `+ u$ F# h
  
) q+ I' G9 g$ X* x用表格概述如下:7 h/ l. Z5 X" V( H6 u

7 |; A7 K& _! e  Q    甲沉默(合作)  甲认罪(背叛)  
$ q5 M  T3 t4 ?  R3 D' W) x乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * K- c' r+ \% E+ Z
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年    V3 ?) y5 R) w3 [  f' l' P. ~* J6 T

( e( E; W0 P( H, n. s9 X! @  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' e: V% l: ^# N" n
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" D$ `( Q9 P( W9 \9 N* h* o( u  若对方沉默、背叛会让我获释,所以会选择背叛。
) A0 b/ s! Z, }/ h( }1 N' h  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ Y% _" M3 w6 @1 V7 }1 a  _  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 k/ ?/ `6 n: F7 s% Y& u  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 v! M2 V4 f2 T$ a) g  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ T7 H& p4 m+ Z) a7 P. u3 e0 u1 W[编辑本段]二、智猪博弈理论' `. N3 a2 Q- X) N5 K* i2 r
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * I2 W7 k5 f0 K; r. h0 i0 r
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # d- l8 n) }1 O5 j: c# m
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 r5 Y3 a( \! e, `, l! o) v: `: ]  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 E! h% y& K3 S* o. M' x, Y
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 n  H. H9 r& X1 l7 T2 S
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + g5 |/ n+ w6 F
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( |4 R, }$ Y' k4 e
  / m8 B) g+ f9 e/ f+ _  Q. O; n1 S
三、关于企业价格策略
* k$ T) @$ ]/ P
0 |6 ~$ L" f, [  
9 F+ f. c$ s: ~" A+ ^  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& x. S5 q' H$ q! [: ]2 q, ~  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
8 y5 z8 l; w, H. q5 X  以下三个定义:3 e& C$ O; C6 r8 D6 A
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- y: ^9 D  n0 z2 P  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 x5 p8 \2 j7 o: g+ c& ]  所谓的双方优势策略则是指双方利益总和最大的策略。  + y6 M( n1 U3 o, N5 b, v
[编辑本段]严格优势策略举例分析
2 I$ D& u- }$ L3 p! I$ }/ A  一、经典的囚徒困境 ( M2 e8 U1 [2 Z8 |
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 p. B4 y9 [# f  R( @8 i- P: I9 X
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: * p  {' _" u3 ~7 N9 H
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& t( d9 S; R' I( P! m: {  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- {/ d2 s2 I) A6 P6 U  若二人都互相检举(互相“背叛”),则二人同样判监2年。; R! l. V5 k* a4 j
  * q) q* P3 T$ _$ l) q
用表格概述如下:
& |- e! c- a4 K  H+ Q5 H
" M0 |# P9 L# x    甲沉默(合作)  甲认罪(背叛)  
0 c$ |* I1 J) E" h2 B乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
) A) T1 }# Y8 W乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  / X; x( ]& b' H* m

* T. B5 s5 o( k* R" |" ?: r  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 k# J' G+ V0 J' K" t) M1 t
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' U  U( [- u% ^# d7 ]6 K3 u" H  若对方沉默、背叛会让我获释,所以会选择背叛。 1 c5 B2 r% Z6 O
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " p7 D3 n3 z) ]! `6 A' |7 D
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, I0 R- x; i1 ^/ d0 N  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 6 F& X. v5 K3 B7 u
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 ?9 s0 n$ \4 P! Y& F; v' P& G8 V
[编辑本段]二、智猪博弈理论
. d8 e2 R$ }  ^0 p+ q5 F  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 a3 o8 `" c- X- T6 T" _  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 C4 Y2 @4 C6 ^- w, a% {# T! |
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 u* H! B( Z% r* n6 [  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 L6 c. p% ~- v7 j! o6 o- M% Y  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: v7 x" u8 b! o1 e( l  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! e7 s5 ]2 E3 i+ n6 M4 c  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* B) ^! b$ o! k* F  3 }# a- d" ]/ J$ ]/ B( b' g6 H) K
三、关于企业价格策略* U4 n- l8 m4 q$ U# a2 V2 @
' {6 ]! L( p3 b* b
  0 u% g; |& i- W6 S/ F
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % g8 g& ~, a* z. R9 K& [
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )