关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
- e- n* M" K; j3 c+ U: n- ?; R; i+ [: n, P, i* a, u' Z
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& U" w1 z& v+ u! u- A  以下三个定义:* P; X! e4 k: u0 u' Y2 R, C
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" `# z' ]6 K* m7 c( i" Y# j! a  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , S" W2 h5 T* G/ {7 O5 {6 l
  所谓的双方优势策略则是指双方利益总和最大的策略。  
# t+ F4 i/ U) C, N[编辑本段]严格优势策略举例分析
: h9 `/ C' Y# H& C$ W0 v6 E' i  一、经典的囚徒困境
- b. K6 }7 _% o: w* G  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 G  `9 t* _2 o. I8 Q/ M3 A  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 g* d8 e5 P5 g
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' y- P8 L& q9 m& l: D2 ~  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & u. y& t# b# _! d
  若二人都互相检举(互相“背叛”),则二人同样判监2年。' R$ M4 J0 j$ t2 {. o5 v; Z
  
  g+ u9 W- C3 `' e用表格概述如下:7 O1 ]- d5 n0 A  h, l: }

$ m$ i7 f' X9 a    甲沉默(合作)  甲认罪(背叛)  
; w+ B6 x1 ]; |$ ~3 u6 I7 y& a4 d( v乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  & O6 p) H/ A( D/ b
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
: }4 U5 S; t: Y$ R) y* z
9 w% y# o: B: E! `: W& _  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; y4 c* L! A7 A5 N
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ! d1 B% q7 W; I6 \% l
  若对方沉默、背叛会让我获释,所以会选择背叛。 # m) N1 R$ h- D) U
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) F3 O8 p- ^2 ]9 C" P) e
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; G& p! g0 `' i7 H' l' u1 @+ @  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 l3 M+ e. A4 C' Q$ F* A
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- @6 {* a2 O) |4 w( B- Q[编辑本段]二、智猪博弈理论
+ v, [: U# y, m5 c  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( D/ N: {4 o! W) T8 s  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: e2 B+ T+ j1 F# D' w/ E  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " W' D5 @# C5 X6 o* Q4 W
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 E9 p7 b3 Q9 ]: a) B* ~  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 T! r. f# p: J2 {) W  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( v% _( k5 C/ R5 p" s  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& y$ ]0 x. v" L1 Q$ E3 [8 X  " ^2 {0 l9 y# l( T
三、关于企业价格策略
: F) Y8 {, [5 w: c' \/ E
+ ]* [, V. Q$ C$ X  
  W9 S9 d( I# x% f5 Y  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& `$ K2 G& O* d6 m& h' H  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 Y9 g' t2 m; ~( a# O  以下三个定义:# o7 h% |( t, X
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 j. J  x- L7 K
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 P  q! Q) X0 S/ m  U4 f  所谓的双方优势策略则是指双方利益总和最大的策略。  % }3 k/ g% z3 }7 e. z
[编辑本段]严格优势策略举例分析
: A/ l& r4 b$ k& l$ G  一、经典的囚徒困境 / D. r1 }" W, ]$ c0 D! Z+ b
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / M0 [2 T7 Q0 A. r
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' X( O2 M( g9 B2 X1 A7 T9 f3 y$ N  o
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 n7 E' d( Y* o5 U; |) r4 ~
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% B& S+ A: D/ w( D5 j" r  _. \. C1 U  若二人都互相检举(互相“背叛”),则二人同样判监2年。
$ a! Z: [! H: O  
& g! {# h7 c4 H" [0 C用表格概述如下:* a, @) J0 f7 t. o$ b
9 ~' B$ C; H! i! ^, i' G
    甲沉默(合作)  甲认罪(背叛)  ' ]$ \/ E$ N0 {( D. V0 O8 m
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  1 [, m1 ?# }. @! U
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ; E5 A/ B+ X  v; p8 W: |
  L3 G4 L5 q, R6 f8 M: F- h6 e
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: ~- z2 h* a( g8 C, H  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' ~: v- h$ ]/ i* R8 u& d  若对方沉默、背叛会让我获释,所以会选择背叛。 0 d3 K0 r4 s$ u0 V; B! w" R
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( a9 d' b6 I1 C5 G
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * _0 e( \! m/ W, d4 ]4 m& [. P
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* h" ~0 [6 N2 j- ]( D! V+ f  g4 z  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" V2 P+ {, y4 p/ E3 K
[编辑本段]二、智猪博弈理论, S$ B+ e# @0 W& f& n! x6 z* e( S
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( M4 |6 f5 L" V! q& q% p& W) M
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 \) H  n, \+ B% f( s- S
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & M# r6 \& s# e! ~, o3 t
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 S% e4 X4 V6 D4 i( B9 ]' N9 ^  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* W$ L5 W7 B. R8 l& s  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ w; |& y* R2 ?2 p& H1 T! {  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 \" W. I: K5 \3 T  9 b& |" `$ t+ W* Q9 w  }9 A
三、关于企业价格策略
$ X2 L& D5 j9 b" p5 v# ~- A  I
  y, `* `% f; \/ w9 p  
: X& j' Q  ?0 I( A& L  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. B9 k$ O7 w1 b, u* E1 k  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* S% o4 ?) x/ r# I: }- \; O
  以下三个定义:6 ~2 x3 ^; K; r/ m- B' u
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( A7 Y. O/ r- A8 T8 m2 T
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! g8 u2 i1 z5 x4 o, H: T1 u# U  所谓的双方优势策略则是指双方利益总和最大的策略。  
3 n/ Q8 S; |! ^1 I6 s& X" y2 X[编辑本段]严格优势策略举例分析1 s6 t& h0 P6 Q; }3 y
  一、经典的囚徒困境
# }' a9 ?  y! H! }- F" n$ f  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " ?3 l% {, p$ k/ l
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% h# Z. s" ^; \3 Z/ b# }  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。   z* \9 _( z3 M8 O, q9 m: F, B$ {
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# {7 @* O5 }4 V  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 ]$ ^+ r8 G2 ]  6 i" W! `2 H6 c" _4 ?/ r$ b
用表格概述如下:
4 D4 b% Q; S, z6 l# p' X& A7 h+ i: G& f3 t) d2 X. {
    甲沉默(合作)  甲认罪(背叛)  6 K* a, K' P! `8 r  d
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
+ m* c. f1 a- I2 ]6 I乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
- m0 t( \; R/ i& E* [+ a" Q# ^$ H/ z& o6 b( W+ Z) t* D
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 S, X8 n! K8 C1 f* D$ n: ?, K  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 t- T" a+ {! M0 s
  若对方沉默、背叛会让我获释,所以会选择背叛。   m9 p1 ]% }( }! \4 O" h1 u  O% O4 \
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * |4 f. o7 B  U; }* ^
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ y1 D  Y: H$ J' `  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! D# ?  S- U1 a# W7 A  G' {
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% P: m, k3 P- Z2 E: s; y+ Q% h[编辑本段]二、智猪博弈理论( `3 Z& |- P" f
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- D! q1 r1 b; m8 s, j! F. f  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) Y+ o% X6 m- ]; M
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 x8 T- I/ z/ `; G( H$ l
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( i$ X' q/ x5 |2 D# _: Z7 [  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' t4 x( p3 s5 j: T9 U: g
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. o% ^; b, q" Y- d1 i  v  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 {9 V% c5 h  B4 p; t% B$ e% J
  
  n- ^0 y" u$ {. I# B  n三、关于企业价格策略
! E! l3 m' H5 S) ]" w% A
$ g9 e6 N, C9 _+ W0 X  
2 M( \+ u0 _9 R8 Z" ]  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 K( H  ~) v  C. I# M  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: n0 }; s( A. h# i) ~( ^; E/ y: W  以下三个定义:" Y: J* }' g# L0 ?. U
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 q" F" j/ J  J" s( o' k/ ~
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( G2 e' H$ h, e6 L8 C! X8 M: c  所谓的双方优势策略则是指双方利益总和最大的策略。  
- I% Q- b3 u- L! C6 V" F[编辑本段]严格优势策略举例分析  c! |# Y- v; @/ C
  一、经典的囚徒困境 ; D5 L1 V! P  Q6 w$ N
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:   o2 A* i# `9 O1 [% I# t: }
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
5 u0 O1 S: I, [; r% Y! f) \  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 C" _) g" k/ S# ^
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 m1 u/ l  U8 W% e1 G
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
: n- ~# C% c/ I$ |% W% c  0 `$ v4 U* |. u3 W$ z, M! I- Q/ ~
用表格概述如下:4 N. f$ y2 \  y2 v, Q! ]

1 q: O9 T) A! W* i& o6 c    甲沉默(合作)  甲认罪(背叛)  # E. S* S' E& W, c/ S3 ~4 `
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
7 \/ H; d; a4 f: ~$ L  k9 P6 W& t乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ T* g2 e# S# r! _; x  e, K1 m& _% }1 b; d" F+ l. Z
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ b+ i; D3 G, q* v
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # z9 [: v$ X. z3 y8 t
  若对方沉默、背叛会让我获释,所以会选择背叛。
- q7 d1 q1 g% `# Y0 T  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : [  b& F$ _! A
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 k8 }  S" G4 P  }  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : P! Q6 ^' [* B0 U
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! [, {+ Y8 E; t& U4 F
[编辑本段]二、智猪博弈理论
! E$ @6 w' y2 o% r) O- T/ X  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! A7 n, v- Q6 X5 v. b* m6 i
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& ]; x4 \: _  w; [9 F. z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " C  y  k) n( X8 ]) t  u5 S
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * ]3 E0 `, C! `) y) B
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . X3 D+ P+ I3 |* @2 S6 `- @0 X
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& n7 `1 r: T3 G& W5 \& A  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% m) C- o3 r$ }6 |
  # [5 {' s: M! y& r( B
三、关于企业价格策略
5 o" D: s5 T& ^2 n5 `; J# T# Z: a+ `& y) `" m  q/ k: q$ l
  ! a$ J: B. R. `# [) `" H
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ X2 U/ y: j! O6 w( s  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )