关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
  b5 ]' i4 m, u, E9 k9 ~4 N# M1 ?1 b& a' }
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 V% f2 t( o; L* T; w, A" w  C0 X
  以下三个定义:
& L: ], G; \4 _( m% n! y3 }: m% m  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# H7 P0 t6 R. N& e0 Z% t, k  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ U( \' c/ q9 [& z. f  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 a7 K: n/ B7 V5 o[编辑本段]严格优势策略举例分析( y, q3 _; j: f3 a; y5 V( C
  一、经典的囚徒困境 # e) ]2 U" m) ]- U' y, ?. t
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 4 l: N9 D4 U. a' C1 U) S
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% o+ F3 ~8 O- W# C( R  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 X* u3 b" s3 |5 O& d( f  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 E- O- G2 V) G3 F' t$ x7 A- I  若二人都互相检举(互相“背叛”),则二人同样判监2年。6 c4 e" C1 a$ i6 I
  
* b+ h. d5 z$ O. O" k用表格概述如下:
0 p0 L% a6 j, L( v0 U8 i+ j2 e$ d, M. t( T; C
    甲沉默(合作)  甲认罪(背叛)  
) l! {+ R/ X: k+ s* y, f0 i乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; b1 W- ~: Z+ w0 ^; N' W, x4 g
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  : Y1 S5 F! F* k& ^5 G, R

( w' E% j; X) Z1 R9 Q: p+ d6 ^  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 b) a# |% A2 e
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' M& l0 H' a0 ]! {9 N  若对方沉默、背叛会让我获释,所以会选择背叛。
+ u0 }: q( d4 \7 i  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " e5 [2 A4 O% i1 ~+ e) i5 b
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! @7 F7 m' ^  ^2 @
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 L5 O; B/ M$ I+ m3 V. j: R3 Y: X  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# |% @: g" M  v$ V0 T2 W[编辑本段]二、智猪博弈理论
" s8 |- d: ]3 E8 I& _. m2 u  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 R- C. W6 l. I* ~* @
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * c6 }5 T4 e1 y3 x) S
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + u9 b) e: w# a- t$ H1 k2 W2 i' F
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ s6 }# o$ N8 c: ?' x5 o+ H  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % I9 V7 D+ H" X& b: y
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& l7 d2 N7 s" W  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 Q) P3 t6 q" a. `2 U! T  
/ B0 @9 b$ Y  S# s8 G( S/ C三、关于企业价格策略
/ E/ _7 `7 O/ ]& v0 _: G# D' ^! y4 U, x
  
* i/ x' [* g3 G1 \8 N& b0 `) B  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % @; O8 A8 f' N, ]8 V
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ b5 N- `2 \8 v. g1 k# r  p& m
  以下三个定义:( y% j& q, E. c
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 y" n8 _0 i  b. I& l6 @  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . E  J- h" [  N- h$ ]
  所谓的双方优势策略则是指双方利益总和最大的策略。  
  {; H$ o( {8 }% b6 ][编辑本段]严格优势策略举例分析+ p' y/ C) f( [, N+ i8 M
  一、经典的囚徒困境
% _$ n% G2 E! _* d  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / t: ?" M# b7 F6 U6 k& [6 B5 }2 [
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 {! I% \/ O; X  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 F) G9 V; b4 F$ Y0 A$ A: A. w
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: K( ]' M8 R+ U- d+ w* V9 a( W  若二人都互相检举(互相“背叛”),则二人同样判监2年。+ d  y9 r) f1 N6 r6 h0 k2 Z* V/ |
  1 h1 V0 [  Q. a1 L6 K
用表格概述如下:
5 l4 c8 M! j; Y  I6 e) V
* \9 U, G7 X! T; u    甲沉默(合作)  甲认罪(背叛)  
/ ]6 j" B: n. f* H乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  % M) z! n  {7 i' ~
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 a$ u& L: i4 P/ `4 D! y8 n
- m8 [: f9 \( ~& f; Z: k
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 R, [! ^+ `& y% f/ \  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 T/ O( T% |+ ^7 Q: k+ _) k, ?  若对方沉默、背叛会让我获释,所以会选择背叛。 & g/ Q" W' d8 Q4 S5 p$ c# T: R3 w
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# `1 I0 I6 Y) h9 u/ T& E( p' Z8 ^& C  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # a. R, l( t6 Q8 r" a/ `% C, e5 w
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 y, E& `! G/ o5 L( d; `3 q8 k
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
8 L: Q; B* x7 ]3 g' }9 [" i[编辑本段]二、智猪博弈理论
6 m8 ?* b: m4 Y2 n  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 # J2 S" _# J7 b: U+ ~2 v/ ^
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 V" h2 @1 M9 W- h  S  u2 Z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 g4 \( O) a  b% r( D, F' ^  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 J) f4 N6 v) y1 P
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
  H7 ]& z' d* Q5 N3 D! \6 @+ O( q  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # f9 B! p$ p7 s, H
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" r8 s1 h* v, Y6 t  Z- O$ Q) Z1 }  _
  4 W8 _. `# G+ p
三、关于企业价格策略: |! n6 u7 Q' h0 K9 E: F' l2 o5 S
7 O6 g; q8 ~  B; _7 g
  
! v- Z* [" B6 ]3 P  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ S' i& }2 Y  t1 W! G) r  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) }3 Y$ Q. t# x$ R, W
  以下三个定义:3 J2 v3 X" Q/ U' i% K: i
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 K. ^; O* \7 J0 ~; `6 a9 ^1 N% Z  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, M, O  t7 p. ?, l5 H  所谓的双方优势策略则是指双方利益总和最大的策略。  
. {  u: [, ~0 Q0 l[编辑本段]严格优势策略举例分析
, _8 N' E: Y& M1 y9 h  一、经典的囚徒困境
+ }# @3 U9 g- K; t! d  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
- L# j5 X/ h6 K1 r  U$ q- h# P. {  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 {" O. `" g, W. l5 a; L
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 @9 _$ e- G# f% x+ C" S  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 s3 I6 U+ H6 K  若二人都互相检举(互相“背叛”),则二人同样判监2年。
* Y$ d7 b' E! a- }6 }  , D& w* V- I) U+ w4 u" |
用表格概述如下:
* L- Z; f% i$ x' P* ^# p% a$ X. t, ?' R' Q
    甲沉默(合作)  甲认罪(背叛)  
6 A0 H) x/ M1 `3 Q- A0 y乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
4 r+ Z$ O- M+ y  P乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
4 x: F# r0 z3 s9 [0 r! N3 S. n2 A& Q! e: X3 n  s* P) B1 Z; y5 q' r$ a4 s
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 s- G9 D2 E/ p/ H) Q% A+ f  k  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, k* @( Y3 a4 B' W  若对方沉默、背叛会让我获释,所以会选择背叛。 . z. A2 p. w/ J$ n
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 V! t: X" C3 B2 O5 R. m4 j* ^  }  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' E* U2 ^1 N. F/ l. E  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 I* @: u( D0 L# P  `& u% o" G) W
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 n9 Z7 V3 y( ]  \( s' o
[编辑本段]二、智猪博弈理论
; {; u/ [1 _4 `7 Z9 }& v, a  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ j) P% M- H( d
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , N: W# O/ G  r( L) r
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 I" t  C) Q/ g& `: h  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。   {8 X2 Q9 b! R
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 L" X3 }% W7 ]+ t- e/ F
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 |8 ?# q/ U0 H+ m9 i4 ]
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. a7 Y% O3 B" E
  3 A6 s- i0 p8 |0 Q% o6 x1 E
三、关于企业价格策略
+ p% V' b% c) b' b5 ]/ E/ c- h# b1 m& _! q& ^4 o& \; X
  
7 x& b( a+ k7 y8 G  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 s4 z" n: w9 f' c  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; \1 o% k' ^- t/ x) r. U9 Q
  以下三个定义:
& @3 Q$ P0 v. T% a0 I  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; X- k! z- N( O( g  T) H6 `1 z
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 Q: ?$ E* u5 |9 Z+ D
  所谓的双方优势策略则是指双方利益总和最大的策略。  
0 L0 R5 o" [7 `, ]2 o; p[编辑本段]严格优势策略举例分析7 G6 ^2 V. i0 N5 {7 f: f3 ?
  一、经典的囚徒困境 / E9 J! f9 x- ~$ R
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 z3 r5 C) d$ ^  g5 p0 R* p) [  h
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # ^. L- E9 b+ F5 m
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" Z$ O9 @( k* E& c7 O  b  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ u+ x! Y' I" ]8 R1 k
  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 R& k, p  \+ H" |- S, H
  
0 u: p) }/ v% F5 _用表格概述如下:
. x1 c" ?; t$ a. }
- z$ H* B7 I7 p& [0 W7 _: K    甲沉默(合作)  甲认罪(背叛)  7 _' c8 J; _0 v2 g% S- F! d
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  5 J# }% F  Z2 G$ Z2 k
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
' s. s8 ?/ y# u: n2 T- P7 M* I' T3 f( t6 R
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# F* n, G5 v7 v' T' [1 {! z  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* z: [+ Z0 N& B4 ~: N  若对方沉默、背叛会让我获释,所以会选择背叛。
; p4 w' C) b/ u- `; k% P  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. t0 G: K% `! b4 ~$ A  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 Z1 r+ A9 {* E7 Y0 t1 V* r  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 c+ {! a- C# Y: x
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; ?+ X) P; t; J[编辑本段]二、智猪博弈理论
% _5 `9 q$ s( y# K& [  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ f) c) h: [% {# _) C2 N  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ ~2 j; [  J" j. t6 z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* e  s. J- g% S6 b" r" [, I  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 r# H5 j: ?5 r6 N7 C
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" O! b* O  N, }: C  P3 ?3 d& B  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 x' t4 m% L4 g: x
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 u0 f: F6 r6 n0 S8 K9 M
  
5 ?0 r# X. w" N! s+ q三、关于企业价格策略
& k1 U  V' A. N# H9 M7 z6 `4 n  |( T! ~$ k$ }
  
! I% H5 R6 j* B  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 y! F" G0 U* z  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )