关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 0 H/ g( g% l6 M/ R8 H" l. r
' \) w: l" H$ u: t
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);  A( p5 D$ l8 U" p: b9 J+ @
  以下三个定义:! c! u- m3 t1 s
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" @! W* H& L% U& ~  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 [  Y. r) \( g  y8 s' D  所谓的双方优势策略则是指双方利益总和最大的策略。  / a. l( H7 ?- K4 I$ J- k4 e
[编辑本段]严格优势策略举例分析
0 b8 h4 L; d, N/ k5 ^  一、经典的囚徒困境 ' `2 Q2 C' e" u( x  n3 j8 b1 [
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 K7 A" d- i3 \. |5 F. h& W
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 5 r1 q  J% f/ Z& T( ?6 j& f
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 y- }# m1 _) Y0 s( v6 D6 v' g  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& t2 a) r3 j0 Z  ]9 p! t5 ?3 o, L/ \  若二人都互相检举(互相“背叛”),则二人同样判监2年。( D. a! m9 L7 v! d, j
  ! |. s5 j# R- w
用表格概述如下:8 D2 W; D/ a/ t: F/ [: ]) G

) H/ i  A. O* l/ C    甲沉默(合作)  甲认罪(背叛)  ( r  _( }9 [  m, q
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
, |% F& m# \  C( h乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
% Z7 P7 y9 L9 X" M# I* m; M4 B( r3 i0 Y
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 ^. G4 {- i% i6 t5 A  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 _9 o# C* r7 Y, D" [  若对方沉默、背叛会让我获释,所以会选择背叛。 , Y' P1 G2 H2 E$ M6 ]" _' e2 V* ?
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 a6 M4 ]) E2 u$ ~# V, h0 ?0 U4 t  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) j" V# _( k1 R% x: P. g
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 x. @" e) z$ }7 j" h! _  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 w$ n- }+ `& x
[编辑本段]二、智猪博弈理论' k* Q& A5 T- _2 y; ^  f" `
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - j# v. \. X: \: t' c: ~
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( j$ S6 p" o, i- D; @  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! P; m2 S. n$ B! A
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - a( x4 ]! G# e: M4 p
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 g5 [% H) h$ l
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 L; Z' r8 R2 s7 V$ z) k" R
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( B6 j! G7 c3 v0 W! d
  
* D% W8 t. Z  E% }/ Z三、关于企业价格策略
3 R* i2 I5 I0 m' I9 y) ?. Q
! V5 E2 w8 i0 l. M' z7 b1 {% Q  
- j# [4 k  a4 `5 y1 F  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 h) b6 i; o7 R# V0 I/ X! ]
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& U4 g) Q" e' g- f$ B/ \  X; Z$ v  以下三个定义:
& Y' A1 a; t) q- H  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 c9 V. f7 b' l) T$ L, @$ L) c/ z
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, Q& s7 t* J  H  所谓的双方优势策略则是指双方利益总和最大的策略。  
! X9 E/ @/ o& Z* h# v[编辑本段]严格优势策略举例分析4 W& Y0 |1 l" G9 p0 _  C' a
  一、经典的囚徒困境
% v5 u0 w! [& C! G  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, G* n& t6 E9 D( x  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 ~4 o$ M: ^8 g9 {, O* _
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % d! u; ^2 b, [# O; s5 Z5 ~
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - o; e) [: l8 P* I
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
. a, p0 y( m2 `* X! V$ k9 Z/ X& D- [  2 f: B: W( a( n3 _
用表格概述如下:
$ n: d/ l$ i, Z$ A, E
, E& s  l# ^3 }& N    甲沉默(合作)  甲认罪(背叛)  
3 s5 D) ]$ W  D9 L. `7 j乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  : I( \/ j- C& d' f; w4 ~' a; W
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
) G9 {6 w/ [& n' \
- N' T8 h/ a0 Q: P8 t  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% ]! X. G8 z+ h- K' c! G' [  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) j& J+ {( G4 ~, _# q
  若对方沉默、背叛会让我获释,所以会选择背叛。 : f& C1 w* }9 b. j8 Y! y3 e7 t1 p
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 }$ |0 {0 c5 X! E# l% h. J4 E$ U8 q  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 6 c8 n8 t0 P+ U' o
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + |, a0 A/ Z- ?1 }  y) B
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 ~  P( u$ R& n9 p* [) n
[编辑本段]二、智猪博弈理论
" X! R3 F3 B0 y9 U) d2 |. A  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" b: M+ c* o1 {3 p: a  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: Y2 q- I. _5 R+ Z, w  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 s5 H, |4 U- x7 E- B- ~, z+ J( @  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 _( z: V7 R8 w' d
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 p9 m# Q# W/ [% ?1 V& }( N: s' g
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* ?" a( S2 z0 p0 z% A& S3 ]5 J) [2 H# u  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 C; t6 _& ]- f0 Y  . v8 r; X# K( k- Z$ k, C) q
三、关于企业价格策略, u( u' J8 U- r7 U% H  X' {: K4 N5 n
- K* b& G, v8 J- V# g* [1 C
  
2 M4 t& ~2 b) k  D- J  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . y' }, Y8 x4 [1 R( _4 L
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: S1 @* `1 F1 L- Q" y' m2 C  以下三个定义:5 z) [; H" `, {# U. p% A* c
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 e6 D+ r% _% Q5 _7 O( ]  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 [8 W9 F3 q* R- J9 _
  所谓的双方优势策略则是指双方利益总和最大的策略。  ; x8 s/ u& f- _# L1 y1 D- [% u( E
[编辑本段]严格优势策略举例分析
; J& I) L$ p; o2 G. k8 W  一、经典的囚徒困境 1 \, U9 j- x# T8 V3 e4 M
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, H% G! l7 ^4 O- @( K  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 K1 l; \9 H1 ?/ x  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) B! F* ^1 _' c$ C% K  J8 F
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 3 \( z( b, i$ |& r
  若二人都互相检举(互相“背叛”),则二人同样判监2年。7 l, v, ]0 D# k7 m6 u' }
  3 j1 I: Z0 c0 D" B) y* `8 A
用表格概述如下:4 [# Z& G4 M; i& {

* r6 L! j8 X7 v1 D    甲沉默(合作)  甲认罪(背叛)  
% E3 V* r" ]% K2 U5 J乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
! {+ g2 `! Z  h( {  ]! V2 b9 e! Z2 V乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
7 R, j- @! j: w8 }! C: Z5 M& [' n$ l- S2 }) g" ]" }- s
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 / r: n9 J8 }* k) g  _) u
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 Z, d& \) j4 y* D0 H  若对方沉默、背叛会让我获释,所以会选择背叛。
" H* h/ d* B5 ?- U/ }  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 k' _# `4 W- f/ ?2 i% }  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 T$ s( i9 _- x' W9 }  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 W9 V7 Q! u2 l5 ]  _- }  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ {" T9 {7 x7 r[编辑本段]二、智猪博弈理论" j8 c: Z9 B6 q( H+ W
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( f. K# B/ s& h* s: D  R9 n- b  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& V3 F: J! F/ B$ S  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & w5 `6 n( y, O' x  e' x7 \, E
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。   O' C  n+ b0 z, n# v
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 & d1 h  U; L9 Z
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , O. ?8 Z# |$ L, _
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 P" e0 t+ J( _2 ~& k
  & }4 |3 M) |' S! `9 _0 I. D
三、关于企业价格策略
6 h, p1 h; f) ]' c. S5 l+ p/ u
# K% N( i! ^1 g; j. i6 Q    A" Z8 D+ q9 h7 }; Q( @# N5 N# l' n
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
# \5 m5 i- ^& y8 C* e3 b6 X  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 q2 C0 Y. L: V/ ]) t2 z% R
  以下三个定义:
; X1 L8 p. Y2 O9 E; J4 P  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 f+ r  D. d# y; G% ?% m
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 Y4 S; K  q* `0 T  所谓的双方优势策略则是指双方利益总和最大的策略。  
% ]/ Z; ^. X) f5 E/ a& L[编辑本段]严格优势策略举例分析3 B; t- T- u" i
  一、经典的囚徒困境 7 S! W& E1 J7 F5 @6 Q6 Q
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" y/ I7 N0 p* y- o2 f  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' i0 w; v9 z! n) u1 G' U3 p0 O
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # a  d5 n" v0 k7 {2 `+ p7 B
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 H; |2 {/ r' v/ O5 b- E* I4 W2 I
  若二人都互相检举(互相“背叛”),则二人同样判监2年。* A9 ?1 d5 d3 ^1 m* M; Z
  
* Y! o; F" d0 r1 Q. X1 T) ^! c用表格概述如下:. G& S+ }- G7 z/ j

: Q2 |4 e$ t9 i# v    甲沉默(合作)  甲认罪(背叛)  " e8 s1 g2 I! Z- ?2 `
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  3 o$ h/ L9 Z: _- |9 V. [
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
4 C! Y" [! n& I$ n; {" y+ Z/ T/ i. d% b7 H
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 ?9 t; v( L! d- `  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& k4 y) H) Y8 ~% ?9 O: j, {" g  若对方沉默、背叛会让我获释,所以会选择背叛。
5 h- c; z. }& [# X5 t- |+ k  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( t5 J: l1 ^8 L1 h2 G+ R  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 ?+ R* {* {, ~! @9 Z3 i9 A8 ^
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - n" I6 @; l; ^9 a  [
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 D" F2 s' o. H( I[编辑本段]二、智猪博弈理论0 n% D/ A+ E5 j! b3 A
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 U- S: v9 P& I  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 U3 B* S9 b. B
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- D& \- S& [" {3 D0 i4 l% S  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + U+ ?1 f3 K' F1 D* e  ]0 W' T
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' N8 b& D' N  `; v# p! n. Z
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 @+ J. }& i! _! Q3 T1 O9 l  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 i2 t5 c/ ]1 u) Q  ( l2 ]0 X# T; ]* x5 T
三、关于企业价格策略. e% e5 b- K/ v7 b) |
1 m5 P1 i' y/ a1 l3 h
  & H/ Q' [: b; V4 x) Y6 \5 S
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 K, F. }7 n6 g1 w  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )