关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 3 j! g8 R  }0 t0 [6 z. t; @

, `  W4 _5 T! |2 Q. ^严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" X4 x! G$ Q" A  以下三个定义:% q! {+ `; J" X' @
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 a3 a: y% o2 g( h$ L  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 N, Q) t9 u( a, p5 e# _1 A
  所谓的双方优势策略则是指双方利益总和最大的策略。  
; @+ V  I8 a& t* l1 Y% P[编辑本段]严格优势策略举例分析1 L6 Y+ T- `  b) T  N
  一、经典的囚徒困境 , Y3 E# J2 _$ t' S
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & D& x% L7 D( p0 r; S' a+ B$ Y9 S
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; r3 f6 W, P6 e" b; n1 h& g
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + K0 w% q7 w) _% d+ T2 }
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 V1 S! `# F' o. X
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
, W8 e& i/ }' `2 s# n  
  B3 W) E8 P3 u6 S2 e) m用表格概述如下:
+ F% k  A* F: U" j  r/ B5 m5 z' g% T, |' W( z1 C- S- Q3 C
    甲沉默(合作)  甲认罪(背叛)  8 O7 F9 c. P* E! R, p0 [
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' X% F& _2 D) [4 D
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
% Z! l3 c- [% C1 I
  m2 w& L5 J, R/ p' K4 p2 r/ H  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : P2 Z; }- |$ a% J
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 S! G7 y3 f2 _8 [  若对方沉默、背叛会让我获释,所以会选择背叛。 / X+ F2 G3 p, s9 X  G! Z5 p& j
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " q/ |, v6 [$ K* r4 r+ a
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 Q) L9 y2 ~% G+ a8 G! E: ~1 ^  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; k0 R3 `" O4 x% t4 `  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' F, B  q, E+ m9 @[编辑本段]二、智猪博弈理论) @& c6 b$ y9 }6 L- K
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 3 j- \" g% T. Y) C! t
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 j$ D' Q: T  J  N
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 E  L; U; e4 Y5 X# ]$ t* I  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
5 q! j' ~3 W7 I0 Q0 @7 `- z9 R  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 z& l! Z; P3 M. T7 X' U  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - x& l! Q9 Q. c4 f) a- H1 l
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 l0 b- l- l1 v3 p+ j4 S' g
  
$ _, _# @3 K+ _4 K* }% P三、关于企业价格策略
! |# ~4 ^1 x- d* i4 v7 b/ C) _& k* H9 C4 b9 C* S9 l
  
6 S0 O( k7 z; u3 v( m  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 z8 b3 m0 T+ ]+ F$ H
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ m! P; _2 u' p( Z  以下三个定义:
1 [* H2 v% A6 p! Q  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 U1 m# V% d/ Y& q
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 D7 r$ ?; V7 F1 u, Q. o
  所谓的双方优势策略则是指双方利益总和最大的策略。  ; b* v% b% n1 g* w+ ~% Y
[编辑本段]严格优势策略举例分析
' |4 c% A. N+ t  a' C6 P  一、经典的囚徒困境 4 b% a( y1 W$ C! [
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * o' r$ |( M8 P# H" V: y! ]- c
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   O4 a/ n: _5 B( ?8 O/ s/ }
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # [8 v7 O9 o; J# N2 y& [
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 k. f# n( @' A$ g7 n( c
  若二人都互相检举(互相“背叛”),则二人同样判监2年。) F& N3 N. t- A( K+ \% ?4 }3 N
  0 x6 ~- x0 [; l
用表格概述如下:
4 w- A7 \3 ]8 P, y  H* s
6 R* ~0 i1 T% r! {3 z9 L# B2 Y    甲沉默(合作)  甲认罪(背叛)    L- C: i5 f6 \' \8 R% i
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; Q, r/ w* M, Y9 n' \/ I乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ! \! u  X8 w) t7 U! E
. C. s) c0 ~# k, T1 p5 t
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 / ]7 G. B9 T: V4 Z. y# C
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 G1 D. |7 c: V; z; f, S( D2 O, E  若对方沉默、背叛会让我获释,所以会选择背叛。
( ^8 ?+ \$ `2 r+ p* \9 E  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
  l4 b6 `1 z0 D: }/ s- [% s  U4 {  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 Z" M6 J( K) C4 W
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 " k# b! O# w/ D: B$ l
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 A# L+ W$ U! Q; W( W/ N9 Z
[编辑本段]二、智猪博弈理论3 z, l9 D& [4 ?+ j9 T7 t
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. A' n" M% ]3 o) b5 _  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 " C1 ]* ^( t& y9 l9 K
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 r6 t! ~# u% Z6 w
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " K3 Y- S; ]9 E4 t! w5 p
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, F* h& H" p) |& I) b% w0 Y* b  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 g7 ~% x2 }: @9 h/ w9 `  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。5 |4 q- I; G. w/ {
  
. R  G. j' X7 `; t' f5 v三、关于企业价格策略
9 Z1 Y( `* f& N" |' y8 R5 y, U( M# @7 x9 [% C/ G% ?
  2 U2 y4 T# h  ]
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( v* A, v9 x! ^' X
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 ^3 f- e2 r& [; g% R
  以下三个定义:
, W4 {( M) D' d  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- ^0 F9 k' d* W% D: P* c: Y  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: |, k( O' x1 H  h  所谓的双方优势策略则是指双方利益总和最大的策略。  
9 w( P5 E7 j6 [2 w2 r; k6 c[编辑本段]严格优势策略举例分析
" o! @2 l9 C3 E' @  a& \  一、经典的囚徒困境
" O! G/ {% Q" S8 u  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # `7 R, I  ]# O' q
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ R) V, p2 t% T+ F# ?- M' t9 P  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* b: N/ l7 ^9 m/ J4 T  v$ {3 O  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 g% t, _/ |9 b
  若二人都互相检举(互相“背叛”),则二人同样判监2年。4 K/ O5 |9 i  k) `* @. b. e
  
$ W1 T/ n; i- V; c& W) V) j用表格概述如下:, `. E+ C5 u  `+ `
* @* V2 v8 x# [
    甲沉默(合作)  甲认罪(背叛)  - r7 j; b% [; v) J3 _0 i
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
& @8 A' x7 u- p6 A乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ; x9 Q/ B2 p- Q) r$ X0 ?" \0 F
8 n* Y# j7 R0 r9 m- Y: c" a
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% Z9 J; p# h$ A# D  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 |- Y- e5 t  ~4 \6 B9 C! A& n  若对方沉默、背叛会让我获释,所以会选择背叛。
* W/ j" o' E* S  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , h, P' n$ }- g5 a
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % e* I" o% ~' b) K3 H9 b, u
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 0 _# H! o* i- E6 Q: X, X- l
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, x3 ~5 _" ]* Q$ r% F5 v
[编辑本段]二、智猪博弈理论: e+ R) Y( q' X9 l  x
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 # K/ ^3 ?5 B, b& g% t1 v9 H3 I
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * `' y0 |+ ^6 p4 |
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 7 i( b' F0 W: ~( [* a* y4 N/ H
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ F% j2 E& y: C+ N  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 J7 ?5 u9 L8 [
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 7 v0 K6 e, {3 t2 a
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; T" E; g9 j" N( _  1 p8 Y( v" }4 l
三、关于企业价格策略
: K$ Z8 q& Y9 w3 C
+ K3 i' H4 l% ?! e  
" X6 M6 E2 a- K# f  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ D6 n3 f3 u" @4 g0 ]* c  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% X! Z6 O+ W" o9 T2 C
  以下三个定义:
7 k7 {# J: F* _; |: F, ]% }  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 / I! j& ~3 \- n* l5 v+ h
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' z  E: t" l! K  }( F- @
  所谓的双方优势策略则是指双方利益总和最大的策略。  
4 C# V/ n+ w& r7 Q, Z8 _[编辑本段]严格优势策略举例分析1 t8 Q/ a8 I" J: N/ K: w6 X
  一、经典的囚徒困境
0 x8 p' f3 n! p6 {( U  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 I0 t' Q& z; w1 @: w4 u  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 Q4 E; ~, \1 e! g# u; f2 t
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : i  n6 G) L( ~# P2 I
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' {- {& A6 p5 |/ M3 N
  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ n% P# a! y0 g! K/ s
  " U! l7 J; A2 v# o$ W
用表格概述如下:7 W4 I' {* H* [3 E

$ j# M. o/ v$ ]% c3 o    甲沉默(合作)  甲认罪(背叛)  * t+ _4 h1 b0 q/ _! i* l1 @; {
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; B7 U4 o. Y, E! t; m3 m' q% N
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  - e+ }3 X& o4 ~4 |1 d7 @* k5 I
8 d. u; V" G. r
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 u0 l1 [( x4 h# u& P4 _9 E
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
% c' v9 [) S. L0 E3 A! [  若对方沉默、背叛会让我获释,所以会选择背叛。
8 o0 `& ^+ V, U0 |! r- f* D7 P  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% b+ v/ y; n1 O/ N( d' Z2 n1 W" \  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 f4 u4 b3 z8 o  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : B& I7 `& j, y$ w2 A. }; ~
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
8 K. J% J% A- Q; l  v  P3 ~$ v( h[编辑本段]二、智猪博弈理论
7 C" d" m& ]" L0 M& _- m  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ e/ b6 r5 A3 A
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; |- B( f0 h7 o0 v, L8 y
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 D5 f1 Q( z, ~4 ~  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 f! N/ I, g! S! V& j5 C
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + b: z9 {2 S1 e" ]7 b- D! t% j
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& |! t' Z) x3 q# C9 P/ i  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。& E$ e+ Q% R" ^/ S" t5 o
  / C) j5 ?, F3 W9 X
三、关于企业价格策略
6 N' j' S; F% h0 i9 y. p
! b* L" J$ H; N  
4 F! A# J$ N) Y6 j  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 {$ i/ K9 s% H' X: {  \  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )