关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 " q7 R1 L5 U& ~' e- D
9 ?, T1 L; \9 l0 P6 g8 B
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! y& W. i$ Y3 d
  以下三个定义:) J: d; S- A0 s  j8 t# B
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   [* T+ X# i9 P, e; \. J
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, ]1 D+ C$ R6 W5 O' F  B  所谓的双方优势策略则是指双方利益总和最大的策略。  , `8 Q1 z4 _) E. O
[编辑本段]严格优势策略举例分析
) W: s, {  ^# t5 y  一、经典的囚徒困境 ! j- f; j3 X: y: ]3 s; w( x! o
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" \, S6 _& z. [) f8 f) n- j1 d  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) O% b1 `2 @4 k) ]- j# B1 D# E
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& B0 a$ G9 W. a  U& ^, v- L! [# H1 J, l  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) B  X! A, b$ v4 [  若二人都互相检举(互相“背叛”),则二人同样判监2年。
' d, R: b$ E- J9 }  
! j6 G0 C1 p' }用表格概述如下:6 A5 k, g2 t( E* |* Q
$ b3 v; U$ B! }1 b) M, s
    甲沉默(合作)  甲认罪(背叛)  - C6 B1 v6 u5 D9 U
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
6 ?. W6 J1 b6 c9 u' Z+ k6 C乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ L4 ~7 U% t) W$ z) a( t- v" l+ B9 U1 S5 V
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) s# Q! Q! d# m' Y6 ^
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + a0 m6 u* s. o' [, S
  若对方沉默、背叛会让我获释,所以会选择背叛。 / @" w/ ~. d0 x: J! |: p
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 I# F% e' C% r, u. _$ E+ l  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 N: L# e9 P, R% s) ]& C7 ~  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 6 U7 Y, Q/ {+ u8 L
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。  G- A4 |# ?8 ^: P; t
[编辑本段]二、智猪博弈理论
- q( n% [  G' ^  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 n2 g7 B' W+ Z( i% `, [
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 B7 i) G- [$ i3 v- ]3 l
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 L- x, V; ?( I1 o8 }" r
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 z* m0 l+ a% d. F, e
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( N' f: M& w+ A3 D4 [- d
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" O6 M/ v) I' e: z, y. ?  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. N& ?  ]0 |/ ]# J. e
  / h/ [+ C9 x) p: U* {
三、关于企业价格策略5 R7 F" f. ^7 t4 Q- |- d+ |$ _
) p3 L; X, D$ M& j
  , Y  z0 G; ~* _+ t
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' e( l, g# Y) M+ @9 |4 Z: l
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);$ x- h' e& D3 e( V4 F% e
  以下三个定义:" v, ?4 o6 A( @
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' y* @6 d! ]$ z8 Q5 M1 J' f  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 k6 b! ]2 W3 m. H. z4 C
  所谓的双方优势策略则是指双方利益总和最大的策略。  + Q! M9 Q% j! i3 ~
[编辑本段]严格优势策略举例分析3 r7 ~' {' d4 j& F% j
  一、经典的囚徒困境 5 ?7 n1 F1 t7 g- N
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! y# @8 m7 d# |: e4 C/ S' j% l+ f3 H
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: $ [8 x$ ?! {: v! ^' @8 j
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 F, r. d* c1 F$ s% l; Z  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . v9 E& W% p; k
  若二人都互相检举(互相“背叛”),则二人同样判监2年。: y% h: C( l& C8 ^4 Q# u! N5 P
  # ^; d- a+ h& J+ A/ @
用表格概述如下:9 M! _1 m0 q1 j# `# Z

0 E) o3 g1 H8 f4 p, ^" ?3 f% |3 [- Q    甲沉默(合作)  甲认罪(背叛)  
; j- b+ x/ I) W+ c" x, z乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
0 f% r1 w' g. y7 g2 J乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
( n  b) j1 R) N. J, E) X& B7 K; Y7 T5 z
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 q" X: K8 d( C# K. p
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 H" M% r* J2 o4 y# u  D  若对方沉默、背叛会让我获释,所以会选择背叛。
$ b" |+ j: y/ v6 ?* s8 N  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 ~: z% g& \4 p7 E9 k* M% C' _
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 d  {+ E: q. p0 U# T8 i  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( e! g* H7 K9 Y1 L  Q1 B
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ }$ x( o+ q6 b( C" Q
[编辑本段]二、智猪博弈理论- N& U) J7 n. R! i: i, S
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& @( t: G' p6 i2 u3 ]/ O  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . {7 o  I- Z& [3 B# Q9 g: D
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 u, h8 s! u# |8 s7 @* S" q
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( M4 E' g2 {: t8 e1 @+ l5 K/ b
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 E2 [+ }8 x8 W' L
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + f" k8 A3 f* w* F# E# S/ I
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。+ g" ~9 F1 o$ w6 n7 s  a
  
+ t4 D1 E! q! Y2 }6 M三、关于企业价格策略2 ]  i9 O! A- N( |: A4 u/ @& L

8 R* n6 }/ ~3 G( l  3 k6 Y+ c& l8 p4 C' C1 D
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 d6 A% w4 A5 Y9 B5 L
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
8 C$ C* `) F2 ^" w1 l  以下三个定义:5 y% K, M- U" U
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
) T' _  D  d9 j- F* {  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 B- Z5 H& t  X% C* f9 s- k# H  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 g8 S  R; W# c: X[编辑本段]严格优势策略举例分析
, G. i% ~. d$ L' {  一、经典的囚徒困境 . `6 _& ^. |5 s# A8 a
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" |0 g& u! Q; U( n# {  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 H! c% b# A+ H8 [8 {( ~# _  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 i& z( O& O3 O  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
7 ?( I2 G7 I$ C7 F  若二人都互相检举(互相“背叛”),则二人同样判监2年。
( B% D" `9 l+ V7 }5 q' M1 H  
8 O8 V7 e$ r! x6 F% g用表格概述如下:
; g2 e! N+ o# A( T" s# G
$ r% x" Z, l6 A7 r5 Z    甲沉默(合作)  甲认罪(背叛)  
, n" _9 i* e4 o% M$ I7 f4 g! P3 Y乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
3 Y" J9 d7 E4 N3 m2 |乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ {: l5 P+ u$ D

4 h1 g- {; T% A5 e1 }0 |  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# P* u. J9 I5 y+ f0 i  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 E2 f. r1 B8 e% @  若对方沉默、背叛会让我获释,所以会选择背叛。 / ?3 w9 D' T2 H# l. M3 j
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 O$ U6 O$ _4 y( ^1 `+ v% M  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( m1 I* y+ H* ?2 ]% m( s3 v+ F; ]
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   K5 d! P2 B  U2 J" o
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 {/ O+ U8 s8 J: {, O2 e
[编辑本段]二、智猪博弈理论
& ?0 H# y- P( e8 F8 `6 K; l& d  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / O" r! t; z, H
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / }; d" F9 m4 l) n  F
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( x0 i; I( q5 l% X
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 o/ V. W. E( h% _1 h- i5 D. B  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 G( D4 A4 r; z
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  Z; R/ }, l" {( W; W7 l  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 a# n. o. k% F$ Q( b  8 k  U0 D9 z9 J) r1 _) D' H1 R( V
三、关于企业价格策略6 c! X+ Q6 i& ~

9 M* ?- e6 ?! n, {( R4 W7 N  $ L1 v- ^% O/ O6 ?2 q7 Q% N# z8 v9 O
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 R2 u' C6 f9 _$ n
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! d/ ?, N* t6 K# W5 M. y
  以下三个定义:9 m5 @) m" k" u' ]  x" \
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 r! z. P9 ~6 E/ E+ Z# N- b
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 q# i0 P7 j0 x9 n) |, i# q: Y: ~
  所谓的双方优势策略则是指双方利益总和最大的策略。  4 m2 p- o& F0 t
[编辑本段]严格优势策略举例分析. e7 C' q1 G4 r0 t
  一、经典的囚徒困境
2 m0 Q- ~8 ^/ X: O$ Q, Y5 E  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 d" R* T: @" e) Z5 ]: B& H
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # j$ R& m3 w2 d9 ^6 T
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / Z& e+ t: P8 v
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - A/ K; o2 n2 ^, C/ A; \
  若二人都互相检举(互相“背叛”),则二人同样判监2年。& M% k- u( k% f5 k" n5 W- j, [: e
  # v+ s+ j, ~# r' M% R. j8 T6 C
用表格概述如下:
4 W6 [- T: n% V# R
9 J0 |! U% P6 U/ L  j    甲沉默(合作)  甲认罪(背叛)    D( e7 k8 y( u7 u  t
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
0 `1 z* J$ B! m# C" X( L. o$ y: j乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
4 B4 c0 G. U1 l- [3 L6 Z1 Z5 S, h4 y0 w7 _
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) o4 Q. Q7 G$ a! s
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # L- ^0 c: q. ?% }8 {* C$ _% j
  若对方沉默、背叛会让我获释,所以会选择背叛。 0 E" I# e( d; h
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' e2 T) D1 `4 b. q+ J  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # H0 ^8 C, V: p, ?6 j+ G# M
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * _- G2 b; w& c
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 `' I; O5 ]& r0 x1 t( V% Y5 O
[编辑本段]二、智猪博弈理论7 E4 M2 r$ i* P; |0 \  B
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " w/ ?% X  Z- ~* Y6 C$ |) O; m
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 f* |" C* B7 G2 z! j
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ v/ h8 C% v$ I( P& d! J% D  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & ]) Q% d( N) o) g
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * F* `' C" k5 W: J" p4 _
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 j. E4 U0 K: t  x1 A+ G  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ r" Q. m7 T) D/ a$ l  G$ j  ; b4 g0 V1 V& Z  S0 h6 n, x) I' n" m
三、关于企业价格策略0 L: K/ d- \9 `3 B4 w. Y; [

  S, V2 L! ^, e+ |' B) A2 g+ X  3 Y! _2 h# g3 N5 \8 T& O
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 A2 l. J8 n! `" L  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )