老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * z" l+ U" O+ _* K) V2 O

. W3 B2 p- V/ @7 s严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
8 l# H! U! D, ~  以下三个定义:$ n  ^' U$ t/ l2 E# W5 F
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! _, k6 m) S, P  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 r9 D- \: o  k/ e4 t2 u
  所谓的双方优势策略则是指双方利益总和最大的策略。  
# o) C. v" D0 R1 Y. q9 }2 G[编辑本段]严格优势策略举例分析
. O) O- O1 [; j  Z& S# B3 ?: N: @. \  一、经典的囚徒困境
+ u- G/ {4 A# o  K8 @2 S4 ]1 b  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 M; T& U: D& f. D1 x( V$ ^2 ?* `; B
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: q$ `3 m+ J' `; ~) u: C9 ?  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 A  r# j" _7 r9 \' Y0 M, \  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : Y9 M2 O2 I6 @
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 Z' p' `0 Q# t) r9 r  
% }0 n' ?- C, L4 T用表格概述如下:
# X" v1 c+ S2 q
4 R: t% D  ]& O5 q    甲沉默(合作)  甲认罪(背叛)  
. @( L. P4 ?) j/ N+ a乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
7 Y6 D5 m0 u  o2 {( f0 `乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; L# N) c, y  ]2 n- P/ ?$ U: c% d3 I4 X  L: d- T3 E9 X5 v- H( `
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 a3 m6 j& x" F3 B  c. {+ {
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
  D% w9 s( O9 e. B1 V# t8 t  h8 L  若对方沉默、背叛会让我获释,所以会选择背叛。
0 ?/ k8 f: U6 N5 N0 M. [  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( D" C1 o7 C* ^* S$ U# g& m+ b
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 5 d' o# Y2 _. J
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
9 Q' O' v7 h; A5 a0 f3 S  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 l- s6 F2 i8 X: N8 V
[编辑本段]二、智猪博弈理论5 Z4 L! a- _' [" G: |7 g
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ d3 @% `9 x( \8 y9 D- \. w# s
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # P" `* X+ f4 e9 q5 g( Z! O) |
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* \( z. M" V5 U: Q  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 Y) n/ g" D+ n5 W5 Z' j2 s+ L  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 j/ Z# {3 w/ E: c9 l
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 A- O8 c& q2 ]* {2 X2 r  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
- P  a- B; ?- V. e. b5 \  
, \! o4 V# t1 x/ v  j三、关于企业价格策略
8 A6 y) U$ B+ P% {% p. I2 s2 b# l: j# p5 H8 A
  " v. c, r: ?- w8 g3 u7 ]
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 X0 ^0 Z4 P! u" i1 W1 e, Z7 ^, Q
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 }2 I8 N5 |+ n- l
  以下三个定义:, K7 z) Q8 M' F9 T8 d( p0 i& n
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 J5 U$ g# ]7 r. X* b5 ]: }  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 I: o. J" P2 i
  所谓的双方优势策略则是指双方利益总和最大的策略。  
& B( {& \; q/ O8 |1 n[编辑本段]严格优势策略举例分析" \% c3 M5 c5 X3 E
  一、经典的囚徒困境
# w( X9 J! e% }3 j  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . B0 d6 s5 [: J- w! I, M3 X8 x) |
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 m; t+ Q' v) v3 n
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
8 \( C* Z5 _0 {' o) R( a  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; X  j) Q; u# d4 v; z4 c  若二人都互相检举(互相“背叛”),则二人同样判监2年。* d$ i4 J, O. n  `7 U
  
5 F5 {; m: e9 u* ^用表格概述如下:
: r+ I6 q& p- I& [9 f, }$ Q& `. G8 [; c; E& R" x, M* m
    甲沉默(合作)  甲认罪(背叛)  : \+ X5 b" F" O0 n. |5 R
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ y9 M- K. |/ B; o3 U3 t+ B$ N( b
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
( A; f( p' v8 L
# i# y' d2 o& G- ^% A4 d  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % J" H5 U# {4 b# W
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 t1 `" L+ v. @$ r2 m  若对方沉默、背叛会让我获释,所以会选择背叛。
( z* `$ Q9 _5 i2 F- l  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : y8 A$ y' M' Z) X
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( B, m" b/ p, q% |( j  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 y7 t4 r3 V& s, e" Q5 t' `  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# d5 b, c+ S4 I8 m) v+ ]/ K
[编辑本段]二、智猪博弈理论
. I3 Q% L) u/ {0 J9 Q  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" p- S- e. m5 ?2 J9 c' [  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, v, \/ e: ], ?, b; W  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% V; q$ A1 ]) @& n' k  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& `- w+ z$ v1 d( N9 {6 ?; a! C1 p  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " Y' O( M( E4 K! G
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: I! {( R( q1 N. i9 M  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。& X+ p6 T' j6 v4 A' g4 S# V
  
) s) b: ~7 v" z+ X/ U三、关于企业价格策略
- h0 L1 C7 p- b) x  P4 q
! V4 K9 o( ~. ~# Q  
* E. k9 c) X6 }. i& C  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( ~4 t8 L  A2 R6 z! X' _
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);- m, n6 B" u6 d1 V! n5 F0 }
  以下三个定义:% Z' N9 B) S4 i
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & M( E7 Y% b% l: y) F, Z8 p
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 B# W  O0 Z8 R2 O9 E% k4 @
  所谓的双方优势策略则是指双方利益总和最大的策略。  
# K  Q1 ^! E5 `( s- G# b* _! k[编辑本段]严格优势策略举例分析
. B. k: z9 P. R6 l7 t  一、经典的囚徒困境 ' f' W8 W/ D( U, w& ~0 _
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:   f" R0 Y2 N7 w8 C: O' ~4 |
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " m: Y. }1 d) U& F' c
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
, ]. l( d# Y7 V3 Y  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 5 U8 |2 f5 M4 I+ ^% r) Z" A
  若二人都互相检举(互相“背叛”),则二人同样判监2年。* q! W, }0 @! y3 Z$ C+ ]( m
  
  @+ O6 ?6 B, K9 L6 l( `用表格概述如下:# K2 E" c( C/ s, t% v3 g' M7 J0 X
, O9 q/ L$ Z$ s7 q
    甲沉默(合作)  甲认罪(背叛)  
% A3 W7 c# c* p. b2 [9 B乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  % e/ \) {  o% \6 B. w5 `' I4 e
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
) `" H4 t% }- e" z  ~* ~
1 {5 o2 d# d% X/ W; f  h  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ @( a5 l3 t8 v: ?8 A7 t1 w
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 j& f8 G, ]6 c; U9 [  若对方沉默、背叛会让我获释,所以会选择背叛。 / z: r# J# c3 e- P  `- o1 v
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% Z0 g( u* l) p) b3 N1 Q2 r  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 m6 H/ }6 @) R8 v6 I. w  P* Q
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& _8 u* ~1 m! a) V! X  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, l* R& U: P5 N[编辑本段]二、智猪博弈理论* @2 c4 i, ]' F1 u
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 S3 S% k9 U4 I4 `$ N, N+ Q
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: M/ K$ e  N+ O* }, s2 S: [6 @7 e) N  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + _6 `( o1 N1 X7 Y: ~. d
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + g( @& Z3 {, Y5 z6 Z: U/ M
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' p, v3 \8 U% V# t0 b7 F  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) p) O5 x+ W8 s9 v9 n" X% [
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, T/ ~9 x# c5 m7 w5 e, v3 ^  
, ^9 d; a5 H, d) t三、关于企业价格策略
. Z% x' [: q( l& u  }# f- P/ x/ v! |. l1 W2 _8 F
  3 u6 C- f3 H6 l) Z8 ~2 I
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' q# p9 L' X+ ?2 o
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 e6 j% W. q" N8 r3 x  以下三个定义:
. A* x% \( @% @! v6 E. X; Z  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 |7 ^, R9 h7 Z- `& |( _2 J6 e  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 S! |1 @, x/ e1 w) B8 ?6 a  所谓的双方优势策略则是指双方利益总和最大的策略。  3 J, ?8 A! _8 s) O. p" P% f
[编辑本段]严格优势策略举例分析
( b, D) y; V8 l  一、经典的囚徒困境
) A9 Z. N/ _4 a0 t, }6 F8 m& N  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' d  `& C" v& z. l( V
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 }9 _: Y9 ?  z* w/ w' b' P% \  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 `" d. n2 s  C) n" M# T
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 v' c+ `4 z+ Y4 Z
  若二人都互相检举(互相“背叛”),则二人同样判监2年。6 [# [5 G- h. y" O/ F2 T* p
  
+ ?2 x% y, l' B' O  @# ^4 J用表格概述如下:* I9 N9 w5 w3 s6 v' a" D& R" n$ ~
* J. L2 `3 t2 O9 C) X
    甲沉默(合作)  甲认罪(背叛)  
: ?* `" E; R! C. t/ M7 q& q' H" B乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ @2 |0 L. q2 J. ~( M1 \
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  % D" S9 H; B. R$ H. z% P5 b

% b2 D) l. W+ Y7 A9 v3 _  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. q- f- y. k; o$ x5 |  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % n) V4 e1 e2 y4 }7 @
  若对方沉默、背叛会让我获释,所以会选择背叛。
' e- r- w9 @5 f3 J  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # W* i3 y+ M1 ~, h6 c
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & l' u# u9 P+ P4 d: o7 V5 u
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 / N2 E9 Y% h3 b% J+ Y/ j
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 ^: A5 G2 {( l9 k7 u6 D) j# g8 G8 e
[编辑本段]二、智猪博弈理论9 A4 F3 N. \( d. ?& C/ C7 @
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % B/ J" A# J& o
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
) w# [+ F5 E4 V( a" |  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & k1 z, r* g; k. l/ G, c
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" |1 i4 K) O1 b1 \  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # C$ q% e" }! j" N9 c4 \7 X
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & E" @# l. n- {( s/ S' l
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 Z0 Z& D8 t& B/ J
  
5 |6 |, R& m# U4 v0 s, Y  C三、关于企业价格策略
: O7 B: b5 d  ?: I' s) j* ]0 b7 G: ^3 ?" P1 `1 c
  ( J8 s  P* W9 B
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , d; C4 s$ g6 e& S
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (https://laomiw.com/) Powered by Discuz! X3.4