老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
3 F1 ^) @& r: C/ c: G! x
9 l1 S0 E' v% E% o; z. c/ y严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' z, Q3 a; n& g0 h& Z5 _
  以下三个定义:$ B/ _- Z' K6 q  d
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 - D: o/ c& J, K
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , u, `2 B3 g1 r: S6 g) y
  所谓的双方优势策略则是指双方利益总和最大的策略。  ! X+ m: I9 B2 C8 ]1 [  T
[编辑本段]严格优势策略举例分析6 s" ^; @  n  ]8 i
  一、经典的囚徒困境 / h* ?# R* c1 U, u; d" p
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 C& g4 l+ T+ p4 k+ c  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 3 S1 i. n! n/ N- h
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& M& d, a% k6 Y5 _1 Y+ W  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! y3 X, n% P" c$ t+ V, ?; w  q  若二人都互相检举(互相“背叛”),则二人同样判监2年。( \) V( C1 Q& y% |; s( U- C! ?
  / R7 ^( V- {6 u% R" G' S2 G
用表格概述如下:. l. B8 h" E! X% _

" \! A3 H2 e* Y; s    甲沉默(合作)  甲认罪(背叛)  6 \  w) u3 V: r& F0 L2 V" A% f! ?/ `
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  2 x6 m( Z7 Z4 d, c
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
0 A, K  u1 J% l% v+ P. L( H7 v
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) s. o2 C& e7 `$ D
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 4 N' |; U: k. K) ?; d9 \% W
  若对方沉默、背叛会让我获释,所以会选择背叛。 $ ^: u+ ~9 g3 U+ d4 J$ i4 ~
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) {1 l7 y5 t6 I9 r3 G- K9 o  M- t& f  P  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ _$ ^/ x5 l$ J- P* O  E  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & A5 a0 i. u! E- j2 Z
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# N& N! h$ F; J6 F( Q[编辑本段]二、智猪博弈理论0 g# h0 J6 E$ W- ~9 {
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 0 E5 u$ o1 ]; t
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! ^; S9 M8 L: p, I- p: F3 C' a4 S1 m  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 `( h2 l, k& ]& q6 k  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& w$ q1 f5 i3 I% E  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 S; t+ n# \* h: S
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) |1 u  Q' n/ O; O" c
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
) Y4 j% i3 A# U* b  
- L6 E3 o4 l! Y7 e2 d* A6 m三、关于企业价格策略. o+ o2 t2 ~2 j5 z6 V& v8 O8 b1 {

6 W% S" l/ r  J3 d) m  
7 i: k1 b9 C! t9 ~4 U2 b7 F- E& K- l, |  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( l2 @+ X( [' ^  I8 X( m3 N! n+ H  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! H5 C7 V9 t; M" F& D( u! X  以下三个定义:) ~2 n" D& Y9 O7 n- N" X3 w
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 `' c+ R2 Y4 S  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% d/ v( U8 A! v$ z6 R" c4 N  所谓的双方优势策略则是指双方利益总和最大的策略。  
2 N5 F" ]1 }% \! }! ][编辑本段]严格优势策略举例分析
: l9 _; W/ @5 ~  r  一、经典的囚徒困境
0 I5 B. P) b# s# U  t  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; V2 E& V* {9 o5 Z3 X) Z4 j
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + W$ N9 M6 C& G8 [( s
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 ^3 g- c8 }0 \$ Y; Z' L: b8 l! O/ K  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / K( V9 u: @& y' L# n. D; \9 r& X$ f
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
- m1 p: v6 D2 x; i  J& C  
. m. P8 H) A) h% @$ m( W用表格概述如下:$ l' A; c5 V- a! M0 Q$ N! i9 I) c: u8 J
& v$ y$ z( H5 [8 k9 a) F8 {) }2 b
    甲沉默(合作)  甲认罪(背叛)  - e9 M5 e2 A' y; o3 P, ?& t3 n5 h
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  3 ?; y& p7 ]+ R, O4 ]3 H
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  0 ~3 _8 G) {% n# E7 `

  p8 ~1 s& l8 Q! ~, u9 ~/ M  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 S& m1 C, C/ d. t; L
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 9 ]; X- _8 S+ e! E
  若对方沉默、背叛会让我获释,所以会选择背叛。
: a# Y/ C( ?1 m: G7 x) U  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ @+ Z9 p" b7 J  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : S  U0 O1 q' q" [! O" m7 |
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 K$ Z4 L; i; X' L
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* I5 T* I3 ^. f' T; O  D4 b$ y
[编辑本段]二、智猪博弈理论
- r" X8 i( u+ }  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / _! r" p( B+ m8 ^
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 - {/ B$ h$ n0 d, Y
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; G. N. H: e3 ]9 N( ?  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 t* a; w- ?4 n- y& n  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# V, A) ^  B7 d9 F. \4 y! `  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
0 ^8 Y, \3 ~+ M9 O) A  a1 B' |1 }  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 ]" M, w. F. U' h  H( }
  . H* f1 c4 D8 N. Z* j: B* G( l1 w
三、关于企业价格策略2 q7 G- t: y3 B1 z* R

0 J0 R$ t" \; {' y3 E5 {; h  
9 F6 ~, Y  b4 w, m6 I# V! S6 V  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 v$ \  {9 o& z  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! r+ G$ ^: x" ?" ?, m$ a/ _
  以下三个定义:1 v! J7 e+ M# J! Y- n5 n: c
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: F& [$ E8 z0 B1 Q# u  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ t2 p3 l$ j/ ]5 J  所谓的双方优势策略则是指双方利益总和最大的策略。  
" k2 x" \% A7 m) X% y[编辑本段]严格优势策略举例分析
6 M& l7 ~4 G# i. g# n3 s  一、经典的囚徒困境 ! X* f6 x( f( K# N5 Y
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 e! C& b9 e+ y+ Z  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' p7 S! T# B# v0 K# s4 n  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % k$ G' F  M! U. L) C3 U, i
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 O' A6 S! P' R" w! V& Q
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 F* w! K; V! T" x: Q2 Q1 J0 r    c: |: K. s' W+ _
用表格概述如下:6 z: m4 ?( z7 d0 u/ d
7 f1 a& X" n! e0 @
    甲沉默(合作)  甲认罪(背叛)  - |. G: p% s' m: U
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  . j4 H7 @: A- u' i" s
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
3 d7 t$ P" r" L- Y7 C- ?0 F* x9 ~4 P
5 ]; t& P' a, @+ E4 o+ l, a' h  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ `# l% j, z5 _" }+ F/ T  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 w  A; u1 d8 U: O
  若对方沉默、背叛会让我获释,所以会选择背叛。
9 o9 L" v8 c" O* x$ y1 R! ]  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 }3 l0 b" W8 |& u6 ?0 G
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, U9 \: Q8 t1 ^9 i- X! k  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 j) ?9 p* v9 `) E1 Z  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ q6 G, l' }; m7 Q7 A9 l[编辑本段]二、智猪博弈理论. H0 D0 _/ U+ g! n& M1 P+ G9 d
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 [! F+ }  ]4 R) n+ H
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 ?2 t5 N# k. q2 O2 g  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 z0 v1 y+ X+ P& _  f" @/ l7 H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# c1 O0 b* D2 Y2 P* k" h  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 i6 w3 U" z6 P" }, s: e( i
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 X) H5 @8 M& r5 `+ g7 B2 o0 Y8 i3 b" `
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. l. r( f, M( b/ \0 W- i  
7 @; p/ n5 e- w6 o三、关于企业价格策略4 c  D) g& @* I1 d) g; c5 `! t
/ W/ V% k4 e% k! k* G
  
& f4 t) O) j; I2 u6 r4 p  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ `# M. `% g6 E& f  [! \6 D" q  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 U* s+ C8 T% i7 l  以下三个定义:% {- t) o, |9 `) d! n. @  u5 ]
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 . |: _; p; F( _" r  {; |# G
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. w' T8 v& T& u, T( n3 R  所谓的双方优势策略则是指双方利益总和最大的策略。  1 X: l. o# k9 O  C, p/ _
[编辑本段]严格优势策略举例分析
5 a' A9 M5 t4 l/ g: k8 e  一、经典的囚徒困境
/ x& y; j: E' z  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: $ _& i6 X% z1 M
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / n, a. o6 P: V
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 G2 ^! O( q3 V) [) @
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 I4 C( O+ A& x9 x5 v; R9 h  若二人都互相检举(互相“背叛”),则二人同样判监2年。
) e  j! w/ l1 T/ ~  p  * Z+ h$ X% P6 p+ ~) t
用表格概述如下:
7 b$ A& Z1 b' [4 t4 e# u  \/ v
% T3 e/ C, E" ]; _    甲沉默(合作)  甲认罪(背叛)  
& l; g8 Y$ }! s  Q' ]乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
! U$ z& F: S# h- ]2 J% _0 o乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ u5 r- P1 U2 v. j9 d, u

0 l  Q0 Q% J3 s6 z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 g& |# X& |6 ~0 f. [
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % |: t: n( A% C
  若对方沉默、背叛会让我获释,所以会选择背叛。 + e0 f+ u) v  _; S
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. X3 B# i, C  i  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% _( X% p- N) D2 a4 r" t  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 I( H9 A; o. |4 X. v  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; G, I  i3 n  ~+ J& a[编辑本段]二、智猪博弈理论
8 t1 [" |+ z9 m9 Q  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 i: y/ N, J1 v, B1 E- A' [( a$ w. E
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
# N* }- B) ?2 B) r' V% L5 j  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; b, d- x4 H. j, g7 Q3 V" B9 N6 u  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( B8 I/ \" D% q& s$ r( r  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : L) v  `0 v/ Y3 H
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) @8 M% x) c: K% j" T  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& b8 @6 R" S$ N  " f' b( ~: R7 }3 R% `
三、关于企业价格策略/ ?! D6 A, t7 G" _! U
3 f  b- t6 H# y( `
  
. F3 @! b7 Q& s  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
# m7 q! Z  V* r. A  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (https://laomiw.com/) Powered by Discuz! X3.4