老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
" \2 B7 ^- m3 q' }: I) [
/ [: w8 [; [6 [0 d严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, s4 [: j8 `: F, ?/ }1 ], a
  以下三个定义:
7 I) S/ t$ [! ~* w$ D/ `- k  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 a7 i/ M  F3 y6 H5 S
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 c0 A4 o( |6 d3 s: W  w; S
  所谓的双方优势策略则是指双方利益总和最大的策略。  
, u( P$ p% F! T. O, ]5 l[编辑本段]严格优势策略举例分析
/ E/ [$ s3 }3 s, B  一、经典的囚徒困境
3 @7 n1 F3 s! o* Z: c5 ~  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * v6 x& D. p5 ]" h/ V4 p
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( m9 e3 w) n$ f8 T* ?: u  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 " l. Q  e( X0 a* E- S$ z3 L
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - q1 i, S( v0 a6 d$ c
  若二人都互相检举(互相“背叛”),则二人同样判监2年。7 {. l& \1 z3 ~
  
# m) i. K+ |; o" T/ A( v$ t3 T9 ^6 f用表格概述如下:& B) [+ _( H: T$ `& U
" K: i; I- q7 |) \
    甲沉默(合作)  甲认罪(背叛)  : I5 l8 H5 p( U& N4 r
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  8 S: ]; q& O* b0 m! B
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ K2 R& t/ l! \7 B2 n0 v' j4 d' e6 |' E3 \$ h. ~3 ^/ g: J
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 A) E& ]  |/ |0 O  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 n0 H" ]- k( O/ k% E
  若对方沉默、背叛会让我获释,所以会选择背叛。
0 V- h$ g! G) O  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 D( `( T- g' J3 E& c7 z- K. p
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 x; a0 [8 V4 y! B$ E3 m) l6 E  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% P5 B5 N- ~" j8 b4 J  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
  v" y* N6 O) w& i2 `7 D4 l[编辑本段]二、智猪博弈理论7 Y/ Y3 k/ [2 X% g
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# y& i' @% _  |2 Q# T& ~5 ?# _  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; A: @+ H7 W1 N6 V( K- ^
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 `* `% N8 `/ E# Z0 B  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 h. F* a) u2 ^: L0 V+ i
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 M' X/ g0 d, u+ i  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  Q, B  U% H+ ^2 W3 V5 O  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。5 |0 |$ Z9 H4 G8 C1 Y9 K" A1 ]
  
7 K* x0 i3 c4 L9 T三、关于企业价格策略/ X& W  m# E9 P1 R
" \1 z/ c8 w. v  x; q# ^$ W8 [
  
( g5 e3 o/ p& g  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 \# J, N9 g6 d. R
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% K5 D+ t. R' _1 [. _5 C
  以下三个定义:) i  P: n* f5 O# X8 G. B
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ! `7 M' M' N; j, v' C
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 \0 p1 K4 ]9 {: O( D
  所谓的双方优势策略则是指双方利益总和最大的策略。  
. ?9 w4 j8 \( a0 C[编辑本段]严格优势策略举例分析3 e* u/ ]& k# d
  一、经典的囚徒困境 " M- ]" _" q) K# q& t) V) R. ^
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
  d( p1 p: E+ S6 L/ {' {; k  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . b% e. z# v5 z- r
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
  _/ L. L& ?+ o. z4 B  G  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 f' e5 G7 h* b% F: F1 c; m0 f$ P  若二人都互相检举(互相“背叛”),则二人同样判监2年。! g; m; r6 O9 G. I$ B
  $ {: U; G+ u- o; j! k$ N; [: A& M- q
用表格概述如下:4 J# V8 g1 F, S7 }  C7 j! W
% o2 ^6 _- S7 [
    甲沉默(合作)  甲认罪(背叛)  
5 o0 f2 Y2 ^, r# ~* f乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; A$ s5 W# [# m3 J9 u5 `
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
) ]# }# {- _" c! M& L
" z$ N1 u1 J% k7 Q- ?9 B! U: [* |  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- v& A; M+ ?( |+ _  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- ?. I2 e; n" p2 N, a5 @8 x  若对方沉默、背叛会让我获释,所以会选择背叛。 . s" j, n; s% [, R
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- l" h( Z! F' n  A% M  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 I7 h! G( K* ~( ?
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 k5 Z4 f4 y% y4 G
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 e& n( G$ @8 y0 b[编辑本段]二、智猪博弈理论9 `; f$ X) w! ~& Q+ V
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ ~8 q0 `- C2 g- T' B2 U  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 L. c- e; \# e6 m
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 d' p& f5 H- p( a# K
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' J0 L2 n0 I* I6 p4 ]  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 `. @3 c0 \+ J$ d# S& A6 T  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 n) i  l2 U4 T- s7 j3 Y- M/ v  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ z: R6 b1 f  T0 t7 i  
1 a' S: a; P& B. [' A1 `三、关于企业价格策略
1 M% v/ _0 m; B: I- G8 b: t: g& u+ d) X- o# @' R- t% R% ^! U1 P
  : F0 r8 O% L) s
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) f% R/ A: y8 `; L, U$ J  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- x9 _; q: L$ q; U' x  以下三个定义:
. r$ {. }( L1 r% o" j6 o  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 |0 q3 K2 e, ?7 ]; d  w
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 _; g. {- |1 t, i" ]
  所谓的双方优势策略则是指双方利益总和最大的策略。  
" g1 `' @& q+ w; L" Z[编辑本段]严格优势策略举例分析) @1 _$ l2 y4 ?: A) h3 ^
  一、经典的囚徒困境 ; L; Y$ C+ r8 w0 F  a
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:   ?# h% I+ U5 u* b3 C
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, n1 h" K( g$ L; T  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; X! A& m  W7 j1 ~' d  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 ^% O6 ^, B2 E$ K% `+ D$ ^) G" {
  若二人都互相检举(互相“背叛”),则二人同样判监2年。8 J; K1 s/ t4 c( q
  3 ^% k) N& Q6 i" ?6 @( R' m
用表格概述如下:
6 F4 a& k$ I3 j, `
3 I4 L4 m" Y* j) }) G    甲沉默(合作)  甲认罪(背叛)  
- o  q! t! x+ j4 K) Q% x9 I- z乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  % H3 R9 u1 E3 D7 a" |/ e- ?1 ]- ~
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
3 v, Q4 M, E8 R
. u8 b+ K9 [6 r1 A  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' S4 H5 W5 L# [& ~+ Y( u  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) k+ k# w5 M3 C: E, A- r: P" b. I
  若对方沉默、背叛会让我获释,所以会选择背叛。
# G) R, X5 T$ J) i8 K  X  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* x1 Q/ _+ _- n  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; w* |( k( Y. Z, m
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 k2 k8 p, s0 C0 @4 ]# v
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 W1 d0 m2 K$ D- i0 D+ c[编辑本段]二、智猪博弈理论2 {, W; [. ]- q0 u  z
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ) `- p: {1 T/ I9 h. ]
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + f: S& d6 _- w* T) C
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , [8 v) |6 u1 F: }! j
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 Z* y! U$ r3 L0 c$ V# T  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 Z6 B+ [: N4 l4 @& K
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) ~9 K# I  L5 M; x- q  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( \# S, u- P  j* j) i, `  
" b8 ?! Z% B; v( x三、关于企业价格策略, b; q5 M  ^$ h
, |3 b) Z2 _; @
  - P6 ^7 X8 j6 L5 L
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 ?) o  w* E1 Y8 X  @3 u) E7 w4 |0 b  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
6 {6 I4 s3 i# k. B: o  以下三个定义:
  S8 o* P( d$ E7 x+ y  `' n7 `$ ]& d6 M  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 [% {$ ~" X5 W* h9 R" w' l  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' b. I3 Y- E, A$ U: W' L2 w3 I  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ D. X3 D3 J1 P[编辑本段]严格优势策略举例分析  U5 i. `/ ~+ H: d$ h
  一、经典的囚徒困境
2 U6 a1 L# U9 U! [/ d$ D  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + U/ S6 k! i; _& _/ \8 t6 K
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + @8 `& L" n! y
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" s( k3 n/ G9 N3 N  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。   J' l( G6 Y6 F( F
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 I* A; Z1 M; L* v6 \; N, w  6 m2 h) ?# h* [5 L* O) \1 A1 C! m
用表格概述如下:
5 H; x; g3 T0 |2 y
# @2 e; w( u7 _& g7 |5 K& l    甲沉默(合作)  甲认罪(背叛)  
) ?. N; s4 j1 G乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  2 \- t# O- \9 P
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年    w" J6 S5 u; Y2 k1 B& s) Z& Z1 c
' q1 c' z1 ?! w' _+ l. V! u
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) a+ E# {& E$ z& i) c2 z$ h. c+ m
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 4 ?* K4 j  y4 |) t; }
  若对方沉默、背叛会让我获释,所以会选择背叛。 1 N) I. P' p$ @% ?  j1 m
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 E6 \$ s% l$ ?( ?0 b7 [/ n& P! j  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 h3 m! F0 d5 ~8 r) D/ ^/ T% Z
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
  ]5 v; y0 _$ U+ V7 p  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* B* H: C( B* y' y0 R[编辑本段]二、智猪博弈理论$ j* ~2 p( z  Q0 K+ l
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * n" L5 Z, S. m( {* f5 k) M/ Q* y
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 I5 w- I: a2 y) p3 ]! F  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ) [3 ~# @* X5 |& g2 z' V' b
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ) E" i3 }- {$ \8 y) {
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" C8 S4 l9 Q5 `$ r0 l0 G  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; p8 {; h' ?' e1 M; L1 R& {8 a
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
  h1 J! B- t( L* [1 g, H, M  1 G1 w. E' M1 M+ u
三、关于企业价格策略
) e& f/ D' w3 ?1 Y& \
9 |0 Z/ W; d# t8 @# j& I- {  ; u+ ~; O( _9 u3 P) X& j7 u: G
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' N$ t; O$ @% a
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (https://laomiw.com/) Powered by Discuz! X3.4