老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * Y, L/ z# S# G) z1 ~) Q2 L2 ^

7 Q8 C) _( E, A" E严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: E8 r  V0 f1 \  V+ s; r- P2 A  a  以下三个定义:
! _5 T7 @7 V, L6 _  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ U6 c8 s+ _5 d% R3 f0 n! z  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 b5 V( U+ e* E! O2 S- y  所谓的双方优势策略则是指双方利益总和最大的策略。  - v- Q3 \6 T& h  A3 H) s& N
[编辑本段]严格优势策略举例分析+ g! u  b! j( t8 E9 g: {  n( h- q
  一、经典的囚徒困境 * S- c1 |; `+ k$ M- e
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; Y; R6 o& _/ `- |" r
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, z! k5 H; _  |. M2 |% O  ^$ z  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : i8 R, O$ h" {
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% [) N3 X2 ]  m, s- k  若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 p; G! g( _! ^; w/ O9 m0 r  
  {/ }! G: R; X" L  d* v1 R: A用表格概述如下:
7 j7 G9 @0 b: f2 K! d3 E8 I% ~, l
5 D3 ~3 D2 h1 }: T% W5 ~8 i7 R    甲沉默(合作)  甲认罪(背叛)  
, U5 g9 B5 O6 J& e; X乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  6 w' S; A8 O( P4 [- T! j
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  6 }% h. U* k- W
9 m! A6 ]7 v  {  G  Z  P
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 A! r+ Q( T+ c  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; H% `2 p! K7 Q  H. A
  若对方沉默、背叛会让我获释,所以会选择背叛。
: |  M. D5 ?% Q: D8 W  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( h! B+ H3 t5 [& A3 y  T  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 c4 e8 O* a3 L
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : [2 M3 V9 \6 s  ?, D7 |( j
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% b: S; G- o3 q: ]1 y6 U. D[编辑本段]二、智猪博弈理论
' c" f" [+ [3 o7 z0 O  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
, \& u! m( d9 p  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- D) r6 z9 z) ]' G1 J5 s0 V# E  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: v- t7 u5 T; B9 n! m  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( j3 E7 \3 [1 F8 N, k" H
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: p2 [) O: U7 O: Y5 G4 P- H- d  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! t0 {8 t5 Z1 ^' t0 |! F+ F* p/ B  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# G% y( `3 @' M3 ^1 c- D  & n0 M3 M! z9 }5 m& ~5 ]) S
三、关于企业价格策略2 y9 o' I. N  ~: x$ z1 x

: H) ?/ v: y! |- E  0 E3 n3 C6 A. i  o4 ]
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 j& N2 a9 i3 d9 w! j, G  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: u* D; U6 \/ h  x5 e  以下三个定义:
* D; G6 g* E  m' \  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ ?4 B3 p) A- l  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 u+ E2 M8 B, J( z8 N& L  a# Q
  所谓的双方优势策略则是指双方利益总和最大的策略。  
" J1 y* z7 V# p6 x4 i[编辑本段]严格优势策略举例分析) f: D7 {3 o8 u( q
  一、经典的囚徒困境
5 z' ]) ^( ]- J% `+ m/ k  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " e- D0 }; d7 |9 i7 }
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ! R0 x# }; B* `- A
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。   f0 x6 _: G7 T5 N  U- F
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
' K: u+ _" r+ x* V  若二人都互相检举(互相“背叛”),则二人同样判监2年。2 ]" \% w8 Q& x( f: M
  . K$ r% p0 Q/ d& a! W
用表格概述如下:% S% {& A$ G) {  k. V/ d/ ~

) ^) }" X- o! E% E) {$ Z8 @9 c    甲沉默(合作)  甲认罪(背叛)  
8 V! n0 D1 Z. p9 X7 p7 [8 Z) Q' M- A乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
: I: W, e" x1 |4 O6 t# b8 Q乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 x7 q6 O3 Y4 L' f

" `7 A' d4 y8 Q& {. E. c  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. [9 W$ l! d' d  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" k9 ^* O( B  l  若对方沉默、背叛会让我获释,所以会选择背叛。 0 {1 A6 {$ D4 C( [9 Z
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 _" I' m4 K1 z' J9 f: q  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 B! V6 a# _' b' _6 j  i
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 q- `0 y% P+ a& y% \9 m  v# k
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, V0 s9 g/ o" c9 O. [[编辑本段]二、智猪博弈理论1 p9 r- l5 R+ i! H
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 V4 B# j0 H( a" L% e3 X
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. [# q4 P. r& g# i* V3 y8 ~  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( E% A9 f& y$ m
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。   Y7 q: o" \# p7 j" @( q
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% }; I5 c) d8 T! }+ h  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 m- V/ }0 b, R% z
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。* c2 R8 {, w, b4 d
  
. }' l( v. a' a8 Z三、关于企业价格策略
& o3 R) g1 j' h/ \+ |0 V( t; O. p: G  r( p0 G5 P% \1 E
  ! q: l" |7 X; T9 y: a+ ~! X. m2 {
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 X- c6 _8 A0 ]2 k
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);# u; H/ l) J' r& p4 z
  以下三个定义:
9 K2 N6 M0 u5 y! S. L& Z, X8 l, u4 ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* W3 _+ J/ H1 ?/ [6 \. y; ^  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% W- y" L( _( h4 G  所谓的双方优势策略则是指双方利益总和最大的策略。  
3 R, z1 F/ X+ ?3 X# |[编辑本段]严格优势策略举例分析
& p) o4 _& n) c0 [  一、经典的囚徒困境 % x' v2 ]% j& R
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 z3 w# @2 Q& y6 [/ `/ \
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 r; h/ N( `& \8 i3 F* ^, J- A/ A& X  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 ?! ?& a) ^) G4 D* o  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ b: n9 p- y; f. ?  若二人都互相检举(互相“背叛”),则二人同样判监2年。7 E6 r: u* V5 k5 q* u/ @% ?
  8 \2 _4 z5 o, L* ~% ?
用表格概述如下:! Q. f9 |0 {! {% g8 S; [1 y3 q

# l8 R0 p2 ~: D$ K% g2 Y$ p    甲沉默(合作)  甲认罪(背叛)  . Z* o  v9 m; U9 ^+ {8 ?6 ]4 s" j3 M
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ O( B/ e1 _9 o
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  . W) k; U4 i7 A" i6 F4 ?
+ ?2 l. V3 o2 s7 I2 {" c
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; {! u; y5 @/ ?0 Z, b2 T  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & H+ `: ?( H. G
  若对方沉默、背叛会让我获释,所以会选择背叛。 6 v! d) j. C/ h9 e7 U$ b+ X4 A/ i
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 . b$ x( W  Y3 N; T3 b) I
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ H8 G* {9 Z- r' v) {% P  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: u& J8 Z5 V. Z/ e' {  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
9 W8 v& g2 _1 ~0 t[编辑本段]二、智猪博弈理论% a2 t% Z+ D/ x3 X+ t7 V1 [/ Z3 ~
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / L0 G* S$ J  S& F9 r
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # e  ^+ M/ Q4 f( N% q) P! [
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; u1 j* B; J+ w  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! C, i: ^' r3 @
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # I0 j1 q& b$ h& W5 l' b. X2 Z! D
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* ?# g; P8 P- Z" o' q2 z# o  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ U8 W  K1 R. K/ \  M' q/ ]/ z& ?. U
  
; |5 u8 }% ]. [! o& i三、关于企业价格策略
  _+ G) P6 G5 X' {$ o
5 G0 K" i6 K; L  $ i3 a+ N4 h/ {9 |
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 m/ T- m7 s$ R+ e$ p$ D' n) h
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! o& p. n' X3 P# y/ ?$ o  以下三个定义:
5 ^, w3 t: T- _  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , X6 _5 [8 ]; q3 A5 _' w2 g5 ^
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: o. N% C' h3 }. D  所谓的双方优势策略则是指双方利益总和最大的策略。  6 I4 k: p5 e# [4 V+ u9 N
[编辑本段]严格优势策略举例分析* k$ K1 @2 T+ Q- W2 b  t. D
  一、经典的囚徒困境 : a$ Q2 P4 M: z7 q
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 r/ @- e6 c- k) ?! y2 b) a: U' {3 h
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ Q" }4 x( ^: T$ v) p+ S, O  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % R& D; B6 v+ N: i' P; s
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ h3 x# W9 f' `9 ?  若二人都互相检举(互相“背叛”),则二人同样判监2年。' C$ x5 Q" r) d! d+ |
  
; _$ z; a& z8 o% @" Z/ G用表格概述如下:
/ J; w# H5 z# Q0 p# I  n: p/ h; `$ N( Q. \3 |* L; G- ^; Y
    甲沉默(合作)  甲认罪(背叛)  
4 f; y/ q$ q% h) ]. j7 t4 e5 v1 Q乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  - B. d( v1 a9 f
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
0 X1 B5 R) [  `$ H) C
" r7 N  ?' e" m) Q) F7 m) S  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . T: ~! _7 b% U- L* O; f3 K
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ N+ d9 `- k/ n# j
  若对方沉默、背叛会让我获释,所以会选择背叛。
0 i/ S# }% k4 Y+ Z3 D7 [  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 R' h# U) [' _$ y' n3 x
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 u1 t8 S$ c! W2 e
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 N8 B- E6 ]/ D/ n: T, H# P
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
  Y" H: o3 w, m' ?[编辑本段]二、智猪博弈理论
9 F9 {( v2 u4 Y3 Z4 ^4 o  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& I; U( F& `, F: ]) R( K7 N* M+ y  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 J. W8 _2 Z4 M( d8 u4 z( b
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 K0 U6 [8 l8 k' e5 M1 X  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 c; y% q' |% d2 P% ~% S  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 x. ~" W- K8 n" s9 h
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& L4 x  |1 d; ~7 W) A# p* q0 B' x3 G. V  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ Q$ O- q7 Y; Z, v  q# ~- k  ' r2 I% K3 X! ^$ |2 ]  c; V
三、关于企业价格策略
$ ~$ C, y. P( f
- A7 @% \! u6 a' w7 y, W- V  , G' o+ I  i) V$ J+ K
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 z- X5 V: Y" O( d4 \
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (https://laomiw.com/) Powered by Discuz! X3.4