老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
" \2 B7 ^- m3 q' }: I) [
/ [: w8 [; [6 [0 d
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, s4 [: j8 `: F, ?/ }1 ], a
以下三个定义:
7 I) S/ t$ [! ~* w$ D/ `- k
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 a7 i/ M F3 y6 H5 S
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 c0 A4 o( |6 d3 s: W w; S
所谓的双方优势策略则是指双方利益总和最大的策略。
, u( P$ p% F! T. O, ]5 l
[编辑本段]严格优势策略举例分析
/ E/ [$ s3 }3 s, B
一、经典的囚徒困境
3 @7 n1 F3 s! o* Z: c5 ~
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
* v6 x& D. p5 ]" h/ V4 p
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( m9 e3 w) n$ f8 T* ?: u
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" l. Q e( X0 a* E- S$ z3 L
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- q1 i, S( v0 a6 d$ c
若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 {. l& \1 z3 ~
# m) i. K+ |; o" T/ A( v$ t3 T9 ^6 f
用表格概述如下:
& B) [+ _( H: T$ `& U
" K: i; I- q7 |) \
甲沉默(合作) 甲认罪(背叛)
: I5 l8 H5 p( U& N4 r
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 S: ]; q& O* b0 m! B
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ K2 R& t/ l! \7 B2 n0 v' j
4 d' e6 |' E3 \$ h. ~3 ^/ g: J
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 A) E& ] |/ |0 O
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
1 n0 H" ]- k( O/ k% E
若对方沉默、背叛会让我获释,所以会选择背叛。
0 V- h$ g! G) O
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 D( `( T- g' J3 E& c7 z- K. p
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 x; a0 [8 V4 y! B$ E3 m) l6 E
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% P5 B5 N- ~" j8 b4 J
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
v" y* N6 O) w& i2 `7 D4 l
[编辑本段]二、智猪博弈理论
7 Y/ Y3 k/ [2 X% g
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# y& i' @% _ |2 Q# T& ~5 ?# _
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; A: @+ H7 W1 N6 V( K- ^
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 `* `% N8 `/ E# Z0 B
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 h. F* a) u2 ^: L0 V+ i
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 M' X/ g0 d, u+ i
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
Q, B U% H+ ^2 W3 V5 O
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 |0 |$ Z9 H4 G8 C1 Y9 K" A1 ]
7 K* x0 i3 c4 L9 T
三、关于企业价格策略
/ X& W m# E9 P1 R
" \1 z/ c8 w. v x; q# ^$ W8 [
( g5 e3 o/ p& g
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 \# J, N9 g6 d. R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% K5 D+ t. R' _1 [. _5 C
以下三个定义:
) i P: n* f5 O# X8 G. B
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! `7 M' M' N; j, v' C
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 \0 p1 K4 ]9 {: O( D
所谓的双方优势策略则是指双方利益总和最大的策略。
. ?9 w4 j8 \( a0 C
[编辑本段]严格优势策略举例分析
3 e* u/ ]& k# d
一、经典的囚徒困境
" M- ]" _" q) K# q& t) V) R. ^
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
d( p1 p: E+ S6 L/ {' {; k
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. b% e. z# v5 z- r
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
_/ L. L& ?+ o. z4 B G
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 f' e5 G7 h* b% F: F1 c; m0 f$ P
若二人都互相检举(互相“背叛”),则二人同样判监2年。
! g; m; r6 O9 G. I$ B
$ {: U; G+ u- o; j! k$ N; [: A& M- q
用表格概述如下:
4 J# V8 g1 F, S7 } C7 j! W
% o2 ^6 _- S7 [
甲沉默(合作) 甲认罪(背叛)
5 o0 f2 Y2 ^, r# ~* f
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; A$ s5 W# [# m3 J9 u5 `
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
) ]# }# {- _" c! M& L
" z$ N1 u1 J% k7 Q- ?9 B! U: [* |
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- v& A; M+ ?( |+ _
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- ?. I2 e; n" p2 N, a5 @8 x
若对方沉默、背叛会让我获释,所以会选择背叛。
. s" j, n; s% [, R
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- l" h( Z! F' n A% M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 I7 h! G( K* ~( ?
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 k5 Z4 f4 y% y4 G
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 e& n( G$ @8 y0 b
[编辑本段]二、智猪博弈理论
9 `; f$ X) w! ~& Q+ V
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ ~8 q0 `- C2 g- T' B2 U
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 L. c- e; \# e6 m
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 d' p& f5 H- p( a# K
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' J0 L2 n0 I* I6 p4 ]
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 `. @3 c0 \+ J$ d# S& A6 T
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 n) i l2 U4 T- s7 j3 Y- M/ v
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ z: R6 b1 f T0 t7 i
1 a' S: a; P& B. [' A1 `
三、关于企业价格策略
1 M% v/ _0 m; B: I- G8 b: t: g& u
+ d) X- o# @' R- t% R% ^! U1 P
: F0 r8 O% L) s
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) f% R/ A: y8 `; L, U$ J
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- x9 _; q: L$ q; U' x
以下三个定义:
. r$ {. }( L1 r% o" j6 o
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 |0 q3 K2 e, ?7 ]; d w
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 _; g. {- |1 t, i" ]
所谓的双方优势策略则是指双方利益总和最大的策略。
" g1 `' @& q+ w; L" Z
[编辑本段]严格优势策略举例分析
) @1 _$ l2 y4 ?: A) h3 ^
一、经典的囚徒困境
; L; Y$ C+ r8 w0 F a
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
?# h% I+ U5 u* b3 C
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, n1 h" K( g$ L; T
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; X! A& m W7 j1 ~' d
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 ^% O6 ^, B2 E$ K% `+ D$ ^) G" {
若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 J; K1 s/ t4 c( q
3 ^% k) N& Q6 i" ?6 @( R' m
用表格概述如下:
6 F4 a& k$ I3 j, `
3 I4 L4 m" Y* j) }) G
甲沉默(合作) 甲认罪(背叛)
- o q! t! x+ j4 K) Q% x9 I- z
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% H3 R9 u1 E3 D7 a" |/ e- ?1 ]- ~
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 v, Q4 M, E8 R
. u8 b+ K9 [6 r1 A
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' S4 H5 W5 L# [& ~+ Y( u
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
) k+ k# w5 M3 C: E, A- r: P" b. I
若对方沉默、背叛会让我获释,所以会选择背叛。
# G) R, X5 T$ J) i8 K X
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* x1 Q/ _+ _- n
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; w* |( k( Y. Z, m
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 k2 k8 p, s0 C0 @4 ]# v
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 W1 d0 m2 K$ D- i0 D+ c
[编辑本段]二、智猪博弈理论
2 {, W; [. ]- q0 u z
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
) `- p: {1 T/ I9 h. ]
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ f: S& d6 _- w* T) C
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, [8 v) |6 u1 F: }! j
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 Z* y! U$ r3 L0 c$ V# T
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 Z6 B+ [: N4 l4 @& K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) ~9 K# I L5 M; x- q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( \# S, u- P j* j) i, `
" b8 ?! Z% B; v( x
三、关于企业价格策略
, b; q5 M ^$ h
, |3 b) Z2 _; @
- P6 ^7 X8 j6 L5 L
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 ?) o w* E1 Y8 X @3 u) E7 w4 |0 b
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
6 {6 I4 s3 i# k. B: o
以下三个定义:
S8 o* P( d$ E7 x+ y `' n7 `$ ]& d6 M
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 [% {$ ~" X5 W* h9 R" w' l
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' b. I3 Y- E, A$ U: W' L2 w3 I
所谓的双方优势策略则是指双方利益总和最大的策略。
/ D. X3 D3 J1 P
[编辑本段]严格优势策略举例分析
U5 i. `/ ~+ H: d$ h
一、经典的囚徒困境
2 U6 a1 L# U9 U! [/ d$ D
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ U/ S6 k! i; _& _/ \8 t6 K
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
+ @8 `& L" n! y
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" s( k3 n/ G9 N3 N
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
J' l( G6 Y6 F( F
若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 I* A; Z1 M; L* v6 \; N, w
6 m2 h) ?# h* [5 L* O) \1 A1 C! m
用表格概述如下:
5 H; x; g3 T0 |2 y
# @2 e; w( u7 _& g7 |5 K& l
甲沉默(合作) 甲认罪(背叛)
) ?. N; s4 j1 G
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 \- t# O- \9 P
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
w" J6 S5 u; Y2 k1 B& s) Z& Z1 c
' q1 c' z1 ?! w' _+ l. V! u
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) a+ E# {& E$ z& i) c2 z$ h. c+ m
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 ?* K4 j y4 |) t; }
若对方沉默、背叛会让我获释,所以会选择背叛。
1 N) I. P' p$ @% ? j1 m
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 E6 \$ s% l$ ?( ?0 b7 [/ n& P! j
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 h3 m! F0 d5 ~8 r) D/ ^/ T% Z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
]5 v; y0 _$ U+ V7 p
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* B* H: C( B* y' y0 R
[编辑本段]二、智猪博弈理论
$ j* ~2 p( z Q0 K+ l
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* n" L5 Z, S. m( {* f5 k) M/ Q* y
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 I5 w- I: a2 y) p3 ]! F
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) [3 ~# @* X5 |& g2 z' V' b
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) E" i3 }- {$ \8 y) {
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" C8 S4 l9 Q5 `$ r0 l0 G
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; p8 {; h' ?' e1 M; L1 R& {8 a
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
h1 J! B- t( L* [1 g, H, M
1 G1 w. E' M1 M+ u
三、关于企业价格策略
) e& f/ D' w3 ?1 Y& \
9 |0 Z/ W; d# t8 @# j& I- {
; u+ ~; O( _9 u3 P) X& j7 u: G
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' N$ t; O$ @% a
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (https://laomiw.com/)
Powered by Discuz! X3.4