老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
* Y, L/ z# S# G) z1 ~) Q2 L2 ^
7 Q8 C) _( E, A" E
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: E8 r V0 f1 \ V+ s; r- P2 A a
以下三个定义:
! _5 T7 @7 V, L6 _
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ U6 c8 s+ _5 d% R3 f0 n! z
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 b5 V( U+ e* E! O2 S- y
所谓的双方优势策略则是指双方利益总和最大的策略。
- v- Q3 \6 T& h A3 H) s& N
[编辑本段]严格优势策略举例分析
+ g! u b! j( t8 E9 g: { n( h- q
一、经典的囚徒困境
* S- c1 |; `+ k$ M- e
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; Y; R6 o& _/ `- |" r
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, z! k5 H; _ |. M2 |% O ^$ z
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
: i8 R, O$ h" {
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% [) N3 X2 ] m, s- k
若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 p; G! g( _! ^; w/ O9 m0 r
{/ }! G: R; X" L d* v1 R: A
用表格概述如下:
7 j7 G9 @0 b: f2 K! d3 E8 I% ~, l
5 D3 ~3 D2 h1 }: T% W5 ~8 i7 R
甲沉默(合作) 甲认罪(背叛)
, U5 g9 B5 O6 J& e; X
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 w' S; A8 O( P4 [- T! j
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
6 }% h. U* k- W
9 m! A6 ]7 v { G Z P
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 A! r+ Q( T+ c
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; H% `2 p! K7 Q H. A
若对方沉默、背叛会让我获释,所以会选择背叛。
: | M. D5 ?% Q: D8 W
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( h! B+ H3 t5 [& A3 y T
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 c4 e8 O* a3 L
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: [2 M3 V9 \6 s ?, D7 |( j
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% b: S; G- o3 q: ]1 y6 U. D
[编辑本段]二、智猪博弈理论
' c" f" [+ [3 o7 z0 O
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
, \& u! m( d9 p
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- D) r6 z9 z) ]' G1 J5 s0 V# E
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: v- t7 u5 T; B9 n! m
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( j3 E7 \3 [1 F8 N, k" H
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: p2 [) O: U7 O: Y5 G4 P- H- d
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! t0 {8 t5 Z1 ^' t0 |! F+ F* p/ B
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# G% y( `3 @' M3 ^1 c- D
& n0 M3 M! z9 }5 m& ~5 ]) S
三、关于企业价格策略
2 y9 o' I. N ~: x$ z1 x
: H) ?/ v: y! |- E
0 E3 n3 C6 A. i o4 ]
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 j& N2 a9 i3 d9 w! j, G
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: u* D; U6 \/ h x5 e
以下三个定义:
* D; G6 g* E m' \
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ ?4 B3 p) A- l
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 u+ E2 M8 B, J( z8 N& L a# Q
所谓的双方优势策略则是指双方利益总和最大的策略。
" J1 y* z7 V# p6 x4 i
[编辑本段]严格优势策略举例分析
) f: D7 {3 o8 u( q
一、经典的囚徒困境
5 z' ]) ^( ]- J% `+ m/ k
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" e- D0 }; d7 |9 i7 }
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
! R0 x# }; B* `- A
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
f0 x6 _: G7 T5 N U- F
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
' K: u+ _" r+ x* V
若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 ]" \% w8 Q& x( f: M
. K$ r% p0 Q/ d& a! W
用表格概述如下:
% S% {& A$ G) { k. V/ d/ ~
) ^) }" X- o! E% E) {$ Z8 @9 c
甲沉默(合作) 甲认罪(背叛)
8 V! n0 D1 Z. p9 X7 p7 [8 Z) Q' M- A
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
: I: W, e" x1 |4 O6 t# b8 Q
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
2 x7 q6 O3 Y4 L' f
" `7 A' d4 y8 Q& {. E. c
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. [9 W$ l! d' d
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" k9 ^* O( B l
若对方沉默、背叛会让我获释,所以会选择背叛。
0 {1 A6 {$ D4 C( [9 Z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 _" I' m4 K1 z' J9 f: q
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 B! V6 a# _' b' _6 j i
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 q- `0 y% P+ a& y% \9 m v# k
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, V0 s9 g/ o" c9 O. [
[编辑本段]二、智猪博弈理论
1 p9 r- l5 R+ i! H
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 V4 B# j0 H( a" L% e3 X
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. [# q4 P. r& g# i* V3 y8 ~
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( E% A9 f& y$ m
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
Y7 q: o" \# p7 j" @( q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% }; I5 c) d8 T! }+ h
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 m- V/ }0 b, R% z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* c2 R8 {, w, b4 d
. }' l( v. a' a8 Z
三、关于企业价格策略
& o3 R) g1 j' h/ \+ |
0 V( t; O. p: G r( p0 G5 P% \1 E
! q: l" |7 X; T9 y: a+ ~! X. m2 {
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
4 X- c6 _8 A0 ]2 k
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# u; H/ l) J' r& p4 z
以下三个定义:
9 K2 N6 M0 u5 y! S. L& Z, X8 l, u4 ^
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* W3 _+ J/ H1 ?/ [6 \. y; ^
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% W- y" L( _( h4 G
所谓的双方优势策略则是指双方利益总和最大的策略。
3 R, z1 F/ X+ ?3 X# |
[编辑本段]严格优势策略举例分析
& p) o4 _& n) c0 [
一、经典的囚徒困境
% x' v2 ]% j& R
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
0 z3 w# @2 Q& y6 [/ `/ \
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 r; h/ N( `& \8 i3 F* ^, J- A/ A& X
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 ?! ?& a) ^) G4 D* o
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ b: n9 p- y; f. ?
若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 E6 r: u* V5 k5 q* u/ @% ?
8 \2 _4 z5 o, L* ~% ?
用表格概述如下:
! Q. f9 |0 {! {% g8 S; [1 y3 q
# l8 R0 p2 ~: D$ K% g2 Y$ p
甲沉默(合作) 甲认罪(背叛)
. Z* o v9 m; U9 ^+ {8 ?6 ]4 s" j3 M
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ O( B/ e1 _9 o
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. W) k; U4 i7 A" i6 F4 ?
+ ?2 l. V3 o2 s7 I2 {" c
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; {! u; y5 @/ ?0 Z, b2 T
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& H+ `: ?( H. G
若对方沉默、背叛会让我获释,所以会选择背叛。
6 v! d) j. C/ h9 e7 U$ b+ X4 A/ i
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. b$ x( W Y3 N; T3 b) I
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ H8 G* {9 Z- r' v) {% P
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: u& J8 Z5 V. Z/ e' {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
9 W8 v& g2 _1 ~0 t
[编辑本段]二、智猪博弈理论
% a2 t% Z+ D/ x3 X+ t7 V1 [/ Z3 ~
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ L0 G* S$ J S& F9 r
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
# e ^+ M/ Q4 f( N% q) P! [
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; u1 j* B; J+ w
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! C, i: ^' r3 @
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# I0 j1 q& b$ h& W5 l' b. X2 Z! D
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* ?# g; P8 P- Z" o' q2 z# o
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ U8 W K1 R. K/ \ M' q/ ]/ z& ?. U
; |5 u8 }% ]. [! o& i
三、关于企业价格策略
_+ G) P6 G5 X' {$ o
5 G0 K" i6 K; L
$ i3 a+ N4 h/ {9 |
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 m/ T- m7 s$ R+ e$ p$ D' n) h
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! o& p. n' X3 P# y/ ?$ o
以下三个定义:
5 ^, w3 t: T- _
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, X6 _5 [8 ]; q3 A5 _' w2 g5 ^
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: o. N% C' h3 }. D
所谓的双方优势策略则是指双方利益总和最大的策略。
6 I4 k: p5 e# [4 V+ u9 N
[编辑本段]严格优势策略举例分析
* k$ K1 @2 T+ Q- W2 b t. D
一、经典的囚徒困境
: a$ Q2 P4 M: z7 q
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 r/ @- e6 c- k) ?! y2 b) a: U' {3 h
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ Q" }4 x( ^: T$ v) p+ S, O
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% R& D; B6 v+ N: i' P; s
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ h3 x# W9 f' `9 ?
若二人都互相检举(互相“背叛”),则二人同样判监2年。
' C$ x5 Q" r) d! d+ |
; _$ z; a& z8 o% @" Z/ G
用表格概述如下:
/ J; w# H5 z# Q0 p# I n: p
/ h; `$ N( Q. \3 |* L; G- ^; Y
甲沉默(合作) 甲认罪(背叛)
4 f; y/ q$ q% h) ]. j7 t4 e5 v1 Q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
- B. d( v1 a9 f
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 X1 B5 R) [ `$ H) C
" r7 N ?' e" m) Q) F7 m) S
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. T: ~! _7 b% U- L* O; f3 K
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ N+ d9 `- k/ n# j
若对方沉默、背叛会让我获释,所以会选择背叛。
0 i/ S# }% k4 Y+ Z3 D7 [
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 R' h# U) [' _$ y' n3 x
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 u1 t8 S$ c! W2 e
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 N8 B- E6 ]/ D/ n: T, H# P
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
Y" H: o3 w, m' ?
[编辑本段]二、智猪博弈理论
9 F9 {( v2 u4 Y3 Z4 ^4 o
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& I; U( F& `, F: ]) R( K7 N* M+ y
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 J. W8 _2 Z4 M( d8 u4 z( b
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 K0 U6 [8 l8 k' e5 M1 X
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 c; y% q' |% d2 P% ~% S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 x. ~" W- K8 n" s9 h
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& L4 x |1 d; ~7 W) A# p* q0 B' x3 G. V
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ Q$ O- q7 Y; Z, v q# ~- k
' r2 I% K3 X! ^$ |2 ] c; V
三、关于企业价格策略
$ ~$ C, y. P( f
- A7 @% \! u6 a' w7 y, W- V
, G' o+ I i) V$ J+ K
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 z- X5 V: Y" O( d4 \
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (https://laomiw.com/)
Powered by Discuz! X3.4