本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 , `- u% n% ]& f5 j6 @4 ~
5 j$ B$ J8 P; R严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 h% y' `; O1 e/ g7 h; R4 ~* v
以下三个定义:9 D6 I g& q# v# _- c
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 N6 u+ R: n) V; c/ g9 g
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 @1 V0 a+ z @9 F) c# o4 ~
所谓的双方优势策略则是指双方利益总和最大的策略。 2 E8 T0 u3 j4 N+ e
[编辑本段]严格优势策略举例分析
9 U1 ?/ C/ ?3 p; V4 e8 v 一、经典的囚徒困境 $ I- c7 L+ Z# ?, L/ H$ k7 E5 F+ x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 V( I: e% f2 z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ~9 T, r( Z; s# p% c7 f$ I
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 o3 y3 z, ?( C" C- O
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# U; W& `6 J2 ^ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 K3 p6 U' c2 S$ C. B
2 t/ {2 \7 k% m/ e3 j. r; L, Y用表格概述如下:% e; i! M" P9 p% y4 ?( m
9 i$ }" `+ X( S 甲沉默(合作) 甲认罪(背叛)
* W( {# Y2 U2 K( f g: i ?乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 N" W2 `# W/ v4 h, ~5 A2 r
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + N9 F+ F8 H s/ h/ ^& Y/ o
2 ?1 g' ]$ E: E4 b8 L& y
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 N6 u2 N* i) b" _
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , h9 S, Q$ K; p6 Q( @
若对方沉默、背叛会让我获释,所以会选择背叛。
+ E& `1 L0 E! p, M3 t1 h 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) d' Q0 A F) X0 f# u) @ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 \8 m0 {3 n8 b 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 D6 Q# F& q8 c, K: C9 J5 b/ z. f 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' j# V% G% y* ` W' z3 B+ P8 U, ~[编辑本段]二、智猪博弈理论7 y: _( g) j n: |* P& x; l O
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * B, W3 w! I5 X' U# {& ?( _3 ?
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : c( ^! _9 w& {8 a5 h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. j! }; X+ q% b- b+ Y5 |+ H" o, l 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; I$ R1 Y: B2 g$ s7 Y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
j/ O4 W5 ~ z7 s3 U' C' x) a 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) v" u* E6 T$ K: U* a4 b! r
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 s$ Y1 e# \6 ~1 {8 T+ S ( R: L0 _; E% s& d) d0 H; Q
三、关于企业价格策略# e5 }& A, M' Z1 V: P/ K
1 R4 s* S9 }! f8 x: R; \$ g' k6 P
8 N2 U2 j) C( @& S
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; Y3 a+ G7 l9 X! d4 l, c1 A 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( T+ [4 U% w- U3 a 以下三个定义:, l" ^! ?' L# _
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 T9 x3 ]/ U; y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 U E5 q/ w8 n0 Y# L) x m. e
所谓的双方优势策略则是指双方利益总和最大的策略。
F/ L4 V; b$ n[编辑本段]严格优势策略举例分析
F' y' M, P- R+ @, o: i/ x3 z 一、经典的囚徒困境 2 X9 G/ G9 M1 n% L
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; v/ q7 F# K4 @7 H) _
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: _. T% [* E3 g
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" i( ~, K3 Q, g& L0 G% P 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 [% {# N% A H/ ~ U3 y( M1 x3 U5 `
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: B" q& F" X& o! r; b# b
( |0 S. r; Y& B+ t) I: w; ]用表格概述如下:8 g& R: I4 O1 ^. l7 [4 B/ k
t7 \1 B, J" k 甲沉默(合作) 甲认罪(背叛)
+ h; e" P5 V) ?- V# o乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
: \" p2 Z. Z( F* V6 Z乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & @5 g* h9 A4 T
* U! P) W9 t' A. D
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
3 R. d" X+ H5 f" y% U 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 m% a4 s. @- ^2 G
若对方沉默、背叛会让我获释,所以会选择背叛。 ; N) X- s0 v7 I" L
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 w+ g; C. m9 H! Z) N _) @7 n: R! z9 W 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 , t/ M% A7 l" Z3 R
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 j |* s5 }' a
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* y, j6 K' p$ W% V1 ^[编辑本段]二、智猪博弈理论) t) k7 X) R, Z5 G( |
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 x3 `% D( a2 I4 S# u
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , M' Y( u0 k) {$ k8 b7 \6 p
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ X6 M( f; P$ v. s0 H 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& ~8 L7 |# P2 { m “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' y9 L5 m: r+ u 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 w0 }8 D9 r, E# B; x
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" J: ~' b4 m& E; j
8 h' ^* `) G6 D+ I2 w# u' P. e三、关于企业价格策略
% K0 |0 k9 q* X- c- e+ d9 d& P4 s0 t5 {5 q
! m5 ~) Z1 Y9 k, C, j! s( v# v
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 v# K" h9 J" A" M 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) x0 `' J" w2 A
以下三个定义:
, \0 v) g. A, q5 Y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 t+ j, u: a% Z Q3 z2 {8 A 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 O% M+ k9 }, l) T
所谓的双方优势策略则是指双方利益总和最大的策略。
! N* S- I, \5 w& i- O[编辑本段]严格优势策略举例分析
$ d! ^: @7 `5 A6 `/ x 一、经典的囚徒困境 + v0 a: C1 ]# \( j7 h
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % p0 y5 e- K- j0 m( N! H
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 \& r# |2 ^7 r6 t% `% J 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* f) p" Q) i: M0 O3 p 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 o+ T9 Z) O' L 若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 Y% `& _# Q0 N 5 |" G5 K8 K8 M2 Q
用表格概述如下:% x" N. }5 V" z6 z4 Q9 L' C c/ B
( O! M. e+ z7 L- I n' N: }$ j 甲沉默(合作) 甲认罪(背叛) + F9 n: C+ k6 K
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 3 u2 ?3 v$ j/ j$ r/ h4 ~
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 \; Y* H* N7 U6 z; D3 {' A% P5 S* N0 W$ {
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % P$ C( Z& E) g% [5 u# [8 I
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % s9 X7 N. _ l: P' u
若对方沉默、背叛会让我获释,所以会选择背叛。 8 \+ z1 P6 q# g' y+ i& j; E
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 X% O1 a9 i& }0 ~5 R0 g/ X 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* z; u, ]7 h( F# D$ T7 ` 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
m6 y% S1 c3 A: n3 J. D 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. U. i- I5 w" y' i% s! }( g* `[编辑本段]二、智猪博弈理论 ^0 p ?6 I% T& h1 ?" Y' `
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 s' M* w( u' K+ t; [6 y/ E
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; k2 B7 H% }5 q+ S& N+ X1 v 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 y8 Q# q0 b1 D3 C3 f5 p6 ~/ H 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ P7 N$ |( D7 T p9 @9 P& O
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 i9 n5 s' j4 r7 g& n Y; v2 ?
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
0 N1 U$ U, X3 a% A3 V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# a# a* j, C% D' ~5 J% k
4 x; [; v; r- P `* A三、关于企业价格策略" `; G# h. h( P3 K5 o T
: ?, O; N! Q1 D% m) [ & Z9 z- @+ c4 v4 ~- M: F( n8 y u
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) y. U8 }; F% T9 Y+ U: }. [ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 W( k9 K" |/ x1 I. {2 m% |! O 以下三个定义:
' u* t k& }. m( f) g 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 e3 N1 Z0 a7 @6 |/ G 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 / e$ F& N1 Z7 B' \/ {
所谓的双方优势策略则是指双方利益总和最大的策略。
/ b( e$ s% J; b. L! I[编辑本段]严格优势策略举例分析8 `3 W6 J" Y7 A5 ?2 [
一、经典的囚徒困境
r9 y6 c: z: G# s2 ]' q 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 _% M& m- R, y+ i' N
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ U2 q% H$ x7 m2 r$ K 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
E+ S' n2 }% r; |' S. S1 B 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 D0 H4 w1 O9 C! w& x7 |
若二人都互相检举(互相“背叛”),则二人同样判监2年。
* ~7 I. @/ i7 I' s3 V3 j
& u1 o5 B! B0 V/ k/ D( S用表格概述如下:7 S0 S) p0 ~. U! n- o7 v( A: Q
6 d7 U$ a) q! Y* w6 a5 _! T
甲沉默(合作) 甲认罪(背叛)
6 `- v, J1 _1 ~5 d乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 o7 c' Q* i$ ^) @
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 [/ `! S5 p' D2 o* {7 p* T2 Y+ `( I7 J
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! {: q! j. O* X) \: @. {
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & U+ e. K4 B' U; k" Y1 N
若对方沉默、背叛会让我获释,所以会选择背叛。
2 w" S6 n& Y* g" y3 ?9 r, |2 g 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 a* T l: u5 j6 W( U! K4 u
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# n: z! v: |# k( C5 h 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 v. d' f/ I2 G; r- \ p
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 [0 J7 T. ^& J+ G[编辑本段]二、智猪博弈理论, A# y2 w' u. _8 J" [
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 e) C/ S2 ?5 q+ v5 w$ e, P 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 B6 A H# m4 {9 O" ^# | 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 p6 ]3 W9 g' ?/ f
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) ~2 [8 n7 y' O “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) o! X( Q0 l" O( N S% W1 Q Q
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ P |+ _5 U' W' \# a ^3 Q 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) u4 S) v i S7 F
; Q# C1 W) Y* |) r' @9 j
三、关于企业价格策略, U# D/ i) p" ^+ i/ _: }0 w
) K! K$ S( S4 I& |9 Q8 P% x) i
! ]' l7 t" x5 l: Q! B4 e1 ]8 I" a
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 A5 n1 N( K# @! { 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |