关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 , `- u% n% ]& f5 j6 @4 ~

5 j$ B$ J8 P; R严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);3 h% y' `; O1 e/ g7 h; R4 ~* v
  以下三个定义:9 D6 I  g& q# v# _- c
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 N6 u+ R: n) V; c/ g9 g
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 @1 V0 a+ z  @9 F) c# o4 ~
  所谓的双方优势策略则是指双方利益总和最大的策略。  2 E8 T0 u3 j4 N+ e
[编辑本段]严格优势策略举例分析
9 U1 ?/ C/ ?3 p; V4 e8 v  一、经典的囚徒困境 $ I- c7 L+ Z# ?, L/ H$ k7 E5 F+ x
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 V( I: e% f2 z  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   ~9 T, r( Z; s# p% c7 f$ I
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 o3 y3 z, ?( C" C- O
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# U; W& `6 J2 ^  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 K3 p6 U' c2 S$ C. B  
2 t/ {2 \7 k% m/ e3 j. r; L, Y用表格概述如下:% e; i! M" P9 p% y4 ?( m

9 i$ }" `+ X( S    甲沉默(合作)  甲认罪(背叛)  
* W( {# Y2 U2 K( f  g: i  ?乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年    N" W2 `# W/ v4 h, ~5 A2 r
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  + N9 F+ F8 H  s/ h/ ^& Y/ o
2 ?1 g' ]$ E: E4 b8 L& y
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 N6 u2 N* i) b" _
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , h9 S, Q$ K; p6 Q( @
  若对方沉默、背叛会让我获释,所以会选择背叛。
+ E& `1 L0 E! p, M3 t1 h  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) d' Q0 A  F) X0 f# u) @  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 \8 m0 {3 n8 b  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 D6 Q# F& q8 c, K: C9 J5 b/ z. f  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' j# V% G% y* `  W' z3 B+ P8 U, ~[编辑本段]二、智猪博弈理论7 y: _( g) j  n: |* P& x; l  O
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * B, W3 w! I5 X' U# {& ?( _3 ?
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : c( ^! _9 w& {8 a5 h
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. j! }; X+ q% b- b+ Y5 |+ H" o, l  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; I$ R1 Y: B2 g$ s7 Y
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
  j/ O4 W5 ~  z7 s3 U' C' x) a  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) v" u* E6 T$ K: U* a4 b! r
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 s$ Y1 e# \6 ~1 {8 T+ S  ( R: L0 _; E% s& d) d0 H; Q
三、关于企业价格策略# e5 }& A, M' Z1 V: P/ K
1 R4 s* S9 }! f8 x: R; \$ g' k6 P
  8 N2 U2 j) C( @& S
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; Y3 a+ G7 l9 X! d4 l, c1 A  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( T+ [4 U% w- U3 a  以下三个定义:, l" ^! ?' L# _
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 T9 x3 ]/ U; y
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 U  E5 q/ w8 n0 Y# L) x  m. e
  所谓的双方优势策略则是指双方利益总和最大的策略。  
  F/ L4 V; b$ n[编辑本段]严格优势策略举例分析
  F' y' M, P- R+ @, o: i/ x3 z  一、经典的囚徒困境 2 X9 G/ G9 M1 n% L
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; v/ q7 F# K4 @7 H) _
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   _. T% [* E3 g
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" i( ~, K3 Q, g& L0 G% P  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 [% {# N% A  H/ ~  U3 y( M1 x3 U5 `
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
: B" q& F" X& o! r; b# b  
( |0 S. r; Y& B+ t) I: w; ]用表格概述如下:8 g& R: I4 O1 ^. l7 [4 B/ k

  t7 \1 B, J" k    甲沉默(合作)  甲认罪(背叛)  
+ h; e" P5 V) ?- V# o乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
: \" p2 Z. Z( F* V6 Z乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  & @5 g* h9 A4 T
* U! P) W9 t' A. D
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
3 R. d" X+ H5 f" y% U  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 m% a4 s. @- ^2 G
  若对方沉默、背叛会让我获释,所以会选择背叛。 ; N) X- s0 v7 I" L
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 w+ g; C. m9 H! Z) N  _) @7 n: R! z9 W  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 , t/ M% A7 l" Z3 R
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 j  |* s5 }' a
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* y, j6 K' p$ W% V1 ^[编辑本段]二、智猪博弈理论) t) k7 X) R, Z5 G( |
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 x3 `% D( a2 I4 S# u
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , M' Y( u0 k) {$ k8 b7 \6 p
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ X6 M( f; P$ v. s0 H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& ~8 L7 |# P2 {  m  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' y9 L5 m: r+ u  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 w0 }8 D9 r, E# B; x
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" J: ~' b4 m& E; j
  
8 h' ^* `) G6 D+ I2 w# u' P. e三、关于企业价格策略
% K0 |0 k9 q* X- c- e+ d9 d& P4 s0 t5 {5 q
  ! m5 ~) Z1 Y9 k, C, j! s( v# v
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 v# K" h9 J" A" M  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) x0 `' J" w2 A
  以下三个定义:
, \0 v) g. A, q5 Y  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 t+ j, u: a% Z  Q3 z2 {8 A  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 O% M+ k9 }, l) T
  所谓的双方优势策略则是指双方利益总和最大的策略。  
! N* S- I, \5 w& i- O[编辑本段]严格优势策略举例分析
$ d! ^: @7 `5 A6 `/ x  一、经典的囚徒困境 + v0 a: C1 ]# \( j7 h
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % p0 y5 e- K- j0 m( N! H
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 \& r# |2 ^7 r6 t% `% J  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* f) p" Q) i: M0 O3 p  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 o+ T9 Z) O' L  若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 Y% `& _# Q0 N  5 |" G5 K8 K8 M2 Q
用表格概述如下:% x" N. }5 V" z6 z4 Q9 L' C  c/ B

( O! M. e+ z7 L- I  n' N: }$ j    甲沉默(合作)  甲认罪(背叛)  + F9 n: C+ k6 K
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  3 u2 ?3 v$ j/ j$ r/ h4 ~
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 \; Y* H* N7 U6 z; D3 {' A% P5 S* N0 W$ {
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % P$ C( Z& E) g% [5 u# [8 I
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % s9 X7 N. _  l: P' u
  若对方沉默、背叛会让我获释,所以会选择背叛。 8 \+ z1 P6 q# g' y+ i& j; E
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 X% O1 a9 i& }0 ~5 R0 g/ X  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* z; u, ]7 h( F# D$ T7 `  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
  m6 y% S1 c3 A: n3 J. D  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. U. i- I5 w" y' i% s! }( g* `[编辑本段]二、智猪博弈理论  ^0 p  ?6 I% T& h1 ?" Y' `
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 s' M* w( u' K+ t; [6 y/ E
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; k2 B7 H% }5 q+ S& N+ X1 v  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 y8 Q# q0 b1 D3 C3 f5 p6 ~/ H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ P7 N$ |( D7 T  p9 @9 P& O
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 i9 n5 s' j4 r7 g& n  Y; v2 ?
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
0 N1 U$ U, X3 a% A3 V  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# a# a* j, C% D' ~5 J% k  
4 x; [; v; r- P  `* A三、关于企业价格策略" `; G# h. h( P3 K5 o  T

: ?, O; N! Q1 D% m) [  & Z9 z- @+ c4 v4 ~- M: F( n8 y  u
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) y. U8 }; F% T9 Y+ U: }. [  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 W( k9 K" |/ x1 I. {2 m% |! O  以下三个定义:
' u* t  k& }. m( f) g  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 e3 N1 Z0 a7 @6 |/ G  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 / e$ F& N1 Z7 B' \/ {
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ b( e$ s% J; b. L! I[编辑本段]严格优势策略举例分析8 `3 W6 J" Y7 A5 ?2 [
  一、经典的囚徒困境
  r9 y6 c: z: G# s2 ]' q  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 _% M& m- R, y+ i' N
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ U2 q% H$ x7 m2 r$ K  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
  E+ S' n2 }% r; |' S. S1 B  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 D0 H4 w1 O9 C! w& x7 |
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
* ~7 I. @/ i7 I' s3 V3 j  
& u1 o5 B! B0 V/ k/ D( S用表格概述如下:7 S0 S) p0 ~. U! n- o7 v( A: Q
6 d7 U$ a) q! Y* w6 a5 _! T
    甲沉默(合作)  甲认罪(背叛)  
6 `- v, J1 _1 ~5 d乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  1 o7 c' Q* i$ ^) @
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 [/ `! S5 p' D2 o* {7 p* T2 Y+ `( I7 J
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! {: q! j. O* X) \: @. {
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & U+ e. K4 B' U; k" Y1 N
  若对方沉默、背叛会让我获释,所以会选择背叛。
2 w" S6 n& Y* g" y3 ?9 r, |2 g  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 a* T  l: u5 j6 W( U! K4 u
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# n: z! v: |# k( C5 h  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 v. d' f/ I2 G; r- \  p
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 [0 J7 T. ^& J+ G[编辑本段]二、智猪博弈理论, A# y2 w' u. _8 J" [
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 e) C/ S2 ?5 q+ v5 w$ e, P  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 B6 A  H# m4 {9 O" ^# |  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 p6 ]3 W9 g' ?/ f
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) ~2 [8 n7 y' O  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) o! X( Q0 l" O( N  S% W1 Q  Q
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ P  |+ _5 U' W' \# a  ^3 Q  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) u4 S) v  i  S7 F
  ; Q# C1 W) Y* |) r' @9 j
三、关于企业价格策略, U# D/ i) p" ^+ i/ _: }0 w
) K! K$ S( S4 I& |9 Q8 P% x) i
  ! ]' l7 t" x5 l: Q! B4 e1 ]8 I" a
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 A5 n1 N( K# @! {  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )