小

8.海盗如何分金币――动态博弈

    8.海盗如何分金币――动态博弈 (第2/3页)

我们总是从最后的情形向前推，这我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果，得到倒数第二步应该选择的策略，依此类推。要是直接从第一步入手解决问题，我们就很容易因这样的问题而陷入思维维僵局：“要是我做这样的决定，下面一个海盗会怎么做？”

    按照这个思路，首先我们考虑只剩下最后的海盗，显然他会分给自己100枚金币，并赞成自己。再回溯到只剩下海盗四和海盗五的决策，海盗四可以分给自己100枚余币并赞成自己；海盗五被分得0枚金币，即使反对也没用。回到海盗三，他可以分给海盗五1枚金币得到海盗五的同意；分给自己99枚金币，自己也同意；分给海盗四O枚金币，海盗四反对无用。接下来回到海盗二，如果分给海盗四1枚金币得到海盗四的同意；分给自己99枚金币，自己也同意；分给海盗三和海盗五0枚金币，他们会反对但反对没用。最后我们回到海盗一，他可以分给海盗三和海盗五各1枚金币，获得海盗三和海盗五的同意；分给自己98枚金币，自己也同意；分给海盗二和海盗四各0枚金币，他们反对也不起作用。

    因此，海盗分金的最终结果是：海盗一提出分给自己98枚金币，分给海盗二和海盗四各0枚金币，分给海盗三和海盗五各1枚金币。该提议获得了通过，因为海盗一、海盗三和海盗五同意。海盗一在此前提下分到了最多的金币。

    在前面的几个故事中，我们涉及的都是静态博弈，也就是说博弈双方是同时行动的。而现实中，博弈常常是动态的、依次行动的，这就要求我们必须考虑人们在将来对我们的行动的反应。“海盗分金”就是一个典型的动态博弈。

    我们再来看一个逆向归纳的例子――最后

    （本章未完，请点击下一页继续阅读）