8.海盗如何分金币――动态博弈

    8.海盗如何分金币――动态博弈 (第2/3页)

我们总是从最后的情形向前推,这我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果,得到倒数第二步应该选择的策略,依此类推。要是直接从第一步入手解决问题,我们就很容易因这样的问题而陷入思维维僵局:“要是我做这样的决定,下面一个海盗会怎么做?”

    按照这个思路,首先我们考虑只剩下最后的海盗,显然他会分给自己100枚金币,并赞成自己。再回溯到只剩下海盗四和海盗五的决策,海盗四可以分给自己100枚余币并赞成自己;海盗五被分得0枚金币,即使反对也没用。回到海盗三,他可以分给海盗五1枚金币得到海盗五的同意;分给自己99枚金币,自己也同意;分给海盗四O枚金币,海盗四反对无用。接下来回到海盗二,如果分给海盗四1枚金币得到海盗四的同意;分给自己99枚金币,自己也同意;分给海盗三和海盗五0枚金币,他们会反对但反对没用。最后我们回到海盗一,他可以分给海盗三和海盗五各1枚金币,获得海盗三和海盗五的同意;分给自己98枚金币,自己也同意;分给海盗二和海盗四各0枚金币,他们反对也不起作用。

    因此,海盗分金的最终结果是:海盗一提出分给自己98枚金币,分给海盗二和海盗四各0枚金币,分给海盗三和海盗五各1枚金币。该提议获得了通过,因为海盗一、海盗三和海盗五同意。海盗一在此前提下分到了最多的金币。

    在前面的几个故事中,我们涉及的都是静态博弈,也就是说博弈双方是同时行动的。而现实中,博弈常常是动态的、依次行动的,这就要求我们必须考虑人们在将来对我们的行动的反应。“海盗分金”就是一个典型的动态博弈。

    我们再来看一个逆向归纳的例子――最后

    (本章未完,请点击下一页继续阅读)