这是个很有意思的问题,偶特地去拜读了一下研究报告的原文,这里偶给出链接,感兴趣的朋友可以去看一下。
中国科学院理论物理研究所的文章介绍:http://www.itp.cas.cn/xwzx/kydt/201407/t20140730_4169491.html
报告原文(英文版的):
https://www.nature.com/articles/srep05830
研究报告说了什么?论文首先报告了在浙江大学实验社会学实验室进行的跨度近四年的实验(12.2010—03.2014)。实验一共招募了浙江大学 360位学生,将他们分成 60 组,每组6 名学生,每一组都玩石头-剪刀-布的游戏 300 轮,每一轮都是这同样 6 名学生随机两两配对厮杀以攒取点数。游戏结束后,每名学生根据其赢得的总点数获得相应的真实报酬。从这些实验结果,三位作者发现每个学生的游戏策略似乎很符合经典博弈论的纳什均衡理论,即石头、剪刀、布三种动作在每轮被选中的概率大约是三分之一。但是一个有趣的现象是,由 6 名学生组成的群体的行为在统计上表现出偏离完全随机的定向转动行为。这一定向转动行为不同的组内都观察到了(不同的组有不同的游戏奖励参数)。这一非平衡集体现象不能由基于完全理性假设的纳什均衡策略解释。
通过对实验数据进行更细致的分析,三位研究者发现学生在重复玩石头-剪刀-布游戏时有一些比较显著的行为统计模式,即如果上一轮的结果是赢,那么下一轮有最高的概率仍然采取上一轮已经采用过的动作(石头、剪刀、或布);如果上一轮的结果是平,那么下一轮保持同样动作的概率也较高,但也有较高的概率逆时针改变动作(即从石头变为布、或从布变为剪刀、或从剪刀变为石头);但是,如果上一轮的结果是输,那么下一轮就有最高的概率顺时针改变动作(即从石头变为剪刀、或从剪刀变为布、或者从布变为石头)。这三位研究者将这样的统计模式称为是条件反应模式。
研究者然后基于条件反应模式进行了理论建模,发现只考虑了条件反应模式的理论模型能够定量地解释几乎所有的实验观察事实,例如群体层次的定向转动行为、个体层次的动作选择惯性效应等等。这项研究就说明,人们看上去非常复杂的个体决策行为和群体动力学行为实际上可以基于很简单的条件反应模式进行理解。而且理论计算表明,通过优化条件反应模式的决策参数,群体有可能获得比采用纳什均衡策略更高的平均收益,因而实现更高的群体效益。
(摘自中国科学院理论物理研究所的介绍)
不存在制胜原理这个研究中,研究者们寻找的不是怎么样玩赢“剪刀石头布”,而是通过人们在石头剪刀布里的行为来判断哪一种理论更能预测人类——是传统的博弈论的纳什均衡,还是演化博弈论。
而所谓的“制胜原理”,只是被带起来的节奏,是舆论所关心的点,而不是研究本身的意愿。
最后,说一点很有意思的内容当年这个报道可是引起了很大的争论的,因为很多网友觉得,凭经验就能得出来的东西,还要你大量人力物力财力去研究?三岁小孩子都会的石头剪刀布,还值得研究?
事实是简单,但是在事实背后真相的探寻却不简单,大家都知道苹果熟了会落下来,可就是透过这么简单的常识,牛顿从中发现了万有引力。囚徒困境,有些人看来就是个互相拆台的问题,可是在科学家眼里就是博弈论。
(囚徒困境示意图。图片来源:Encyclopaedia Britannica)
偶特别欣赏当时的一条评论,这里给大家分享一下。
当学者们以科学的态度对待“剪刀石头布”,而网民们却是以“剪刀石头布”的心态对待科学时,到底谁更可笑,又是谁赢了谁呢?