时间尺度的多样性促进零行列式策略在网络系统中涌现
周涛  |  2015-04-01  |  科学网  |  553次阅读

零行列式(Zero-determinant strategy, ZD)策略是近年来博弈论关注的一类重要策略,使用零行列式策略的个体可以单方面保证双方期望收益满足线性关系[1]。零行列式策略为刻画博弈双方作用关系提供了全新的研究视角,正在改变博弈理论的研究范式[2,3]。剥削策略(Extortion strategy)——它可以使自身收益是对手的任意倍——作为一类重要的零行列式策略近年来被广泛关注。最近的研究指出,剥削策略在种群中通常不是演化稳定的,但它可以作为触媒促使合作行为在种群中涌现[4,5]。因此,以剥削策略为代表的零行列式策略在种群中的演化机理正被深入研究[6,7]

 

网络演化博弈中存在两类相互耦合的网络:相互作用网络和策略演化网络,前者描述了个体与谁博弈;后者刻画了个体行为的变化,二者演化的时间尺度可能不同。基于前期网络中时间尺度演化研究[8]的基础上,荣智海教授、吴枝喜教授(兰州大学)、郝东博士、Michael Chen博士(香港大学)、周涛教授合作探讨了策略演化时间尺度的多样性对剥削策略的演化作用机理[9]。考虑获得高收益的个体更倾向于维持当前行为而减缓策略演化速度,因此可以将策略演化时间尺度与个体收益联系,研究因收益导致的不同时间尺度的个体在规则格子、随机网络和无标度网络中的剥削策略演化过程。不同于过去认为剥削策略在均匀混合种群中的演化不稳定,该文发现策略演化时间尺度因素的引入会促使剥削策略在网络环境中的稳定存在,并进一步导致合作行为的涌现。由于个体收益与时间尺度之间的反馈作用,无标度网络中大度节点更倾向于采取剥削策略,促使合作行为在异质的无标度网络中更容易涌现。这可以为群体行为调控和多智能体协议设计提供理论指导。

 

参考文献:

[1]W. Press, F. Dyson (2012), Iterated Prisoner’s Dilemma containsstrategies that dominate any evolutionary opponent, Proceedings of the NationalAcademy of Sciences, vol. 109, pp. 10409–10413.

[2]A. J. Stewart, J. B. Plotkin (2012), Extortion and cooperation in thePrisoner’s Dilemma, Proceedings of the National Academy of Sciences, vol.109,pp.10134–10135.

[3]D. Hao(郝东), Z. Rong(荣智海), T. Zhou(周涛) (2014), Zero-determinant strategy: An underwayrevolution in game theory, Chinese Physics B, vol. 23, pp. 078905.

[4]C. Adami, A. Hintze (2012), Winning isn’t everything: Evolutionarystability of zero determinant strategies, Nature Communications, vol.4,pp.3193.

[5]C. Hilbe, M. A. Nowak, K. Sigmund (2013), Evolution of extortion initerated Prisoner's Dilemma games, Proceedings of the National Academy ofSciences, vol.110, pp.6913-6918.

[6]A. J. Stewart, J. B. Plotkin (2013), From extortion to generosity, theevolution of zero-determinant strategies in the prisoner's dilemma, Proceedingsof the National Academy of Sciences, vol. 110, pp.15348-15353.C.

[7] A. J. Stewart, J. B. Plotkin (2014), Collapse of cooperation inevolving games, Proceedings of the National Academy of Sciences, vol.111,pp.17558–17563.

[8]Z. Rong(荣智海), Z. Wu(吴枝喜), G. Chen(陈关荣) (2013), Coevolution ofstrategy-selection time scale and cooperation in spatial prisoner's dilemmagameEPL, vol.102, pp.68005.

[9]Z. Rong(荣智海), Z. Wu(吴枝喜), D. Hao(郝东), Michael Z. Q. Chen(陈志强), T. Zhou(周涛) (2015), Diversity of time scale promotes themaintenance of extortioners in spatial prisoner's dilemma game, New Journal of Physicsvol.17, pp.033032.

 

全文免费下载链接:http://iopscience.iop.org/1367-2630/17/3/033032





文章原载于作者的科学网文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文