大量生物、技术、信息系统都可以用网络来刻画,其中诸如互联网、万维网、P2P网络、在线社交网络等都是信息科学特别关注的对象。网络在演化生长的过程中表现出很多有趣的结构特征,比如集聚性、社团性、无标度性、小世界性等等。建立网络模型重现观察到的结构特性,是最常见的理解网络生长过程潜在驱动力量的方法。针对同一类网络甚至同一个网络,往往有多个理论模型,每一个模型都声称能够捕捉真实网络某几个方面的特征。由于刻画网络结构的特征量成百上千,数不胜数,模型1可能在刻画特征A, B, C方面胜过其他模型,而模型2给出最符合特征D, E的结果——事实上,直到现在,我们没有一种本质上有效的方法,来判断不同模型的优劣。
王文强等人的论文第一次试图解决这个困难的问题!链路预测是复杂网络的一种重要分析方法,其目标是通过学习当前观察到的网络结构,计算尚未出现连边的节点对之间存在连边的似然。受到这个方法的启发,王文强等人认为每一个演化模型原则上都对应于一种链路预测的算法,因此,如果把当前网络的真实结构看作基于一段时间之前的网络在模型对应的链路预测算法下预测得到的,我们就可以分析当前网络出现的似然。王文强等人认为,让当前网络似然更大的算法所对应的演化模型更好——这实际上提供了一个评价网络模型优劣的不依赖于任何特定的结构特征或特征组的统一的平台。
王文强等人以真实的互联网数据为基准,比较了有代表性的互联网演化模型的优劣。有趣的是,他们发现通过他们的评价机制得出的模型的“最佳参数”在刻画新增节点的性质的时候,要明显好于通过其他办法得到的“最佳参数”。该工作还隐隐约约包含了一个重要的思想,就是以前的研究,总是关注网络从无到有的过程,希望找到一个普适的模型,一股脑刻画网络一生的行为。实际上,网络初始的增长和中后期的增长机制可能是完全不一样的!链路预测更像是关注网络从少到多,从当前到未来的短期行为,这可能更加重要!即便是在一个模型下,通过与真实网络对比,不同增长时期的“恰当的参数值”也会不一样。这个问题在以前的研究中罕有讨论,但是可以通过本文提出的办法进行分析、挖掘。
论文信息:W.-Q. Wang, Q.-M. Zhang, T. Zhou, " Evaluating network models: A likelihood analysis", EPL 98 (2012) 28004.
全文可通过链接http://iopscience.iop.org/0295-5075/98/2/28004获取
全文下载:Evaluating Network Models.pdf