Papadopoulos等人的这篇论文[1],我也是先简略看过,最近又重新细看。文章的切入点不算新,是讨论流行性(度大的节点受到更多关注,产生马太效应)和相似性(相似的节点对之间更容易建立连接)在网络增长中各自起到的作用大小。
不过作者分析这个问题的思路很新颖,他们认为节点越老,倾向于度越大,所以“流行性可以用节点的年龄刻画”,这样把每一个节点映射为平面中的一个点。如果这个点用极坐标表示,那么半径就是节点出生的时间步的对数(第一个节点就在原点),角度则是随机赋予的。作者提出了一个优化模型,其中节点不是单纯按照优先连接(年龄越老越好,或者按照度成正比)或者单纯按照相似性(夹角越小越好),而是按照最小化“年龄乘以夹角”。而“年龄乘以夹角”,正好就对应于该平面中两个点的双曲距离——明眼的读者知道,这是先计算好关系之后在文章叙述的时候甩了一个包袱。
实际上,这种“相似性”的机制,很类似于10年前李翔和陈关荣老师的“局域世界模型”[2],因为该模型实际上是把连接限制在了某个角度的表示的局域世界。遗憾的是作者可能并不知道这篇文章(李翔这篇文章引用了350次左右)。
文章的妙处和野心在于,这样一个简单的几何表示,如果加上一些修正,几乎可以扫过各种各样的模型。譬如如果允许节点从靠近圆心的位置向外运动,可以实现从随机网络到各种各样指数的幂律网络。这里面作者又玩了一个巧,因为老化网络就具有这样的特点[3],两者本质上是一致的。而相似性里面如果引入费米函数,则温度可以调节簇系数,这是显然的。虽然作者取了很多巧,而且我怀疑故意没有引用很多特别相关的文章,但是不得不承认这个几何表示很直观,也的确给出了很多模型的统一性的框架。
文章有一处亮点,是作者认为他们提出了一种判断演化机制是否恰当的真正方法——以前的方法比较的是演化机制产生的结果(譬如度分布、簇系数),而作者引以自豪的方法比较的是演化方法本身(比较链路产生的概率)。在于这篇文章几乎同样时期,我们曾经提出过利用似然分析给出一种普遍适用的判断演化规律谁好谁坏的方法[4]。我觉得我们的方法更加简单直观,便于理解,当然,我们在其他方面并无贡献。
作者认为这个工作可以用于链路预测,但是并没有验证他们的想法,我觉得这倒是一个有趣的问题,可以尝试。不过结果可能令人失望,因为肯定很多网络不适合使用作者在附录中提到的那种非常复杂而缓慢的映射方法。
[1] Papadopoulos, F., Kitsak, M., Serrano,M. Á., Boguná, M., & Krioukov, D. (2012). Popularity versus similarity ingrowing networks. Nature, 489(7417), 537-540.
[2] Li, X., & Chen, G. (2003). A local-world evolving network model. Physica A: Statistical Mechanics and itsApplications, 328(1), 274-286.
[3] Dorogovtsev,S. N., & Mendes, J. F. F. (2000). Evolution of networks with aging ofsites. Physical Review E, 62(2), 1842.
[4] Wang, W. Q., Zhang, Q. M., & Zhou,T. (2012). Evaluating network models: A likelihood analysis. EPL(Europhysics Letters), 98(2), 28004.