节点相似性指标的稳定性分析
周涛  |  2016-03-10  |  科学网  |  456次阅读

     节点相似性指标非常重要,在链路预测、节点聚类、个性化推荐、社团挖掘方面应用都很广泛,我就不一一说了。我们认为,一个指标如果要好,必然有相当的稳定性。举个例子,如果给定一个网络G,我把它所有边随机分成两个部分A1和A2,分别用这两个部分计算节点对的相似性。那么一个好的指标,虽然用的信息变少了,针对A1和A2计算出来的相似性排序应该有很大的相关性。反过来,一个烂指标,很可能A1算出来的相似性和A2算出来的相似性差别非常大。

 

   我们针对15种相似性指标,在大量的人造网络和真实网络中作了实验,发现相似性的指标稳定性有很大差异,而常见的共同邻居相似性(CN),AA Index和RAIndex稳定性很好。特别地,我们用这些方法作了个性化推荐的实验,发现用稳定性好的相似性指标,效果很好;反过来用稳定性差的相似性指标,效果不佳,会给出很多不正确的推荐。

 

论文:

J.-G. Liu, L. Hou, X. Pan, Q. Guo, T. Zhou, Stability ofsimilarity measurements for bipartite networks, Scientific Reports 6 (2016)18653.

 

全文免费下载链接:

http://www.nature.com/articles/srep18653 





文章原载于作者的科学网文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文