今天上Google Scholar自己的主页——一般每个月我都会上一、两次,看看自己引用有没有增长,诱惑啊。发现有6篇论文引用超过了300次,高兴之余介绍给各位同行,希望大家更多关注。
我的Google Scholar Homepage:
https://scholar.google.com/citations?user=MXgWgmEAAAAJ&hl=zh-CN
[1] Zhou, T., Ren, J., Medo, M., & Zhang, Y. C. (2007).Bipartite network projection and personal recommendation. Physical Review E, 76(4), 046115.
这个文章是我所有文章里面目前唯一单篇引用超过500次的。文章其实很简单,就是把守恒扩散动力学引用来解决二部分图上的个性化推荐问题。应用场景是在用户-商品二部分图上对用户进行商品推荐,这个方法挺好用,百分点原来的主算法库里面这是一个核心算法,在淘宝以前的算法库里面,这个方法也是其中的核心算法之一。当然现在推荐系统也都是Learn to rank,做成大规模机器学习,几千上万个弱预测器(weak predictors),单一算法也没有以前那种风光了。感觉有几个优点值得一提:方法超级简单;计算超级快;完全可并行也完全可增量化。这里面最主要的优点还是两个字:简单!
论文链接:
http://journals.aps.org/pre/abstract/10.1103/PhysRevE.76.046115
[2] Lü, L., & Zhou, T. (2011). Linkprediction in complex networks: A survey. Physica A: Statistical Mechanics andits Applications, 390(6), 1150-1170.
这是我们针对链路预测的一个大型综述,没想到啊没想到,比我们2012年在Physics Reports的那篇推荐系统综述影响力还大,后者到现在引用只有219次,而且链路预测的综述2014年以来被引用了221次,推荐系统的综述同期引用只有141次。考虑到Physica A的影响因子只有1.7,而Physics Reports在23左右,这个结果我自己都很惊讶。我觉得受到关注,主要还是因为链路预测这个研究方向,会成为复杂网络研究中一个重要而有鲜明特色的方向。抛开在生物网络(预测缺失作用)和社会网络(推荐好友和关注对象)中巨大的应用潜力不谈,仅从理论角度来说,至少有三点是非常有吸引力的。一是链路预测问题本身是数据挖掘中最最基本的问题,其与复杂网络的结合有望给这个信息科学的老问题带来新活力;二是这个问题定义得非常干净,一些统计力学的手段,例如系综理论和似然估计,有望被用来建立链路预测的理论基础,进而形成用统计力学的观点描述数据挖掘的图景;三是网络演化建模本质上等价于含有时间信息的链路预测,因此对链路预测的研究,可以形成统一的演化模型评价平台并为很多真实网络的演化机制提供线索。我推荐大家看看高教出版社的专著《链路预测》,比英文综述更加全面系统。
论文链接:
http://www.sciencedirect.com/science/article/pii/S037843711000991X
[3] Yan, G., Zhou, T., Hu, B., Fu, Z. Q., & Wang, B. H.(2006). Efficient routing on complex networks. PhysicalReview E, 73(4), 046108.
我和严刚等人开始做网络交通问题的时候,是想从节点处理信息报能力分配的思路来对网络“通信能力/交通能力”进行优化。工作基本都完成后,发现了arXiv上来颖诚老师和赵良老师领衔完成的一篇几乎一样的文章(Onset of traffic congestion in complexnetworks,这篇文章也非常成功,现在引用344次),这个发现对我们是一次打击(那时候严刚才本科),同时我们也注意到这个模型本身存在的“过于理想化”的缺陷,因为现实中要想增加或者减少路由器的信息处理能力并不是一件容易可行的事情。于是我们产生了“不改变处理器的结构和配置,而是寻找更好的路由策略”的思路。于是我们将常见的最短路策略做了修改,提出了以节点度加权的新的路由策略。这篇文章发表之后效果出奇地好,很快就成为当年最有影响力的PRE论文。这篇文章后来也获得了中国百篇最有影响力的优秀学术论文奖。我觉得有三个优点:第一是方法超级简单,但是体现了网络交通瓶颈的关键问题;第二是效果很好,在不改变算法复杂性的前提下,能够在网络节点度异质性较强的情况下,把网络的信息吞吐量提高十倍以上;第三是题目和方向把握不错,按照arXiv的时间,应该是国际上最早明确提出“复杂网络路由”这个问题的论文。
论文链接:
http://pre.aps.org/abstract/PRE/v73/i4/e046108
[4] Zhou, T., Kuscsik, Z., Liu, J. G., Medo,M., Wakeling, J. R., & Zhang, Y. C. (2010). Solving the apparent diversity-accuracydilemma of recommender systems. Proceedings of the National Academy of Sciences, 107(10), 4511-4515.
在这篇文章中,我们明确指出传统意义上的信息推荐算法具有“过度强调精确性而忽略多样性”的缺点,而信息提供者的价值“往往更多地源于提供多样和新颖的信息”(推荐一个你喜欢但是肯定知道的东西其实价值不大,因为你本来就知道了,都用不着推荐了)。我们第一次系统研究了仅知道网络拓扑结构的情况下如何考量推荐算法的多样性和新颖性,这对于该方向的研究起到了基础性的作用。我们还提出了一种专门推荐“不太流行的冷门资源”的基于热传导的算法,该算法与所有已知的均倾向于发掘“流行资源”的算法大异其趣。当然,这个方法单独用精确性不行,要和[1]中的扩散方法一起用(两者的Laplace矩阵互为转置,结合起来就像全真教的剑法加上古墓派的剑法)。我们通过大量基于真实数据的分析,显示了此算法与基于物质扩散的算法结合后,可以同时明显提高推荐系统的准确度、多样性和新颖性。这一发现有望推动甚至最终解决推荐系统中精确性与多样性鱼和熊掌不可兼得之难题。Nature新闻栏目后来给这个工作做了一个长篇的专题报道。
论文链接:
http://www.pnas.org/content/107/10/4511.short
[5] Zhou, T., Lü, L., & Zhang, Y. C.(2009). Predicting missing links via local information. The EuropeanPhysical Journal B-Condensed Matter and Complex Systems, 71(4), 623-630.
这是我们链路预测的发家之作,当时提出的一些局部指标,特别是Resource Allocation(RA)现在已经是知名的相似性指标,而且不仅仅在链路预测方面,在群落挖掘,信息推荐等等方面,效果都很不错。而这个指标背后的逻辑非常简单,就是两个人有共同邻居固然重要,但是要看共同邻居是谁,如果两个人都认识一个大名人,这没有什么奇怪的,但是两个人都认识我,可能都是做复杂网络的。也就是说,“共同认识小人物”可以更大程度上帮助推断两个人之间的相似性或者相近度,而不是“共同认识大人物”。
论文链接:
http://link.springer.com/article/10.1140%2Fepjb%2Fe2009-00335-8?LI=true
[6] Wang, W. X., Wang, B. H., Yin, C. Y., Xie, Y. B., &Zhou, T. (2006). Traffic dynamics based on local routing protocol on ascale-free network. Physical Review E, 73(2), 026111.
这个文章和文章[3]基本上同期出来,思想也差不多,但是文章[3]所使用的是全局信息来设计路由策略,而本文使用的是局部信息来设计路由策略。这个工作受到了韩国Beom Jun Kim教授2002年PRE工作的启发(Path finding strategies inscale-free networks,引用235次)。
论文链接:
http://journals.aps.org/pre/abstract/10.1103/PhysRevE.73.026111
论文全文下载:
Traffic dynamics based on local routing protocol on a scale-free network.pdf
Predicting missing links via local information.pdf
Solving the apparent diversity-accuracy dilemma of recommender systems.pdf
Efficient routing on complex networks.pdf
Link prediction in complex networks-A survey.pdf
Bipartite network projection and personal recommendation.pdf