从发表第一篇论文到现在,已经十年整了。垃圾文章很多,有价值的文章屈指可数。有趣的是,自己喜欢也觉得重要的很多工作,引用反而不多。如同其他老年人一样,突然有一种冲动,想盘点一下自己的工作:一是回顾一下引用较多的工作,二是回顾一下自己真正喜欢的工作。所以有了这篇博文,欢迎大家拍砖。
论文1:Bipartitenetwork projection and personal recommendation
作者:周涛,任捷,Matus Medo,张翼成
出版物:PRE,2007年
链接:http://pre.aps.org/abstract/PRE/v76/i4/e046115
引用:353次
现在可以获取的数据量越来越多,而我们人类甄别处理数据的能力有限,信息过载就成了一个大问题——别说是Amazon上面的几百万本书,就是机顶盒下面几百个电视节目你都看不过来。推荐系统是解决信息过载问题目前认为的唯一可行之道,因为它可以自动化帮助大家找到喜欢或者需要的东西!
这篇文章提出了一个基于局部物质扩散的原创性推荐算法。这个方法很快速,而且算法精确度还行。就像协同过滤的初级版,虽然还有很多改进可以做,但是初级版是个基础,而且初级版也可以应用。值得一提的是,这个算法目前已经应用于近千家商业客户的个性化推荐中,推荐内容包括各类商品和咨讯,服务的不同用户数目超过3亿。当然,不是单独使用,而是和其他算法一起通过混合算法(HybridAlgorithms)或者集成学习(Ensemble Learning)来使用。对于信息过滤,特别是个性化推荐感兴趣的非计算机学科方面的读者,可以从这篇文章入手,因为写法很容易理解,不同于一般计算机科学方向的论文。任何一个有过基本训练的高中生,都可以毫无障碍地理解这篇文章。
论文2:Efficientrouting on complex networks
作者:严钢,周涛,胡波,傅忠谦,汪秉宏
出版物:PRE,2006年
链接:http://pre.aps.org/abstract/PRE/v73/i4/e046108
引用:323次
做这篇文章的时候,严钢还是本科生。那时候我们一起产生了两个想法,一个是把确定性阿波罗网络推广为随机阿波罗网络,一个是做网络上的路由策略。大家贡献都比较接近,就约定分别为这两篇文章的第一第二作者,现在看起来,这两篇文章都比较成功。网络交通是科大研究组在国际上最早产生系统贡献的方向,客观来讲,严钢是做得最早的,王文旭是做得最好的,我和他们合作发了很多文章,总体上比他们俩要弱一些。
这篇文章也遇到了一些波折。我们开始的时候,是想从节点处理信息报能力分配的思路来进行优化,完成了大部分,突然发现了一篇论文[http://pre.aps.org/abstract/PRE/v71/i2/e026125],思路几乎和我们一样(当时还没有发表出来,应该在arXiv上面)。这篇文章是来颖诚小组赵良老师领衔完成的,工作也很成功,05年发表后,到现在引用了294次。发现赵良老师德文章对我们是一次打击,同时我们也注意到这个模型本身存在的“过于理想化”的缺陷,因为现实中要想增加或者减少路由器的信息处理能力并不是一件容易可行的事情。
那个时候迫于无奈,我们才产生了“不改变处理器的结构和配置,而是寻找更好的路由策略”的思路。于是我们将常见的最短路策略做了修改,提出了以节点度加权的新的路由策略——该策略在不改变算法复杂性的前提下,能够在网络节点度异质性较强的情况下,把网络的信息吞吐量提高十倍以上。这篇文章也是国际上(按照arXiv时间)最早明确提出“复杂网络路由”这个问题的论文。
文章发表也遇到一些坎坷,在PRL审了3轮,总是一个同意一个拒绝,最终也没有接收,后来在PRE发表了。所以说,有一些引用了这篇文章的工作,反而发表在之前。但是文章发表之后效果出奇地好,很快就成为当年最有影响力的PRE论文。这篇文章后来也获得了中国百篇最有影响力的优秀学术论文奖。
Google Scholar主页:http://scholar.google.com/citations?user=MXgWgmEAAAAJ&hl=en