恶意攻击下具有鲁棒性的排序算法入选EPL最佳论文
周涛  |  2012-04-22  |  科学网  |  368次阅读

http://iopscience.iop.org/0295-5075/page/Best%20of%202011%20Collection

A robust ranking algorithm to spamming

周艳波,雷霆,周涛*

Ranking problem of web-based rating systems has attracted much attention. A good ranking algorithm should be robust against spammer attack. Here we proposed a correlation-based reputation algorithm to solve the ranking problem of such rating systems where user votes some objects with ratings. In this algorithm, the reputation of a user is iteratively determined by the correlation coefficient between his/her rating vector and the corresponding objects' weighted average rating vector. Comparing with iterative refinement (IR) and mean score algorithm, results for both artificial and real data indicate that the present algorithm shows a higher robustness against spammer attack.

EPL 94 (2011) 48002

论文链接 http://iopscience.iop.org/0295-5075/94/4/48002

以前学院的新闻报道

互联网科学中心在《欧洲物理快报》上发表论文
发布者:招生办 发布时间:2011/5/30 16:25:46
计算机·软件学院互联网科学中心周涛教授与瑞士弗里堡大学的周艳波博士、雷霆博士合作的“针对恶意用户的健壮的排序算法”的研究论文,近日在《欧洲物理快报》上发表。周涛为通讯作者。

恶意用户是一个让所有互联网商家和普通用户头痛的问题,除非你本人就是恶意用户——不妨想想淘宝上通过虚假购买和虚假评分打造出来的皇冠商家,微博上面的僵尸粉和水军……当然,恶意用户可能也没有那么可恶,也许他只是乱评论乱打分,扰乱网络生态环境,但依然在某种程度上伤害到我们获取信息的准确性上。

 

周涛教授等人用一个二部分图来刻画这种互联网上普遍的评分行为:一部分节点是用户,另外一部分节点是对象,譬如商品、电影、书籍等等。用户可以给自己看过的电影,购买过的商品打分。正常的用户会根据商品的质量进行评分,当然,每个人都会有误差。而恶意用户可能会表现为:随机乱打分,故意给一个集合里面的商品打高分,故意给一个集合里面的商品打低分……周涛教授等人的研究目标是建立一个自动化的信誉系统,能够给出对象质量和用户评价准确程度(可信度或者信誉度)的排序。

周涛教授等人提出了迭代寻优的方法。简单地说,就是对象的质量是由用户打分的加权平均决定的,其中信誉度高的用户权重大;而用户的权重又是根据他的若干打分是否整体上较符合对象的质量来决定的。所以,这是一个迭代的方程,最终会收敛。该算法不管是在人工生成的数据,还是MovieLens和Netflix在线电影观看的真实数据上,效果都比原来的方法要好。

当然,需要提醒的是,道高一尺魔高一丈,再好的方法,也总会有更厉害的恶意用户能够从中获益——这个工作只是希望把恶意渔利的门槛提高一些罢了。




文章原载于作者的科学网文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文