《计算机通讯》第76期专题是“数据密集业务的挑战和机遇——‘大数据’在工业界”。随着各行业和部门产生的数据量的急剧增长,对数据处理分析能力的要求不断提高。如何面对大数据的挑战,发现新的机遇,是工业界和学术界共同关注的问题。本期专题重点介绍了工业部门在密集数据方面的应用、实践和需求;邀请了中兴通讯、淘宝、百分点公司、华大基因、SAP、盛大在线等企业撰文,分享来自业务第一线的看法。本期专题作者主要来自企业的科研人员,是一次有意义的尝试。
链接:http://www.ccf.org.cn/sites/ccf/jsjtbbd.jsp?contentId=2679929345796
推荐引擎:信息暗海的领航员
Terry Lau 张韶峰 周 涛
互联网的发展使我们获取的信息总量以指数级别增长,目前已知的网页超过5000亿,仅淘宝网上就有接近10亿件商品。而我们分辨甄选信息的能力并没有提高。对于普通用户来说,大多数信息是暗信息——我们有可能对某些信息感兴趣,但由于没有“领航员”的帮助,我们无法看到这些信息。这种被称为“信息过载”的问题,正是目前互联网发展中遇到的最棘手、最重要的问题。
推荐引擎最有希望解决信息过载的问题。推荐引擎的本质是通过分析用户历史活动的记录,包括音乐下载、视频观看、图书购买、网络约会、朋友互动、论坛评论等等,分析用户的个性化喜好,主动向用户推荐他们感兴趣的信息。推荐引擎的精髓是个性化,通过分析群体数据,得到每位用户的个性化喜好,再进行个性化推荐。很多用户最早接触的推荐引擎是亚马逊(Amazon)的推荐服务,因此留下了一些刻板的印象,例如推荐引擎服务的都是电子商务公司,采用的都是相似的挖掘方法(比如关联规则和协同过滤),“看过还看过,买过还买过”这类推荐通过简单的数据库查询就可以完成。
我们正在经历由个性化推荐技术构筑未来商业模式,基于很多读者对个性化推荐的憧憬和误解,本文将以国内领先的推荐引擎提供商为实例,介绍其架构和算法,展示基于个性化推荐技术的应用场景和产品,呈现较完整的个性化推荐的轮廓。
……
全文下载: