互联网的发展将我们带入了一个大数据信息化的时代,与此同时,我们遭遇到了两个突出的矛盾。一是可以获取的信息量的爆炸性增长和我们甄别选择信息能力的局限性之间的矛盾。二是同时共现的信息量的极度丰富和我们注意力的局限性之间的矛盾。前者表现为人们难以从数万亿网页,数亿商品或数百万图书中高效率地找到自己喜欢或者需要的对象,后者表现为人们往往无法从以网页、视频、搜索引擎、邮箱和手机应用等为媒介或载体的广告中获得有价值的信息。
这两个矛盾每一个互联网和移动互联网的用户都应该有切身体会。虽然是看起来很不一样的两个问题,但是都具有完全相同的核心科学问题,亦即如何从海量信息中挖掘出用户感兴趣的信息,并把这些信息推送给用户。两者的解决之道也惊人相似,都是对个性化技术的深入运用[1],实际上已经有学者指出,解决前一问题的推荐系统技术和解决后一问题的计算广告技术具有本质上的一致性[2]。直观地讲,精准的广告对于用户而言就是有价值的信息,反过来,不准确的推荐对于用户来说就是广告。
我们推出这个专题,就是为了向各位读者展示这两个在基础理论和算法方面受到挑战,又具有重大应用价值的研究方向的概貌,吸引有志于此的学术界和工业界的朋友从事这方面的理论和应用研究。特别值得强调的是,除了中国科学技术大学和电子科技大学的学术界朋友的来稿,我们的专题作者中还包括葫芦软件、百分点科技、诺基亚、微软和亿赞普的一线研究和开发人员。
项亮的文章简要回顾了推荐系统发展的几个里程碑,给出了推荐系统的核心模块,并指出现有的推荐算法都来自于传统的机器学习和数据挖掘的算法[3]。是否如其所言,当然是仁者见仁、智者见智。但无论如何,项亮提出的推荐系统架构的确代表了大部分已知的商业应用的架构,入门者可以通过这篇论文快速了解到推荐系统的概貌,进一步的阅读可以参考项亮最近的专著[4]和吕琳媛等人最近的大型综述[5]。
龚亮等人[6]以百分点推荐引擎为例介绍了推荐系统的一个实战例子,特别强调了场景引擎的应用。传统的推荐算法都是通过分析用户的历史数据来挖掘用户的喜好,尽管有对于用户兴趣关联随时间衰减方面的研究和应用[7],但归根到底是把时间间隔作为机器学习的一个属性或者引入一种按照时间权重衰减的方式[8],不同于场景引擎将用户的心理意图划分成若干不同的可能场景,并力图推过预测算法判断用户行为表现出来的当前意图。百分点推荐的实例证明了场景引擎的重大价值!
陈恩红等人[9]介绍了移动情境感知的个性化推荐技术。龚亮等人[6]所介绍的百分点场景引擎实际上是情境感知的一个具体应用实例,强调的通过浏览、收藏、购买等行为对用户当前意图的预测。广义而言,情境感知包括所有与人机交互相关的可用于区分标定当前特殊场景的信息。陈恩红等人的文章不仅介绍了情境感知技术的重要意义,还特别强调了移动情境感知技术,特别是显著地点挖掘和用户移动模式分析等技术与传统静态情境感知技术的不同。随着智能手机和Wifi的普及,基于位置的服务极有可能成为下一代伟大企业的核心,该文是具有相当高度的普及性材料。特别地,该文不仅讨论了推荐技术,也讨论了广告策略,恰好可以帮助读者完成从推荐系统到互联网广告的过渡。
计算广告学是研究如何利用计算的方法求解广告相关问题的一门新兴学科,它涉及到大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学,也是一种典型的社会计算。刘铁岩[10]以显示广告和搜索广告为例,用优美舒雅的笔调向读者介绍了计算广告学的理念和应用场景。除了享受性的阅读外,刘铁岩还提出了包括“拍卖机制设计”和“点击预测算法”等等在内的若干未来研究问题,其中有一些问题,譬如转化收费模型和自适应反馈学习方法等等,已经超出了纯碎学术的范围,涉及到了包括商业模式在内的探索,对于相关研究人员和业界人士具有特别重要的借鉴意义。
2012年,全球已经有50亿移动用户,移动广告的市场规模达到了50亿美元。作为移动互联网广告领先企业亿赞普的一线从业者,张中峰等人[11]介绍了移动互联网广告提单系统、投放系统、结算系统和响应流程的设计思路,以及若干移动广告遇到的技术挑战。传统互联网广告主要还是一个广告位稀缺的市场,品牌媒体在其中占据极大优势。广告内容的设计以及抢夺广告位很多时候比技术更重要。反过来,移动互联网广告位并不稀缺,广告的投放技术和关联挖掘技术反而变得特别重要,此文所介绍的,应该是很多技术人员和研究人员能够体现更大贡献的重要方向。
[1] 苏萌,柏林森,周涛,个性化:商业的未来,机械工业出版社,2012.
[2] A. Z. Broder, Computational advertising and recommender systems, Proceedings of the 2008 ACM conference on Recommender systems, ACM Press, 2008.
[3] 项亮,机器学习和数据挖掘在个性化推荐系统中的应用,中国计算机学会通讯,xxxxxx.
[4] 项亮,推荐系统实践,人民邮电出版社,2012.
[5] L. Lü, M. Medo, C. H. Yeung, Y.-C. Zhang, Z.-K. Zhang, T. Zhou, Recommender Systems, Physics Reports 519 (2012) 1-49.
[6] 龚亮,刘译璟,郭志金,场景引擎:下一代推荐系统的核心模块,中国计算机学会通讯,xxxxxx.
[7] Y. Koren, Collaborative filtering with temporal dynamics, Communications of the ACM 53(4) (2010) 89-97.
[8] J. Liu, G. Deng, Link prediction in a user-object network based on time-weighted resource allocation, Physica A 388 (2009) 3643-3650.
[9] 陈恩红,徐童,田纪雷,杨禹,移动情境感知的个性化推荐技术,中国计算机学会通讯,xxxxxx.
[10] 刘铁岩,方兴未艾的计算广告学,中国计算机学会通讯,xxxxxx.
[11] 张中峰,元张毅,糜万军,移动互联网广告的机遇和挑战,中国计算机学会通讯,xxxxxx.