因为今年帮助ACM RecSys 2013评审工业界投稿的论文,仅就今年工业界推荐系统研究的情况选择一些有趣的例子进行介绍,不代表整个推荐系统研究的总体情况。
今年收到的研究内容很多样,包括韩国SK Planet公司讨论如何在手机应用上推荐横幅广告,LinkedIn讨论如果通过建立虚拟属性空间更好向用户推荐群组,百度讨论怎么样通过匹配新问题和实时在线的用户来大幅提高百度知道的回答率和回答质量,加拿大皇家商业银行考虑的金融政策推荐,澳大利亚国家信息和通讯技术研究中心分析的电视节目推荐等等。我个人感觉澳大利亚国家信息和通讯技术中心的文章综合水平最高。我选择部分有趣的结果稍作介绍。
App广告要关注App而不是设备。我们目前有一个中等规模的研究小组正在从事移动互联网精准广告方面的研究,细节不谈,大的框架就是区分按设备推荐(分析这个手机用户的App激活记录,广告展示和点击记录,以及手机型号、位置等属性信息)还是按应用推荐(分析最适合目标广告投放的应用群)。从SK Planet的初步结果来看,按应用推荐的效果明显更好。SK Planet的科学家给出的解释是按应用推荐能够更好把握用户当前的兴趣,这对于手机广告是否获得点击起到决定性的作用。相比SK Planet的初步分析,我们近期会有更完整漂亮的结果呈现,但是SK Planet的研究很大程度上启发了我。
手机就是分分钟的事儿。我个人特别喜欢百度的研究结果,尽管看起来不太像一篇学术论文(亲,技术都省略了只报导试验结果是不行的)。他们特别关注了利用手机进行百度知道回答的用户行为。他们的研究显示,不需要大范围变动原来的推荐机制,只是把新问题都推送给正在手机上网的用户(当然,这个匹配本身要考虑以前行为内容表现出来的相似关系),就能够同时提高回复率和回复质量。这个研究再次说明了手机上网是碎片化的,当前分分钟解决不了的事情,没有人会放到一个收藏夹或者文件夹里面回味。我自己也感觉百度知道越来越有价值了。
电视节目要推陈出新两手抓。我们正好在同步分析两组电视节目点击数据,一个来自智能终端,一个来自机顶盒。电视节目中有相当部分是电视剧或者每天固定时间播放的节目(例如新闻联播)。前面这两类我们可以统一叫做节目组。我们已经发现观看节目组和新节目这两种行为要区分对待。澳大利亚研究组尽管在似然分析和时间效应方面都存在不足,但是他们简单直观的方法说明了推荐已经看过部分的节目组(推陈)和推荐新电视节目(出新)要分割成两个不同的算法模块,然后进行组合。当然,前者的精确性远远超过后者,但是后者难度也大。我们也在沿着类似的方向开展研究(各自独立),技术上其实更先进,统计规律的描述也更清楚,遗憾的是,澳大利亚小组先投稿了。接收一篇打压自己当前工作的论文真是一件郁闷的事情,也正因为自己在做,所以明白这个思路的重要应用价值,所以尽管他们技术上有缺陷,我还是strongly accept了。