任晓龙1,2,朱燕燕1,王思云3,廖 好2,韩筱璞1,吕琳媛1
(1.杭州师范大学阿里巴巴复杂科学研究中心 杭州 311121;2. 弗里堡大学物理系 瑞士弗里堡 CH-1700;3. 成都理工大学商学院 成都 610059)
【摘要】通过腾讯QQ数据集详细分析了中国在线社交网络中用户的统计特征,交友、聊天等行为规律和地理分布规律。同时,对比《中国城市统计年鉴》等权威统计资料,发现在线社交网络的用户和用户行为数据,例如各地区的用户数、聊天数与该地区发展指标呈正相关,这表示在线社交网络数据能够在一定程度上反映各地经济、交通、通信等城市建设状况,相关结果对于区域经济研究具有启发意义。
评《在线社交网络结构与区域经济关联性研究》◆周 涛◆
在这篇文章中,任晓龙等人分析了百多万腾讯用户的数据,揭示了QQ在线社交网络的结构特征,以及QQ用户在性别、年龄和地理上的分布。这些结果有价值,但都不是我感兴趣的。我真正感兴趣的,是作者揭示了QQ上的活跃程度和城市经济指标GDP之间的关系。让人吃惊的是,一个城市QQ用户数和这个城市的GDP之间的Pearson相关系数达到了惊人的0.84。这么强的关联,暗示用在线数据预测城市GDP的可能性。最近刘金虎等人的论文“OnlineSocial Activity Reflects Economic Status”分析了2亿多新浪微博的用户数据,发现在线用户注册数目和城市GDP之间的Pearson相关系数可以超过0.86,并且利用这些数据可以进行很好的GDP预测。
任晓龙和刘金虎的论文都只是连接在线行为和线下社会经济的最初步尝试,但是这些结果价值不菲。首先,传统的经济普查要消耗大量的人力和物力,并且有很长的时间延后,而利用在线数据——当然不仅仅是这两篇文章这么简单的单一数据集——其成本相比经济普查几乎可以忽略不计,而且实时可以获得这些数据,不存在分析结果与现实状况之间巨大的时间差。其次,这些分析能够发现一些异常,例如刘金虎等人发现鄂尔多斯、崇左、来宾、中卫等几个城市在2012年之间互联网非常不活跃,但是GDP很高,而这些城市的经济结构比较单一,对于资源储备和资源价格有非常强的依赖,容易遭遇经济风险。例如鄂尔多斯在2012年后就遇到了经济上的巨大挑战!
任晓龙的文章只是一个起点,它告诉我们互联网的数据能够告诉我们更多。
全文免费下载:http://html.rhhz.net/dzkj-nature/html/1768.htm