人类行为时间统计特性的实证总结
周涛  |  2012-01-24  |  科学网  |  477次阅读

咨询文献要收费!!!!

 

 

人类行为时间统计特性实证研究结果总结。幂指数若无特殊说明指间隔时间分布。

分析对象

数据来源

幂指数

电子邮件

大学里以三个月为周期的3188位用户收发的共129135封信件[1,26,27]

个体回复时间和间隔时间分布幂指数均为1

数据同上[28,29]

不符合幂律,建议用级联非齐次泊松过程刻画

数据同上[30]

不符合幂律,建议用对数正态分布刻画

一个大型咨询公司在2006年7月到2007年1月间,其1052个管理人员之间发送的1493441封电子邮件[31]

邮件从收到到回复的时间服从一个很广阔的分布——从立刻回复到超过1000小时不等,且接受者倾向于在较短时间内回复和自己存在社交关系的友人

水陆信件

爱因斯坦、达尔文和弗洛伊德一生收发的30801封、14121封和5858封信[32,33]

回复时间分布幂指数为3/2

钱学森通信记录,来自涂元季主编的《钱学森书信》,跨越时间为1955年至2000年。包括了记录有写作时间的3335封信,其中1819封信注明了此信所回复的信件的收到时间,单位是天[34,35]

回复时间和间隔时间分布幂指数均为2.1

从十六世纪中叶到二十世纪中叶,16位著名作家、演员、政治家和科学家的通信记录[36]

不符合幂律,建议用级联非齐次泊松过程刻画

手机短信通讯

志愿者的短消息通信记录,统计时间长度从3个月到6个月不等[37]

1.2到1.7之间,针对个体

2006年新年期间6326713位用户37577781条短信记录[38]

发送时间间隔分布在30秒到20000秒之间符合幂律,指数为1.188;回复时间间隔分布在60秒到20000秒之间符合幂律,指数为1.148

来自3家公司147672位用户1589869条短信记录[39]

不符合幂律或截尾幂律,建议用双模分布刻画,前段为幂律,后段为指数

手机通话

六百万用户一个月的通话记录[40]

时间间隔分布服从带指数截断的幂律,幂指数为0.9,截断值为48天

图书馆借阅

圣母大学三年间2247名教工从图书馆借阅的48409条记录[33]

个体间隔时间分布,幂指数在1附近分布

中国两所不同大学图书馆数据库,包括13866名学生和教师共计772504条借书记录和647048条还书记录[41]

个体借阅时间分布近似为幂律,指数集中在1.5左右;群体借阅时间分布形式复杂,有明显的截止时间效应;个体借还书间隔时间分布指数在0.6到1.6之间,与借阅量正相关

金融活动

中欧银行在1999年6月到2003年5月间由一个股票经纪人发起的所有54374次交易[33]

幂指数为1.3,但是有一个指数的截断

在2002年的三月、六月和十月GSKVOD证券交易中将近800000次订购和540000次交易[42]

胖尾,但不符合幂律分布

2006年12月9日台北市长选举前以5位候选人为对象设计的在线期货交易实验,实验共持续了30天,有400多名志愿者参加[43]

全体层面间隔时间分布服从指数截断的幂函数律,幂指数为1.3

网页访问

匈牙利新闻娱乐网02年11月8号到12月8号期间每个访问者每次下载文件的时间纪录[33]

不同个体略有不同,幂指数以1.1为中心

数据同上[44]

全体用户群集数据对应的分布为1.2;个体均值为1.14

美国乔治亚州亚特兰大市埃默里大学从2005年4月1日到2006年1月17日其门户(www.emory.edu)及所属网页访问记录[45]

同一用户访问同一网页间隔时间分布指数为1.0,统一用户访问不同网页间隔时间分布为1.25

上海理工大学十五天内访问Internet的记录[46]

个体分布在2.13之间,全体用户群集数据对应2.82

2004年12月23日到2008年10月8日,7565401位用户登录维基百科的17531208次记录[47]

群体层面间隔时间分布指数约为1.2

网络通信

1998年到2008年,Ebay上748282位用户所发出的149087003条反馈信息[47]

群体层面间隔时间分布指数约为1.9

MSN即时通信2006年6月,2.4亿用户间发生的约300亿次交谈[48]

群体层面交谈时间间隔分布指数为1.53

五位志愿者在QQ上4个半月到1年不等时间内发信息的记录[49]

个体层面幂指数在2.0到2.5之间

网络搜索

2006年3月1日至5月31日,美国在线657426位用户36389566次搜索记录[47]

群体层面间隔时间分布指数约为1.9

2007年4月1日-4月8日手机终端上498872个搜索需求[50]

全体层面上24小时内的时间间隔分布接近幂律,24小时以外按指数衰减

论坛博客活动

2005年8月到9月间,45000位博主发表的220万篇博文[51]

群体层面上博文发表的间隔时间分布指数为2.7

南京大学小百合BBS截止到2009年9月1日20379名用户发布的1627697个帖子[52]

群体数据幂指数为1.98,作者实际上采用的Mandelbrot分布[53]进行拟合

数据同上[54]

同一用户连续两次发表帖子的间隔时间分布都近似服从幂函数律,但在分钟、小时和天的不同尺度上指数不同

科学网博客4名博主发布的博文,数量分别为588,191,536和772篇[55]

时间间隔服从伽玛分布[56],不严格地讲,该分布可以看作带指数截断的幂函数和Mandelbrot分布[53]的结合

用户在博客和微博上的行为[57]

都服从幂律,指数分别是1.3和2.0

随机抽取的2006年注册用户的30%在Boards.ie下面的9个论坛上的行为[58]

群体层面幂指数约为1.7

用户在新浪微博上发微博行为[59]

幂指数为1.4

社交网络活动

2003年6月到2005年10月,在韩国最大的在线社交网络Cyworld上17788870位用户在留言本上留言的记录[60]

群体层面间隔时间分布出现三段幂律:在间隔小于36分钟时,指数为1.696;间隔在36分钟到1天间,指数为0.910;在间隔大于1天时,指数为2.276

任务执行

2009年1月到2010年4月,亚马逊推出的名为土耳其机器人的再现任务解决系统,共包含9436个任务(总奖金529259美元)所导致的6701406个访问[61]

任务从发出到执行完毕的等待时间分布符合幂律,幂指数为1.48

超过10000个文件中自动记录的用户在使用计算机软件时出现的中断/暂停行为[62]

两次中断/暂停之间的时间间隔分布符合幂律,指数为1

6位用户在服务器上产生的7个历史文件所记录的Linux命令日志文件,每个文件包含命令数在12000到93000之间[63]

两次提交命令的间隔时间分布符合幂律,指数在1.47到1.74之间

一个大规模协作实验,要求参赛队在尽可能少的时间里面在美洲大陆十个指定地点放上红色气象球,最终麻省理工代表队借助社会网络的力量在8小时52分完成该任务,获得冠军。文献[64]分析了该队数千名参加者接到任务到回复的时间间隔(这个间隔不能直接得到,因此用一个参与者和他所发展的下线注册时间差代替)

指数分布

在线服务

在线共享电影网www.netflix.com电影观看数据,包含了17770部电影,447139位用户和近亿条记录[65]

群体数据指数为2.08,个体分布形式不定,但有胖尾

在线音乐共享网站上的登陆记录[66]

群体数据显示用户两次听音乐的时间间隔分布具有胖尾特征,但分布后部分波动剧烈,难以用幂函数拟合

Delicious网站上从2004年4月1日到2007年11月1日220867个用户共计54204641个书签收藏记录[67]

群体层面在一天以内和一天以外,间隔时间服从不同的分布,幂指数分别为1.07和2.41

2008年12月2日至2010年1月12日274148位用户针对京东商城上28620件商品的购买数据[68]

时间间隔服从幂律分布,不同品类商品幂指数不同

战争叛乱暴力

54679个有报导的暴力事件[69],有趣的是,本文在《自然》期刊第911页发表,应该是来自编辑的冷幽默。

每天发生的暴力事件数目存在明显的阵发特性

中国历史上有记载的战争[70]

间隔时间服从广延指数分布

从MIPT网站上获得的在伊朗发生的8627次恐怖袭击数据和在阿富汗发生的772次恐怖袭击[71]

伊朗和阿富汗幂指数分别为2.61和2.41

写作

2005年2月11日到2005年10月2日利用谷歌RSS阅读器得到的68022篇博文的内容[72]

总出现次数小于214次的单词相续出现的间隔时间(单位:天,注意此处间隔不是按照词语数衡量,而是真实时间)分布指数约为1.5

中文维基百科在2002年10月26日到2009年6月7日81823名用户9641842次编辑记录[54]

同一用户连续两次编辑的间隔时间分布都近似服从幂函数律,但在分钟、小时和天的不同尺度上指数不同

大文学家苏轼和活跃的科学家Stanley, Newman, Barabasi发表文学作品和学术论文的时间[73]

发表时间间隔服从幂律分布,幂指数相差很大

物理接触

2005年5月在迈阿密召开的IEEE INFORCOM会议上,54位志愿者佩戴Intel iMote,从而其行为轨迹能够被记录[74]

两位志愿者之间产生接触的间隔时间分布满足具有很强截断的幂函数,幂指数约为1.4

数据同上[75]

幂指数约为1.6

100位麻省理工学生通过内置蓝牙设备的手机记录的长达9个月的空间位置信息[75,76]

两位志愿者之间产生接触的间隔时间分布满足具有很强截断的幂函数,幂指数约为1.49

2008年10月13-17日,50余名与会人员在明为“面对疾病传播的挑战”的研讨班上,佩戴RFID胸牌,可以记录近距离两两交互[77-79]

一个志愿者与其他志愿者两次物理接触之间的间隔时间和一对有多次接触的志愿者连续两次接触之间的时间间隔都符合相近的幂律分布,幂指数未给出。

日本一家公司163位志愿者73天中通过配戴传感器记录的51879次面对面的交谈行为[80]

幂指数为2.52




文章原载于作者的科学网文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文