传说有人问泰勒斯:“何事最难为?”泰勒斯回答说:“认识你自己。”尼采也说过:“离每个人最远的,就是他自己。”如果有人问我,形形色色的复杂系统中,什么系统最复杂。我会告诉他,我们自身的行为最复杂,我们组成的系统最复杂!从2005年起,以Barabasi和Brockmann为代表的青年科学家,掀起了一股研究人类行为复杂性的热潮,本文主要讨论的是人类出行行为的复杂性。
从长途旅行时携带的美元现钞,日常出行时手机的位置信息到乘坐出租车的GPS定位信息,最近的很多实证研究都暗示我们人类出行的位移满足一个具有指数截断的幂函数律,与此同时,我们的行动还具有强烈的向心性,以至于不能以任何形式的连续时间随机游走模型来解释,包括我们耳熟能详的Levy飞行。最近Barabasi小组在《自然-物理》上公布了一个大胆的模型,他们认为,群体数据上标度关系的本质是个体层面的出行也具有标度关系,而这种标度关系的来源有二:一是以一种幂函数的形式降低对新位置的访问频率,二是返回访问过的位置的概率正比于以前访问过该位置的次数。两个因素加在一起,可以推出,个体出行位移满足幂函数律!
有人可能立刻会指出,这个模型不过是从一个幂函数律推出另一个幂函数律的花样!的确如此,然而这还不是致命的问题——致命的问题是小勇用更有说服力的数据证明了,在个体层面根本就没有所谓的标度律存在!我们知道,钱和出租车都不是一个人霸着用,这些数据无法反映单个个体的行为;而目前发表的手机数据要么是接拨电话记录一次,要么是每隔一个小时记录一次,这些时候个体或者没有任何有目的的出行,又或者只是在从出发点到目的点的中途,例如高速路上接到电话。所以,这样的数据虽然量很大,能不能真正反映个体的出行距离,是要打个问号的。小勇分析了瑞士弗劳恩费尔德市230位居民的出行日志,包括每一次有目的的出行的出发地、目的地和时间,发现不同类别的人有着截然不同的出行模式:学生主要在家和学校间往返,职工除了家以外还有若干常去的场所,而退休人员则有很多个经常去的地方。通过假设检验,小勇发现,在这230个人中,有198人的出行距离分布不满足幂律分布。这不得不让我们对Barabasi模型的基础产生担忧,并再一次想起Hidalgo在2006年时关于不同活跃性的泊松个体在群体层面涌现幂律的证明。
在手头只有几百个样本的时候,我们或许会天真的认为,几百万的样本会告诉我们一切。然而,也许你最后会发现,隐藏在纷繁复杂的人类行为背后的故事,往往是通过对几十数百个体深入的跟踪分析得到的!