俗话说:“物以类聚,人以群分”,可是这分群聚类之事,也不容易。网络社团结构挖掘是眼下一个热点,不仅算法上有挑战,而且应用范围非常广。
网络上的优化问题很多,匹配、着色、嵌入等等,这些问题很难,但是都有很严格的定义和很明确的待优化的目标函数。挺有趣的一件事情是,什么是社团,到现在都没有让所有人信服的严格定义——以前提出的但凡严格的定义,往往在实用上都存在局限性。在这种情况下,最重要的问题是“要优化什么”,至于“怎么优化”,倒成了其次的问题。
张聪和沈惠璋老师的文章就是注意到了模块度函数作为优化目标所存在的问题,特别是无法挖掘小社团的问题,提出了简单而有效的解决方案。说其简单,是因为不过是把一个自然密度因子乘在模块度函数的每一项上,内行一句话就听明白了;说其有效,是因为这的确克服了模块度函数分辨率的问题,作者不仅给出了虚拟基准网络和真实数据的分析,还从容不迫地通过推理论证说明该指标能够解决Fortunato和Barthelemy所举特例中存在的问题。即便读者不喜欢中间的推导,略过不读,这依然是一篇能够在很短时间内给予很大信息量的高质量论文。
[近期将给出全文下载链接]