周涛
我们经常使用的评价指标对链路预测算法的评估一致吗?
链接预测是网络科学中最活跃且重要的分支之一,在过去的二十年中,已有数千种链路预测算法被提出。随之而来的问题是如何评估这些链路预测算法的性能呢?目前已有的研究中已经使用了许多评估指标,包括受试者工作特征曲线下的面积(AUC)、平衡精确度(BP)、精确率-召回率曲线下的面积(AUPR)、精确度(Precision)、召回率(Recall)、F1得分(F1-measure)、Matthews相关系数(MCC)、归一化的折扣累积增益(NDCG)、精确率曲线下的面积(AUC-Precision)等。面对这么多的评价指标,它们评估链路预测算法的性能是一致的吗?应该选取哪些评价指标才可以更科学且公平地评估链路预测算法的性能呢?这些问题一直未被详细地探讨。
于
2024-11-24
发布于
科学网
631
次阅读