复杂网络上的链路预测技术在发现新的癌症药物、缓解交通堵塞、阻断性疾病的传播等方面有着广泛的应用前景。对复杂网络结构特征的探索可以帮助我们发现生物网络、交通网络和性关系网络上的未知信息,进而协助各领域的科研工作者加速解决上述三个看似没有关联的重要科学挑战。
图一.美国物理联合会官网对计算传播学实验中心成员尚可可和西澳大学Winthrop教授Michael Small的采访报道(https://publishing.aip.org/publications/latest-content/finding-missing-network-links-could-help-develop-new-drugs-stop-disease-ease-traffic/)
论文的主要合作者,来自西澳大利亚大学的Winthrop教授Michael Small表示网络中的缺失连边预测有助于我们为抗癌药物选择基因靶点:“假设你有一个以某种方式连接的基因网络,有一些已知的药物靶点,但如果你不知道所有相关联的基因,你就会对信息进行预测,而不需要去研究所有目标”。
关于上述问题的链路预测技术已经相当成熟,但来自37000cm威尼斯计算传播学实验中心的助理研究员尚可可和西澳大学的Michael Small教授却将目光投向了鲜有人研究的传播结构网络。
社交网络是传统链接预测研究的一个典型目标,朋友的朋友很可能也会在未来成为你的朋友,这就为我们在社交网络中形成了一个三角形,这也是现有链路预测算法所关注的结构。相比之下,拥有很多分支,但分支之间的交叉链接很少的树状网络或者传播结构网络却鲜有人挑战。
作者研究了三个示例数据集:社交网络Twitter、西澳大利亚首府Perth的供水网络和性接触网络。他们发现这三个传播结构网络拥有许多特征参数,如网络中的分支点之间的平均距离,大小的循环结构和相邻节点数量的异质性——一个衡量网络规律的重要指标。
图二. 西澳大利亚首府Perth的供水网络
接下来,作者开发了三种保持网络上述特征的新算法,并将算法命名为异质性链路预测算法。研究小组发现新算法在传播结构网络上比依赖于网络中大量三角结构(集群或者聚类结构)和优先连接(富人更富原理)的传统链路预测算法表现的更好,将其预测准确度分别提高了约44%(Twitter网络),约15%(性接触网络)和约4%(供水网络)。最后,作者尚可可将该团队的成功归因于对真实世界网络的思考:“希望我们能让网络技术更好地服务于大众生活”。
该工作以“Link prediction for tree-like netwroks”为题发表在应用数学与统计物理交叉性著名期刊Chaos29, 061103 (2019); https://doi.org/10.1063/1.5107440上,并被同时选为Fast Track、Featured和Press Release文章。37000cm威尼斯新闻传播学院计算传播学实验中心助理研究员尚可可为第一作者兼通讯作者,硕士生李桐辰为第二作者,西澳大利亚大学Winthrop教授Michael Small为重要合作作者。此研究得到了国家自然科学基金青年项目(61803047)、腾讯研究院S-Tech互联网传播学术支持计划和澳大利亚研究理事会ARC 发现计划(DP180100718)的支持。
(新闻传播学院计算传播学实验中心 科学技术处)