论文解读|AAAI2026:分层拓扑粒度图对比学习
2025-12-26
3191

近日,实验室研究团队完成的论文 HTG-GCL: Leveraging Hierarchical Topological Granularity from Cellular Complexes for Graph Contrastive Learning 被人工智能领域顶级会议 AAAI 2026(The 40th Annual AAAI Conference on Artificial Intelligence)接收。下面将对该论文做详细地解读,供大家交流学习。
论文具体信息如下:
论文题目:HTG-GCL: Leveraging Hierarchical Topological Granularity from Cellular Complexes for Graph Contrastive Learning
作者:戢启瑞*,秦滨*,靳毅凡,赵云泽,孙楚雄,郑昌文,曹建文,李江梦
论文地址:https://arxiv.org/pdf/2512.02073
概述:
图对比学习(GCL)的目标是通过对比同一图的不同视图,学习具有判别性的语义不变性,这些视图往往共享关键的拓扑结构模式。然而,现有基于结构增强的 GCL 方法往往难以识别任务相关的拓扑结构,更无法适应不同下游任务中从粗到细不断变化的拓扑粒度需求。为此,我们提出分层拓扑粒度图对比学习(HTG-GCL)框架,通过对同一图执行多粒度的拓扑变换,构建具有不同最大环长的多尺度胞腔复形视图,以分层方式刻画拓扑粒度并生成丰富多样的拓扑结构表征。鉴于某些粒度可能包含误导性语义,我们进一步提出多粒度解耦对比学习策略,并引入基于不确定性的粒度特定加权机制来调整不同粒度的贡献。在多个基准数据集上的实验表明,HTG-GCL 能够有效提升图表示的判别能力。

论文动机实验图
动机与分析:
现有基于拓扑结构的图对比学习方法(如 CellCLAT)在构建胞腔复形时通常采用固定的最大环长,从而只能刻画单一层级的拓扑粒度。然而,不同任务场景对图中高阶结构的依赖差异显著:例如,社交网络(IMDB-B)更依赖三角结构等小环,因此适合较粗粒度的拓扑建模;而分子图(NCI1)常需识别更大、更复杂的环结构,从而依赖更细的拓扑粒度。当引入的拓扑粒度与任务语义不匹配时,不仅无法提升性能,甚至会造成明显的性能下降。此外,我们在 NCI1、MUTAG、NCI109 和 IMDB-B 四个 TU 数据集上开展了拓扑粒度对比实验,比较三种单一最大环转换(6,9,12)粒度与多粒度集成的表现。结果表明,多粒度策略在所有数据集上均显著优于任何单一粒度,说明不同拓扑粒度之间存在互补的结构信息。这些发现共同指向一个核心问题:如何在自监督学习中有效利用分层拓扑粒度,从而提升图表示质量?

HTG-GCL框架图
方法:
为此,我们提出了 HTG-GCL(一种分层拓扑粒度的图对比学习框架),用于构建并利用多尺度的拓扑结构信息。核心思路是在数据层面和学习范式层面同时刻画不同最大环粒度下的高阶结构信息,来避免单一粒度带来的语义偏差,又充分挖掘多粒度之间的互补性。具体而言:(i)在数据表示上,HTG-GCL 通过基于最大环的图--胞腔复形变换,将每个原始图统一映射为多个最大环长不同的胞腔复形视图,形成由粗到细的多尺度拓扑粒度序列;(ii)在对比学习机制上,HTG-GCL 先将原始图及各粒度胞腔复形统一映射到一个公共空间,通过标准对比损失强化同一图多视图的一致性;同时,针对每个粒度再设置独立投影头,构建对应的“粒度特定解耦空间”,在其中以原始图为锚点,仅将其他粒度视图作为正样本、不同图视图为负样本,从而在保留粒度间互补性的同时,抑制单一粒度可能带来的误导信息;(iii)在粒度选择上,引入基于狄利克雷分布的不确定性估计,对不同粒度空间的聚类置信度进行量化评估,并将其作为权重融入总对比损失,实现对可靠粒度的自适应强化,从而获得判别性更强的图表示。
实验:

无监督设置结果

半监督10%标签设置结果
我们将HTG-GCL与多种不同的图对比学习方法在图分类基准数据集(TU-dataset)上进行了无监督和半监督10%标签设置的对比。实验结果表明HTG-GCL在不同设置上均取得了最佳性能。
