在大數據時代,圖結構數據廣泛存在于社交網絡、推薦系統和生物信息學等領域。然而,當前的圖神經網絡(GNN)方法在處理大規模、異質和噪聲較大的圖結構數據時,往往面臨著可解釋性不足、過度平滑、噪聲堆疊、計算復雜性高的挑戰。
近期,大連理工大學軟件學院、國際信息與軟件學院萬良田副教授研究團隊通過創造性地融合隱層表征與拓撲信息、小波去噪與圖卷積、自監督學習中的LLE降維優化、Z-laplacian框架的矩陣分解方法等多種有效方法,解決了圖結構數據處理中的系列難題,為該領域的進一步研究提供了新的方向和思路。相關研究相繼發表在中國計算機學會認定的數據挖掘及知識發現領域頂級學術會議及期刊(A類)中,包括2024年國際知識發現與數據挖掘大會、2023年國際萬維網會議,以及IEEE知識與數據工程匯刊。文章第一作者均為萬良田副教授,第一完成單位為大連理工大學。
成果1:基于隱層表示學習的靈活圖擴散模型
研究團隊通過分析過度平滑問題,提出了基于擴散的隱層表征學習方法。該方法通過設計靈活的圖聚合模型,根據不同節點的鄰接關系自適應聚合鄰居信息,從而有效應對異質圖和深層網絡中的過度平滑問題。FGND在堆疊256層后依然具備優秀的可區分度。
圖1 FGND與GCN模型堆疊多層后隱層表示區分度對比(Cora)
成果2:小波去噪濾波器統一并改進圖卷積神經網絡
為解決噪聲累積問題,研究團隊引入了小波去噪濾波器,將其與圖卷積神經網絡相結合,利用小波擴散局部性的特點,顯著提升了模型的效果以及可解釋性,同時設計了一種新的圖采樣策略,在多個數據集上實現了更加穩定和準確的節點分類。
圖2 字母GSP在不同小波系數下的擴散程度
成果3:基于自監督學習的圖神經網絡模型
研究團隊聚焦于圖對比學習的優化與可解釋性,通過將LLE降維算法引入自監督學習框架,團隊設計了更具解釋性的對比學習模型,大幅提升了圖嵌入的準確性,同時保持了較低的計算復雜度。研究團隊提出的GraphTL模型相比之前的圖對比模型MVGRL、GRACE以及有監督模型GCN,分類效果更加優秀。
圖3 GraphTL模型與其他模型在分類效果上的對比
成果4:Z-拉普拉斯矩陣分解:具有可解釋圖信號的網絡嵌入
針對計算復雜性和效率問題,研究團隊提出了一種基于Z-laplacian框架的圖嵌入方法。該方法通過引入偏置參數,實現了對不同時間長度擴散的精確控制,不僅提升了模型在節點分類和鏈路預測任務上的表現,還顯著降低了計算復雜度。
圖4 Z-NetMF模型在BlogCatalog數據集上的分類效果
相關研究得到了國家重點研發計劃、國家自然科學基金、遼寧省自然科學基金、中央高?;究蒲袠I務費專項資金、浙江實驗室以及重慶市教委科技研究計劃項目的資助和支持。(來源:軟件學院、國際信息與軟件學院 作者:萬良田 李鵬 編輯:李夢瑤)
論文1鏈接:https://dl.acm.org/doi/10.1145/3637528.3671860
論文2鏈接:https://dl.acm.org/doi/10.1145/3543507.3583253
論文3鏈接:https://dl.acm.org/doi/abs/10.1145/3543507.3583441
論文4鏈接:https://ieeexplore.ieee.org/document/10313024