圖卷積網(wǎng)絡 (GCN) 的高層解釋
發(fā)布日期:2022/7/26 10:19:18 瀏覽量:
圖的力量

圖的獨特功能可以捕獲數(shù)據(jù)之間的結(jié)構(gòu)關系,從而比孤立地分析數(shù)據(jù)可以獲得更多的洞察力。圖是最通用的數(shù)據(jù)結(jié)構(gòu)之一。它們自然出現(xiàn)在許多應用領域,從社會分析、生物信息學到計算機視覺。
這里只是一些例子:
- 醫(yī)療診斷和電子健康記錄建模
- 藥物發(fā)現(xiàn)和合成化合物
- 社會影響預測
- 推薦系統(tǒng)
- 流量預測
歐幾里得數(shù)據(jù)被建模為在 n 維線性空間中繪制。例如,圖像文件可以用 x、y、z 坐標表示。
非歐幾里得數(shù)據(jù)沒有必要的大小或結(jié)構(gòu)。它們處于動態(tài)結(jié)構(gòu)中。
因此,一個潛在的解決方案是在低維歐幾里得空間中學習圖的表示,從而可以保留圖的屬性。
圖神經(jīng)網(wǎng)絡的特征
1-鄰接矩陣

鄰接矩陣是用 0 或 1 填充的 N x N 矩陣,其中 N 是節(jié)點總數(shù)。鄰接矩陣能夠通過矩陣中的值來表示連接節(jié)點對的邊的存在。
實際上,將我們的圖表示為鄰接矩陣使我們能夠以張量的形式將其提供給網(wǎng)絡,這是我們的模型可以使用的。
2-節(jié)點特征

該矩陣表示每個節(jié)點的特征或?qū)傩?。?jié)點功能可能因您嘗試解決的問題類型而異。
例如,如果您正在處理 NLP 問題,則節(jié)點可以具有句子的獨熱編碼向量或具有定義連接到分子的原子的屬性,例如原子類型、電荷數(shù)和鍵。
CNN vs GCN

卷積神經(jīng)網(wǎng)絡在提取復雜特征方面已被證明非常有效,如今卷積層代表了許多深度學習模型的支柱。CNN 在處理任何維度的數(shù)據(jù)方面都取得了成功。
CNN 如此有效的原因在于它能夠?qū)W習一系列過濾器來提取更復雜的模式。有了一點創(chuàng)造性,我們可以將這些相同的想法應用于圖形數(shù)據(jù)。
圖像是連接到其他像素的像素的隱式圖形,但它們始終具有固定的結(jié)構(gòu)。社交媒體網(wǎng)絡、分子結(jié)構(gòu)表示或地圖上的地址不是歐幾里得的。
GCN 執(zhí)行類似的操作,其中模型通過檢查相鄰節(jié)點來學習特征。
圖卷積網(wǎng)絡基礎
空間卷積適用于節(jié)點的局部鄰域,并根據(jù)節(jié)點的 k 個局部鄰域了解節(jié)點的屬性。
在譜圖卷積中,我們對圖的拉普拉斯矩陣進行特征分解。這種特征分解幫助我們理解圖的底層結(jié)構(gòu),我們可以用它來識別這個圖的集群。
與空間圖卷積方法相比,譜圖卷積目前不太常用。
GNN 還具有獨特的消息共享機制。它們在相鄰節(jié)點之間執(zhí)行一些聚合。我們可以將這個過程想象為傳遞消息和更新,其中 GCN 的每一層都獲取鄰居節(jié)點的聚合并將其傳遞給下一個節(jié)點。
我們可以使用學習到的節(jié)點嵌入來執(zhí)行許多操作。例如,我們可以對節(jié)點向量求和,然后使用 MLP 進行分類。
圖卷積的另一個案例
越來越多的證據(jù)表明,來自多種化學類別的數(shù)千種其他分子,如植物中豐富的多酚、黃酮類化合物、萜類化合物,可能有助于預防和對抗疾病。
在這個論文中,研究人員應用圖神經(jīng)網(wǎng)絡使用蛋白質(zhì)-蛋白質(zhì)和藥物-蛋白質(zhì)相互作用圖來尋找食物中的抗癌分子。
我們發(fā)現(xiàn)的一些超級食物清單:柑橘類水果、卷心菜、芹菜。
論文地址:https://www.nature.com/articles/s41598-019-45349-y
最后總結(jié)
從知識圖譜到社交網(wǎng)絡,圖譜應用無處不在。
GNN 的目標是在低維歐幾里得空間中學習圖的表示。
圖卷積網(wǎng)絡具有強大的表達能力來學習圖表示,并在廣泛的任務和應用中取得了卓越的性能。
GNC 在藥物發(fā)現(xiàn)中必不可少。
馬上咨詢: 如果您有業(yè)務方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術,還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生