<aside>
📌 프로젝트를 위해 공부 했던 'HAN' 에 대해 정리하고자 한다. 이번 포스팅에서는 'HAN'을 처음 소개했던 'Heterogeneous Graph Attention Network' 논문의 내용을 바탕으로 참고 자료와 함께 다시 정리하였다.
</aside>
0. Preliminaries
Heterogeneous Graph Embedding
-
크게는 Embedding 기반 방법론과 Path기반 방법론으로 나뉨
-
Embedding 기반 방법론으론 TransE, TransH, TransR 으로 관계정보가 embedding space에 보존되도록 학습하는 방식 (주로 link prediction task에서 많이 사용)
-
Path 기반으론 RandomWalk base의 Metapath2vec, **graph networks 기반의 GCN, GAT**가 있음
(** Meta-path : 네트워크 스키마상에 정의된 edge type - node type의 sequence)
- target node과 이웃과의 관계를 aggregate하는 과정에서 인접된 이웃의 중요도(Attention weight)를 바탕으로 가중치를 적용하는 방식

1. Introduction
- Graph representation에 기반한 GNN(graph neural networks)은 많은 분야에서 유의미한 성과를 보임
- 하지만 여전히, 다른 node type과 link를 가진 HetG(Heterogeneous Graph)를 완전히 고려하지 못함
- HetG는 더 comprehensive information 하고, rich semantics를 포함함으로 data mining task에서 광범위하게 활용 가능 하지만 이를 처리하는 것은 여전히 challenges
- HetG에서 nodes간 관계는 서로 다른 semantics information을 가질수 있는데, 이러한 복합적인 관계를 연결한 ‘Meta-path’ 는 semantics 구조를 표현하기 위한 방법으로 활용됨
- 최근 연구 동향은 모델이 데이터에서 가장 두러진 부분에 집중하도록 유도하는 ‘attention mechanism’ 을 적용하는 것이나, HetG task에 적용 하기에는 제약조건들이 존재
1.1 Traditional graph neural network cannot be directly applied to HetG
C1 : Heterogeneity of graph
- node type 따라 feature이 다르고 이에 따라 서로 다른 semantics information을 가질수 있음
- 복잡한 구조 정보를 처리하고, 다양한 특징 정보를 동시에 보존할 수 있는 방안 필요
C2 : Semantic-level attention