cNMF

data preprocess

<aside>

https://github.com/SuA0409/BioAI/blob/main/proj_diabetes/cnmf_t2d_treatment_analysis.ipynb

image.png

상단 fig1. UMAP 시각화. 하이퍼파라미터를 계속 수정하였지만 clustering이 안 됨.

중간 fig2. Leiden clustering. X_cnmf를 기반으로 만든 cluster(좌측)는 군집 분리가 잘 되어 있지만, 각 군집에 다양한 condition이 섞여있음.

⇒ 이는 각 treatment condition이 완전히 독립된 program usage를 갖지는 않지만, 특정 program 조합에 따라 세포들이 부분적으로 반응 프로그램을 공유할 수 있음을 의미

하단 fig3. dominant program 기반 clustering. 각 cell의 프로그램 사용 비율이 아닌 dominant program으로 clustering.

image.png

상단 fig4. bar plot으로 각 program의 condition 별 usage 비교. 대부분의 cluster에서 treatment를 진행하여도 T2D가 유도되었을 때와 condition의 형태와 유사하게 나타남.

하단 fig5. leiden cluster 별 condition enrichment. 각 클러스터 별 condition 구성이 다름. cluster 14은 T2D_db/db 비율이 크므로, T2D가 유도되지 않은 cell 군집일 확률이 클 것으로 예상.

6.1_program 0의 condition 별 유전자 활성화.png

6_각 program 별 상위5개 대표 유전자들.txt

9_top20_genes_by_program.csv

fig 6. condition 별 program 0에서의 사용량의 차이. (program 0~8)

다른 program과 다르게 program 0에서만 대부분의 condition의 사용량이 높게 관찰됨.

program 0에서의 top 5 gene marker (예시) (https://www.bgee.org/)

Gene identifier Name Description T2D 연관
ENSMUSG00000027419 Pcsk2 proprotein convertase subtilisin/kexin type 2 (proinsulin을 insulin과 glucagon으로 분해하는 prohormone convertase 계열 효소) 인슐린 및 글루카곤 처리 및 분비 조절
ENSMUSG00000039278 Pcsk1n proprotein convertase subtilisin/kexin type 1 inhibitor - PCSK1(GLP‑1, POMC, proinsulin의 처리와 관련)을 조절함으로서 호르몬 분비 및 포만, 혈당 조절에 영향

10_average usage of gene programs by treatment group.png