1. PCA 들어가기 전 input data (= pre_df)

image.png

2. PCA(embedding 작업)


제가 생각하는 가장 현실적으로 scICE를 돌려볼 수 있는 방법은,

  1. 데이터를 보다 더 robust하게 필터링을 진행하여 데이터 크기 많이 줄이기
  2. 이를 가지고 scICE를 돌려 consistent cluster label 확보
  3. consistent cluster label이 없는 cell(데이터)만 다시 추출해서 1, 2 단계 계속 반복

⇒ 즉, sub clustering을 매우 많이 반복: 시간이 많이 들겠지만, 상대적으로 정확도/가능성이 있다고 생각함.