설명
각 H&E염색 WSI 에서의 분할 및 검출 AI 알고리즘
AI
1. H&E WSI 레벨 영역 분할 모델
- 목적: H&E 염색된 전 조직 슬라이드(Whole Slide Image, WSI)에서 거대 구조 단위로 영역을 분할하여, Tumor(종양) / Stroma(기질) / 기타(지방, 정상 조직 등)를 자동으로 구분함.
- 데이터셋/준비현황: 현재 WSI 단위로 공개된 “정형화된 영역 분할” 오픈데이터셋은 추가 확인 중이며, 데이터 준비 및 주석 범위 검토가 필요함.
- 장점:
- 패치 단위 처리 대비 속도 우위 → WSI 전체를 한번에 처리 가능 → 실사용·상용화 관점에서 유리
- 고사양 자원 확보 시에는 패치 단위와 유사한 수준으로 성능 확보 가능
- 제한 사항:
- 고성능 자원 요구됨 (예: GPU VRAM 80 GB 이상) → 저사양 환경에서는 성능/처리속도 보장 어려움
- 세포 단위 또는 매우 미세한 구조까지의 분할은 현실적으로 제한됨
- 클래스가 매우 세분화된 경우(예: 여러 하위 종류의 stroma, 림프구 침윤 영역 등)에는 기대 수준의 성능 달성 어려움 → 크게 Tumor / Stroma / Others 수준에서 적용 권장
- 적용 방향 및 커버리지:
- 초기 단계에서는 Tumor와 Stroma로 나누는 2-클래스 분할 모델 구축
- 이후 필요 시 정상 유방 조직, 지방, 림프구 침윤 영역 등 3~4 클래스 구조로 확장 예정
- 병리 진단 보조, 면역미세환경 분석의 전처리 파이프라인으로 활용 가능
- 향후 계획:
- WSI 단위 공개 데이터셋 조사 & 확보
- 모델 구조 설계 (예: U-Net 기반, 효율화된 슬라이드 단위 인퍼런스 구조)
- 자원 조건에 따른 스케일링 전략 수립 (고사양 vs 저사양)
- 분할 결과의 후속 처리(예: 패치 추출, 세포검출 모델 연계)

2. H&E WSI 레벨 세포 검출 모델
- 목적: Whole Slide Image 상에서 개별 세포 단위의 핵(nucleus) 위치 및 종류를 검출하여 Tumor, Immune, Stromal 세포 구성 및 분포를 정량 분석
- 데이터셋/준비현황: Lizard, NuCLS 등 공개 핵 검출 데이터셋 확보 완료. 세포 타입 분류 포함 모델 학습 준비됨
- 장점:
- TME(Tumor Microenvironment) 기반 면역침윤도·세포 비율 정량화 가능
- 후속 IHC 기반 biomarker 분석(예: PD-L1 CPS 등) 연계 기반 마련
- 제한 사항:
- 고해상도 WSI 처리 시 연산량 매우 큼 → WSI 단위 전체 탐지 시 슬라이딩 윈도우/타일링 전략 필요
- 실제 임상 조직 데이터 편차(염색/스캐너 차이)에 대한 도메인 정규화 필요
- 적용 방향 및 커버리지:
- 초기: Tumor nucleus vs Immune lymphocyte nucleus vs 기타 stromal nucleus 검출을 중심으로 구조 확립
- 이후: 세부 면역세포 타입별 정량화 및 biomarker 지표 기반 분석 파이프라인 확장
- 향후 계획:
- Lizard/NuCLS 학습 결과 기반 도메인 갭 보정 및 내부 병원 데이터 추가 확보
- 세포 검출 결과를 AI 기반 면역미세환경 분석 및 바이오마커 정량화에 확장