기본 규칙

(N, J, D) ↑ ↑ ↑ │ │ └── 하나의 데이터 크기 (dim) │ └───── 관절/마커 수 (Joint) └──────── 프레임 수 (시간축)


실제 예시로 읽기

poses: (601, 156)

601 → 프레임 수 (시간) 156 → 52관절 × 3 (axis-angle) └── 2D라서 관절축이 이미 flatten됨

marker_data: (601, 85, 3)

601 → 프레임 수 85 → 마커 85개 3 → XYZ 좌표

joints: (N, 24, 3)

N → 프레임 수 24 → 관절 24개 3 → XYZ 위치

betas: (16,)

16 → 체형 계수 16개 프레임 축 없음 = 시간에 따라 안 변함 (사람 체형은 고정)

vertices: (N, 6890, 3)

`N → 프레임 수

6890 → mesh 꼭짓점 6890개 3 → XYZ 위치`


마지막 dim(D) 으로 표현방식 읽기

`마지막 dim이...

3 → XYZ 위치 또는 axis-angle 회전 4 → quaternion (w,x,y,z) 6 → 6D rotation 9 → rotation matrix (3×3 flatten) 2 → UV 텍스처 좌표 또는 2D 투영 좌표 1 → scalar (confidence, contact 등)`


헷갈리는 경우 구분법

3인데 위치인지 회전인지 모를 때