Full order sampling _ humanoid_ covariance 바꿔서.pdf
논문 제목:
“Full-Order Sampling-Based MPC for Torque-Level Locomotion Control via Diffusion-Style Annealing”
저자: Haoru Xue∗ , Chaoyi Pan∗, Zeji Yi, Guannan Qu, and Guanya Shi
<Purpose>
diffusion style annealing process(single-step diffusion)를 사용해서 full-order 사족보행을 torque sample하여 optimize함. real time(50Hz)으로
<Process & characteristic>
dynamics : JAX, using the Brax simulator로 모델 업데이트해서 사용.
sampling method : forward density function을 diffusion process에 넣어서 gausian distribution의 평균과 분산을 적합하도록 맞춤.

Action level annealing → inner loop action level annealing으로, H는 time horizon을 의미. 처음에는 좁게 보지만, time step이 커질수록 더 넓은 구역 탐험.

⇒ trajectory level annealing이랑 action level annealing을 합치면 아래 알고리즘과 그림과 같아짐.
장점: sampling num이 커질수록 더 최적화시키고(처음에 넓은 area를 보고 맞는 방향으로 좁힘) timestep이 커질 수록 exploration area는 크게 만들어서 더 넓은 영역을 탐색하되, 최적화도 진행.
이 과정을 diffusion process로 annealing해서 이론상 최적화될 거라고 증명함.


<adaptable features>
<similar paper(maybe helpful to double check)>