a9.3_5. [entry] title: NeRF 기반 모델의 한계와 이를 극복하려는 시도들

NeRF
- a9.3_1. [entry] title: NeRF
NeRF 는 '피사체가 정지해 있어야 한다' 는 전제가 깔려 있다(참고2,3,8). 정지되어 있는 피사체라는 점, 가려지는 피사체를 구분해내고 극복하기 위한 연구가 있다.
- D-NeRF 가 제안되었다(참고3).
- 심지어 NeRF in the wild 라는 연구에서 구글 연구진은 한술 더 떠서 구글 유저들의 랜드마크 촬영 영상 집합만으로 3d 복원을 성공시키고, 정지한 대상과 정지해있지 않은 대상을 구분해내기까지 한다.
- Single session driving can only observe a limited zone and occlusion issue is inevitable. … On the contrary, with multisession SLAM we can prevent this kind of occlusions by perceiving more information from multiple views.
- 동적 물체와 정적 물체를 처리하지 못한다는 문제, 여러개의 매핑을 하나로 합치기 어렵다는 문제가 있었다. 이들 문제를 해결하는 연구 갈래 중 하나로, multi session SLAM 이 있다. Multi session NeRF 는 불가능한걸까? 혹시 Block NerRF 나 NeRF In the wild 같은 연구들과 결을 같이하지는 않을까?
NeRF 는 또한 어떠한 피사체를 정말 다양한 각도에서 촬영한 뒤 모아주어야 동작한다는 문제도 가지고 있다. 필요한 영상의 양을 줄이겠다는 취지로 DietNeRF 가 제안되었다(참고4).
- DietNeRF: Putting NeRF on a Diet
NeRF 의 I/O 를 보면(from1) 영상들뿐 아니라 물리공간상의 영상 수집점간 관계도 요구된다. 수집점 간 관계 없이 영상만으로 3D 복원을 수행할 수 있도록 만들기 위해 NeRF-- 가 제안되었다(참고6).
- [a9.3_5.3. title: NeRFmm 은 카메라 내부 파라미터(Intrinsic parameters)와 카메라 외부 파라미터(Extrinsic parameters)를 이미지 집합으로부터 학습한다.](https://www.notion.so/a9-3_5-3-title-NeRFmm-7ebc58daef7044be9f6e031626b756a8)
또한 NeRF 기반 연구들이 작은 공간에서 정합을 수행할 수밖에 없었다는 점과 real world 적용사례가 적었다는 점도 단점으로 볼 수 있다.
- ‣
NeRF 기반 연구들은 카메라 extrinsic 은 물론 intrinsic 과 카메라 왜곡모델에도 매우 민감하다(참고10). 이런 문제들을 해결하고자 수동 캘리브레이션에서 벗어나 스스로 더욱 정확한 캘리브레이션을 향해 움직이는 Self-calibration NeRF(참고9) 같은 방법들이 등장하게 되었다.
‣
‣

NeRF 에서는 왜 광각 카메라나 초광각 카메라를 사용하지 않는걸까? 어떤 것이 두려운걸까? “NeRF 같은 방법에서는 왜 어안렌즈나 광각렌즈를 잘 안쓸까요? 작은 모델링오차에도 민감하기 때문에 많이 난이도가 높아지는 탓일까요? 이미 Visual SLAM 에는 어안렌즈까지도 많이 사용되고 있어서, NeRF 같은 모델에 쓰는게 불가능하지 않을듯 싶은데 관련연구를 찾을 수 없었습니다.”

from

참고