(23.05.03)
Depth Estimation 논문 정리하기 4탄
이런 방법도 있구나.. 라는 것만 보고 넘어간다
- 논문 제목: Single-Image Depth Perception in the Wild (NeurIPS 2016)
- https://arxiv.org/pdf/1604.03901v2.pdf
(https://arxiv.org/pdf/2003.06620.pdf survey에서 설명하는 내용)
supervised signal로 depth의 gorund truth가 사용되는 것이 아니라, realative depth annotations에 의해 학습된다.
Abstract
본 논문에서는 unconstrained setting에서 single image로부터 depth를 회복하는 방식을 제안하며, single-image depth perception in the wild에 대해 연구하였다.
저자는 random points의 쌍들 사이에서 relative depth를 annotated된 자연의 image들로 구성된 Depth in Wild라는 새로운 dataset을 도입한다.
relative depth의 annotations를 사용하여 metric depth를 추정하는 새로운 알고리즘을 제안하는데, 이는 기존의 sota보다 더 간단하며 성능이 더 좋다.
RGB-D data와 그들의 새로운 relative depth annotations를 함께 사용하면 single-image depth perception in the wild의 성능가 향상됨을 실험을 통해서 보여준다.
Model Architecture
human pose estimation에서 sota를 달성한 "hourglass" network를 사용하였다.
input과 output의 resolution이 동일하고, relative depth의 annotations와 함께 학습한다.
위의 그림에서 보이는 모든 block은 layer를 뜻하고, 이것은 모두 inception module이다. (아래 그림 참고)
Loss function
ordinal annotations를 사용하여 학습시킬 수 있도록 하는 loss function을 정의하였다.
Experiments