Resource

Problem Statement

영상에 따라 depth의 범위가 다름.

영상에 따라 depth의 범위가 다름.

Contribution

  1. scene에 대한 전역적인(global) processing을 수행하는 architecture building block 제안. 제안한 구조는 추정된 depth range를 bins로 나누는데, bin width는 영상마다 달라짐. bin center value에 대해 linear combination으로 최종 depth를 추정한다.
  2. 모든 supervised MDE에 대해 NYT Detph v2, KITTI DB에 대해 모든 metric에서 기존 연구보다 좋은 성능을 나타냄.
  3. 제안된 Adabin block에 대한 다양한 수정을 가해 depth estimation 정확도에 미치는 영향을 조사/분석함.

Related Works

Methodology

1. Overview

  1. Self Attention을 이용한 input scene의 features에 따라 dynamical하게 변하는 adaptive bins 계산 방법을 제안
  2. classification 기법을 통해 이진화된 얻은 depth value는 시각적으로 품질이 좋지 않으므로, bin center에 대해 linear combination을 취해 최종 depthmap을 계산