Kapture + CVPR2020 Visual localization challenge (NAVER LABS Europe)

Posted on 2021-04-03 Edited on 2023-06-09 In 1. Spatial AI , 1.1 SLAM Views:

kapture – A unified data format to facilitate visual localization and structure from motion.아티클 원본
One method, one pipeline: NAVER LABS Europe ranks high across three visual localization challenges at CVPR 2020 아티클 원본

Kapture

Visual localization 입문을 쉽게 만들어주는 소프트웨어 정도로 생각하면 좋을 것 같다.

CVPR 2020의 Joint Workshop on Long-Term Visual Localization, Visual Odometry and Geometric and Learning-based SLAM에서는 3가지 visual localization 챌린지를 열었다.
1. 자율주행 자동차에서 visual localization하기
2. Handheld device에서 visual localization하기
3. Long-term localization을 위한 local feature 찾기.
NAVER LABS Europe팀은 1번 챌린지에서 1등, 2번 챌린지에서 4등, 3번 챌린지에서 2등을 했다고 한다.

R2D2
- Sparse keypoint detector & descriptor
- Synthetic image 기반으로 학습됨.
- Detection과 Description을 동시에 추론 가능.
  - Keypoint reliability와 repeatability를 따로 계산함.
너무 큰 Large-scale인 경우에는 3D reconstruction을 할 수 없음. 그러므로 image retrieval을 이용해서 place recognition 방식을 사용함.
APGeM
- Generalized meanpooling (GeM) 레이어를 이용해서 feature map을 정해진 길이의 컴팩트한 형태로 바꿈.
- Mean average precision (mAP) 값을 이용해서 모델을 학습함. (Metric learning)
  - Google Landmakrs dataset으로 학습.
COLMAP을 이용해서 structure-from-motion (SfM)을 수행하고, geometric verification을 수행.

조금 이해가 안가는 부분은, training images는 어떻게 결정하는지이다. APGeM으로 Top k개의 similar image들을 뽑은거를 training image라고 한걸까?

이미지에 다양한 요소가 포함되어있음에도 굉장히 잘 generalize했다.
- time of day
- season of the year
- Outdate reference representation
- Occlusion
- Motion blur
- Extreme viewpoint change
- Low texture area
1등을 한 챌린지인 ‘자율주행에서의 visual localization’에서는 motion sequence가 주어지면서, 이로부터 정확한 위치를 찾을 수 있었다.
4등을 한 챌린지인 ‘Handheld 기기에서의 visual localization’에서는 1장의 query image로부터 정확한 위치를 찾는 것이였다.