Is SLAM solved? 고수들에게 물어본다

인터뷰 진행 방식

진행일: 2010년 (꽤 오래된 자료이긴 하다)

인터뷰 참여자:

  • Udo Frese (인터뷰어)
  • Sebastian Thrun
  • Jose Neira

SLAM. 이 문제는 다 풀린건가?

Thrun:

  • 정적인 환경에서는 풀렸다.
    • 이론적으로도 깊게 이해하고 있고, scale-up 하는 방법도 있다.
  • 동적인 환경에서는 풀리지 않았다.
    • 정적인 물체, 동적인 물체, 동적 움직임이 가능하지만 정지해있는 물체를 구분할 수 없다.
    • Semantic understanding을 할 수 있어야한다.

Neira:

  • “처음보는 환경에서 센서만 가지고 주변 환경에 대한 모델을 추론하고 현재 위치를 추론할 수 있는가?” -> 할 수 있다.
  • 하지만 그 환경에…
    • 동적인 물체가 있는가?
    • 동적인 물체를 무시하고 주변 환경을 모델링 할 수 있는가?
    • 엄청나게 큰 환경에서 실시간으로 작동할 수 있는가?
    • 환경의 변화를 인지하고 업데이트 할 수 있는가?
    • Geometric한 정보를 뛰어넘어 Semantic한 정보도 함께 모델링 할 수 있는가?

 


지난 20년간의 연구를 봤을 때 (i.e. 1990~2010), 우리는 좋은 연구를 하고 있는가?

Thrun:

  • 잘 하고 있는 것 같다. 하지만 너무 특정 문제에 집중하는 것 같다.
    • 아무도 GPS를 쓰려고 하지 않는다.
    • Real-world에서는 GPS가 꼭 필요할텐데 말이다.

Neira:

  • GPS를 쓰는게 이론적으로 매력적이지 않아서 연구가 많이 되지 않는 것 같다.
  • 논문을 낼 때, 새로운 이론이 아무래도 단순 구현 방식보다 더 매력적이기 마련이다.
  • 그러다보니 Real-world 문제를 해결하는 것에서 점점 멀어지는 것 같다.

 


모션 플래닝 분야에서도 비슷한 트렌드가 있다 (i.e. 특정 연구분야에만 집중한다). 이런게 AI/science 분야에서 자주 나타나는 것인가?

Thrun:

  • 종종 특정 분야에 집중하다보면 ‘큰 그림’을 보지 못하면서 쓸려가는 경우가 있다. SLAM도 마찬가지다.
  • 우리의 목표는 로봇을 통해 세상에 이익을 가져와야하는 것이며, SLAM은 그 컴포넌트 중 하나라는걸 잊지 말아야한다.

Neira:

  • Academia의 한계인 것 같다.
    • 연구자들의 성과는 논문을 낸 수와, 그 논문들의 피인용수가 중요하다.
    • 2자리 수의 피인용수가 나지 않는 논문은 의미가 없다고 생각하는 문화가 이런 한계를 만들어내는 것 같다.
    • 이 때문에 연구자들이 빠르고 간단하게 피인용수를 얻어낼 수 있는 논문에 집중하게 되고, 사회에 임팩트를 줄 수 있는 논문과는 멀어지는 것 같다.

 


Big-O-notation이 SLAM 연구에 영향을 줬을 것이라고 생각하는가?

Thrun:

  • 그렇게 생각하지 않는다.
  • 이전 연구를 개선하는 방향 vs 큰 그림을 그리는 방향. 이 둘 사이에서 항상 딜레마가 있는 것 같다.
  • Computational complexity는 SLAM에서 그렇게 크게 중요하게 보는 것 같지 않다. FastSLAM이나 GraphSLAM이 훨씬 더 효율적임에도 말이다.

Neira:

  • 지난 연구들을 보면 SLAM 알고리즘들의 효율성에 대해 집중하는 경우가 많은 것 같다.
  • 하지만 그에 비해 robustness에는 충분히 집중하지 않은 것 같다.

 


수식을 만들어서 문제를 풀려고 하는 것과, 문제를 풀면서 수식을 발견하게 되는 것. 어떤 것이 더 중요할까?

Thrun:

  • 무엇이 되었던지 사회에 줄 수 있는 임팩트를 생각해야한다.
  • 이분법으로 생각하는 것 보다 이게 더 중요하다.
  • 이론이 더 중요할 때도 있고, 구현이 더 중요할 때도 있다.

Neira:

  • ‘좋은 이론보다 더 practical한 것은 없다’ 라고 한다.
  • 이론이던, 구현이던, 둘 다 중요하니 언제든지 어떤 방법으로도 도전해보는게 중요하다.

 


Google Street View에는 SLAM이 들어가있는지? (Thrun 타겟 질문)

Thrun:

  • 조금 들어있다.
  • 카메라와 라이다를 써서 포즈를 추정한다.
  • 그 외로 GPS와 IMU 내비게이션도 사용한다.

 


Real-world에서 쓸 수 있는 SLAM의 다른 예제가 있나?

Thrun:

  • Transportation은 엄청 큰 시장이다.
  • 해저 구조를 탐색하거나, 산업/공장들을 맵핑해서 온실가스 맵핑을 하는 것도 좋다.

 


SLAM의 트렌드는 점점 Visual-SLAM이 되고 있다. 그 중 bundle-adjustment나 structure-from-motion이 주목받고 있다. SLAM이 컴퓨터 비젼 분야에 어떤 기여를 할 수 있을까? (Neira 타깃 질문)

Neira:

  • 디지털 카메라가 빠르고, 작고, 저렴해지고 있다.
  • Scale 정보가 없다는 점이 연구적인 목적에서 문제를 흥미롭게 만든다.
  • 컴퓨터 비젼에서 풀려고 하는 문제들은 efficiency에 대해 집중하는 경우가 많이 없다. 그에 비해 visual-SLAM 연구자들은 efficiency에 많이 집중하기 때문에, 이 부분에서 기여를 할 수 있을 것이다.

 


SLAM 분야가 AI 커뮤니티에 어떤 메세지를 줄 수 있을까?

Thrun:

  • 우리 겁나 어려운 문제 풀었다! 멋지지??!!

Neira:

  • 로보틱스는 AI를 실제 세상으로 끌어오기 아주 좋은 필드다.

 


SLAM의 미래는 어떤 모습일까?

Thrun:

  • 미래에는 SLAM 연구들이 실제 세상에 많은 임팩트를 줄 수 있으면 좋겠다.
    • 나도 얼마전부터 논문을 적기보다는 수백/수천만명의 삶을 개선시킬 수 있는 실제 시스템을 만드는데에 집중하고 있다.
  • SLAM 연구 분야의 최전선을 달리는 몇몇 리더들이 너무 특정 문제에만 집중하는 것 같아서 아쉽다.

Neira:

  • SLAM 기술에 대한 기대치와 꿈을 더 높게 잡으면, 더이상 특정 분야에만 집중하지 않게 되지 않을까?
  • 좀 더 general하고 complex한 문제에 집중해야한다.

출처

링크