#네이버랩스 #공간지능🤖 #ECCV 1위🏆

2024.10.09•읽음 1,317

네이버랩스 '공간 지능' 기술, 세계 최고 컴퓨터 비전 학회서 1위 수상

네이버랩스가 세계 최고의 컴퓨터 비전 학회인 ‘ECCV 2024(European Conference on Computer Vision)'에서 개최된 주요 챌린지에서 1위를 차지했어요. ECCV는 컴퓨터 비전 및 이미지 처리 분야에서 가장 권위 있는 국제 학회 중 하나에요. 2년마다 개최되며 전 세계 우수 연구자들이 모여 최신 연구 성과를 발표하고 새로운 기술 화두를 제시하는 중요한 행사예요.

이번 ECCV 2024에서 네이버랩스는 ‘지도 없이 시각 정보로 위치를 찾아내는 기술(Map-free visual relocalization)’과 ‘물체의 3D 위치와 자세를 정확하게 추정하는 기술(Benchmark for 6D Object Pose Estimaion)’을 겨루는 두 챌린지에서 모두 1위를 수상하며 공간 지능(Spatial Intelligence) 분야에서의 뛰어난 기술력을 입증했어요. 👏🏼

아하, 사람의 눈과 같은 기술이군요?

네 맞아요! 네이버랩스의 목표는 로봇이 우리의 일상 속에서 유용하게 쓰일 수 있도록 하는 것이고, 이를 위해 로봇의 '뇌'보다 '눈'에 집중하는 방향으로 기술을 발전시켰다고 해요. 일상 속 다양한 환경에서 로봇이 마주할 변수는 무궁무진한데, 그 수많은 경우의 수를 모두 공부시키는 건 현실적으로 어려워요. 따라서 로봇이 세상을 보고 물리적으로 이해할 수 있게 하여 로봇이 예상하지 못한 환경과 조건에 대응할 수 있도록 하는 것이죠.

ECCV 학회에서 네이버가 거둔 성과를 자세히 살펴보자면:

1. ‘Map-free Visual Relocalization Challenge’ 1위

어떤 기술일까요: Map-free Visual Relocalization

이 기술은 지도를 미리 얻을 수 없는 상황에서 유용해요. 재난 지역이나 공사 현장과 같이 3D 지도를 만들기 어려운 상황이나 지역이 너무 작거나 일부여서 미리 지도를 생성하는 것이 비효율적인 환경에서는 지도 없이도 위치를 인식할 수 있는 기술이 필요하거든요.

네이버랩스 유럽은 고정밀 3D 지도 없이도 정확한 위치를 추정하는 Map-free Visual Relocalization Challenge에서 최고 성적을 거두었어요. '마스터(MASt3R)'가 그 주인공이에요. 이번 챌린지에서 마스터는 이미지를 분석 후 복잡한 환경을 빠르게 이해하여, 지도가 없는 새로운 환경에서도 한 장의 기준 영상에 대한 위치값을 가장 정확히 추정했어요.

Map-free Visual Relocalization 데이터 세에 대한 MASt3R 데모 (출처: 네이버랩스)

'마스터(MASt3R)' 이전 버전인 '더스터(DUSt3R)'와 비교하면:

'마스터(MASt3R)'는 이전 버전인 '더스터(DUSt3R)'와 비교했을 때 스케일과 디테일 면에서 향상되었어요. 더스터는 한두 장의 사진만으로도 공간을 빠르게 재구성할 수 있는 성능으로 주목을 받았다면, 마스터는 수천 장의 대규모 이미지를 처리할 수 있게 했어요. 또한 마스터는 미터 단위까지 3D 정보를 제공할 수 있고, 이미지 매칭도 할 수 있어요.

수천 장의 이미지를 처리할 수 있으며, 더욱 높은 정밀도를 보여주는 MASt3R (출처: 네이버랩스)

2. ‘Benchmark for 6D Object Pose Estimation Challenge’에서 2년 연속 1위

어떤 기술일까요: Benchmark for 6D Object Pose Estimation

이 기술은 스마트폰이나 로봇이 주변 환경에 있는 사물들의 3차원 위치를 정확히 인식할 수 있게 해요.

네이버랩스는 '6D 객체 포즈 추정(Benchmark for 6D Object Pose Estimation)' 챌린지에서 2년 연속 우승을 차지했어요. 이 챌린지에서는 이미지 내에 있는 물체들의 3차원 회전과 위치를 얼마나 정확히 추정하는지를 겨뤄요. 네이버랩스가 해당 부문에 제출한 기술 모델은 RGB 이미지만으로도 물체의 위치를 가장 정확하게 측정하고, 또 가장 빠르게 처리할 수 있다는 평가를 받으며 세계 최고 수준의 기술력을 다시 한번 입증했어요.

RGB 이미지 한 장으로부터 처음 보는 물체의 위치와 자세를 빠르게 측정하는 네이버랩스의 기술 데모 (출처: 네이버랩스)

앞으로는: 디지털 세계를 넘어 우리가 살아가는 물리 세계로

AI 혁신은 현시점에서 디지털 세계에 집중되어 있어요. 챗GPT, 챗봇, 이미지 생성 AI, 3D 아바타 등은 모두 디지털 세계에서의 성과이지요. 다음의 혁신은 우리가 살아가는 물리 세계에서 일어날 수 있을까요?

물론 현실적인 제약이 상당해요. 막대한 비용이 들기도 하고, 물리 세계의 데이터 확보도 쉽지 않아요. 로봇업계에서는 이러한 이유 등으로 디지털 세계에서의 성과에 비해 물리적 세계에서의 모델 연구가 전 세계적으로 초기 단계에 머물러 있다고 평가하고 있어요.

글을 마무리하며

저는 사물을 인지하는 AI 기술이 이렇게나 발전했다는 사실이 정말 놀라웠어요! 또한 물리적 세계의 AI 혁신을 꿈꾸는 연구들을 응원하고 싶어졌어요.

뉴니커는 아티클을 읽으며 어떤 생각이 들었나요? 댓글로 자유롭게 알려주세요! 😊

2026 상반기에
무슨 일이 있었더라?

핵심 트렌드∙이슈 모음집 + 스니핏 30일 이용권 무료 증정이슈 모음집 + 스니핏 이용권 무료!