선진적인 자율주행 AI 소프트웨어를 제공하는 헬름AI가 카메라만으로 작동하는 자율주행 소프트웨어 스택 ‘헬름AI 드라이버’의 기능을 대폭 확장했다고 밝혔다.
이 시스템은 고급 레벨2+부터 레벨4 수준의 도심 자율주행까지 끊김 없이 확장할 수 있도록 설계된 양산형 소프트웨어다.
헬름AI는 자사의 독자적인 ‘팩터드 임보디드(Factored Embodied) AI 아키텍처’를 기반으로 이 시스템을 구축했다. 이 시스템은 고정밀 지도나 라이다 센서에 의존하지 않고도 복잡한 도심 교통 환경에서 사람처럼 자연스럽고 부드러운 주행을 구현한다. 기반 모델이 특정 자율주행 레벨에 종속되지 않도록 설계돼 있어, 완성차 업체는 고급 레벨2+ 시스템을 곧바로 양산에 투입한 뒤 하드웨어와 규제 로드맵의 진전에 맞춰 동일한 소프트웨어 아키텍처로 레벨3 ‘아이즈 오프(eyes-off)’ 기능과 레벨4 완전 자율주행까지 단계적으로 확장할 수 있다.
이번 발표와 함께 헬름AI는 캘리포니아주 레드우드시티 도심에서 헬름AI 드라이버가 실제로 주행하는 데모 영상을 공개했다. 영상에는 교차로 좌·우회전, 복잡한 신호 체계 대응, 다른 도로 이용자와의 역동적인 상호작용까지 차량이 스스로 처리하는 장면이 담겼다. 모든 주행은 양산을 전제로 한 자율주행 시스템의 표준 테스트·검증 프로토콜을 따랐으며, 안전운전 요원이 동승한 가운데 안전하게 이뤄졌다.
지금 자동차 업계는 이른바 ‘데이터의 벽’에 직면해 있다. 자율주행 기술이 드물고 예외적인 ‘엣지 케이스’ 상황에서 성능을 끌어올리려면, 현실 도로에서 얻은 희귀하고 고가의 데이터를 기하급수적으로 더 많이 확보해야 하는 단계에 진입했기 때문이다. 설령 이런 데이터를 마련하더라도 픽셀 입력부터 제어 명령까지 한 번에 처리하는 통합 ‘엔드 투 엔드(end-to-end)’ 모델은 사실상 블랙박스에 가깝다. 이로 인해 레벨3 이상에서 요구되는 엄격한 안전 인증을 통과하는 데 필수적인 ‘설명 가능성(해석 가능성)’을 확보하기 어렵다.
헬름AI 드라이버는 이와 달리 데이터 부족과 해석 가능성 문제를 동시에 풀기 위해 팩터드 임보디드 AI 아키텍처를 채택했다. 이 접근법은 자율주행 문제를 ‘인식(perception)’과 ‘정책(policy)’이라는 두 개의 명확하고 해석 가능한 레이어로 분리한다. 먼저 인식 레이어에서 원시 센서 데이터를 정보량이 풍부하고 고도로 구조화된 의미론적 세분화 정보와 3D 정보로 변환한다. 이어 헬름AI의 엔드 투 엔드 정책 모델이 원시 픽셀이 아니라 이렇게 해석 가능한 의미론적 기하 정보를 입력으로 받아 도로 구조와 교통 규칙을 둘러싼 상황을 ‘추론’한다.
이 같은 팩터드 방식 덕분에 인터넷 규모 데이터셋을 활용한 대규모 학습이 가능해지고, 엔드 투 엔드 정책 모델도 훨씬 효율적으로 데이터 학습을 진행할 수 있어 ‘데이터의 벽’을 허무는 데 기여한다. 동시에 이 구조는 완성차 업체가 특히 중시하는 투명성을 확보해, 감독이 전제된 레벨2+부터 ISO 26262 인증이 가능한 레벨3·레벨4까지 확장 배치할 수 있는 명확하고 감사 가능한 소프트웨어 기반을 제공한다.
전통적인 접근법에서는 도심 자율주행 능력을 확보하기 위해 수십억 달러 규모의 설비 투자와 수백만 마일에 이르는 주행 학습 데이터가 필요한 경우가 대부분이다. 그러나 헬름AI 드라이버의 플래너는 실제 도로 주행 데이터 1,000시간 분량만으로 이와 유사한 성숙 단계에 도달했다.
이 같은 성과는 헬름AI가 독자 개발한 비지도 학습 기법 ‘딥티칭(Deep Teaching)’ 덕분이다. 이 기술을 활용하면, 신경망이 인터넷 규모 비전 데이터셋에 고가의 사람 손 라벨링을 거칠 필요 없이, 쉽게 확보할 수 있는 방대한 비운전 이미지·영상 데이터로부터 직접 학습할 수 있다. 여기에 의미론적 시뮬레이션을 결합해, 사진과 구분하기 어려운 수준의 픽셀을 렌더링하는 막대한 연산 부담 없이 사실상 무한대에 가까운 기하학적 주행 시나리오를 학습하도록 했다. 헬름AI는 원시 픽셀이 아니라 세계를 표현한 ‘의미론적 기하학’을 대상으로 시스템을 훈련함으로써, 자율주행 개발에 따르는 전통적인 비용·시간 장벽을 우회하고 있다.
양산차용 자율주행 시스템의 진짜 시험대는 수동 튜닝이나 HD 지도 없이도 얼마나 잘 ‘미지의’ 환경을 소화해 내느냐다. 이를 가늠하기 위해 헬름AI는 최근 캘리포니아주 토런스(대 로스앤젤레스 지역)에 소프트웨어를 투입해 시스템의 일반화 능력을 점검했다.
헬름AI 드라이버는 이 지역 특정 도로에 대한 사전 학습 없이도 이른바 ‘제로샷(zero-shot)’ 자율주행 조향을 구현했다. 이렇게 한 도시를 넘어서는 일반화 능력을 확보함으로써, 헬름AI의 완성차 파트너들은 도시별 데이터 수집이나 지오펜싱에 막대한 비용을 쏟아붓지 않고도 레벨2+부터 레벨4 기능을 전 세계 시장으로 확장 배포할 수 있다는 설명이다.