[이학무의 테크리딩] 포스트 애플이 될 테슬라(하)

이학무 미래에셋증권 통신서비스 애널리스트
입력 2021.09.26 06:00
기술이 세상을 빠르게 바꾸고 있다. 기술을 직접 개발하지 않는다 하더라도 각자의 영역에서 필요한 만큼의 기술에 대한 이해가 필요한 세상이 되었다. 학생은 미래의 직업을 선택하기 위해서 그리고 이미 직업을 가진 사람은 각자 직업의 미래를 예상하기 위해서 세상을 바꾸는 기술에 대해서 이해해야만 한다. IT조선은 [이학무의 테크리딩]을 통해서 기술을 이해하기 위한 기초 다지기와 이를 기반으로 필수적인 기술 이해 방법을 제공한다. <편집자주>

운행 계획과 제어

테슬라가 3차원 벡터공간을 도입한 것은 상당히 탁월한 선택이다.

첫째, 인공지능을 교육하는 데이터를 만들기 굉장히 용이해졌다. 8대의 카메라에서 들어오는 데이터를 하나의 통합된 가상공간에 모았기 때문이다.

인공지능을 교육하는 데이터는 입력과 출력의 매칭이 정확해야 한다. 테슬라는 전 세계 백만대 이상의 차량에서 업데이트되는 비디오 클립으로 3차원 벡터공간을 합성한다. 덕분에 각각의 사물이 무엇인지 라벨링 하는 과정이 매우 간편해졌다. 카메라의 위치, 앵글에 따라 다르게 보이는 사물일지라도 모두 한 번에 라벨링 할 수 있다. 예를 들어, 벡터공간으로 재구성된 데이터에서 교통표지판을 선택한 후 그것이 교통표지판이라고 라벨링 한다. 그러면 8대 카메라에서 교통표지판에 매핑된 대상 모두를 한 번에 교통표지판으로 라벨링 할 수 있다. 이와 같이 하면 같은 사물이 보는 각도에 따라서 다르게 보이는 것에 대한 학습도 쉽게 시킬 수 있다.

둘째, HD맵을 손쉽게 구성할 수 있게 됐다. 인공지능은 차선, 구획선은 좀 더 편하게 그리고 정확하게 인식할 수 있다. 따라서 다수의 차량에서 업데이트된 동일 지역의 영상에서 옮겨진 벡터공간을 합성해 고품질의 HD맵을 수월하게 만들 수 있다. 정확하게 말해서 이는 HD맵은 아니지만 HD맵과 유사한 역할을 할 수 있다. 기존 방식의 HD맵보다 쉽게 만들 수 있을 뿐 아니라, 동일 지역을 통과하는 다수의 차량을 통해 다각도로 정보가 업데이트가 된다는 점에서 기존의 HD맵보다 효용성은 훨씬 뛰어나다.

마지막으로는 운행계획을 수립하기가 용이해졌다. 차량을 어떻게 주행할지 벡터공간에서 먼저 고민한 후, 그 결론을 현실에 반영하기만 하면 되기 때문이다. 인간 입장에서도 벡터공간에서 운행 계획을 수립하는 것이 훨씬 용이하다는 것을 쉽게 알 수 있다. 벡터공간에서 보면 상대방 차량이 어떻게 움직이고 내 주변 상황이 어떠한지를 쉽고 빠르고 명확하게 알 수 있기 때문에 내가 멈출지 또는 내가 앞으로 나갈지를 결정하기가 쉽다.

가령, 반대편에서 차량이 오고 있다고 치자. 만약 그 차가 우측으로 이동하면 내 차량이 먼저 가면 된다. 마주 보고 있는 차량이 피해를 주지 않는 상황에서 내 차량 주변에 피해 갈 수 있는 공간이 있다면, 상대방이 피해 갈 수 있도록 내 차량을 잠깐 멈춰 주면 된다.

테슬라 AI 데이 영상 / 유튜브
벡터공간에서 인간이 운행 계획을 수립하는 것이 용이하기 때문에 이는 인공지능도 마찬가지가 된다. 문제는 인공지능이 인간처럼 판단할 수 있게 만들어 주는 것이다. 인간은 감으로 상대방 차가 내 차에게 양보를 하려는지 아니면 내가 양보를 해야 하는지 알 수 있다. 하지만 사실 그 감도 여러 가지 데이터를 종합해서 이뤄지는 것이다. 다만, 우리가 그것을 인지하지 못할 뿐이다. 이때, 상대방 차량의 속도와 방향, 내 차량의 속도, 내 차량과 상대방 차량 주변의 공간 여유 등을 종합하여 판단하는 것이다. 이를 감이라고 생각할 뿐이다.

따라서 인공지능이 운행 계획을 수립하게 하려면 우선 상대방 차량의 속도 및 방향 등의 판단을 위한 변수를 빠짐없이 설정한 후 각각의 변수에 대해서 내 차를 앞으로 움직일지, 아니면 멈출지를 지시해야 한다. 인간이 정확한 데이터를 기반으로 운전하지 않기 때문에 인공지능을 가르치는 것은 생각보다 어렵다. 상대방 차량의 속도가 얼마이고 내 차 속도가 얼마이고 주변 공간이 얼마나 될 때 내가 양보하는지 아니면 전진하는지를 인간도 알지를 못한다. 그리고 안다고 해도 그 경우의 수가 엄청나게 많아서 하나의 상황에 대해서만 인공지능을 교육하기에도 현실적으로 불가능하다.

그렇기 때문에 사용하는 방법이 소프트웨어 2.0이다. 인간은 변수만 설정하고, 어떤 조건일 때 어떻게 행동하는지는 인공지능이 스스로 학습한다. 이를 구현하려면 수없이 많은 비디오 클립이 필요하다. 이 비디오 클립 데이터를 기반으로 인공지능이 스스로 조건을 찾아내는데, 이것이 스스로 코딩한다는 개념이다. 덕분에 인공지능은 인간의 감과 유사한 수준의 판단력을 갖게 되고 인간처럼 운전할 수 있다.

하지만 여전히 핵심 변수를 설정하는 일은 인간이 해야 할 일이다. 테슬라는 이를 편안함, 안전함, 그리고 효율성에서부터 접근한다. 운전의 가장 기본적인 원칙이기도 하다. 편안하고 안전하며 효율적으로 운전하도록 한다는 것이 원칙이라는 것인데 이는 각각의 함수 관계 및 변수 설정에서 시작한다.

예를 들어 편안함이라고 함은 급가속 및 감속과 흔들림이 적다는 것을 의미하고 이와 관계된 변수는 가속도와 가가속도, 횡가속도와 횡가가속도 등이다. 가가속도는 가속도가 얼마나 변하는 지를 나타내는 것으로 일반적으로 사용되지 않지만 승차감에서는 가속도보다 더 영향이 크다고 한다. 이와 같이 핵심적인 변수 설정은 인간이 이에 대한 함수 관계의 조건을 찾는 역할은 인공지능이 한다. 변수 설정이 잘되었고 데이터만 충분하다면 정확한 조건을 찾는 것을 어렵지 않다. 테슬라는 자율주행을 위해서 필요한 변수를 이미 수백만개를 설정했다고 한다. 각 변수의 조건을 찾는 과정은 실제 주행 데이터를 인공지능에 입력 시켜서 최적화 해나가고 있을 것이다.

하지만 전세계에서 백만대 이상의 테슬라 차량으로부터 전송되는 엄청난 데이터로도 수백만개의 변수를 최적으로 구성하는 것에는 아직도 부족한 측면이 있다. 이를 위해서 시뮬레이터를 통해서 가상의 상황을 만들어서 데이터로 입력을 한다.

이 역시 벡터공간에서 시작되는 것인데, 벡터공간에서 어떤 상황인지를 먼저 만든다. 즉, 주변의 차량 및 사람이나 동물들의 설정 및 움직임 등을 먼저 만드는 것이다. 그리고 이를 실제 8대의 카메라 영상으로 합성해서 8개의 동영상을 만든다. 이는 8대의 영상에서 벡터공간을 합성했던 과정과 반대인 것이다. 8대의 카메라 앵글의 차이 등을 완벽하게 재현한 8개의 영상을 테슬라 인공지능에 입력한다. 그러면 인공지능은 실질 카메라 데이터로 인식하고 그대 대한 대응을 학습하는 것이다.

시뮬레이터에는 2가지 목적이 있다. 첫째, 인공지능 학습이 어려운 상황을 반복적으로 학습시킬 수 있다. 예를 들어 코너를 돌면서 앞에 차량이 가깝게 나타나는 상황에서 대응이 안되었다고 하면 차량도 바꾸고 도로의 회전 각도도 바꿔 가면서 반복적으로 학습을 시킬 수 있다.

둘째, 현실에서 잘 나타나지 않는 상황을 학습시킬 수 있다. 시뮬레이터를 통해 고속도로에서 무단횡단하는 사람이 있을 경우 어떻게 피해야 할지, 제동거리가 충분히 확보되지 않는 상황에서 차선책은 무엇인지 등에 대한 인공지능의 대응을 확인할 수 있고 이에 대한 학습을 시킬 수 있다.
이와 같이 벡터공간과 8대 카메라의 실사 영상 재구성이 AI 데이에서 시연한 것과 같이 완벽하게 전환된다면, 테슬라는 엄청난 경쟁 우위를 확보한 셈이다. 학습이 부족한 상황에 대한 인공지능의 대응력을 더 빨리 개선할 수 있기 때문이다. 덕분에 완벽한 자율주행 인공지능 개발이 예상보다 빨라질 수 있다.

테슬라는 포스트 애플이 될 것이라는 생각이 점점 더 강해진다

이학무 미래에셋증권 통신서비스 애널리스트 leehakmoo@gmail.com

※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.

이학무 미래에셋증권 애널리스트는 반도체, 핸드폰, 디스플레이 등 IT 산업뿐 아니라 전기차, 배터리 및 신재생에너지 산업까지 다수의 성장산업을 분석한 신성장 산업 분석 전문가다. 공학을 전공하고 비즈니스를 20년간 분석한 경험을 바탕으로 세상을 이끄는(lead) 기술 읽기(read)를 제공한다.

관련기사를 더 보시려면?
T조선 뉴스레터 를 받아보세요! - 구독신청하기
매일 IT조선 뉴스를 받아보세요 닫기