<사진 / 보스톤다이너믹스 홈페이지>

[뉴스비전e 김호성 기자] 보스톤다이너믹스의 전투로봇, 야스카와중공업이 만든 로봇과 인간과의 검술 비교 등을 보면 로봇이 인간의 움직임과 상당히 유사한 수준으로 올라왔다. 

<사진 야스카와 유튜브 캡쳐>

 

반면 최근 영국의 슈퍼마켓에 배치되자마자 해고된 페퍼 로봇의 모습은 사뭇 다르다. 

<사진 / amari 유튜브 캡쳐>

아래가 일자로 된 다리는 사람이 걷는 형상이 아닌 굴러가는 모습이다. 페퍼가 해고된 이유는 "우유가 어디있어?"라고 물으면, "냉장고"라고 답하고, 냉장고는 어디있어?라고 물으면 더이상 답을 못하는 안내 능력의 한계라고 전해졌다. 

그러나 로봇 페퍼가 좀더 인간의 동작과 유사한 모습을 갖췄다면, 사람들의 호응이 좀 더 이어졌을지도 모른다. 

<이미지 / UBC LAB>

인지능력 강화학습이 로봇에 도입될 필요성이 높아지고 있다. 

이를 위해 강화학습을 로봇에 적용하기 위한 많은 실험들이 진행되고 있다. 특히 최근들어 기존의 좌우정만을 기반으로 한 2차원 환경이 아닌, 고도 정보까지 더해진 3차원 환경 정보를 인지해 이를 기반으로 로봇이 현실 지형에 대응할수 있도록 하는 연구가 더욱 활발해 지고 있다.  

대표적 사례가 캐나다 UBC연구팀과 구글 딥마인드의 강화학습 연구다. 

기존의 좌우의 방향 뿐 아니라, 3차원 및 현실세계와 거의 비슷한 정보를 제공해 인공지능이 이를 반복학습 하도록 함으로써, 좌우 정보 분아니라 높이까지도 인식해 오르막길, 비탈길 등에 대응하도록 하는 연구다. 

고도만 더한것 뿐이라는 생각이 들지 모르지만, 2D와 3D 세계는 데이터량, 처리해야 할 변수 등 기술적 차이가 현격하다. 단순히 로봇이 오르막길을 어색하지 않게 올라가는 것을 넘어서,예상치 못한 수많은 환경을 잘 대응할 수 있게 된다는 점에서 기능적면에서의 적용분야다 훨씬 방대해 진다.    

기존 좌우 데이터만을 기반으로 인지해 동작하는 것에 비교, 고도까지 포함한 3차원 데이터를 처리할 경우, 인공지능이 처리해야 할 데이터의 양이 상당히 방대해진다. 

캐나다 UBC 연구팀은 이 문제를 극복하기 위해. 강아지의 모양을 가상화해 강화학습을 통한 시뮬레이션을 만들었다. 가상화된 개의 캐릭터는 단순한 한개의 객체가 아닌, 머리·목·몸통·꼬리 등 신체 각부분에 있는 수많은 관절들을 각각의 인식 포인트로 지정해 3D 환경에서 대응하도록 했다. 

<사진 / UBC LAB>

즉, 오르막길을 마주했을때, 강아지 캐릭터가 움직여야 할 한개의 연산값이 아닌,, 개의 발목 관절, 무릅관절, 꼬리 관절 등 수많은 관절들이 오르막에서 어떻게 움직여야 하는지에 대한 수많은 수치가 바로 산출된다. 

이를 통해 강아지 캐릭터가 가상의 언덕길을 마주쳤을때, 실제 상황과 최대한 유사한 모습과 패턴으로 뛰어올라갈 수 있도록 하는데 성공했다. 

<사진 / deepmind>

딥마인드 역시 이번에는 사람의 캐릭터가 뛰고 걷는 방법을 강화학습을 통해 터득하도록 했다. 

4차산업의 핵심기술간 융합을 통해 기술이 고도화되고 적용분야도 더욱 다양해 지는 단계에 들어섰다. 

<사진 / deepmind>

컴퓨터가 미래에 어떻게 동작할 것인지에 대한 결과 및 추세를 예측하고 기존 데이터를 최대한 활용·분석 할 수 있도록 알로리즘을 제공하는 단계까지는 머신러닝(기계학습)이다. 여기에  반복학습을 적용한 강화학습은 최초 설계된 알고리즘은 반복적인 학습을 통해, 또 하나의 알로리즘을 스스로 만들어낼 수 있다. UBC 연구팀, 딥마인드는 이와 같은 강화학습에 3D 데이터까지 더해진 연구를 진행해 왔다.  

이와 같은 3D 강화학습의 기술이 진전되면 자율주행차에도 필요한 핵심 기술로 자리잡을 전망이다.

자율주행차가 인터체인지에서 차로에 끼어들기를 할 경우 현실차로에 대한 보다 고도화된 대응이 필요하기 때문이다. 

LG연구원 관계자는 "이와 같은 3D 강화학습은 앞으로 휴머노이드 로봇, 자율주행차 뿐 아니라, 산업용 제조에서도 적용될 핵심 기술"이라고 평가했다.  

저작권자 © 뉴스비전e 무단전재 및 재배포 금지