[뉴스비전e 김호성 기자 ] 딥러닝의 발전은 최적화된 전용 하드웨어를 중심으로 실현될까? 이런 하드웨어 없이도, 더 우수하고 똑똑하며 효율적인 알고리즘이 발전을 주도할까?

인공지능의 진화를 위해 구글, 마이크로소프트 등 글로벌 기업들이 벌이고 있는 경쟁은 프레임워크 등 알고리즘에만 국한되지 않는다. 

AI하드웨어는 효율성과 저전력을 기반으로 하는 가속칩의 경쟁으로 이어지고 있다. 

 

▲AI 하드웨어의 지향점은 효율성 및 저전력

서버연산 독점하던 CPU에  GPU FPGA, TPU 등 다양한 하드웨어(인프라)가 적용이 이뤄지고 있다. 

하드웨어의 본질은 인공지능의 효율성을 높이기 위해서는 계산량을 줄이는 것이다. 

이를 위해 신경망은 모델교육 (Trainning model)을 하고 있고 이와 같은 교육과정은 지속적으로 개선되고 있다. 

리프로그래밍(re-programming)은 숙력된 모델을 쉽게 업데이트 하게 해주며, 프로그래머블 로직은 병렬 아키텍처를 통해 알로리즘 처리를 가속화한다. 

FPGA(Field-Programmable Gate Array)가 주목을 받는건 이 때문이다. '트레이닝 모델', '리프로그래밍', '프로그래머블 로직' 모두에 적합한 솔루션이라는 평가다. 

CPU와 FPGA 비교 <자료 / 뉴스비전e DB>

FPGA는 현장에서 프로그래밍이 가능한 반도체기 때문에 이미 설계가 완료된 이후 출하되는 AISC보다는 유연한 특성이 있다.

이에 따라 커넥티드카 또는 자율주행차에서 RADAR센서, GPS지도, 충돌 회피 시스템 등에 적용되면서 앞으로 관련 시장의 급속한 성장이 예상되고 있다. 

마이크로소프트는 지난해, 15개 국가의 서버 장비에 수 만개 FPGA(Field-Programmable Gate Array) 설치를 완료했다고 밝힌바 있다.

이 칩은 마이크로소프트가 직접 제공하고 유지하는 이른바 'First-party' 서비스에 적용돼, 애저클라우드 플랫폼의 네트워킹 속도를 크게 높이고, 머신러닝 및 다른 클라우드의 성능을 개선한 것으로 MS는 평가했다.

중국 커제와 대국을 펼친 알파고2에 적용된 TPU는 구글이 자사 AI알로리즘인 텐서플로우에 최적화해 만들어졌다. 

딥러닝에 특화된 전자부품으로, 스마트폰부터 소셜네트워크서비스(SNS)까지 쓰임새가 확산될 것으로 보인다. 단점으로는 구글의 클라우드를 사용해야 하는 점이 꼽힌다. 

 

▲딥러닝 전용 하드웨어에 도전하는 스타트업 기업들..."GPU도 능가하겠다"

신생 창업회사 그래프코어(Graphcore)는 신경망에서 사용되는 그래프 데이터를 처리할 수 있는 딥러닝 전용 프로세서, IPUI를  개발했다. 

그래프코어가 만든 IPU는 인공지능에 특화해 만든 첫번째 가속기로 꼽힌다. 

클라우드와 엔터프라이즈 환경에서 인공지능의 연산 성능과 효율성을 높이는 반면 저전력을 통해 비용을 줄인다는 평가다. 

 

<사진 / 그래프코어 홈페이지>

그래프코어는 네트워크를 위한 모델을 가능한 실리콘 가까이 위치시키고, 외부 메모리로의 전송을 피하는 방법으로 처리 속도를 앞당긴다. 

이와 같은 기술력을 바탕으로, 그래프코어는 삼성전자와 델 테크놀로지 등으로부터 투자를 유치하기도 했다. 

<사진 / 웨이브 컴퓨팅 홈페이지>

또 다른 신생 창업회사인 웨이브 컴퓨팅(Wave Computing)도 딥러닝 전용 하드웨어를 개발했다. 

웨이브 컴퓨팅은 2.9 페타옵(petaops)의 연산력을 전달할 수 있는 맞춤형 실리콘을 사용해 '데이터플로우 어플라이언스' 랙마운트 시스템을 구축할 계획이다. 이는 구글 TPU가 제공하는 92테라옵(teraops)를 훨씬 능가하는 속도다.

아직은 다른 솔루션에 비해 페타옵당 가격 경쟁력이 있는지 확인해야 하지만,  웨이브는 가격과 상관없이 잠재적인 사용자가 있을 것으로 보고 있다. 이 제품은 텐서플로부터 시작해 CNTK, 아마존 MXNet 등을 지원할 예정이다.

▲AI 성능을 최적화하는 가속칩의 경쟁

임베디드의 비전처리에서는 머신러닝용 DSP를 장착하는 추세다. 

퀄컴의 헥사곤 682 DSP는 퀄컴의 스냅드래곤 835 SoC로 텐서플로우를 지원한다. 

프로세싱 성능을 향상시키는 한편, 머신러닝을 위한 구글의 텐서플로우(TensorFlow) 소프트웨어 및 이미지 프로세싱을 위한 프로그래밍 언어인 할라이드(Halide)를 지원하기도 한다. 이는 갤럭시S8에 들어가며 주목받은바 있다. 

구글 어시스턴트를 불러내는 촉발어인 '오케이, 구글'을 인식할 때도 DSP를 사용하는 것으로 알려진다. 

DSP가 주목을 받고 있다. DSP 역시 FPGA와 마찬가지로, ASIC의 한 분야지만,  FPGA는 부동소수점연산을, DSP는 고정 소수점을 사용해 연산한다. 

더 많은 머신러닝 가속 칩이 등장하면서, SP · FPGA · CPU 등 작업마다 상황에 맞춰 최적화된 프로세서를 선택하고 있다. 

관련기사

저작권자 © 뉴스비전e 무단전재 및 재배포 금지