
미국의 빅테크들은 수백억 수천억 달러를 퍼 넣어 대형 AI모델을 만든다고 난리법석인 데 중국은 신생 스타트업, 그것도 증권투자를 하는 투자공학 모델을 만들던 퀀트펀드 회사가 만든 AI모델이 세계 최강의 챗GPT의 성능과 비슷한 AI모델을 만들자 멘붕 상태에 빠졌다.
그간 한국의 DRAM업체들이 최첨단 EUV장비로 대충 설계해서 기계의 힘으로, 돈으로 반도체 만들다가 돈도 없고 기술도 없어 맨땅에 헤딩하고 구식장비로 공정 개선해서 제품을 만들어낸 마이크론이나 중국의 CXMT같은 후발업체에 뒤통수 맞은 것과 같은 현상이 미국에서도 일어난 것이다.
미국 AI 업계도 모델개선이나 공정개선보다는 첨단반도체만 서로 경쟁적으로 사다가 돈으로 쉽게 데이터센터 구축하는 바람에 “엔비디아 만 떼돈 벌어준” 바보 같은 일을 하이퍼 스케일 빅테크들이 했고, 여기에 미국 정부의 어설픈 반도체와 AI 대중국규제가 더 해져 만든 “대륙의 실수”가 터져 나온 것이다.
스티브 잡스 같은 괴팍한 인재 하나가 회사를 먹여 살리고, 나라를 먹여 살리고, 세상을 바꾸는 시대다. 이런 시대에 중국의 영재(英才)교육이 AI시대에 묘하게 맞아 떨어졌다. “중국의 엔비디아”로 불리는 중국 AI칩의 대명사 한무기(寒武纪 688256. SS 영문명:cambricon)역시 16세에 중국 과기대 영재반에 입학한 85년생 천재 CEO 천텐스(陈天石)가 창업한 회사다. Deep Seek 역시 85년생 수학천재 CEO가 만든 AI회사다.
Deep Seek의 AI 모델이 다른 미국 빅테크 기업의 거대 모델보다 파격적으로 저렴한 이유는 효율적인 자원이용과 혁신기술의 이용, 비용 효율적인 개발전략 때문이다.
첫째, 자원 활용 측면에서, Deep Seek는 2,048개의 엔비디아 H800 GPU만을 사용하여 모델을 훈련시켰다. 이는 다른 AI 선두 기업들이 H100, A100 등의 고성능 칩을 1만 6000개 이상 사용하는 것과 대조적이다
둘째, 혁신기술 적용이다. 1) MLA (Multi-head Latent Attention): 이 기술은 메모리 사용량을 대폭 감소시켜 모델 운영의 효율성을 높였다 2) MoE (Sparse Mixture of Experts): 이 방식은 계산 비용을 절감하여 저비용 고효율 모델 개발을 가능하게 했다. 3)강화학습 기반 접근: Deep Seek은 강화학습(RL)을 적극 활용하여 모델의 추론 능력을 향상시켰다. 이 방법은 지도학습 데이터 없이도 모델이 스스로 학습하고 진화할 수 있게 했다.
셋째, 비용 효율적인 개발 전략이다. DeepSeek-V3 모델은 약 557만 6000달러의 비용으로 개발되었다. Deep Seek은 이러한 효율적인 개발 방식을 바탕으로 매우 경쟁력 있는 가격을 제시하고 있다. 예를 들어, DeepSeek-R1 모델의 사용 비용은 백만 토큰당 16위안(약 2.20달러)으로, OpenAI의 가격 438위안(60.2달러)의 1/27수준에 불과하다
네째 Deep Seek의 CEO 량원펑의 인재관리 전략이다. 량원펑은 현재 중국의 AI와 국제 최고 수준과 상당한 격차가 있음을 숨기지 않는다. 그리고 국제수준과 동일한 효과를 달성하려면 모델 구조, 훈련 역학 및 데이터 효율성이 4배이상이 필요하다고 본다. 그리고 그는 그 해법을 신선하고 새로운 아이디어를 가진 인재에서 찾는다.
OpenAI가 ChatGPT-4o를 교육하는 데 지출한 비용은 최대 7,800만 달러 또는 심지어 1억 달러에 달한다. Deep Seek와 비용 차이는 최소 10배이상이다. DeepSeek-V3는 수학, 코딩 능력, 중국어 지식 질의응답 측면에서도 ChatGPT-4o를 능가하며, 이는 매우 비용 효율적이다. 일단 인건비에서 보면 Deep Seek에는 R&D 인력이 139명에 불과한 반면 ChatGPT를 개발한 OpenAI 팀에는 1,200명의 연구원이 있다.
오픈 모델을 표방한 Deep Seek은 새롭게 떠오르는 제품으로서 모든 측면에서 협력을 가속화하고 지속적으로 개발 및 업데이트를 통해 중국 AI의 대변인이 될 가능성이 크다. 특히 Deep Seek의 최강의 가성비의 오픈소스 모델은 미국의 폐쇄형 모델을 위협하는 직접 위협하는 존재로 부상할 가능성이 크다.
전병서 중국경제금융연구소장
