엔비디아(Nvidia)가 중국 AI 스타트업 딥시크(DeepSeek)의 R1 모델을 “뛰어난 AI 발전”이라고 평가하며 호의적인 입장을 밝혔다. 이는 딥시크의 등장으로 엔비디아 주가가 17% 급락한 상황에서 나온 반응으로, 엔비디아가 딥시크의 기술 발전을 오히려 새로운 기회로 보고 있음을 시사한다.
엔비디아 관계자는 CNBC와의 인터뷰에서 “딥시크의 R1 모델은 테스트 타임 스케일링(Test Time Scaling)의 완벽한 예시이며, 뛰어난 AI 발전을 보여준다”고 말했다. 이어 “딥시크의 작업은 널리 사용 가능한 모델과 수출 규제를 준수하는 컴퓨팅 자원을 활용해 새로운 모델을 창출할 수 있는 방법을 보여준다”고 설명했다.
이번 발표는 딥시크가 지난주 공개한 R1 모델에 대한 평가로, R1은 오픈소스 추론 모델(reasoning model)로 개발돼 OpenAI를 비롯한 미국 기업들의 최고 수준 모델을 능가하는 성능을 보인 것으로 알려졌다. 특히 R1의 훈련 비용은 600만 달러 미만으로, 실리콘밸리 기업들이 AI 모델 개발에 투자하는 수십억 달러에 비해 극히 저렴한 수준이다.
엔비디아는 딥시크의 기술 발전이 자사의 그래픽 처리 장치(GPU) 수요를 증가시킬 것으로 보고 있다. 관계자는 “추론(Inference) 과정에는 상당한 수의 엔비디아 GPU와 고성능 네트워킹이 필요하다”며 “현재 우리는 프리트레이닝(Pre-training), 포스트트레이닝(Post-training), 그리고 새로운 테스트 타임 스케일링이라는 세 가지 스케일링 법칙을 가지고 있다”고 설명했다.
또한, 엔비디아는 딥시크가 중국 시장용으로 특별히 제작된 GPU를 사용했다고 밝혀, 딥시크가 중국 내 금지된 엔비디아 GPU를 사용했다는 스케일 AI CEO 알렉산드르 왕(Alexandr Wang)의 주장을 반박했다. 딥시크 측도 중국 시장용 엔비디아 GPU를 사용했다고 확인했다.
이번 사태로 인해 마이크로소프트, 구글, 메타 등이 엔비디아 기반 AI 인프라에 투자한 수십억 달러가 낭비되고 있는지에 대한 의문이 제기되고 있다. 마이크로소프트는 2025년 한 해 동안 AI 인프라에 800억 달러를 투자할 계획이며, 메타는 600억에서 650억 달러를 AI 전략에 투자할 예정이다.
뱅크오브아메리카(BofA) 증권 애널리스트 저스틴 포스트(Justin Post)는 “모델 훈련 비용이 크게 낮아진다면, 클라우드 AI 서비스를 사용하는 광고, 여행, 소비자 앱 기업들에게 단기적인 비용 절감 효과가 있을 것”이라며 “장기적으로는 하이퍼스케일러의 AI 관련 수익과 비용이 낮아질 가능성이 있다”고 분석했다.
엔비디아의 이번 발표는 최근 몇 달간 엔비디아 CEO 젠슨 황(Jensen Huang), OpenAI CEO 샘 알트먼(Sam Altman), 마이크로소프트 CEO 사티아 나델라(Satya Nadella)가 논의해온 새로운 주제를 반영한다. AI 산업의 성장과 엔비디아 GPU 수요는 2020년 OpenAI 연구진이 제안한 “스케일링 법칙(Scaling Law)”에 의해 주도됐다. 이 법칙은 더 많은 컴퓨팅 자원과 데이터를 투입해 더 나은 AI 시스템을 개발할 수 있다는 개념이다.
그러나 지난 11월부터 젠슨 황과 샘 알트먼은 “테스트 타임 스케일링(Test Time Scaling)”이라는 새로운 개념에 주목하고 있다. 이는 완전히 훈련된 AI 모델이 예측이나 텍스트, 이미지 생성 과정에서 추가적인 컴퓨팅 파워를 사용해 “추론” 시간을 늘리면 더 나은 결과를 제공할 수 있다는 이론이다. 이 개념은 OpenAI의 o1 모델과 딥시크의 R1 모델에서도 활용되고 있다.