中 딥시크, 신규 가성비 추론모델 공개…"단일 GPU로 고성능 구현"

가성비 인공지능(AI)으로 돌풍을 일으킨 중국의 스트타업 딥시크가 고성능을 유지하면서도 단일 그래픽처리장치(GPU)로 실행 가능한 새로운 추론 모델을 공개해 주목받고 있다.

30일 테크크런치 등 외신에 따르면 딥시크는 자사 대표 AI 모델 'R1'의 매개변수 크기를 줄인 '딥시크-R1-0528-큐원3-8B'를 출시했다.

딥시크가 새로운 가성비 추론모델을 공개했다. (사진=챗GPT 제작)

이 모델은 80억 규모 매개변수를 갖춘 추론 모델로, 이달 알리바바가 공개한 큐원3 모델에 자체 생성한 합성 사전 학습 데이터와 고도화된 추론 알고리즘을 파인튜닝해 개발됐다.

딥시크는 이번 모델이 논리 추론과 수학적 사고 등 고차원 문제 해결 영역에서 구글과 마이크로소프트의 동급 모델을 능가하는 성능을 보인다고 주장했다.

딥시크 측에 따르면 딥시크-R1-0528-큐원3-8B는 수학 경시인 AIME 2025에서 구글의 '제니마이-2.5 플래시'보다 높은 문제 해결 능력을 보였다. 또 다른 수학 기술 테스트인 HMMT에서도 마이크로소프트가 최근 출시한 소규모 제품 '파이-4 플러스' 모델과 유사한 성능을 보인 것으로 조사됐다.

특히 딥시크-R1-0528-큐원3-8B는 일반 모델 대비 컴퓨팅 연산량이 훨씬 적다는 게 강점이다. 알리바바의 큐원 모델은 구동하기 위해 다량의 엔비디아 H100 그래픽처리장치(GPU)가 필요한 반면, 이번 출시된 딥시크 모델은 단일 GPU 환경에서도 작동하는 것으로 알려졌다.