가성비 인공지능(AI)으로 돌풍을 일으킨 중국의 스트타업 딥시크가 고성능을 유지하면서도 단일 그래픽처리장치(GPU)로 실행 가능한 새로운 추론 모델을 공개해 주목받고 있다.
30일 테크크런치 등 외신에 따르면 딥시크는 자사 대표 AI 모델 'R1'의 매개변수 크기를 줄인 '딥시크-R1-0528-큐원3-8B'를 출시했다.
딥시크가 새로운 가성비 추론모델을 공개했다. (사진=챗GPT 제작)
이 모델은 80억 규모 매개변수를 갖춘 추론 모델로, 이달 알리바바가 공개한 큐원3 모델에 자체 생성한 합성 사전 학습 데이터와 고도화된 추론 알고리즘을 파인튜닝해 개발됐다.
딥시크는 이번 모델이 논리 추론과 수학적 사고 등 고차원 문제 해결 영역에서 구글과 마이크로소프트의 동급 모델을 능가하는 성능을 보인다고 주장했다.
딥시크 측에 따르면 딥시크-R1-0528-큐원3-8B는 수학 경시인 AIME 2025에서 구글의 '제니마이-2.5 플래시'보다 높은 문제 해결 능력을 보였다. 또 다른 수학 기술 테스트인 HMMT에서도 마이크로소프트가 최근 출시한 소규모 제품 '파이-4 플러스' 모델과 유사한 성능을 보인 것으로 조사됐다.
특히 딥시크-R1-0528-큐원3-8B는 일반 모델 대비 컴퓨팅 연산량이 훨씬 적다는 게 강점이다. 알리바바의 큐원 모델은 구동하기 위해 다량의 엔비디아 H100 그래픽처리장치(GPU)가 필요한 반면, 이번 출시된 딥시크 모델은 단일 GPU 환경에서도 작동하는 것으로 알려졌다.

관련기사
- 민주당, 김홍일 방통위원장 탄핵 추진..."6월내 통과 목표"2024.06.27
- 김홍일 위원장 "2인 체제 방통위, 바람직하지 않지만 위법 아니다”2024.06.21
- LG 구광모 6년...AI·바이오·클린테크 키운다2024.06.28
- 화재 막는 배터리 진단기술 뜬다...민테크, 상장 후 존재감 '쑥쑥'2024.06.28