정부가 1조4천600억원을 투입해 첨단 그래픽처리장치(GPU) 1만3천장을 확보하는 초대형 인공지능(AI) 인프라 사업을 본격 추진한다. 이번 사업은 국내 AI 컴퓨팅 자원의 부족 문제를 해소하고 소버린 AI 생태계 구축을 본격화하는 첫 단추로 평가된다.
과학기술정보통신부는 'AI 컴퓨팅자원 활용기반 강화사업'의 일환으로 추진한 'GPU 확보·운용지원' 사업의 최종 사업자로 네이버클라우드·NHN클라우드·카카오 등 3개사를 선정했다. 총 4개 기업이 신청서를 제출했지만 쿠팡은 최종 탈락했다.
최종 사업자로 선정돼 클라우드 3사는 대규모 GPU 클러스터를 구축하고 연내부터 산학연과 스타트업 등에 순차적으로 지원에 나선다.
GPU 확보 사업에 네이버·카카오·NHN이 선정됐다. (사진=챗GPT 제작)
이번 사업은 정부가 지난 5월 국회에서 확보한 1조4590억원 규모의 1차 추경 예산을 바탕으로 기획됐다. 엔비디아의 최신 GPU를 신속히 확보해 국내 AI 스타트업, 학계, 연구기관 등이 사용할 수 있도록 지원하는 것이 핵심이다.
당초 정부는 '국가AI컴퓨팅센터' 구축 사업과 연계해 이 사업을 진행하려 했으나, 해당 사업이 두 차례 유찰되면서 별도로 추진됐다. 그 결과 GPU 구매·운영 경험과 인프라 역량을 모두 갖춘 클라우드 3사가 낙점됐다.
"실행력과 경험이 갈랐다"…클라우드 3사, 평가 앞선 이유는
정부는 사업자 선정에 있어 단순한 GPU 구매 가격만이 아니라, 실행 역량과 기술 내재화를 중점적으로 평가한 것으로 알려졌다. 평가 항목은 크게 ▲사업 이해도 및 추진역량 ▲구축계획의 우수성 ▲운영역량 및 사업관리 ▲AI 생태계 기여 계획 등이다.
가장 많은 점수를 차지한 것은 '구축계획의 우수성'이었다. 대규모 클러스터를 직접 구성할 수 있는 기술 내재화, 최신 GPU 확보 속도, 연내 서비스 가능성 등이 주요 관건으로 작용했다.
최종 선정된 클라우드 3사는 이미 자체 데이터센터를 보유하고 있으며 GPU 클러스터링 운영 경험도 충분해 안정적인 인프라 운용 능력을 인정받았다. 특히 서비스형 GPU(GPUaaS) 상용 서비스 경험이 있어 정부가 요구하는 빠른 실행력과 기술력 확보에서 앞섰다는 평가다.
NHN클라우드 광주AI컴퓨팅센터 (사진=NHN클라우드)
네이버클라우드는 '각 춘천'과 '각 세종' 등 자체 데이터센터뿐만 아니라 올 초부터 LG CNS 죽전 데이터센터, LG유플러스 가산 데이터센터 등 외부 데이터센터 임차를 진행 중이다. NHN클라우드는 '광주 AI 데이터센터'를 운용해 왔으며 이번 사업에는 영등포 양평 데이터센터와 일산 삼송 데이터센터를 제시한 것으로 알려졌다. 카카오 역시 자체 데이터센터인 '카카오 데이터센터 안산'을 지난해부터 운영 중이다.
반면 쿠팡은 싱가포르계 엠피리온 디지털 데이터센터를 임차해 사업에 참여할 계획이었으나 클라우드 인프라 자체 운영 경험이 사업에 선정된 3사 대비 부족하다는 점에서 낮은 평가를 받은 것으로 알려졌다.
업계 한 관계자는 "이번 사업은 단순히 장비를 들여오는 것이 아니라 그것을 어떻게 안정적으로 운영하고 서비스로 전환하느냐에 방점이 찍힌 평가였다"며 "데이터센터 기반부터 클러스터링 운용 능력, GPUaaS 사업 경험까지 총체적 실행 역량을 검증한 것"이라고 설명했다.
엔비디아 B200·H200 1.3만장 확보…대형 클러스터 본격 가동
이번 사업으로 정부와 민간이 확보하는 GPU는 총 1만3천장으로, 엔비디아 B200 1만80장과 H200 3천56장을 확보할 계획이다. 이 중 정부가 직접 활용하는 GPU는 B200 8160장, H200 2296장 규모다.
구축될 GPU는 대규모 AI 워크로드에 대응할 수 있도록 클러스터 형태로 구성된다. 대표적으로 정부는 ▲B200 510노드(4천80장) ▲255노드 2세트(2천40장) ▲H200 255노드(2천40장)를 각각 클러스터링해 초대형 AI 연산 작업에 활용할 계획이다.
GPU 활용 방안 (사진=과기정통부)
세 사업자가 확보한 GPU 물량을 살펴보면 먼저 NHN클라우드는 B200 총 7천656장 확보하며 가장 많은 물량을 담당할 예정이다. 이 중 6천120장은 정부 활용분이며 510노드·255노드 형태로 구성해 고밀도 수냉식 클러스터로 운용할 계획이다.
네이버클라우드는 H200 총 3천56장을 확보한다. 이 중 2천296장이 정부 활용분이다. H200 기반 255노드와 32노드 클러스터를 구성해 연내부터 본격 가동할 계획이다.
카카오는 B200 총 2천424장을 확보하고 정부 활용분인 2천40장은 255노드 단일 클러스터로 구성될 예정이다.
GPU 활용은 어떻게? '통합지원 플랫폼'으로 접근성↑
정부와 사업자들은 연내부터 확보한 GPU 자원을 필요로 하는 산학연과 스타트업 등에 순차적으로 배분한다. 이를 위해 온라인 기반의 'GPU 통합지원 플랫폼(가칭)'도 함께 구축하기로 합의했다.
해당 플랫폼이 구축되면 사용자는 GPU 자원을 자유롭게 신청하고 평가를 거쳐 적정 자원을 배정받게 된다. 유휴 자원이 발생할 경우 대기 수요자에게 자동으로 재분배하는 체계도 마련될 전망이다.
이번 사업의 운영 기간은 2030년까지로, 향후 국가AI컴퓨팅센터나 독자 AI 파운데이션 모델 프로젝트 등 국가 단위 AI 사업과도 연계될 가능성이 크다.
업계 관계자는 "지금까지는 GPU가 있어도 정작 필요한 곳에 닿지 못해 활용률이 낮은 경우가 많았다"며 "GPU 통합지원 플랫폼이 제대로 작동하면 컴퓨팅 자원이 특정 기업이나 연구기관에 편중되지 않고 스타트업이나 대학도 실질적으로 활용할 수 있는 생태계가 마련될 수 있을 것"이라고 말했다.
배경훈 장관 "AI 고속도로 바탕으로 소버린 생태계 본격 확장"
이번 GPU 확보 사업은 고성능 AI 연산 자원이 부족한 국내 현실에서 커다란 전환점을 마련했다는 게 업계 평가다. 그동안 AI 스타트업이나 대학, 중소기업은 대규모 모델 학습이나 추론 환경을 제대로 갖추지 못한 채 글로벌 클라우드 서비스에 의존한 사례가 많았다.
이제 정부 주도의 대규모 GPU 클러스터가 공공 형태로 공급되면 ▲초거대 AI 모델 학습 ▲멀티모달 AI 개발 ▲AI 응용 서비스 고도화 등이 보다 넓은 생태계 안에서 가능해질 전망이다.
업계 관계자는 "GPU 1만장 이상을 정부와 민간이 공동으로 확보하고 오픈된 구조로 운영하는 모델은 긍정적인 방향"이라며 "한국형 AI 생태계를 본격적으로 시작할 수 있는 자산이 될 것"이라고 강조했다.

관련기사
- 민주당, 김홍일 방통위원장 탄핵 추진..."6월내 통과 목표"2024.06.27
- 김홍일 위원장 "2인 체제 방통위, 바람직하지 않지만 위법 아니다”2024.06.21
- LG 구광모 6년...AI·바이오·클린테크 키운다2024.06.28
- 화재 막는 배터리 진단기술 뜬다...민테크, 상장 후 존재감 '쑥쑥'2024.06.28