아마존웹서비스(AWS)가 추론 모델과 에이전틱 인공지능(AI) 시스템 발전을 가속화하기 위한 인프라를 출시했다.
AWS는 엔비디아 그레이스 블랙웰 슈퍼칩으로 구동되는 'P6e-GB200 울트라서버'를 출시했다고 15일 밝혔다.
P6e-GB200은 최대 72개의 블랙웰 중앙처리장치(GPU)를 단일 도메인으로 연결하고, 360페타플롭스(FP) 성능과 13.4TB(테라바이트)의 GPU 메모리를 제공한다.
AWS는 엔비디아 그레이스 블랙웰 슈퍼칩으로 구동되는 'P6e-GB200 울트라서버'를 출시했다. (사진=AWS)
이 서버는 프론티어급 조 단위 모델 훈련과 실시간 동시성 추론에 최적화됐다. 특히 전문가 혼합 모델 등 복잡한 아키텍처에서도 빠르고 일관된 응답을 보장하며, 분산 서빙 최적화에도 적합한 구조다.
AWS는 P6-B200가 8개의 GPU 구성으로 보다 범용적인 AI 워크로드를 지원한다고 밝혔다. 기존 P5en 대비 GPU 연산 성능은 최대 2.25배, 메모리는 1.27배 향상됐으며, 기존 코드 수정 없이 마이그레이션이 가능한 호환성도 강점이다.
해당 솔루션은 AWS 니트로 시스템 기반의 보안성과 무중단 '라이브 업데이트'를 지원한다. 니트로는 펌웨어 업데이트와 최적화 작업을 별도 중단 없이 처리할 수 있어 AI 환경에서의 안정성을 높인다.
3세대 EC2 울트라클러스터와 결합된 P6e-GB200은 대규모 클러스터 운영 시에도 전력 소비를 40% 줄이고 케이블링도 80% 이상 절감할 수 있다. 이와 함께 AWS는 네트워크 혼잡 최소화를 위한 4세대 EFA 네트워크 어댑터(EFAv4) 기반 프로토콜도 탑재했다.
AWS은 서버의 냉각 방식에서도 차이를 뒀다. P6e-GB200은 액체-칩 방식의 리퀴드 냉각을 적용해 높은 밀도와 효율을 보장하며, 기존 인프라와도 유연하게 결합할 수 있는 설계를 적용했다.
운영 측면에서는 세이지메이커 하이퍼팟을 통한 자동화된 GPU 클러스터 관리, EKS 기반 쿠버네티스 통합 운영, DGX 클라우드를 통한 다중 노드 AI 플랫폼 확장 옵션도 제공된다.

관련기사
- 민주당, 김홍일 방통위원장 탄핵 추진..."6월내 통과 목표"2024.06.27
- 김홍일 위원장 "2인 체제 방통위, 바람직하지 않지만 위법 아니다”2024.06.21
- LG 구광모 6년...AI·바이오·클린테크 키운다2024.06.28
- 화재 막는 배터리 진단기술 뜬다...민테크, 상장 후 존재감 '쑥쑥'2024.06.28