최대 1200 W, 다양한 구성, 새로운 아키텍처를 갖춘 NVIDIA 블랙웰 GPU
엔비디아 CEO 젠슨 황이 GTC 2024 기조연설에서 블랙웰Blackwell을 발표했을 당시에는 기술 및 아키텍처에 대한 정보가 많이 부족했습니다. 하지만 이후 며칠간의 GTC 기간 동안 NVIDIA는 조금 더 자세한 내용을 공유했지만, 여전히 우리 모두가 기다리고 있는 기술적 심층 분석에 대해서는 너무 많이 다루지 않았습니다. 새로운 세부 사항은 조나 알베(NVIDIA 수석 부사장 겸 GPU 아키텍트)와 이안 벅(NVIDIA 하이퍼스케일 및 HPC 담당 부사장)이 공개했습니다.
새로운 아키텍처로 AI 시대를 위해 설계된 블랙웰 GPU
우선, 우리 모두는 블랙웰이 호퍼Hopper보다 대대적인 아키텍처 업그레이드가 될 것이라는 것을 알고 있었고, 조나가 블랙웰이 호퍼와는 완전히 다른 마이크로 아키텍처를 사용한다고 말한 것을 보면 그 이상인 것 같습니다.
블랙웰에 대해 우리가 알고 있는 것은 FP4 및 FP6 컴퓨팅 포맷을 추가한 2세대 트랜스포머 엔진 기술이 탑재되어 있다는 것입니다. 이러한 형식과 새로운 소프트웨어 최적화를 통해 Blackwell은 지구상에서 가장 빠른 AI 칩이 되었지만, 표준 FP64 컴퓨팅은 호퍼에 비해 32% 향상되는 데 그쳤습니다. 그 이유는 간단명료합니다. 블랙웰은 우선 AI 칩이고, 이것이 주요 목표 시장이기 때문입니다. AI 관점에서 FP64는 그다지 중요하지 않으며, 낮은 칩일수록 추론 및 학습 기능이 더 빠릅니다.
또한 칩렛(MCM) 방식을 선택한 이유는 수율 향상보다는 전반적인 성능 개선이 필요하기 때문이기도 합니다. 동일한 패키지에서 실행되는 두 개의 GPU에 대해 이야기하고 있기 때문에 NVIDIA의 첫 번째 MCM 접근 방식이 현장에서 어떻게 작동하는지 보는 것은 흥미로울 것입니다. CUDA는 두 개의 GPU와 서로 다른 아키텍처를 처리하는 데 상당히 능숙하기 때문에 프로그래머에게 큰 변경이 필요하지 않다고 언급되었습니다.
GB200 GPU는 완전한 블랙웰 사양으로, 호퍼보다 500W 더 많은 전력을 제공합니다
출시 당시에는 모든 블랙웰 GPU와 플랫폼 변형을 둘러싼 혼란이 특히 컸습니다. 젠슨은 블랙웰은 GPU가 아니라 전체 플랫폼이며 플랫폼에는 다양한 제품이 있지만 여전히 GPU를 기반으로 한다고 말했습니다. 현재 NVIDIA는 세 가지 공식 블랙웰 GPU 변형을 발표했습니다.
여기에는 GB200 슈퍼칩 플랫폼에서 사용되는 플래그십 및 최고 사양 B200이 포함됩니다. 이 칩은 최고 등급의 컴퓨팅 성능을 갖추고 있으며 최대 TDP는 1200 W입니다. 이는 700 W TDP를 제공했던 호퍼 H100보다 500 W 더 높은 수치입니다. 전체 슈퍼칩에는 이러한 B200 GPU 두 개와 최대 2700 W 전력(B200의 경우 1200W x 2 + 300W CPU/IO)을 위한 Grace CPU가 장착되어 있습니다.
다음으로 DGX 및 HGX 플랫폼에 사용되는 블랙웰 B200입니다. 약 1000 W에 최적화되어 있으며 전체 사양의 거의 90%에 달하는 성능을 제공합니다. 이 변형이 TDP만 낮은지 아니면 전체 구성에 비해 사양을 줄인 것인지는 알려지지 않았습니다. 마지막으로 700 W TDP로 더욱 튜닝된 블랙웰 B100이 있습니다. 이 모델은 B200(1000W)의 약 80%, B200(1200W)의 약 70% 성능을 제공합니다.
특히 향후 PCIe 플랫폼용 싱글 다이 블랙웰 GPU 변형이 출시될 가능성이 있습니다. 블랙웰 GPU 아키텍처는 이미 드라이브 토르 및 향후 출시될 지포스 라인업과 같은 소비자용 RTX 및 AI 플랫폼에 통합되고 있습니다. NVIDIA 블랙웰 GB200 GPU는 올해 말 첫 번째 주요 AI 고객에게 출하를 시작하고 이후 물량을 늘려나갈 예정입니다.
|