Microsoft는 맞춤형 AMD CPU로 구동되는 최신 고성능 컴퓨팅(HPC) Azure 가상 머신을 발표했습니다 . 이 CPU는 한때 MI300C라고 불렸을 수 있습니다.
Azure VM의 HBv 시리즈는 HPC에 중요한 사양인 대량의 메모리 대역폭을 제공하는 데 중점을 두고 있습니다. Microsoft는 이를 "가장 큰 HPC 병목 현상"이라고 부릅니다. 이전에 Microsoft는 이 추가 대역폭을 제공하기 위해 AMD의 3D V-Cache와 함께 Milan-X 및 Genoa-X 서버 CPU를 사용했지만 최신 HBv5 VM의 경우 Microsoft는 분명히 훨씬 더 성능이 뛰어난 것을 원했습니다.
HBv5 VM에 사용되는 맞춤형 AMD CPU는 일반적으로 AMD의 MI300X와 같은 최신 데이터 센터급 GPU에 사용되는 메모리인 HBM3를 활용합니다. 단일 VM에서 4개의 칩에서 6.9TB/s의 대역폭을 제공하는 이 VM은 Microsoft가 HBv4 VM에서 제공하는 Genoa-X CPU보다 거의 9배 빠르고 HBv3 VM에서 Milan-X 칩보다 거의 20배 빠릅니다.
CPU와 페어링하면 HBM3는 3D V-Cache와 비슷한 역할을 합니다. 그래도 L3 캐시 풀을 확장하는 대신, 대역폭이 훨씬 더 크고 대기 시간이 훨씬 더 짧은 거대한 L4 캐시를 효과적으로 추가합니다. 그러나 후자는 특정 유형의 작업 부하에서는 그렇게 중요하지 않습니다.
각 HBv5 VM은 이러한 맞춤형 AMD CPU를 4개씩 가지고 있으며, 모든 장식과 함께 단일 HBv5 VM은 450GB의 HBM3, 최대 4GHz까지 클록하는 352개의 Zen 4 코어, 일반 Epyc CPU에서 사용할 수 있는 일반 Infinity Fabric 대역폭의 두 배를 제공합니다. 그러나 SMT(하이퍼스레딩)는 비활성화되었습니다. VM에는 네트워크 스위칭을 위한 Nvidia의 Quantum-2 InfiniBand 800Gb/s도 있습니다.
4개의 CPU에 352개의 코어가 있으므로 각각 88개의 코어가 있지만 프로세서의 모든 코어가 VM에 노출되는 것은 아닐 가능성이 큽니다. 각 Zen 4 CCD에는 Zen 4인지 Zen 4c인지에 따라 8개 또는 16개의 코어가 있습니다. 사용자 지정 CPU는 Zen 4 CCD 11개 또는 Zen 4c CCD 6개를 사용하며, 한 CCD의 8개 코어는 비활성화됩니다. CPU에 완벽하게 작동하는 코어 96개가 있고, 그 중 8개는 오케스트레이션 또는 하이퍼바이저 역할에서 VM을 작동하도록 예약되어 있을 가능성이 더 큽니다.
이 "커스텀" AMD CPU도 작년에 소문난 MI300C 칩 과 꽤 비슷해 보이니 그다지 커스텀이 아닐 수도 있습니다 . 이 CPU는 본질적으로 MI300A APU이지만 CDNA 3 그래픽 대신 Zen 4 CCD만 장착하여 HBM3을 탑재한 96코어 CPU가 될 것으로 예상되었습니다. MI300A의 CPU 코어는 최대 3.7GHz까지 클럭이 올라가며 HBv5에 사용된 CPU와 크게 다르지 않아 커스텀 Azure 프로세서와 MI300C가 동일할 수 있음을 나타냅니다.
하지만 HBv5 CPU가 기술적으로 커스텀이 아닐 수 있지만, 그래도 Microsoft의 독점 CPU입니다. Microsoft 엔지니어 Glenn Lockwood는 Bluesky 에서 AMD CPU가 일반 Epyc CPU로 출시될지 궁금해하는 사용자에게 "Azure에서만 사용할 수 있습니다."라고 답했습니다.
AMD 메모리 엔지니어 필 파크에 따르면, HBv5 프로세서가 이전에 MI300C였을 경우 AMD는 처음에는 일반 대중에게 판매하고 싶었지만 판매 시장을 찾는 데 어려움을 겪었을 수 있다고 합니다.
"왜 EPYC+HBM을 더 일찍 보지 못했을까요? EPYC는 대량 시장에 집중했기 때문에 소켓이 2개 이상인 EPYC를 볼 수 없습니다." Park가 Bluesky 에 게시했습니다 . "DDR5 컨트롤러를 교체하고 HBM 컨트롤러/스택을 추가하면 그만이라고 할 수 없습니다. HBM은 특정 설계 선택을 강제합니다(예: 모든 HBM3 스택에는 16개의 64비트 채널이 필요함).
"유연성: HBM을 사용하면 용량을 업그레이드하거나 채널이 적게 채워진 저가 버전을 가질 수 없습니다."라고 그는 덧붙였습니다. "일반적으로 CPU는 그렇게 많은 대역폭을 필요로 하지 않습니다."
이 설명은 지금까지 HBM이 장착된 CPU의 짧은 역사와 일치합니다. 인텔은 이미 Sapphire Rapids를 기반으로 한 HBM이 주입된 CPU인 Xeon Max를 출시했으며, 이는 Aurora 슈퍼컴퓨터에서 사용되고 일반적으로도 이용 가능합니다.
그러나 인텔은 작년에 Emerald Rapids를 기반으로 한 Xeon Max 버전이 없을 것이라고 확인했고 , Granite Rapids도 Xeon Max 변형을 받을지 불확실 하여 상업적으로 큰 성공을 거두지 못했을 수 있습니다. AMD의 실용적인 결정은 Microsoft와 계약을 맺고 MI300C 생산을 Azure에 집중하는 것이었을 수 있습니다.
|