Nvidia의 Ampere A100은 이전에 최고의 AI 가속기 중 하나였지만, 새로운 Hopper H100, H200 및 다가오는 Blackwell GB200에 의해 그 자리를 내어주었습니다. 이 칩 제조업체는 시장에 나오지 않은 강화된 버전을 실험했거나, 아니면 중국에 대한 미국의 제재 조치에 대응하여 기업들이 A100을 비밀리에 개조하여 더 빠르게 만들었을 수 있습니다. X 사용자 Jiacheng Liu는 최근 중국 중고 시장에서 Nvidia의 '일반' A100보다 훨씬 더 높은 사양을 자랑하는 다양한 A100 프로토타입을 발견했습니다.
강화된 속성에도 불구하고, A100 7936SP(비공식 명칭, 7936개의 shader 프로세서를 가지고 있기 때문)는 일반 A100과 동일한 GA100 Ampere 다이를 공유합니다. 하지만 전자는 GA100 실리콘에서 가능한 128개의 SM(Streaming Multiprocessor) 중 124개가 활성화되어 있습니다. 최대 구성은 아니지만, A100 7936SP는 표준 A100보다 CUDA 코어가 15% 더 많아 상당한 성능 향상을 보여줍니다.
텐서 코어 수도 SM 수에 비례하여 증가합니다. 따라서 더 많은 SM이 활성화되어 있다는 것은 A100 7936SP가 더 많은 텐서 코어를 보유하고 있음을 의미합니다. 사양만 보면, SM, CUDA, 텐서 코어 수의 15% 증가로 AI 성능 또한 15% 향상될 수 있습니다.
Nvidia는 A100을 40GB와 80GB 구성으로 제공합니다. A100 7936SP 역시 두 가지 모델이 있습니다. A100 7936SP 40GB 모델은 A100 80GB와 동일한 1,410MHz 부스트 클록을 유지하면서 59% 더 높은 기본 클록을 자랑합니다. 반면, A100 7936SP 96GB는 일반 A100에 비해 18% 더 빠른 기본 클록을 가지고 있으며, 6번째 HBM2 스택을 활성화하여 총 96GB의 메모리를 제공합니다. 불행히도 중국 판매자들은 GPU-Z 스크린샷에서 부스트 클록 속도를 삭제했습니다.
A100 7936SP 40GB 메모리 서브시스템은 A100 40GB와 동일합니다. 40GB의 HBM2 메모리는 5개의 HBM2 스택을 사용하는 5120비트 메모리 인터페이스에서 2.4Gbps로 작동합니다. 이 설계로 최대 메모리 대역폭이 1.56TB/s에 달합니다.
하지만 A100 7936SP 96GB 모델이 주목할 만합니다. 이 그래픽 카드는 여섯 번째 HBM2 스택이 활성화되어 Nvidia가 제공하는 것보다 20% 더 많은 HBM2 메모리를 가지고 있습니다. 매우 큰 언어 모델 학습은 메모리 집약적일 수 있으므로, 추가적인 메모리 용량은 AI 작업에 매우 유용할 것입니다.
A100 7936SP 96GB는 A100 80GB와 비교하여 메모리 서브시스템이 개선된 것으로 보입니다. HBM2 메모리는 3Gbps 대신 2.8Gbps로 작동하지만, 6144비트 메모리 버스를 사용하여 차이를 만회합니다. 이로 인해 A100 7936SP 96GB는 A100 80GB보다 약 11% 더 높은 메모리 대역폭을 제공합니다.
A100 40GB와 80GB의 TDP는 각각 250W와 300W입니다. 더 빠른 사양을 고려할 때, A100 7936SP의 TDP는 더 높을 수 있습니다. 하지만 공유된 GPU-Z 스크린샷에서는 이 값을 알 수 없습니다.
엔지니어링 PCB에는 표준 A100의 단일 8핀 PCIe 전원 커넥터 대신 3개의 8핀 PCIe 전원 커넥터가 있습니다. 엔지니어링 프로토타입이므로, A100 7936SP가 3개의 전원 커넥터를 모두 사용하지는 않겠지만, 추가 CUDA 코어와 HBM2 메모리로 인해 표준 A100보다 다소 더 많은 전력을 소비할 것으로 보입니다.
많은 중국 판매자들이 eBay에서 A100 7936SP를 판매하고 있습니다. 96GB 모델의 가격은 $18,000(약 2,501만 원)에서 $19,800(약 2,751만 원)사이입니다. 이들이 Nvidia 연구소에서 탈출한 엔지니어링 샘플인지, 아니면 특정 고객을 위해 제조사가 개발한 맞춤형 모델인지는 알 수 없습니다. 어쨌든 A100이 최신 미국 수출 제재 대상이지만, 이미 중국 내에 있는 카드에는 영향을 미치지 않습니다.
물론 보증이나 공식 드라이버 지원이 없습니다. A100 7936SP가 A100보다 더 나은 성능을 제공하고 비슷하거나 낮은 가격일 수 있지만, 공식 제품을 구매하거나 GPU를 임대하는 것이 더 안전합니다. 하지만 더 이상 A100 GPU를 수입할 수 없는 중국 시장에서는 추가 메모리와 컴퓨팅 능력이 고려할 만한 가치가 있어 보입니다.
※ 퀘이사존 공식 기사가 아닌 해외 뉴스/기사를 번역한 것으로, 퀘이사존 견해와 주관은 포함되어 있지 않습니다. |