Stability AI는 Intel의 Xeon + Gaudi2 슈퍼컴퓨터 플랫폼을 최초로 사용합니다.(이미지 : 인텔)
인텔은 화요일 인공지능(AI) 워크로드를 위한 Gaudi2 가속기의 세계 최초 대규모 배포 중 하나를 발표했습니다. Dell과 협력하여 제작된 슈퍼컴퓨터는 Stability AI에서 생성 AI 애플리케이션을 위해 사용될 것입니다.
Intel의 새로운 슈퍼컴퓨터는 회사의 최신 Intel Xeon Scalable 프로세서를 기반으로 하며 최대 4,000개의 Intel Habana Gaudi2 AI 하드웨어 가속기를 실행합니다. 각 시스템이 OAM 폼 팩터(OAM 시스템에 일반적임)에서 8개의 Habana Gaudi2 프로세서를 사용한다고 가정하면 시스템에는 최대 500개의 노드가 있습니다. Intel의 Gaudi2가 강력한 성능을 제공한다는 점을 고려하면 이는 일부 응용 프로그램에서 Nvidia의 H100과 비교할 수 있는 수준이므로 슈퍼컴퓨터는 상당히 강력할 것입니다. 우리는 아마도 7~8 FP16 ExaFLOPS의 AI 성능을 보고 있을 것입니다.
인텔과 델은 앞으로도 AI 슈퍼컴퓨터를 위해 계속 협력할 것인지 여부를 밝히지 않았습니다. 한편, 칩 설계자에게는 세계 최대의 서버 공급업체 중 하나가 Xeon Scalable CPU와 AI 워크로드용으로 특별히 개발된 Habana Gaudi2 가속기를 갖춘 PowerEdge 시스템을 보유하고 있다는 것이 중요합니다. 이러한 머신은 대규모 교육과 기본 수준 추론을 모두 처리하도록 설계되었습니다.
Dell 외에도 Alibaba Cloud는 4세대 Xeon을 Intel AMX(Advanced Matrix Extensions) 가속기 및 다양한 소프트웨어 최적화와 함께 사용하면 모델 제공 플랫폼 DashScope 프로그램에서 3배의 추론 속도를 달성할 수 있다고 밝혔습니다.
인텔의 프로세서는 수많은 슈퍼컴퓨터와 심지어 AI 및 고성능 컴퓨팅(HPC) 응용 프로그램을 위한 엔비디아의 DGX H100 시스템에도 전원을 공급하지만, 회사 자체의 AI 가속기와 컴퓨팅 GPU는 운이 좋지 않으며 현재까지 가우디/가우디2 또는 폰테 베키오 기반 AI 배치가 거의 없습니다. 안정성 AI가 가우디2와 함께 작동하면 다른 회사들도 어떤 시도를 하기로 선택하는지 보는 것은 흥미로울 것입니다.
※ 퀘이사존 공식 기사가 아닌 해외 뉴스/기사를 번역한 것으로, 퀘이사존 견해와 주관은 포함되어 있지 않습니다. |