하드웨어 뉴스 - 최신 IT/하드웨어 정보를 만나보세요

AMD, 엔비디아와 경쟁하기 위해 120만 GPU AI 슈퍼컴퓨터 사용

QM달려

12 2760 7 2024.06.26 08:40

<img src="https://img2.quasarzone.com/editor/2024/06/26/14d1c15b52ebe60f809101ad2de85b74.webp" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    데이터 센터에서 더 많은 컴퓨팅 성능에 대한 수요가 엄청난 속도로 증가하고 있으며, AMD는 무려 120만 개 이상의 GPU를 포함하는 단일 AI 클러스터를 구축하기 위한 진지한 문의를 받았다고 밝혔습니다 . AMD의 인정은 데이터 센터에서 AMD의 미래에 대해 AMD의 EVP이자 데이터 센터 솔루션 그룹의 GM인 Forrest Norrod와 함께 The Next Platform을

    오랫동안 논의한 데서 비롯되었습니다 . 가장 눈에 띄는 반응 중 하나는 누군가가 진지하게 고려하고 있는 가장 큰 AI 훈련 클러스터에 관한 것이었습니다. 회사가 120만 GPU 규모의 클러스터에 대한 문의를 접수했는지 묻는 질문에 Forrest는 평가가 사실상 정확하다고 답했습니다.

    Morgan: 누군가가 심각하게 생각하는 가장 큰 AI 훈련 클러스터는 무엇입니까? 이름을 언급할 필요가 없습니다. 누군가 당신에게 와서 MI500에 대해 120만 GPU 정도가 필요하다고 말한 적이 있습니까? 
    포레스트 노로드: 그 범위 안에 있다고요? 예.

    Morgan: “그 범위 안에 있다”고만 말할 수는 없습니다. 실제 가장 큰 숫자는 무엇입니까?

    Forrest Norrod: 정말 심각합니다. 그 범위에 속합니다.

    모건: 한 대의 기계로요.

    Forrest Norrod: 예, 저는 하나의 기계에 대해 이야기하고 있습니다.

    모건: 조금 마음이 흔들립니다. 아시죠?

    120만 개의 GPU는 터무니없는 숫자입니다(포레스트가 인터뷰 후반부에 농담을 하듯 놀랍습니다). AI 훈련 클러스터는 여러 서버 랙 이하에 걸쳐 고속 상호 연결을 통해 연결된 수천 개의 GPU로 구축되는 경우가 많습니다. 반면 120만 개의 GPU로 AI 클러스터를 만드는 것은 사실상 불가능해 보입니다.

    백만 개가 넘는 GPU를 갖춘 AI 클러스터를 구축하기 위해 누군가가 극복해야 할 함정은 상상할 수 있지만 대기 시간, 전력 및 하드웨어 오류의 불가피성은 즉시 떠오르는 몇 가지 요소입니다.

    AI 워크로드는 지연 시간, 특히 특정 데이터 전송이 다른 데이터 전송보다 훨씬 오래 걸리고 워크로드를 방해하는 꼬리 지연 시간 및 이상값에 매우 민감합니다. 또한 오늘날의 슈퍼컴퓨터는 규모에 따라 몇 시간마다 발생하는 GPU 또는 기타 하드웨어 오류를 완화해야 합니다. 이러한 문제는 현재 알려진 가장 큰 클러스터 크기의 30배로 확장할 때 훨씬 더 두드러집니다. 그리고 그것은 그러한 대담한 목표에 필요한 원자력 발전소 규모의 전력 공급을 다루기도 전입니다.

    세계에서 가장 강력한 슈퍼컴퓨터라도 수백만 개의 GPU로 확장할 수는 없습니다. 예를 들어, 현재 가장 빠르게 작동하는 슈퍼컴퓨터인 Frontier에는 "유일하게" 37,888개의 GPU가 있습니다.

    백만 개의 GPU 클러스터 목표는 2020년대를 형성하고 있는 AI 경쟁의 심각성을 말해줍니다. 가능성의 영역이라면 AI 처리 능력이 더 높아진다면 누군가는 시도할 것이다. 포레스트는 어떤 조직이 이 규모의 시스템 구축을 고려하고 있는지 밝히지 않았지만 "매우 냉정한 사람들"이 AI 훈련 클러스터에 수백억에서 수천억 달러를 지출하는 것을 고려하고 있다고 언급했습니다. 모두). </td></tr></tbody></table></div><div style="text-align: center; "></div><div style="text-align: center; "> </div><div style="text-align: center; ">※ 퀘이사존 공식 기사가 아닌 해외 뉴스/기사를 번역한 것으로, 퀘이사존 견해와 주관은 포함되어 있지 않습니다. </div><div style="text-align: center;"> </div><div style="text-align: center;">
</div>

QM달려

행성: QM

포인트: 403,164 exp

작성물 댓글

모든회원 자기소개 펼치기

댓글: 12개

하드웨어 뉴스 - 최신 IT/하드웨어 정보를 만나보세요

공지 뉴스게시판 특별 규정(23.09.07)

퀘이사존

20.2k

11-08

전체 CPU/MB/RAM 그래픽카드 케이스 쿨링솔루션 저장장치 파워 키보드/마우스 음향기기 디스플레이 네트워크 소프트웨어 노트북 업계동향 기타/주변기기

추천	제목
5	[컴퓨텍스] 엔비디아 부스에서 SFF 지원 그래픽카드 및 케이스 간략히 살펴보기 10 그래픽카드 Wormhole 1.7k 06-03
2	[컴퓨텍스] 기가바이트 AI TOP 생태계: 생성 및 보조 AI 소프트웨어, 새로운 인증 하드웨어 4 기타/주변기기 Wormhole 490 06-03
8	[컴퓨텍스] 기기바이트, 실시간 LCD 시스템 정보 디스플레이 전시 10 기타/주변기기 Wormhole 1.5k 06-03
34	[컴퓨텍스] 기가바이트, 자체 후면 연결 메인보드 표준 Stealth 전시 53 CPU/MB/RAM Wormhole 5.7k 06-03
16	[컴퓨텍스] 기가바이트, 인텔 Z890 및 AMD X870E 칩셋 메인보드 전시 (사진 추가) 18 CPU/MB/RAM Wormhole 3.5k 06-03
3	[컴퓨텍스] 기가바이트 AORUS Xtreme Ice, AI TOP, Eagle OC Ice 그래픽카드 전시 6 그래픽카드 Wormhole 1.2k 06-03
4	AMD AI 가속기 라인업 4분기에 MI325X 리프레시, 25년 CDNA 4 출시 예정 14 업계동향 QM건빵 994 06-03
2	디스플레이 위크 2024의 EL-QLED 아이캔디 3 업계동향 QM안나 557 06-03
4	뷰소닉 VX2759-2K-PRO-3 공식 출시, 240Hz QHD 디스플레이 DisplayHDR 400 5 디스플레이 QM안나 328 06-03
3	AOC AGON AG275UXM 데뷔, 4K 고속 IPS 디스플레이, 미니 LED 165 Hz 3 디스플레이 QM안나 456 06-03
4	Elon Musk는 "내년 여름"까지 xAI용 NVIDIA B200 칩 300,000개를 구입하기 위해 약 90억 달러를 지출하겠다고 약속했습니다 9 업계동향 신지™ 1.2k 06-03
13	MSI, Ryzen 9000 지원 발표 및 X870 토마호크 WIFI와 PRO X870-P WIFI 공개 20 CPU/MB/RAM Wormhole 3.7k 06-03
14	바이오스타, 플래그십 X870E Valkyrie 메인보드 공개 26 CPU/MB/RAM Wormhole 2.4k 06-03
34	AMD, X870E 및 X870 800 시리즈 칩셋 발표, AM5 소켓에 대해 2027년 이상의 수명 약속 61 CPU/MB/RAM Wormhole 8.7k 06-03
10	AMD, AM4 소켓 Ryzen 9 5900XT 및 Ryzen 7 5800XT 공식 발표 21 CPU/MB/RAM Wormhole 6.7k 06-03
2	AMD Radeon PRO W7900 듀얼 슬롯 워크스테이션 GPU 3499달러에 발표 5 그래픽카드 Wormhole 981 06-03
63	AMD Ryzen 9000 데스크탑 CPU 공식: Zen 5는 7월 출시로 16% IPC 향상, 9950X, 9900X, 9700X, 9600X SKU, 5.7G... 78 CPU/MB/RAM 신지™ 19.9k 06-03
6	미디어텍 Kompanio 838 칩셋 공개 6 업계동향 QM브로리 1.2k 06-03
4	레노버 리전 R27qe-30, QHD 180Hz IPS 모니터 출시 4 디스플레이 QM브로리 410 06-03
9	AOC, 540Hz 24.1인치 AGON 6 Pro 모니터 출시 11 디스플레이 QM브로리 645 06-03
10	AMD, '컴퓨텍스 2024(High Performance Computing In The AI-Era)' 컨퍼런스 댓글 생중계 91 업계동향 블레이더영혼 2.6k 06-03
1	Acer DA271K 및 Acer DA321QK는 4K 디스플레이와 생산성 향상 기능으로 공식 출시됩니다. 2 디스플레이 QM안나 254 06-03
1	Acer Nitro GA271U P 및 Acer Nitro GA321QU P 스마트 모니터가 Google TV 지원 기능으로 공개되었습니다 2 디스플레이 QM안나 186 06-03
0	Gurman: WWDC에 하드웨어 없음, 다음 Apple TV은 더 이상 출시되지 않음 1 업계동향 QM락형 465 06-03
14	AMD Ryzen 9000 CPU 슬라이드 유출, IPC 전작 대비 16% 향상 & 7월 31일 출시 29 CPU/MB/RAM Wormhole 5.5k 06-03
5	삼성도 속았다…9년간 3백 건 넘게 담합하다 적발 9 업계동향 빌보 4.7k 06-03
17	[루머] RTX 50 시리즈 블랙웰 GPU는 Ada와 동일한 GPC 수 제공 38 그래픽카드 Wormhole 8.5k 06-03
9	삼성전자 노조 6월 7일 첫 파업, 칩 공급 우려 제기 21 업계동향 Wormhole 1.4k 06-03
5	韓 HBM 경고등…마이크론, 기술 추월 시작했다 9 CPU/MB/RAM 블랙웰 2k 06-03
1	삼성전자, '비스포크 스팀' 출시…"성능 유지, 가격 부담↓" 4 기타/주변기기 블랙웰 1.1k 06-03