하드웨어 뉴스 - 최신 IT/하드웨어 정보를 만나보세요

NVIDIA H100 4 nm GPU 성능 데뷔: 4.5배 성능 향상!

QM벤치

18 5895 4 2022.09.10 04:29

※ 퀘이사존 공식 기사가 아닌 해외 뉴스/기사를 번역한 것으로, 퀘이사존 견해와 주관은 포함되어 있지 않습니다.
※ 내용 중 일부는 오류/오역이 있을 수 있습니다. 지적해 주시면 확인 후 수정 조치하겠습니다. 감사합니다. <img src="https://img2.quasarzone.com/editor/2022/09/10/9d3bb56c7a0c8e664a4ec9ee5c566a5c.jpg" alt="퀘이사존"><div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(39, 39, 39) rgb(39, 39, 39) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(39, 39, 39) rgb(39, 39, 39);">     9월 9일 베이징 시간, MLCommons 커뮤니티는 최신 MLPerf 2.1 벤치마크 결과를 발표했으며, 새로운 벤치마크는 거의 5,300개의 성능 결과와 2,400개의 전력 소비 측정을 가지고 있습니다. 이전 라운드보다 각각 1.37배 및 1.09배 더 높으며, MLPerf의 적용 범위는 더욱 확대되었습니다.

    Alibaba, ASUS, Azure, Battery Technologies, Dell, Fujitsu, 기가바이트, H3C, HPE, 웨이브, 인텔, 크라이, 레노버, Moffett, Nettrix, Neural Magic, NVIDIA, OctoML, Qualcomm, SAPEON 및 Supermicro는 모두 이 테스트의 기여자입니다.

    그 중에서도 NVIDIA는 H100과 함께 처음으로 MLPerf 테스트를 수행하고 모든 워크로드에서 세계 기록을 경신하는 등 여전히 강세를 보이고 있습니다.     H100은 A100보다 4.5배 향상된 세계 기록을 경신했습니다

    엔비디아는 지난 3월 새로운 아키텍처인 엔비디아 호퍼(NVIDIA Hopper)를 기반으로 한 H100 GPU를 출시해, 2년 전 출시된 엔비디아 암페어(NVIDIA Ampere) 아키텍처에 비해 규모의 성능 도약을 이뤄냈습니다.
    GTC 2022에서 젠슨 황은 20개의 H100 GPU가 전 세계 인터넷 트래픽과 동일한 트래픽을 지원할 수 있으며, 고객이 고급 추천 시스템을 출시하고 실시간으로 데이터 추론을 실행하는 데 도움이 되는 대규모 언어 모델을 출시할 수 있다고 말했습니다.

    AI 실무자들이 기대하고 있는 H100은 2022년 3분기에 공식적으로 출하될 예정이었으나, 현재 사용자의 실제 사용량과 H100의 실제 성능을 알 수 없기 때문에 최신 MLPerf 테스트 점수를 통해 H100의 성능을 미리 확인할 수 있습니다. <img src="https://img2.quasarzone.com/editor/2022/09/10/1e08219106df028ca7709b4ca418d9ba.png" alt="퀘이사존" style="width: 100%;">     이번 테스트에서는 Intel Sapphire Rapids, Qualcomm Cloud AI 100, Biren BR104, SAPEON X220-enterprise에 비해 NVIDIA H100은 데이터 센터의 6개 신경망 모델 모두에서 테스트 결과를 제출할 뿐만 아니라 단일 서버 및 오프라인 시나리오에서 처리량과 속도면에서 선도적인 위치를 점했습니다.

    NVIDIA A100에 비해 H100은 MLPerf 모델 중 가장 크고 성능이 가장 까다로운 모델 중 하나인 자연어 처리를 위한 BRT 모델에서 4.5배, 다른 5개 모델에서 1~3배 더 많은 성능을 제공합니다.

    H100이 BRT 모델에서 뛰어난 성능을 발휘한 주된 이유는 Transformer Engine 덕분입니다.

    Biren BR104만이 오프라인 시나리오에서 ResNet50 및 BRT-Large 모델에서 NVIDIA A100에 비해 두 배 이상의 성능 향상을 보였으며, 다른 제출 제품은 A100을 능가하지 못했습니다.
    데이터 센터 및 에지 컴퓨팅 시나리오에서 A100 GPU는 NVIDIA AI 소프트웨어의 지속적인 개선으로 인해 2020년 7월 MLPerf에 처음 등장한 것에 비해 6배 향상된 성능으로 테스트 결과를 유지했습니다. AI 공통성을 추구, 모든 AI 모델을 커버하는 테스트 결과

    사용자는 일반적으로 사용자의 음성 요청을 이해하고, 이미지를 분류하고, 권장 사항을 제시하고, 음성으로 응답해야 하는 AI 응용 프로그램과 같이 다양한 유형의 신경망을 사용하여 함께 작업해야 하므로 각 단계에는 서로 다른 AI 모델이 필요합니다. <img src="https://img2.quasarzone.com/editor/2022/09/10/8b77efe142acbc58f06fedef5eadce96.png" alt="퀘이사존" style="width: 100%;">     따라서 MLPerf 벤치마크는 컴퓨터 비전, 자연어 처리, 추천 시스템 및 음성 인식과 같은 인기 있는 AI 워크로드 및 시나리오를 다루어 사용자가 안정적이고 유연한 성능을 배포할 수 있도록 합니다. 즉, 제출된 테스트 점수가 더 많은 모델을 커버할수록 더 나은 결과를 얻을 수 있으며 AI 기능이 더 보편적입니다.
    이번 테스트에서 NVIDIAAI는 데이터 센터 및 에지 컴퓨팅에서 모든 MLPerf 추론 워크로드 및 시나리오를 실행할 수 있는 유일한 플랫폼으로 남았습니다. 데이터 센터에서 A100과 H100은 모두 6개의 모델 테스트 결과를 제출했습니다.
     에지 컴퓨팅에서 NVIDIA Orin은 모든 MLPerf 벤치마크를 실행했으며 모든 저전력 시스템 수준 칩 중에서 가장 많은 테스트를 이겼습니다. <img src="https://img2.quasarzone.com/editor/2022/09/10/77e950a1621b8e5537d6ddec6a354814.png" alt="퀘이사존" style="width: 100%;">     Orin은 NVIDIA Ampere 아키텍처 GPU 및 Arm CPU 코어를 하나의 칩에 통합하여 로봇 공학, 자율 기계, 의료 기계 및 기타 형태의 에지 임베디드 컴퓨팅에 사용됩니다.

    현재 Orin은 NVIDIA Jetson AGX Orin 개발자 키트뿐만 아니라 로봇 및 자율 시스템 생성 모델 테스트에 사용되어 자율 주행 자동차 플랫폼, 의료 기기 플랫폼 및 로봇 플랫폼을 포함한 전체 NVIDIA AI 소프트웨어 스택을 지원합니다.

    오린의 에너지 효율은 지난 4월 MLPerf에서의 데뷔에 비해 50% 향상되었으며, 이전 세대 Jetson AGX Xavier 모듈보다 각각 5배, 2배 빠른 속도와 평균 에너지 효율을 제공합니다.

    범용을 추구하는 NVIDIA AI는 업계의 광범위한 기계 학습 에코시스템에 의해 지원되고 있습니다. 이 벤치마크 라운드에서 70개 이상의 커밋이 NVIDIA 플랫폼에서 실행되었습니다. 예를 들어 Microsoft Azure는 클라우드 서비스에서 NVIDIA AI를 실행한 결과를 제출했습니다. </td></tr></tbody></table></div>

QM벤치

행성: QM

포인트: 170,164 exp

작성물 댓글

모든회원 자기소개 펼치기

댓글: 18개

하드웨어 뉴스 - 최신 IT/하드웨어 정보를 만나보세요

공지 뉴스게시판 특별 규정(23.09.07)

퀘이사존

20.5k

11-08

전체 CPU/MB/RAM 그래픽카드 케이스 쿨링솔루션 저장장치 파워 키보드/마우스 음향기기 디스플레이 네트워크 소프트웨어 노트북 업계동향 기타/주변기기

추천	제목
0	Scythe, Wonder Tornado 120 ARGB 2500 RPM 팬 출시 1 쿨링솔루션 QM제크 198 12:49
0	BIOSTAR, 새로운 산업용 애플리케이션 시스템 출시 업계동향 QM제크 190 12:45
1	스카이로켓, 이야기를 만들어 읽어주는 AI 곰 '포' 8월 출시 기타/주변기기 QM브로리 164 12:28
1	메타, 2031년 퀘스트 VR에 대한 흥미로운 비전 제시 1 업계동향 QM브로리 330 12:27
0	글로벌 수동부품 대기업, 대만 공급망에 이익이 되는 가격 20% 인상 2 업계동향 신지™ 164 12:24
0	삼성 HBM3e, 엔비디아 인증 획득설, 3분기 DDR5 가격 상승세 견인 CPU/MB/RAM 신지™ 551 12:23
9	짐 켈러, 엔비디아가 끌어올린 AI 칩 가격을 낮추고자 한다 12 업계동향 QM포시포시 1.3k 12:04
3	프랑스 경쟁 당국, NVIDIA 조사 확인...성과 있으면 기소될 것 6 업계동향 QM포시포시 408 11:50
0	R2R DAC를 탑재한 FiiO 최초의 데스크탑 헤드폰 앰프 K11 R2R 출시 2 음향기기 심심해❤️ 517 10:56
1	삼성 타이젠 OS, 유럽 명품 LOEWE TV에 탑재 2 소프트웨어 빌보 352 10:46
0	Zidoo, 4개의 새로운 8k 미디어 플레이어 출시: 가격, 사양 및 상세정보 기타/주변기기 심심해❤️ 165 10:34
3	SFF 케이스 3D 프린팅 모델, 제작자 무료 배포 3 쿨링솔루션 QM브로리 580 10:32
0	Omdia: 9인치 이상 OLED 출하량 2024년 124% 급증 업계동향 QM이라 141 10:26
0	삼성전자, 업계 최고 속도 LPDDR5X 동작 검증 완료 CPU/MB/RAM QM포시포시 477 10:16
3	Trak Racer, 베이스 셰이커 키트 출시 3 기타/주변기기 QM건빵 212 10:11
3	AMD, Ryzen AI 300 시리즈 노트북 칩으로 차세대 AI PC 강화 3 CPU/MB/RAM QM건빵 360 09:56
3	미국 상원, 윤리적 AI 개발을 위한 법적 틀을 마련하기 위한 획기적인 법안 제출 4 업계동향 QM달려 205 09:21
1	AMD, Zen 5 아키텍처 심층 분석 - Ryzen 9000 및 AI 300 벤치마크, RDNA 3.5 등 CPU/MB/RAM QM달려 1.1k 08:58
3	삼성의 The Serif 2024 TV가 정원이나 테라스에 완벽한 새로운 색상으로 출시됩니다 3 디스플레이 심심해❤️ 220 08:48
3	NVIDIA, 향후 10년 동안 50조 달러 가치를 가질 수 있으며 Tesla 및 Amazon 투자자 초기 추정 5 업계동향 QM달려 423 08:38
0	Cervoz, 새로운 2.5GbE M.2 2230(A+E) 이더넷 카드 출시 네트워크 QM달려 194 08:34
2	ASUS, Core Ultra 프로세서와 RTX 4070 및 RTX 4060을 탑재한 NUC 14 Performance 발표 2 기타/주변기기 QM달려 414 08:33
4	AOC의 AGON, 경쟁 게임을 위한 두 가지 새로운 모니터 출시 3 디스플레이 QM달려 184 08:31
2	버클을 매세요! 에이팩서, 램 스틱용 안전벨트 출시 5 CPU/MB/RAM 블랙웰 485 06:59
0	메테오 레이크 기반 미니 PC 출시 4 기타/주변기기 블랙웰 770 06:57
3	WD, 게이밍 라인업에 대용량 8TB NVMe SSD를 조용히 추가 6 저장장치 블랙웰 805 06:54
21	AMD, Ryzen 7 9700X는 게임에서 Ryzen 7 7800X3D보다 2% 더 빠르다 32 CPU/MB/RAM Wormhole 3.6k 01:09
17	[루머] 인텔 15세대 애로우 레이크 데스크탑 CPU 구성 유출 35 CPU/MB/RAM Wormhole 3.4k 00:10
0	"AI 위협 큰 일자리 341만명···SW·로봇과 양상 달라" 2 업계동향 블랙웰 437 00:01
7	"엔비디아, 10년 내 시총 50조 달러 가능" …근거는? 13 업계동향 블랙웰 783 00:01