안녕하세요. QM벤치입니다.
2020년 9월 2일 새벽 1시(한국시간 기준), 엔비디아는 지포스 스페셜 이벤트 얼티밋 카운트다운 공식 행사에서 지포스 30 시리즈 3종(RTX 3090/RTX 3080/RTX 3070)을 발표했습니다. 지포스 30 시리즈는 지포스 20 시리즈를 잇는 차세대 그래픽카드로 암페어(Ampere) 아키텍처 기반 GPU에 더욱 향상된 RTX(레이트레이싱/DLSS 등) 기능과 성능 그리고 진보된 설계를 갖췄습니다. 특히나 기존의 루머를 완전히 뒤엎는 정보들도 존재하여 많은 이들을 놀라게 했습니다.
▲ 엔비디아 지포스 RTX 3080 공식 소개 영상
다 필요 없고 얼마인지 궁금하시다고요? 네, RTX 3090의 MSRP는 $1,499, RTX 3080은 $699, 마지막으로 RTX 3070은 $499입니다. 바로 이전 세대인 튜링(Turing) 아키텍처 기반 지포스 20 시리즈와 비교하면, RTX 3090의 경우 RTX 2080 Ti 대비 $200 상승했고, RTX 3080과 3070은 $100 하락한 가격입니다.(Founders Edition 가격 기준) 다만 RTX 3090의 경우 네이밍 정책이 변경되었고 상대적으로 매우 큰 용량의 VRAM을 갖춰, 기존의 RTX 2080 Ti보다는 상대적 지위가 기존 TITAN 시리즈 스펙에 근접했다는 차이는 있습니다.
RTX 3090 24GB 공식 MSRP: $1,499
RTX 3080 10GB 공식 MSRP: $699
RTX 3070 8GB 공식 MSRP: $499
실제로 RTX 2080 Ti는 풀칩 TU102 GPU를 탑재한 TITAN RTX에 비해 5.6% 유닛이 삭제됐고(4,608 CUDA -> 4,352 CUDA), 메모리 인터페이스도 384-bit에서 352-bit로 축소되었으며 VRAM도 11GB에 머무릅니다. 이에 반해 RTX 3090은 풀칩 GPU 대비(블록 다이어그램이 공개되지 않아 오피셜 정보가 아닌 이론적 계산에 근거) 고작 2.4% 유닛이 날아갔으며(10,752 CUDA -> 10,496 CUDA), 심지어 메모리 인터페이스는 온전히 384-bit를 유지한 채 24GB의 대용량 VRAM을 갖췄습니다. 즉 GPU 유닛 구성 측면에서 이전 세대의 GTX 1080 Ti/RTX 2080 Ti와 비교하면 상대적 지위가 상승한 것이죠.(물론, 더 과거로 가면 반대로 80 Ti 모델에 메모리 인터페이스 유지 + 풀칩 GPU가 적용되었던 사례도 존재) 따라서 엔비디아는 과감하게 80 Ti 네이밍 대신 듀얼 GPU가 사용하던 90 네이밍을 부활시켜 적용한 것으로 판단합니다.
TSMC 7nm가 아닌 삼성전자의 8nm 커스텀 공정 사용
이번 발표에서 또다른 의미로 놀라웠던 건, 바로 지포스 30 시리즈에 탑재되는 암페어 GPU 제조공정이었습니다. TSMC 7nm 공정이 아닌 삼성의 8nm 공정으로 밝혀졌기 때문인데요. 게다가 그동안의 삼성은 비메모리 반도체 분야에서 하이엔드 그래픽카드에나 쓰이는 빅뷰티 GPU를 생산한 전례가 없었기에 더 놀랍습니다. 물론 지속적으로 엔비디아 빅칩 GPU를 수주했다는 정황, 포착 등의 기사는 존재했지만 반신반의하는 분위기가 분명 존재했던 상황에서 결국 사실로 밝혀진 것이죠. 엔비디아 공식 이미지에서도 삼성의 8nm 공정에 기반한다는 내용이 분명하게 명시되어 있습니다.
루머로 흘러나온 스펙은 진짜였을까?-> 아니, CUDA 코어 2배란다
▲ 지포스 RTX 30 시리즈 공식 스펙
▲ 지포스 RTX 20 시리즈 공식 스펙
가장 최신 루머에서 RTX 3090의 CUDA 코어는 5,248개, RTX 3080은 4,352개, RTX 3070은 2,944개였습니다. 그리고 결과는 어땠을까요? 실제로는 루머로 알려진 CUDA 코어의 정확히 2배에 해당하는 숫자였습니다. RTX 3090은 무려 1만 개가 넘는 CUDA 코어인 것이죠. 사실 따져보면 반은 맞고 반은 틀린 것인데, 기존의 A100 GPU의 GPC 구성 및 SM 구조를 염두에 두고 생각해보면 해당 루머는 틀리지 않았다고 볼 수 있습니다. 하지만 엔비디아는 지포스 30 시리즈에서 작동하는 암페어 GPU 아키텍처 운용을 기존 아키텍처와 다른 방식을 차용함으로써 완전히 다른 숫자를 가지게 되었습니다.
※ 기존에 등록한 SM 아키텍처 예시 이미지는 정보 제공에 혼동을 유발할 수 있어 삭제하였습니다.(09.03 오후 9시)
그리고 기존 지포스 20 시리즈와의 차이점이라면, RTX 2080의 경우 TU102 GPU보다 크기가 작은 TU104 GPU 컷칩을 탑재하고 메모리 인터페이스도 256-bit에 머물렀으나, RTX 3080은 스펙상 RTX 3090과 동일한 GPU 기반의 컷칩 버전으로 예상된다는 것입니다. 메모리 인터페이스 역시 256-bit가 아닌 320-bit로 작동하여 기존 지포스 9 시리즈/10 시리즈/20 시리즈의 80 모델 대비 강력한 스펙을 보여줍니다. 바꿔 말하면 RTX 3090 vs. RTX 3080의 성능 차이가 기존의 80 Ti vs. 80 대비 작을 수 있다는 뜻도 됩니다. 이 부분은 성능 엠바고 해제 시점에 정확한 테스트를 통해 검증해 보도록 하겠습니다.
RTX 3070이 RTX 2080 Ti보다 빠르다고?
많은 분들이 가격만큼이나 궁금해했을 게임 성능 부문입니다. 최근 RTX 3070이 RTX 2080 Ti와 동급 성능이라는 루머 뉴스가 등록된 바 있는데요. 과연 사실일까요? 아직까지는 모릅니다. 모든 것은 성능 공개 엠바고가 해제되어야 정확해지기 때문이죠. 하지만 적어도 엔비디아 공식 자료에서는 RTX 3070이 무려 RTX 2080 Ti보다 빠르다고 합니다. 놀라운 말이죠. 물론, 이것이 소위 '깡성능'을 말하는 것인지 아니면 일부 조건에서의 성능을 말하는 것인지는 알 수 없습니다. 하지만 파스칼에서 튜링으로 넘어갔을 때보다 전반적인 성능 향상이 확실히 높을 것이라는 기대감은 충분히 가져볼만합니다.
그리고 RTX 3080은 RTX 2080 대비 최대(Up to로 표기됨) 2배의 성능을 보여준다는 내용도 있습니다만, 정말 놀라운 소식입니다. 따라서 이 모든 걸 종합해보면, RTX 3080은 RTX 2080 Ti 대비 결코 무시할 수 없는 차이로 뛰어난 게임 성능을 보여줄 것입니다. 하물며 RTX 3090이라면? 최근 루머에 등장했던 RTX 2080 Ti 대비 50% 성능 향상이 허황되게 느껴지지 않는군요. RTX 3090은 분명 압도적인 성능으로 진정한 게임의 왕이 될 것입니다.
PCB와 쿨러는 어떻게 생겼나?
지포스 30 시리즈의 파운더스 에디션 쿨러는 기존 세대와 완전히 다른 외형과 특징을 가지고 있습니다. 특히 RTX 3090은 어마어마한 크기를 자랑하죠. 정확한 길이는 측정해봐야 알겠지만, 길이도 길어졌으며 3 슬롯을 차지하기 때문에 덩치도 커졌습니다. 또한, 쿨링 효율을 높이기 위해 독특한 형태의 짧은 PCB로 설계하였으며, 히트파이프 4개와 비대칭 쿨링팬 구조를 가졌습니다. 따라서 브래킷에 가까운 쪽의 쿨링팬은 흡기, 먼 쪽은 배기로 구성되어 공기역학적 설계를 충실히 따르고 있습니다. 물론 이러한 쿨러는 엔비디아 파운더스 에디션에 국한된 것으로, 파트너사에서 출시하는 제품들은 각자 고유의 설계와 외형을 갖춘 쿨링팬이 탑재될 것입니다.
소비전력은? TGP와 12핀?
RTX 3090은 350W, RTX 3080은 320W입니다. 그동안 최상급 싱글 GPU 기반 그래픽카드의 TDP가 250W 수준이었던 것과 비교하여 매우 큰 폭으로 상승하였습니다. 하지만 여기서 분명히 짚고 넘어가야 할 것이 있습니다. 바로 기준을 삼고 있는 용어 개념 자체가 다르다는 것이죠. 엔비디아는 매우 오랜 시간 동안 사용되던 TDP(Thermal Design Power, 열설계전력) 개념 대신 이제 TGP를 사용합니다. TDP의 경우 GPU에 국한된 열 설계 관점의 개념 단위이기 때문에 전체 소비전력은 TDP 대비 괴리감이 존재합니다. 따라서 엔비디아는 지포스 20 시리즈 세대부터 TGP(Total Graphics Power) 개념을 조금씩 사용하기 시작했고요. 이에 비춰 본다면 표면상으로는 250W에서 350W로 100W 상승했지만, 실제 소비전력 차이는 이보다 작을 것입니다.
그리고 루머를 통해 드러난 바와 같이, 지포스 30 시리즈 파운더스 에디션은 12핀 규격의 보조 전원 단자를 사용합니다. 독자적으로 수집한 정보에 따르면, 마이크로핏 3.0(Micro-Fit 3.0) 12핀 단자는 12개의 핀 중 12V 라인이 6개 핀으로 구성되어 기존의 8+8핀(12V 라인은 3+3)을 대체합니다. 또한, 12핀 규격 단자는 이론적으로 12V 핀 하나당 9A(이론적 스펙에 근거)를 버틸 수 있기 때문에 이를 전력에 대입하면 최대 648W에 이르는 전력을 감당할 수 있습니다. 물론, 이는 이론적인 최대치일 뿐 실제로는 다양한 컴포넌트 구성 요소에 제한을 받습니다.(커넥터, 전선 케이블 AWG 규격에 의한 허용 전류 등)입니다. 물리적인 크기 역시 8핀 보조 전원 단자와 커넥터 폭은 비슷하지만, 더 얇고 짧다는 것이 장점입니다.
RTX는 더 좋아졌나? 새로운 기능은?
지포스 30 시리즈의 암페어 아키텍처 GPU는 튜링 GPU에 비해 진보된 기능성과 기술들을 갖췄습니다. 특히 2배로 향상된 셰이딩 유닛과 2세대 RT 코어 및 3세대 텐서 코어를 통해 개선된 RTX 기능성 및 성능을 기대할 수 있습니다. 또한, 마이크로소프트의 다이렉트스토리지 API도 지원합니다. 특히 다이렉트스토리지는 고성능 SSD를 사용함에 있어 엄청나게 부하가 높은 IO 요청 처리 프로세스를 획기적으로 줄일 수 있습니다. 이로 인해 CPU 스레드 부하를 최소화하고(병목 현상을 줄이고) IO 성능을 최적화시킬 수 있습니다. 엔비디아는 이를 RTX IO라는 이름을 지어주었습니다.
실제로 해당 기술은 마이크로소프트의 차세대 콘솔, 엑스박스 시리즈 엑스(Xbox Series X)의 벨로시티(Velocity) 아키텍처를 통해 소개된 기술입니다. 그리고 차세대 지포스 그래픽카드가 RTX IO라는 이름으로 지원하게 된 것이고요. 응용 프로그램 역시 다이렉트스토리지 API를 최대한 활용할 수 있도록 지원이 되어야겠으나, 기존의 IO 요청 프로세스는 매우 느린 HDD 기반 저장장치에 기준을 두었기 때문에 반드시 개선되어야 할 영역이었습니다. 드디어 한 발짝 나아간 것으로 해석합니다.
HDMI 2.1 그리고 PCIe 4.0 지원
시스템 셋업 차원에서 HDMI 연결이 필수인 분들도 계실 겁니다. 그러나 기존의 그래픽카드는 HDMI 2.0에 머물러 지원 대역폭의 한계로 4K/HDR/60Hz 이상의 환경에서는 최상의 결과를 보여주지 못했습니다. 하지만 지포스 30 시리즈는 HDMI 2.1을 지원하기 때문에 이러한 제약에서 벗어날 수 있습니다.
PCIe 인터페이스는 이제 4.0을 지원합니다. 사실 AMD가 나비(Navi) 그래픽카드를 통해 먼저 지원하기 시작했죠. 하지만 아직까지는 PCIe 3.0의 대역폭이 성능 발휘에 있어 큰 변수가 아니기 때문에 실질적인 효능감은 작습니다. 이는 엔비디아의 지포스 30 시리즈에 대입해도 마찬가지일 것으로 예상되나, 적어도 라데온 RX 5700 XT에 비하면 절대적 성능이 매우 높을 것이기에 PCIe 버전에 따른 성능 차이 역시 좀 더 커질 것으로 전망합니다.
단, PCIe 4.0은 현재 인텔 플랫폼에서는 지원하지 않으며 AMD X570/B550 플랫폼에서 지원합니다. 그러나 상급 CPU끼리 비교했을 때, 전반적인 3D 게임 성능은 PCIe 3.0이라 하더라도 인텔 플랫폼이 더 뛰어납니다. 따라서 이런 의문이 자연스럽게 생길 수 있습니다. 인텔 CPU + PCIe 3.0 vs. AMD CPU + PCIe 4.0 환경에서의 RTX 3090 성능은 누가 더 좋을까? 무척 궁금한 질문인데요. 이 역시 차후 벤치마크에서 다뤄보도록 하겠습니다.
그래서 출시는 언제?
엔비디아는 젠슨황 CEO를 통해 지포스 RTX 3080을 9월 17일에 출시한다고 못 박았습니다. 그 뒤를 이어 9월 24일에는 RTX 3090을 출시합니다. RTX 3070은 10월로 명시했을 뿐 구체적인 일정은 정해지지 않았고요. 어쨌든 곧 우리에게 새로운 지포스 그래픽카드가 찾아온다는 뜻입니다. 그리고 퀘이사존 역시 한동안 더 바쁜 날들을 보내게 될 것입니다. 지포스 30 시리즈의 진정한 성능과 실체를 궁금해하실 여러분을 위해 말이죠.
이상, QM벤치였습니다.
※ 이하 이미지는 엔비디아가 공개한 공식 지포스 30 시리즈 이미지 모음입니다