퀘이사존 지포스 RTX 3070 Ti 20종 게임 벤치마크

GA104 풀칩 GPU와 GDDR6X 메모리 탑재로 RTX 3070 강화!!

퀘이사존 QM벤치
96 16228 2021.06.09 21:35


퀘이사존



퀘이사존 지포스 RTX 3070 Ti 20종 게임 벤치마크

RTX 3070 최종 강화판 등장


    엔비디아 지포스 게이밍 제품 부문 수석 부사장, 제프 피셔Jeff Fisher는 컴퓨텍스 2021 기조연설에서 지포스 그래픽카드 신모델 2종을 발표했습니다. 첫 번째는 6월 2일 성능 엠바고Embargo가 해제된 RTX 3080 Ti, 두 번째는 오늘 여러분께 소개할 RTX 3070 Ti입니다. 사실 RTX 3080 Ti는 이전 세대 지포스 그래픽카드 가격 정책을 고려하면 크게 매력적인 녀석은 아닙니다. RTX 3080 대비 약 10~12% 우수한 성능으로 RTX 3090과 다를 바 없는 성능을 제공해주고, 가격은 RTX 3090보다 $200 저렴하다는 것은 분명 장점이지만, 문제는 바로 아래 모델인 RTX 3080 가격이 $699에 불과하여 가성비로 접근하면 애매하게 느껴지기 때문이죠.

    하지만 비정상적인 그래픽카드 시장 상황을 고려하면 얘기가 달라집니다. 엔비디아가 예고한 대로 RTX 3080 Ti은 암호화폐 채굴 성능(이더리움, Ethereum)이 제한되어 있었으며, 여기에 더해 앞으로 나올 제품은 물론, 기존에 출시된 그래픽카드 역시 LHR(Lite Hash Rate) 버전으로 출시할 것이라는 내용을 발표했기 때문입니다. 즉 RTX 3080 Ti를 기점으로 지나치게 과열됐던 그래픽카드 시세를 조금은 안정적으로 바꾸는 데 일조하고 있습니다. 이런 상황에서는 과거와 동일한 잣대로 단순 MSRP와 절대 성능 그 자체로 평가하기엔 무리가 있습니다. 실질적인 시장 상황이 어떻게 흘러갈지 정확한 예측이 힘들기 때문이죠. 긍정적인 건 이렇게 채굴 성능이 제한된 그래픽카드 종류가 많아지고 또 시장에 적극적으로 투입될수록, 이전 대비 안정화된 시장 상황을 기대할 수 있다는 건 분명합니다. 이런 관점에서 새롭게 등장한 지포스 30 시리즈 Ti 제품군은 게이머들에게 숨결을 불어넣을 수 있는 역할을 수행하는 것이 지상 과제일 것입니다.


퀘이사존

▲ 세상에 존재를 드러낸 RTX 3070 Ti FE, RTX 2070 SUPER 대비 1.5배 성능을 가졌다고 주장, $599 가격에 6월 10일부터 판매


RTX 3070과 비교 시 차별성 – GA104 풀칩 그리고 GDDR6X 메모리 탑재

    그렇다면 RTX 3070 Ti는 RTX 3070이랑 무엇이 다를까요? 먼저 그래픽카드 성능의 핵심인 GPU는 RTX 3070과 동일한 GA104 GPU입니다. 그러나 GPU 내부로 들어가면 분명한 차이가 있습니다. RTX 3070이 일부 유닛이 비활성화된 GA104 컷칩 GPU를 탑재했던 것에 반해, RTX 3070 Ti는 모든 유닛이 활성화된 GA104 풀칩 GPU를 탑재하고 있기 때문이죠. 따라서 실장된 CUDA 코어는 6,144개로 RTX 3070의 5,888개 대비 256개 더 많은 연산 코어를 가지고 있습니다. 물론 256개라는 코어는 백분율로 환산하면 고작 4.3% 더 많은 것이기 때문에, GA104 풀칩이라는 구성만으로 차별화된 성능을 기대하기란 어렵습니다. 결국 의미있는 변화를 꼽는다면 메모리 구성으로 보아야할 것입니다. RTX 3070은 14 Gbps 속도의 GDDR6 메모리를 탑재했지만, RTX 3070 Ti는 GDDR6X 메모리를 탑재하여 무려 19 Gbps 속도로 작동합니다. 결국 메모리 대역폭에서 약 36% 더 좋은 구성(608.0 GB/s vs. 448.0 GB/s)을 확보하였습니다.


퀘이사존

▲ RTX 3070 Ti FE 전면 디자인(RTX 3070 FE와 RTX 3080 FE 디자인을 혼합한 콘셉트)

메모리 대역폭이 높으면 뭐가 좋나?

    이렇게 빠른 속도의 GDDR6X 메모리를 탑재함으로써 자연스럽게 개선되는 메모리 대역폭은 실제 3D 성능에서 분명한 이점으로 작용합니다. 근본적인 렌더링 연산 성능 자체는 GPU가 결정하지만, 메모리 데이터 전송 속도가 느리다면, 결과적으로 최종 성능이라 할 수 있는 FPS 수치가 낮아지기 때문이죠. 대표적인 예로 GDDR6 메모리를 탑재한 RTX 3070은 일반적으로 RTX 2080 Ti와 동급 또는 소폭 높은 성능을 제공하지만, 메모리 인터페이스가 256-bit에 작동 속도는 14 Gbps로 최종 메모리 대역폭은 고작 448 GB/s에 그칩니다. 반면 RTX 2080 Ti은 메모리 작동 속도가 GDDR6 14 Gbps로 동일하지만, 메모리 인터페이스가 352-bit로 훨씬 높기 때문에 메모리 대역폭 역시 616 GB/s 수치를 가지게 되어, 고해상도 환경에서 RTX 3070과의 성능 격차를 줄이거나 또는 역전하는 상황을 연출하기도 합니다. 결국 성능을 보는 관점에 따라 RTX 3070은 GPU 성능 대비 메모리 대역폭이 아쉽다고 평가될 수 있는 부분입니다.


퀘이사존

▲ RTX 3070 Ti FE 후면 디자인(쿨링 방식은 RTX 3090 FE & RTX 3080 FE와 동일)


아키텍처 관점에서 보다 단단한 완성도를 가진 RTX 3070 Ti

    이런 관점에서 보면 RTX 3070 Ti는 GPU 연산 능력과 메모리 구성에서 밸런스가 매우 좋아졌습니다. GPU는 온전한 GA104 풀칩이고, 메모리 인터페이스는 256-bit로 동일하지만 GDDR6X 메모리로 작동 속도를 19 Gbps까지 끌어올려 608 GB/s 메모리 대역폭을 확보했기 때문입니다. 사실상 RTX 2080 Ti와 동일한 수준이죠. 이 정도면 QHD->4K로 넘어가는 고해상도 환경에서 RTX 2080 Ti와 동일한 수준의 성능 하락 또는 더 작은 성능 하락을 기대할 수 있습니다. 더군다나 암페어Ampere 아키텍처 고유의 메모리 운용 능력까지 고려하면, 여러모로 완전해진 형태입니다.

채굴 성능은? 제한되어 있는 거 맞아?

    그러나 앞서 말씀드린 내용들은 어디까지나 마니아 영역에서의 감성적/기술적 완성도에 대한 내용이고, 결국 소비자에게 중요한 건 ‘그래서 성능이 얼마나 더 좋은데?’로 귀결될 것입니다. 사실 이게 가장 중요한 것도 맞습니다. 이에 대한 내용은 퀘이사존이 20종 게임 대규모 벤치마크로 평균 성능을 계산했으니, 글 말미에서 확인해 주시기 바랍니다. 또한 단순 스펙 외에도 차별화되는 요소는 바로 이더리움 채굴 성능 제한입니다. 퀘이사존 RTX 3080 Ti 벤치마크에서도 확인한 내용이지만, RTX 3070 Ti 역시 채굴 성능이 대폭 제한되어 채굴 머신으로써의 매력을 강제로 하락시켜놓았습니다. 얼마나 큰 효과를 거둘 수 있을지는 알 수 없으나, 어쨌든 시장 안정화와 용도에 따른 제품 정체성 확립에는 의미가 있습니다.




퀘이사존

퀘이사존

▲ RTX 3070 Ti 및 주요 그래픽카드 상세 스펙


    RTX 3070 Ti 상세 스펙입니다. 과거 지포스 20 시리즈와 달리 지포스 30 시리즈는 파운더스 에디션(Founders Edition, 이하 FE)과 레퍼런스 제품 간 표면적인 스펙 차이는 없습니다.(바꿔 말해 지포스 20 시리즈는 레퍼런스 클록과 FE 클록을 따로 설정하는 등 다소 혼란스러운 정책 존재) 여기서 굳이 표면적이라고 얘기한 까닭이 있는데요. FE 버전은 비레퍼런스 대비 표기 부스트 클록 대비 실제 부스트 클록(게임 구동 시 실제 적용 클록)이 굉장히 높은 경향을 가지고 있기 때문입니다. 이런 특징 때문에 아예 최고급형 모델이 아닌 이상, 일부 제조사 모델의 경우 스펙상 FE 대비 높은 부스트 클록을 가지고 있어도, 실제 3D 게임 구동 시 FE 대비 낮은 부스트 클록으로 작동하는 경우가 비일비재합니다.


퀘이사존

▲ RTX 3070 | GA104-300-A1 블록 다이어그램 예상도(비활성화를 뜻하는 적색 영역은 임의지정)


퀘이사존

▲ RTX 3070 Ti | GA104-400-A1 블록 다이어그램(모든 유닛이 활성화된 풀칩 구성)


GA104 풀칩이로구나... 편-안

    다시 본론으로 돌아와 스펙을 보겠습니다. 앞서 말씀드렸듯이 풀칩 GA104 GPU를 탑재하여 완전해진 GPU를 자랑합니다. RTX 3070은 GA104 컷칩 구성으로 TPC 1개(=2 SM=256 CUDA)가 비활성화된 바 있죠. 사실 풀칩 자체가 특별한 성능적 이점을 가져다주는 것은 아니지만(컷칩이든 풀칩이든 실제 성능은 CUDA 코어수에 비례), 눈에 보이는 것 뿐만 아니라 하드웨어/아키텍처 관점의 감성에도 관심 있는 분들에게는 매력적인 요소로 어필할 수 있습니다. 여기에 더해 부스트 클록을 소폭 끌어올리고, GDDR6X 메모리를 탑재하여 메모리 대역폭을 35.7% 끌어올렸습니다.

큰 폭으로 높아진 TGP는 단점

    그러나 모든 것이 좋아진 건 아닙니다. TGP(Total Graphics Power) 220W에 보조 전원 단자가 8핀 1개로 작동했던 RTX 3070과 달리, TGP 290W에 8핀 2개 구성으로 소비전력이 크게 높아졌습니다. 소비전력만 보면 RTX 3070이 아닌 RTX 3080에 가까워진 것이죠. 이것이 큰 단점으로 다가오는 이유가 있습니다. 스펙 구성 한계로 인해 정작 성능은 RTX 3080이 아닌 RTX 3070에 가까울 확률이 매우 높기 때문이죠. MSRP는 두 그래픽카드 사이에서 정중앙에 위치하는 $599로 발표하였습니다.




퀘이사존

퀘이사존

▲ 퀘이사존 지포스 RTX 3070 Ti 벤치마크 시스템 사양


    퀘이사존 그래픽카드 벤치마크 시스템은 빅나비 RX 6800 시리즈 출시를 기점으로 AMD 라이젠 플랫폼을 사용합니다. 라이젠 5000 시리즈 프로세서 출시로 인해, 최강 게이밍 플랫폼은 이제 인텔이 아닌 AMD가 되었기 때문입니다. 그래픽카드 드라이버는 RTX 3070 Ti 리뷰어 대상으로 배포된 NVIDIA GeForce Game Ready Driver 466.61 버전을 사용하였습니다.(대조군은 RTX 3080 Ti 벤치마크 당시 사용했던 466.54 버전 데이터 유지) 그 외 마더보드 UEFI 및 시스템 드라이버 모두 최신 빌드 버전을 사용하였습니다.

    또한, Resizable BAR(AMD: SAM) 활성화가 가능한 그래픽카드는 모두 활성화된 상태로 테스트를 진행하였습니다. 최초에는 라라랜드 플랫폼이라 불리며 라이젠 CPU+라데온 그래픽카드만 가능했으나, 현재는 지포스 30 시리즈도 해당 기능을 사용할 수 있습니다.




퀘이사존


▲ 대원 CTS 제공: AMD 라이젠 7 5800X(8C/16T) ※ 벤치마크(링크)


    CPU는 AMD 라이젠 7 5800X로 선정하였습니다. 높은 게이밍 성능을 보장하는 것은 물론, 라이젠 5000 시리즈 중에서도 상급 게이밍 성능을 가지고 있습니다. 참고로 라이젠 5000 시리즈는 부스트 클록 알고리즘 개선과 함께 실제 게이밍 구동 시 적용되는 클록이 상당히 높아져, 게이밍 성능 향상 목적으로는 오버클록 효용성이 극히 낮습니다. 그러나 벤치마크에서는 유동적으로 변하는 CPU 클록 주파수 변인을 최소화하기 위해 올코어 4.7 GHz OC 설정으로 고정하여 테스트를 진행했습니다.



▲ 대원 CTS 제공: ASUS TUF Gaming X570 PRO (Wi-Fi)


    X570 칩세트 기반, ASUS TUF Gaming X570 PRO (Wi-Fi) 모델입니다. 3800 MHz 메모리 오버클록 및 IF 1:1 동기화도 문제가 없었으며, 전원부 온도 또한 나쁘지 않은 녀석입니다. 특히 AMD가 발표한 스마트 액세스 메모리(Smart Access Memory) 활성화를 위해서는 500 시리즈 마더보드가 필수이기도 하죠. 동일한 모델은 아니지만 ASUS TUF Gaming X570 PLUS (Wi-Fi) 제품은 QM센스가 칼럼을 진행하였으며, 좋은 평가를 받기도 하였습니다.(링크)



▲ 서린씨앤아이 제공: G.SKILL TRIDENT Z ROYAL DDR4-3,200 CL14 16GB x2(기사 링크)


    일명 보석 메모리로 통하는 지스킬 트라이던트 Z 로열 시리즈. 이제는 모르는 분들을 찾기 힘들 정도로 유명한 제품입니다. 최초 해당 제품이 등장했을 때는 특유의 고급스러운 디자인에 녹아든 화려한 보석 RGB LED가 충격적이기까지 했죠. QM슈아의 가장 최신 트라이던트 Z 로열 칼럼을 통해 성능과 외형의 진면목을 확인해 보실 수 있습니다. 벤치마크에 사용된 모델은 3200 MHz CL14 모델이었으나 3800 MHz CL16까지 무리 없는 설정이 가능하였습니다. 현재 라이젠 5000 시리즈는 일부 2 슬롯 기반 마더보드를 제외하면 3800 MHz(IF: 1900 MHz)가 한계치 설정으로 파악됩니다.


▲ 서린씨앤아이 제공: PATRIOT VIPER VPN100 M.2 NVMe 2TB(기사 링크)


    벤치마크 시스템은 수십 종 게임을 한꺼번에 테스트해야 하기 때문에, 고용량 SSD는 필수입니다. 특히 최신 게임은 100 GB를 넘어 200 GB를 초과하는 용량을 보이는 경우도 있고요. 그래서 준비한 SSD가 바로 PATRIOT 바이퍼 게이밍(VIPER GAMING) 저장장치, VPN100 NVMe 2TB 모델입니다. 용량도 용량이지만, 알루미늄 방열판을 기본 장착하고 있다는 점에서 발열로 인한 스로틀링 걱정을 한시름 놓게 됩니다. 또한, 해당 제품은 QM달려가 냉철한 시각으로 분석한 칼럼도 등록되었으니 참고해 주시기 바랍니다.



▲ 마이크로닉스 제공: 마이크로닉스 Classic II 850W 80PLUS GOLD 230V EU 풀모듈러(750W 기사 링크)


    최신 하이엔드 그래픽카드 소비전력은 과거 250W 수준에서 벗어나 높게는 350W 수준을 보이고 있습니다.(일부 RTX 3090 비레퍼런스 모델은 전력 제한 해제 시 약 500W 에 달함) 따라서 고용량 파워서플라이는 필수라 할 수 있겠죠. 특히 AMD가 발표한 풀칩 빅나비 GPU를 탑재한 RX 6900 XT는 파워서플라이 권장 출력을 850W로 표기하기도 했습니다. 물론 그 이하 출력을 가진 파워에서도 충분히 구동은 가능하나, 파워에 가해지는 로드율이나 그로 인한 효율과 팬소음까지 고려하면 권장 출력 이상의 파워를 사용하는 것이 쾌적합니다. 벤치마크 시스템에 사용된 마이크로닉스 클래식 II 제품은 준수한 골드 등급 효율에 팬리스 모드 온/오프 스위치 제공, 풀모듈러 구성, 우수한 전압 유동폭  등 여러모로 테스트 시스템에 적합한 요건을 갖춰 선정하였습니다.




퀘이사존

퀘이사존

▲ RTX 3070 Ti 벤치마크에 동원된 게임 목록



"퀘이사존 벤치마크는 세계 최고의 데이터 신뢰성을 지향합니다. 따라서 새로운 그래픽카드 성능을 최대한 정확하게 반영하기 위해, 최신 게임 타이틀을 테스트에 대거 투입합니다. 물론, 최신 게임 뿐만 아니라 유저들에게 인지도가 높은 게임, AAA급 게임으로서 대표성을 지니는 타이틀 등 다양한 요소를 고려해서 구성합니다."



    그래픽카드 테스트 시 최신 게임 타이틀이 중요한 이유는 출시된 지 오래된 게임들로 구성하면 최신 하드웨어의 아키텍처 이점과 성능을 제대로 반영할 수 없기 때문입니다. 그러나 반대로 최신 게임으로만 구성하면 구세대 그래픽카드와의 성능 격차가 과도해져 실사용과 괴리감이 생길 위험이 있겠죠. 따라서 최신 게임, 벤치마크로 상징성이 높은 게임, 게이머들에게 인기가 높은 게임, GPU 최적화가 좋은 게임 등 다양한 기준을 통해 20종에 달하는 게임 타이틀을 선정하였습니다.


퀘이사존

    기본적으로 3종 해상도(FHD/QHD/UHD) 조건에서 테스트를 진행하며, DLSS를 적용하지 않은 순수 레이트레이싱 게임 성능은 기술 구현에 따른 성능 변화 파악에 우선순위를 두어 QHD 해상도 한정으로 테스트를 진행하였습니다. 다만 RTX(레이트레이싱+DLSS) 성능은 QHD와 4K/UHD 해상도 2종으로 진행하였습니다.




※ 아래 내용부터는 벤치마크 테스트 결과로 이어집니다.

항목별 구체적인 테스트 결괏값은 세부 페이지에서 확인해 주세요.




퀘이사존

퀘이사존


    타임스파이 점수입니다. DX12 API 기반 벤치마크 툴로써, DX11 API 기반 파이어스트라이크 대비 최신 게임 환경에서의 그래픽카드별 성능 평가에 더 적합합니다. RTX 3070 Ti는 RTX 2080 Ti 대비 소폭 높은 점수를 기록하였습니다. 다만 실제 게임 성능은 이보다 점수가 낮은 RTX 3070과 RTX 2080 Ti가 동급이라는 점을 고려했을 때, 최소 RTX 2080 Ti 성능은 확실히 앞설 것으로 예상할 수 있습니다.




퀘이사존


    타임스파이 기본 설정 외에도 DX12 API+4K/UHD 해상도 환경을 대변하는 타임스파이 익스트림을 테스트에 포함하였습니다. 익스트림 옵션에서 RTX 3070 Ti는 RTX 2080 Ti와 성능 격차를 더 벌리는 양상을 확인할 수 있습니다. 그러나 RTX 3070 역시 타임스파이 기본 테스트와 달리 RTX 2080 Ti 성능에 매우 근접한 것으로 보아 단순 메모리 대역폭 이점 뿐만 아니라 아키텍처 특성 차이에 기인했을 가능성이 높습니다.




퀘이사존


    파이어스트라이크 점수입니다. AMD 라데온 RX 6000 시리즈가 매우 높은 점수 경향을 보이는 벤치마크 툴입니다. RTX 3070 Ti는 RTX 3080과 비교 시 큰 격차로 성능이 낮으며, RTX 3070에 가까운 모습을 보입니다. 실제 게임 성능 역시 이변 없이 RTX 3070에 가까울 것으로 예상됩니다.




퀘이사존


    마이크로소프트 API 중에 DirectX Raytracing, 줄여서 DXR API가 존재합니다. DXR은 DX12 API 확장 기능으로써 실시간 레이트레이싱 연산을 위한 윈도우 10 표준이기도 합니다. 포트로열Port Royal은 DXR API로 레이트레이싱을 구현하며, 레이트레이싱 기술이 포함된 게임 성능을 대변합니다. 그동안 AMD 라데온 그래픽카드는 레이트레이싱을 지원하지 않아 측정 자체가 불가능하였으나, RX 6000 시리즈는 RDNA 2 아키텍처를 차용함으로써 ‘DXR API에서 실시간 레이트레이싱 게이밍’이 가능합니다. 다만 포트로열은 모든 렌더링을 레이트레이싱 기법으로 처리하는 것이 아니라 전통적 방식인 래스터화(Rasterization) 기법을 함께 사용하기 때문에, '깡성능'도 무시할 수 없다는 특성이 있습니다. 따라서 레이트레이싱을 적극적으로 사용한 게임이라면 포트로열 결과 대비 지포스와 라데온 격차가 더 커질 수 있다는 한계가 있습니다. 이럴 땐 아래 DirectX Raytracing feature test 항목을 같이 참고하면 좋습니다.




퀘이사존


    다음은 순수 실시간 레이트레이싱 연산 능력 위주로 성능을 측정하는 DirectX Raytracing feature test입니다. 포트로열과 다른 점이라면, 포트로열은 레이트레이싱 옵션이 적용된 종합 게이밍 성능(Rasterization+RayTracing=Hybird)을 대변하지만, 본 테스트는 최대한 실시간 레이트레이싱 연산 자체에 집중한다는 것입니다. 따라서 아키텍처에 따라 성능 격차가 매우 선명하게 드러납니다. 결론만 말하면 RTX 3070 Ti는 RTX 3070과 크게 다를 바 없는 레이트레이싱 성능을 보여주었습니다. RTX 3070과 동일한 GA104 GPU 기반에 유닛 구성이 크게 차이나지 않다는 태생적 한계를 드러냈습니다.




퀘이사존

퀘이사존퀘이사존퀘이사존


    해당 그래프는 각 게임에서 RTX 3070 FE 성능(평균 FPS)을 100% 두었을 때, 대조군 그래픽카드 상대 성능을 계산하고 이를 20종 게임 전체로 확장하여 평균값을 도출한 그래프입니다. 레이트레이싱 적용 성능을 제외했기 때문에 속된 말로 '깡성능'입니다. 결과를 보면 RTX 3070 Ti는 FHD/QHD 해상도에서 RTX 3070 대비 약 6~9% 높은 성능을, 4K 해상도에서는 약 10% 높은 성능을 기록하였습니다. $20 차이의 경쟁 구도라 볼 수 있는 RX 6800과 비교하면, QHD 해상도에서 미세하게 낮은 성능을, 4K/UHD 해상도에서는 동급 성능을 기록하였습니다.

    메모리 대역폭 이점이 증명된 결과이기도 합니다. RTX 3070은 QHD->4K 전환 시 RTX 2080 Ti에게 성능이 점점 따라잡히는 양상이지만, RTX 3070 Ti는 성능 격차를 더욱 따돌리는 양상을 보여주었기 때문입니다. 그러나 수치적으로 그 차이가 대단한 것은 아닙니다.




퀘이사존

퀘이사존


    DLSS와 같은 업스케일링 기술을 제외한 순수 레이트레이싱 게임 성능 테스트 결과입니다. 테스트 결과에서 인상적인 부분이라면, 실시간 레이트레이싱 분야에서 지포스 그래픽카드가 단연 뛰어난 성능을 보여준다는 것입니다. 이미 널리 알려진 사실이기도 하죠. AMD는 빅나비 그래픽카드를 위시한 RDNA 2.0 아키텍처에서부터 레이트레이싱 연산에 힘을 쏟고 있긴 하나, 아직까지는 역부족입니다. 이를 방증하는 것이 RX 6800을 쫓아가던 RTX 3070 Ti는 AMD 라데온 플래그십 모델, RX 6900 XT보다도 뛰어난 성능을 발휘하였습니다.




퀘이사존

퀘이사존퀘이사존


    다음은 DLSS까지 적용한 실시간 레이트레이싱 게이밍 성능입니다. RT와 DLSS(Deep Learning Super Sampling)를 모두 활성화했기 때문에 사실상 엔비디아 전용 RTX 게임 테스트라 해도 무방합니다. DLSS는 엔비디아 전용 기술이기 때문에 라데온은 대조군에서 제외하였습니다. 4종 게임에서 QHD, 4K/UHD 해상도로 테스트를 진행하였으며, 당연하지만 해상도가 높을수록 그래픽카드별 성능 편차가 두드러집니다. 일반 게임 성능 양상과 마찬가지로 RTX 3070 Ti는 QHD 해상도에서 약 7%, 4K/UHD 해상도에서 약 9% 높은 성능을 보여주었습니다. 그 위로 존재하는 RTX 3080 성능을 바라보기엔 성능 차이가 큽니다.




퀘이사존

퀘이사존


    RTX 3070 Ti는 RTX 3080 Ti와 마찬가지로 이더리움Ethereum 채굴 성능이 제한되었습니다. 또한, 엔비디아는 기존 그래픽카드 역시 용도 구분을 위해 LHR(Lite Hash Rate) 그래픽카드로 출시할 계획을 발표하기도 했죠. 이를 검증하기 위해 퀘이사존은 피닉스마이너PhoenixMiner 최신 버전을 통해 간단하게 이더리움 채굴 성능을 확인해 보았습니다. RTX 3070 Ti는 RTX 2070 SUPER 대비 미세하게 높은 38.1 MH/s 해시 성능을 기록하였습니다. 게임 성능과는 완전히 다른 결과이며, 해시레이트가 확실히 제한되어 있다는 말합니다. 다만 실제 전문적으로 채굴 시스템을 구성하는 유저들은 별도의 전력 제한 레벨 조정과 메모리 오버클록을 통해 채산성 효율 튜닝을 가미한다는 변수가 있습니다. 그러나 이를 감안해도, RTX 3070 Ti는 태생적 소비전력이 높아 상대적인 매력은 매우 떨어집니다.




퀘이사존

퀘이사존

▲ RTX 3070 Ti FE 오버클러킹 설정(GPU-Z 화면 캡처)


    오버클록 잠재력도 확인해 보았습니다. 오프셋 클록 기준 코어: +180 MHz, 메모리 클록: +1,500 MHz까지 정상 작동을 확인하였습니다. 이때 유효(Effective) 메모리 속도는 19 Gbps에서 22 Gbps까지 상승합니다. 전력 제한 레벨은 최대 110%(전력 환산: 320W)까지 설정 가능합니다. 단 해당 수치는 FE 기준이며 비레퍼런스는 제조사/모델마다 상이하게 나타날 것입니다.


퀘이사존

▲ 오버클록 적용 시 실제 부스트 클록(좌: 기본, 우: 오버클록)


    둠 이터널(QHD/2560x1440 해상도)을 구동하여 오버클록으로 인한 부스트 클록 차이가 있는지 확인해 보았습니다. 기본 설정에서 1,890 MHz로 작동하지만, 전력 제한 레벨 해제와 함께 +180 MHz 오프셋 클록 적용 시 2,070 MHz까지 상승합니다. 정확히 180 MHz 차이입니다. 메모리 역시 11,002 MHz로 표기되지만, 유효 속도로 환산하면 22 Gbps 수준이 됩니다. 결과적으로 해당 구간에서의 성능도 225 FPS에서 241 FPS로 향상되었습니다.


퀘이사존

▲ RTX 3070 Ti FE OC 적용 시 3DMark 3종 그래픽 점수 변화


퀘이사존

▲ RTX 3070 Ti FE OC 적용 시 3종 게임 4K/UHD 성능 변화




퀘이사존

퀘이사존퀘이사존


    게임 종류별 성능 차이로 알아본 RTX 3070 Ti 성능입니다. 이 정도면 뭐 동급이라 해도 과언이 아닙니다. 게임에 따라 다른 양상이긴 하나 비교적 일관된 성능 향상을 보여줍니다. CPU 병목 현상이 두드러지는 일부 게임을 제외하면 대략 7~12% 성능 향상을 기대할 수 있습니다.




퀘이사존퀘이사존


    엔비디아는 컴퓨텍스 스페셜 키노트에서 RTX 3070 Ti가 RTX 2070 SUPER 대비 1.5배 성능을 가졌다고 주장한 바 있습니다. 테스트 결과 엔비디아 주장에 꼭 맞지는 않으나, 근접한 수치를 확인하였습니다. 일부 게임에서 1.5배 이상의 성능을 기록하기도 하나 대부분 40~50% 높은 성능을 보여주었습니다. 20종 게임 평균은 44.9% 향상입니다.




퀘이사존퀘이사존


    마지막으로 MSRP $579로 발표된 RX 6800과의 비교입니다. 제조사/아키텍처가 완전히 다르기 때문에 게임에 따른 성능 양상이 다채롭게 나타납니다. 국산 MMORPG 로스트아크는 워낙 특이 케이스이기 때문에 이를 무시하고 DX12 게임을 중점적으로 보면 RX 6800 대비 약 90~95% 수준 성능으로 판단하는 것이 합리적일 것입니다.




퀘이사존


▲ NVIDIA PCAT 설루션과 AD POWER HPM-100A(WATTMAN) 장비를 활용한 소비전력 측정(기사 링크)


퀘이사존퀘이사존


    RTX 3070 Ti FE 공식 TGP는 290W입니다. 퀘이사존이 NVIDIA PCAT로 측정한 그래픽카드 단독 소비전력을 측정한 결과에서 비슷한 결과를 확인할 수 있습니다. 하위 모델인 RTX 3070 FE보다 약 70W 더 높고, 상위 모델인 RTX 3080 FE보다는 30W 더 낮은 결과인데요. GDDR6X 메모리 탑재와 그래픽카드 크기 등 외부에서 확인할 수 있는 물리적인 특성처럼 RTX 3080 FE에 더 가까운 모습입니다.

    WATTMAN으로 측정한 시스템 전체 소비전력은 평균 441.9W, 최대 452.5W로 PCAT 결과와 마찬가지로 RTX 3080 FE에 더 가까운 성향을 보여줍니다. 실제 제조사 권장 파워서플라이 역시 RTX 3080 FE처럼 750W를 권장하고 있습니다. 참고로 WATTMAN으로 측정한 시스템 전체 소비전력은 AC 입력값으로 파워서플라이 효율을 고려하면 부품이 순수 소비하는 전력은 더 낮습니다.




퀘이사존

퀘이사존


    소비전력 항목에서도 언급했듯이 물리적인 특성이 RTX 3080 FE에 가깝다고 하였는데요. RTX 3080 FE보다 약간 작은 크기로 RTX 3070 FE보다는 훨씬 큰 방열면적을 갖췄습니다. 쿨링팬 역시 RTX 3080 FE처럼 전면 흡기(Push), 후면 배기(Pull)로 구성되었습니다. 쿨링팬 크기는 지름 85 mm로 똑같습니다. 온도는 TGP 30W 더 높은 RTX 3080 FE보다 미세하지만, 조금 더 높게 측정되었습니다. 아무래도 베이퍼체임버와 8 mm 히트파이프 4개로 구성된 RTX 3080 FE과 달리 RTX 3070 Ti FE는 일반 구리베이스에 6 mm 히트파이프 4개로 구성되다 보니, 쿨링팬과 크게 차이 나지 않는 방열면적을 갖췄음에도 쿨링 성능이 다소 떨어진 것으로 보입니다.

    참고로 RTX 3070 Ti FE 역시 제로 팬(혹은 0dB 팬, 부하가 낮으면 쿨링팬 회전이 완전히 멈추는 기능) 기능은 그대로 유지하고 있습니다. 일정 온도로 내려갈 때까지 쿨링팬이 작동했다가, 멈추기 때문에 지속적으로 쿨링팬이 작동하는 RTX 20 시리즈보다는 상대적으로 유휴 상태 온도가 높습니다.




퀘이사존

▲ 소음 측정 장비: Cirrus CR-152A 소음측정기(기사 링크)


퀘이사존


    온도 항목에서 RTX 3080 FE보다 쿨링 설루션 성능이 떨어진다고 언급하였는데요. 위 그래프에서도 확인할 수 있듯이 소음에서도 그런 부분을 확인할 수 있습니다. 전부 같은 환경에서 테스트 한 결과는 없지만, 기존 벤치마크 기사의 소음 항목을 참고하면 RTX 30 시리즈 중에서는 소음이 가장 큰 편이라고 판단할 수 있습니다. 하지만, RTX 3080 FE나 RTX 3080 Ti FE와 차이는 크지 않고, 다른 부품 소음까지 덮을 정도로 심하지는 않습니다.


※ 온도/소음 항목 참고 사항

테스트 게임, 해상도, 측정 시간, 테스트실 온도 등 테스트 환경이 같지 않기 때문에 지난 콘텐츠와는 온전히 비교하기 어려운 점 참고 바랍니다.




퀘이사존

퀘이사존



■ GA104 풀칩 + GDDR6X 메모리로 RTX 2080 Ti 성능을 확실히 넘어서다

-> RTX 3070 Ti는 여러모로 RTX 3070의 완전판으로 볼 수 있다. 일부 유닛이 비활성화된 RTX 3070과 달리 6,144 CUDA 코어가 모두 활성화되어 GA104 풀칩을 탑재했음은 물론, GDDR6X 메모리 탑재로 RTX 3070의 아쉬웠던 메모리 대역폭을 확실하게 개선했다. 결과적으로 RTX 2080 Ti와 동급 취급을 받았던 RTX 3070과는 확실히 차별화된 성능을 제공한다.


■ Ti 네이밍을 부여하기에는 실망스러운 성능 향상

-> Ti 네이밍이 확보한 이미지를 고려해보면, RTX 3070 대비 실제 성능 향상은 실망스럽다. 퀘이사존 테스트 결과에서 RTX 3070 대비 평균 9% 이내의 성능 향상(QHD 해상도 기준)을 보여주었기 때문. 다만 엔비디아가 공언한 대로 RTX 2070 SUPER와 비교하면 약 45% 이상 높은 성능을 가지고 있어, 업그레이드를 고려하고 있는 지포스 20 시리즈 사용자라면 체감은 확실할 것.


■ MSRP 기준, 비슷한 가격대의 RX 6800과 비교한다면?

-> 소위 ‘깡성능’ 부문에서 RX 6800 성능을 넘어서지 못한다. 오히려 약간 낮은 성능을 기록. 그러나 레이트레이싱 성능이 훨씬 뛰어나고, 라데온에서는 아직 사용할 수 없는 DLSS와 같은 훌륭한 기술적 이점을 누릴 수 있기 때문에, 용도에 따라 가성비에 대한 평가는 달라질 수 있다. 그러나 RTX 3080이 아닌 RTX 3070 성능에 가까움에도, 두 모델 사이에서 정확히 가운데 지점인 $599 가격은 긍정적으로 볼 수 없다. MSRP 기준이 아닌 실제 형성될 가격대에 주목할 필요가 있다.


■ QHD+고주사율 게이밍을 고려한다면 효율적인 선택지가 될 것

-> RTX 3070 Ti은 결국 QHD 해상도+고주사율 모니터 사용자에게 가장 적합한 성능을 가지고 있다. 일부 초고사양 게임을 제외하면 풀옵션 또는 적당한 옵션 타협을 통해 얼마든지 100 FPS 이상의 성능을 기대할 수 있기 때문.


■ 제한된 이더리움 채굴 성능 확인

-> RTX 3080 Ti와 마찬가지로 실제 채굴 성능 테스트 결과 해시레이트는 점점 감소하며 최종 38 MH/s 수준에 머물게 된다. 해당 수치는 RTX 2070 SUPER와 크게 다르지 않고, RTX 3070 노말 모델이 별도 튜닝 없이도 약 52 MH/s를 보여준다는 것을 감안한다면 성능이 크게 제한되었다는 것을 말해준다.


■ 높아진 소비전력은 단점 

-> 전성비, 즉 효율성 면에서는 좋은 평가를 내리기 힘들다. RTX 3070 Ti의 TGP는 290W로 게임 성능은 220W TGP의 RTX 3070에 가까운데, 정작 소비전력은 RTX 3080의 320W TGP에 더 가깝다. 풀칩 GPU에 GDDR6X 메모리 탑재 등의 요인이 소비전력을 높이는 데 일조한 것으로 판단된다. 결국 FE 모델 역시 RTX 3070보다 덩치가 큰 쿨러를 탑재할 수밖에 없었다.


■ 엔비디아 지포스 RTX 3070 Ti의 가치

-> MSRP는 정확하게 공표되었지만, 국내 그래픽카드 시장에서 실제 어느정도 가격대에 안정화될지는 확실히 예측하기 힘들다. 그러나 채굴 성능 제한이라는 내부 특징과 외부적 요인(암호화폐 시장 및 채굴 열풍 등)이 다소 줄어든 측면이 있기 때문에 신제품 물량 투입 효과는 분명 존재할 것으로 예상된다. 따라서 RTX 3070 Ti는 그래픽카드 시장 전반적으로 긍정적인 영향력을 끼칠 수 있다는 점과, RTX 3070 대비 강화된 상품성을 가지고 있다는 것에 그 가치가 있다.





우리의 벤치마크는 계속될 것이다

늘 그랬듯이





퀘이사존 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.​


※ 본 칼럼에 쓰인 RTX 3070 Ti FE는 NVIDIA로부터 대여 받았습니다.




댓글: 96

신고하기

신고대상


신고사유

투표 참여자 보기