퀘이사존 지포스 RTX 3070 Ti 20종 게임 벤치마크 RTX 3070 최종 강화판 등장
엔비디아 지포스 게이밍 제품 부문 수석 부사장, 제프 피셔Jeff Fisher는 컴퓨텍스 2021 기조연설에서 지포스 그래픽카드 신모델 2종을 발표했습니다. 첫 번째는 6월 2일 성능 엠바고Embargo가 해제된 RTX 3080 Ti, 두 번째는 오늘 여러분께 소개할 RTX 3070 Ti입니다. 사실 RTX 3080 Ti는 이전 세대 지포스 그래픽카드 가격 정책을 고려하면 크게 매력적인 녀석은 아닙니다. RTX 3080 대비 약 10~12% 우수한 성능으로 RTX 3090과 다를 바 없는 성능을 제공해주고, 가격은 RTX 3090보다 $200 저렴하다는 것은 분명 장점이지만, 문제는 바로 아래 모델인 RTX 3080 가격이 $699에 불과하여 가성비로 접근하면 애매하게 느껴지기 때문이죠.
하지만 비정상적인 그래픽카드 시장 상황을 고려하면 얘기가 달라집니다. 엔비디아가 예고한 대로 RTX 3080 Ti은 암호화폐 채굴 성능(이더리움, Ethereum)이 제한되어 있었으며, 여기에 더해 앞으로 나올 제품은 물론, 기존에 출시된 그래픽카드 역시 LHR(Lite Hash Rate) 버전으로 출시할 것이라는 내용을 발표했기 때문입니다. 즉 RTX 3080 Ti를 기점으로 지나치게 과열됐던 그래픽카드 시세를 조금은 안정적으로 바꾸는 데 일조하고 있습니다. 이런 상황에서는 과거와 동일한 잣대로 단순 MSRP와 절대 성능 그 자체로 평가하기엔 무리가 있습니다. 실질적인 시장 상황이 어떻게 흘러갈지 정확한 예측이 힘들기 때문이죠. 긍정적인 건 이렇게 채굴 성능이 제한된 그래픽카드 종류가 많아지고 또 시장에 적극적으로 투입될수록, 이전 대비 안정화된 시장 상황을 기대할 수 있다는 건 분명합니다. 이런 관점에서 새롭게 등장한 지포스 30 시리즈 Ti 제품군은 게이머들에게 숨결을 불어넣을 수 있는 역할을 수행하는 것이 지상 과제일 것입니다.
▲ 세상에 존재를 드러낸 RTX 3070 Ti FE, RTX 2070 SUPER 대비 1.5배 성능을 가졌다고 주장, $599 가격에 6월 10일부터 판매
RTX 3070과 비교 시 차별성 – GA104 풀칩 그리고 GDDR6X 메모리 탑재
그렇다면 RTX 3070 Ti는 RTX 3070이랑 무엇이 다를까요? 먼저 그래픽카드 성능의 핵심인 GPU는 RTX 3070과 동일한 GA104 GPU입니다. 그러나 GPU 내부로 들어가면 분명한 차이가 있습니다. RTX 3070이 일부 유닛이 비활성화된 GA104 컷칩 GPU를 탑재했던 것에 반해, RTX 3070 Ti는 모든 유닛이 활성화된 GA104 풀칩 GPU를 탑재하고 있기 때문이죠. 따라서 실장된 CUDA 코어는 6,144개로 RTX 3070의 5,888개 대비 256개 더 많은 연산 코어를 가지고 있습니다. 물론 256개라는 코어는 백분율로 환산하면 고작 4.3% 더 많은 것이기 때문에, GA104 풀칩이라는 구성만으로 차별화된 성능을 기대하기란 어렵습니다. 결국 의미있는 변화를 꼽는다면 메모리 구성으로 보아야할 것입니다. RTX 3070은 14 Gbps 속도의 GDDR6 메모리를 탑재했지만, RTX 3070 Ti는 GDDR6X 메모리를 탑재하여 무려 19 Gbps 속도로 작동합니다. 결국 메모리 대역폭에서 약 36% 더 좋은 구성(608.0 GB/s vs. 448.0 GB/s)을 확보하였습니다.
▲ RTX 3070 Ti FE 전면 디자인(RTX 3070 FE와 RTX 3080 FE 디자인을 혼합한 콘셉트)
메모리 대역폭이 높으면 뭐가 좋나?
이렇게 빠른 속도의 GDDR6X 메모리를 탑재함으로써 자연스럽게 개선되는 메모리 대역폭은 실제 3D 성능에서 분명한 이점으로 작용합니다. 근본적인 렌더링 연산 성능 자체는 GPU가 결정하지만, 메모리 데이터 전송 속도가 느리다면, 결과적으로 최종 성능이라 할 수 있는 FPS 수치가 낮아지기 때문이죠. 대표적인 예로 GDDR6 메모리를 탑재한 RTX 3070은 일반적으로 RTX 2080 Ti와 동급 또는 소폭 높은 성능을 제공하지만, 메모리 인터페이스가 256-bit에 작동 속도는 14 Gbps로 최종 메모리 대역폭은 고작 448 GB/s에 그칩니다. 반면 RTX 2080 Ti은 메모리 작동 속도가 GDDR6 14 Gbps로 동일하지만, 메모리 인터페이스가 352-bit로 훨씬 높기 때문에 메모리 대역폭 역시 616 GB/s 수치를 가지게 되어, 고해상도 환경에서 RTX 3070과의 성능 격차를 줄이거나 또는 역전하는 상황을 연출하기도 합니다. 결국 성능을 보는 관점에 따라 RTX 3070은 GPU 성능 대비 메모리 대역폭이 아쉽다고 평가될 수 있는 부분입니다.
▲ RTX 3070 Ti FE 후면 디자인(쿨링 방식은 RTX 3090 FE & RTX 3080 FE와 동일)
아키텍처 관점에서 보다 단단한 완성도를 가진 RTX 3070 Ti
이런 관점에서 보면 RTX 3070 Ti는 GPU 연산 능력과 메모리 구성에서 밸런스가 매우 좋아졌습니다. GPU는 온전한 GA104 풀칩이고, 메모리 인터페이스는 256-bit로 동일하지만 GDDR6X 메모리로 작동 속도를 19 Gbps까지 끌어올려 608 GB/s 메모리 대역폭을 확보했기 때문입니다. 사실상 RTX 2080 Ti와 동일한 수준이죠. 이 정도면 QHD->4K로 넘어가는 고해상도 환경에서 RTX 2080 Ti와 동일한 수준의 성능 하락 또는 더 작은 성능 하락을 기대할 수 있습니다. 더군다나 암페어Ampere 아키텍처 고유의 메모리 운용 능력까지 고려하면, 여러모로 완전해진 형태입니다.
채굴 성능은? 제한되어 있는 거 맞아?
그러나 앞서 말씀드린 내용들은 어디까지나 마니아 영역에서의 감성적/기술적 완성도에 대한 내용이고, 결국 소비자에게 중요한 건 ‘그래서 성능이 얼마나 더 좋은데?’로 귀결될 것입니다. 사실 이게 가장 중요한 것도 맞습니다. 이에 대한 내용은 퀘이사존이 20종 게임 대규모 벤치마크로 평균 성능을 계산했으니, 글 말미에서 확인해 주시기 바랍니다. 또한 단순 스펙 외에도 차별화되는 요소는 바로 이더리움 채굴 성능 제한입니다. 퀘이사존 RTX 3080 Ti 벤치마크에서도 확인한 내용이지만, RTX 3070 Ti 역시 채굴 성능이 대폭 제한되어 채굴 머신으로써의 매력을 강제로 하락시켜놓았습니다. 얼마나 큰 효과를 거둘 수 있을지는 알 수 없으나, 어쨌든 시장 안정화와 용도에 따른 제품 정체성 확립에는 의미가 있습니다.
▲ RTX 3070 Ti 및 주요 그래픽카드 상세 스펙
RTX 3070 Ti 상세 스펙입니다. 과거 지포스 20 시리즈와 달리 지포스 30 시리즈는 파운더스 에디션(Founders Edition, 이하 FE)과 레퍼런스 제품 간 표면적인 스펙 차이는 없습니다.(바꿔 말해 지포스 20 시리즈는 레퍼런스 클록과 FE 클록을 따로 설정하는 등 다소 혼란스러운 정책 존재) 여기서 굳이 표면적이라고 얘기한 까닭이 있는데요. FE 버전은 비레퍼런스 대비 표기 부스트 클록 대비 실제 부스트 클록(게임 구동 시 실제 적용 클록)이 굉장히 높은 경향을 가지고 있기 때문입니다. 이런 특징 때문에 아예 최고급형 모델이 아닌 이상, 일부 제조사 모델의 경우 스펙상 FE 대비 높은 부스트 클록을 가지고 있어도, 실제 3D 게임 구동 시 FE 대비 낮은 부스트 클록으로 작동하는 경우가 비일비재합니다.
▲ RTX 3070 | GA104-300-A1 블록 다이어그램 예상도(비활성화를 뜻하는 적색 영역은 임의지정)
▲ RTX 3070 Ti | GA104-400-A1 블록 다이어그램(모든 유닛이 활성화된 풀칩 구성)
GA104 풀칩이로구나... 편-안
다시 본론으로 돌아와 스펙을 보겠습니다. 앞서 말씀드렸듯이 풀칩 GA104 GPU를 탑재하여 완전해진 GPU를 자랑합니다. RTX 3070은 GA104 컷칩 구성으로 TPC 1개(=2 SM=256 CUDA)가 비활성화된 바 있죠. 사실 풀칩 자체가 특별한 성능적 이점을 가져다주는 것은 아니지만(컷칩이든 풀칩이든 실제 성능은 CUDA 코어수에 비례), 눈에 보이는 것 뿐만 아니라 하드웨어/아키텍처 관점의 감성에도 관심 있는 분들에게는 매력적인 요소로 어필할 수 있습니다. 여기에 더해 부스트 클록을 소폭 끌어올리고, GDDR6X 메모리를 탑재하여 메모리 대역폭을 35.7% 끌어올렸습니다.
큰 폭으로 높아진 TGP는 단점
그러나 모든 것이 좋아진 건 아닙니다. TGP(Total Graphics Power) 220W에 보조 전원 단자가 8핀 1개로 작동했던 RTX 3070과 달리, TGP 290W에 8핀 2개 구성으로 소비전력이 크게 높아졌습니다. 소비전력만 보면 RTX 3070이 아닌 RTX 3080에 가까워진 것이죠. 이것이 큰 단점으로 다가오는 이유가 있습니다. 스펙 구성 한계로 인해 정작 성능은 RTX 3080이 아닌 RTX 3070에 가까울 확률이 매우 높기 때문이죠. MSRP는 두 그래픽카드 사이에서 정중앙에 위치하는 $599로 발표하였습니다.
▲ 퀘이사존 지포스 RTX 3070 Ti 벤치마크 시스템 사양
퀘이사존 그래픽카드 벤치마크 시스템은 빅나비 RX 6800 시리즈 출시를 기점으로 AMD 라이젠 플랫폼을 사용합니다. 라이젠 5000 시리즈 프로세서 출시로 인해, 최강 게이밍 플랫폼은 이제 인텔이 아닌 AMD가 되었기 때문입니다. 그래픽카드 드라이버는 RTX 3070 Ti 리뷰어 대상으로 배포된 NVIDIA GeForce Game Ready Driver 466.61 버전을 사용하였습니다.(대조군은 RTX 3080 Ti 벤치마크 당시 사용했던 466.54 버전 데이터 유지) 그 외 마더보드 UEFI 및 시스템 드라이버 모두 최신 빌드 버전을 사용하였습니다.
또한, Resizable BAR(AMD: SAM) 활성화가 가능한 그래픽카드는 모두 활성화된 상태로 테스트를 진행하였습니다. 최초에는 라라랜드 플랫폼이라 불리며 라이젠 CPU+라데온 그래픽카드만 가능했으나, 현재는 지포스 30 시리즈도 해당 기능을 사용할 수 있습니다.
▲ 대원 CTS 제공: AMD 라이젠 7 5800X(8C/16T) ※ 벤치마크(링크)
CPU는 AMD 라이젠 7 5800X로 선정하였습니다. 높은 게이밍 성능을 보장하는 것은 물론, 라이젠 5000 시리즈 중에서도 상급 게이밍 성능을 가지고 있습니다. 참고로 라이젠 5000 시리즈는 부스트 클록 알고리즘 개선과 함께 실제 게이밍 구동 시 적용되는 클록이 상당히 높아져, 게이밍 성능 향상 목적으로는 오버클록 효용성이 극히 낮습니다. 그러나 벤치마크에서는 유동적으로 변하는 CPU 클록 주파수 변인을 최소화하기 위해 올코어 4.7 GHz OC 설정으로 고정하여 테스트를 진행했습니다.
▲ 대원 CTS 제공: ASUS TUF Gaming X570 PRO (Wi-Fi)
X570 칩세트 기반, ASUS TUF Gaming X570 PRO (Wi-Fi) 모델입니다. 3800 MHz 메모리 오버클록 및 IF 1:1 동기화도 문제가 없었으며, 전원부 온도 또한 나쁘지 않은 녀석입니다. 특히 AMD가 발표한 스마트 액세스 메모리(Smart Access Memory) 활성화를 위해서는 500 시리즈 마더보드가 필수이기도 하죠. 동일한 모델은 아니지만 ASUS TUF Gaming X570 PLUS (Wi-Fi) 제품은 QM센스가 칼럼을 진행하였으며, 좋은 평가를 받기도 하였습니다.(링크)
▲ 서린씨앤아이 제공: G.SKILL TRIDENT Z ROYAL DDR4-3,200 CL14 16GB x2(기사 링크)
일명 보석 메모리로 통하는 지스킬 트라이던트 Z 로열 시리즈. 이제는 모르는 분들을 찾기 힘들 정도로 유명한 제품입니다. 최초 해당 제품이 등장했을 때는 특유의 고급스러운 디자인에 녹아든 화려한 보석 RGB LED가 충격적이기까지 했죠. QM슈아의 가장 최신 트라이던트 Z 로열 칼럼을 통해 성능과 외형의 진면목을 확인해 보실 수 있습니다. 벤치마크에 사용된 모델은 3200 MHz CL14 모델이었으나 3800 MHz CL16까지 무리 없는 설정이 가능하였습니다. 현재 라이젠 5000 시리즈는 일부 2 슬롯 기반 마더보드를 제외하면 3800 MHz(IF: 1900 MHz)가 한계치 설정으로 파악됩니다.
▲ 서린씨앤아이 제공: PATRIOT VIPER VPN100 M.2 NVMe 2TB(기사 링크)
벤치마크 시스템은 수십 종 게임을 한꺼번에 테스트해야 하기 때문에, 고용량 SSD는 필수입니다. 특히 최신 게임은 100 GB를 넘어 200 GB를 초과하는 용량을 보이는 경우도 있고요. 그래서 준비한 SSD가 바로 PATRIOT 바이퍼 게이밍(VIPER GAMING) 저장장치, VPN100 NVMe 2TB 모델입니다. 용량도 용량이지만, 알루미늄 방열판을 기본 장착하고 있다는 점에서 발열로 인한 스로틀링 걱정을 한시름 놓게 됩니다. 또한, 해당 제품은 QM달려가 냉철한 시각으로 분석한 칼럼도 등록되었으니 참고해 주시기 바랍니다.
▲ 마이크로닉스 제공: 마이크로닉스 Classic II 850W 80PLUS GOLD 230V EU 풀모듈러(750W 기사 링크)
최신 하이엔드 그래픽카드 소비전력은 과거 250W 수준에서 벗어나 높게는 350W 수준을 보이고 있습니다.(일부 RTX 3090 비레퍼런스 모델은 전력 제한 해제 시 약 500W 에 달함) 따라서 고용량 파워서플라이는 필수라 할 수 있겠죠. 특히 AMD가 발표한 풀칩 빅나비 GPU를 탑재한 RX 6900 XT는 파워서플라이 권장 출력을 850W로 표기하기도 했습니다. 물론 그 이하 출력을 가진 파워에서도 충분히 구동은 가능하나, 파워에 가해지는 로드율이나 그로 인한 효율과 팬소음까지 고려하면 권장 출력 이상의 파워를 사용하는 것이 쾌적합니다. 벤치마크 시스템에 사용된 마이크로닉스 클래식 II 제품은 준수한 골드 등급 효율에 팬리스 모드 온/오프 스위치 제공, 풀모듈러 구성, 우수한 전압 유동폭 등 여러모로 테스트 시스템에 적합한 요건을 갖춰 선정하였습니다.
▲ RTX 3070 Ti 벤치마크에 동원된 게임 목록
"퀘이사존 벤치마크는 세계 최고의 데이터 신뢰성을 지향합니다. 따라서 새로운 그래픽카드 성능을 최대한 정확하게 반영하기 위해, 최신 게임 타이틀을 테스트에 대거 투입합니다. 물론, 최신 게임 뿐만 아니라 유저들에게 인지도가 높은 게임, AAA급 게임으로서 대표성을 지니는 타이틀 등 다양한 요소를 고려해서 구성합니다."
그래픽카드 테스트 시 최신 게임 타이틀이 중요한 이유는 출시된 지 오래된 게임들로 구성하면 최신 하드웨어의 아키텍처 이점과 성능을 제대로 반영할 수 없기 때문입니다. 그러나 반대로 최신 게임으로만 구성하면 구세대 그래픽카드와의 성능 격차가 과도해져 실사용과 괴리감이 생길 위험이 있겠죠. 따라서 최신 게임, 벤치마크로 상징성이 높은 게임, 게이머들에게 인기가 높은 게임, GPU 최적화가 좋은 게임 등 다양한 기준을 통해 20종에 달하는 게임 타이틀을 선정하였습니다.
기본적으로 3종 해상도(FHD/QHD/UHD) 조건에서 테스트를 진행하며, DLSS를 적용하지 않은 순수 레이트레이싱 게임 성능은 기술 구현에 따른 성능 변화 파악에 우선순위를 두어 QHD 해상도 한정으로 테스트를 진행하였습니다. 다만 RTX(레이트레이싱+DLSS) 성능은 QHD와 4K/UHD 해상도 2종으로 진행하였습니다.
※ 아래 내용부터는 벤치마크 테스트 결과로 이어집니다. 항목별 구체적인 테스트 결괏값은 세부 페이지에서 확인해 주세요.
타임스파이 점수입니다. DX12 API 기반 벤치마크 툴로써, DX11 API 기반 파이어스트라이크 대비 최신 게임 환경에서의 그래픽카드별 성능 평가에 더 적합합니다. RTX 3070 Ti는 RTX 2080 Ti 대비 소폭 높은 점수를 기록하였습니다. 다만 실제 게임 성능은 이보다 점수가 낮은 RTX 3070과 RTX 2080 Ti가 동급이라는 점을 고려했을 때, 최소 RTX 2080 Ti 성능은 확실히 앞설 것으로 예상할 수 있습니다.
타임스파이 기본 설정 외에도 DX12 API+4K/UHD 해상도 환경을 대변하는 타임스파이 익스트림을 테스트에 포함하였습니다. 익스트림 옵션에서 RTX 3070 Ti는 RTX 2080 Ti와 성능 격차를 더 벌리는 양상을 확인할 수 있습니다. 그러나 RTX 3070 역시 타임스파이 기본 테스트와 달리 RTX 2080 Ti 성능에 매우 근접한 것으로 보아 단순 메모리 대역폭 이점 뿐만 아니라 아키텍처 특성 차이에 기인했을 가능성이 높습니다.
파이어스트라이크 점수입니다. AMD 라데온 RX 6000 시리즈가 매우 높은 점수 경향을 보이는 벤치마크 툴입니다. RTX 3070 Ti는 RTX 3080과 비교 시 큰 격차로 성능이 낮으며, RTX 3070에 가까운 모습을 보입니다. 실제 게임 성능 역시 이변 없이 RTX 3070에 가까울 것으로 예상됩니다.
마이크로소프트 API 중에 DirectX Raytracing, 줄여서 DXR API가 존재합니다. DXR은 DX12 API 확장 기능으로써 실시간 레이트레이싱 연산을 위한 윈도우 10 표준이기도 합니다. 포트로열Port Royal은 DXR API로 레이트레이싱을 구현하며, 레이트레이싱 기술이 포함된 게임 성능을 대변합니다. 그동안 AMD 라데온 그래픽카드는 레이트레이싱을 지원하지 않아 측정 자체가 불가능하였으나, RX 6000 시리즈는 RDNA 2 아키텍처를 차용함으로써 ‘DXR API에서 실시간 레이트레이싱 게이밍’이 가능합니다. 다만 포트로열은 모든 렌더링을 레이트레이싱 기법으로 처리하는 것이 아니라 전통적 방식인 래스터화(Rasterization) 기법을 함께 사용하기 때문에, '깡성능'도 무시할 수 없다는 특성이 있습니다. 따라서 레이트레이싱을 적극적으로 사용한 게임이라면 포트로열 결과 대비 지포스와 라데온 격차가 더 커질 수 있다는 한계가 있습니다. 이럴 땐 아래 DirectX Raytracing feature test 항목을 같이 참고하면 좋습니다.
다음은 순수 실시간 레이트레이싱 연산 능력 위주로 성능을 측정하는 DirectX Raytracing feature test입니다. 포트로열과 다른 점이라면, 포트로열은 레이트레이싱 옵션이 적용된 종합 게이밍 성능(Rasterization+RayTracing=Hybird)을 대변하지만, 본 테스트는 최대한 실시간 레이트레이싱 연산 자체에 집중한다는 것입니다. 따라서 아키텍처에 따라 성능 격차가 매우 선명하게 드러납니다. 결론만 말하면 RTX 3070 Ti는 RTX 3070과 크게 다를 바 없는 레이트레이싱 성능을 보여주었습니다. RTX 3070과 동일한 GA104 GPU 기반에 유닛 구성이 크게 차이나지 않다는 태생적 한계를 드러냈습니다.
해당 그래프는 각 게임에서 RTX 3070 FE 성능(평균 FPS)을 100% 두었을 때, 대조군 그래픽카드 상대 성능을 계산하고 이를 20종 게임 전체로 확장하여 평균값을 도출한 그래프입니다. 레이트레이싱 적용 성능을 제외했기 때문에 속된 말로 '깡성능'입니다. 결과를 보면 RTX 3070 Ti는 FHD/QHD 해상도에서 RTX 3070 대비 약 6~9% 높은 성능을, 4K 해상도에서는 약 10% 높은 성능을 기록하였습니다. $20 차이의 경쟁 구도라 볼 수 있는 RX 6800과 비교하면, QHD 해상도에서 미세하게 낮은 성능을, 4K/UHD 해상도에서는 동급 성능을 기록하였습니다.
메모리 대역폭 이점이 증명된 결과이기도 합니다. RTX 3070은 QHD->4K 전환 시 RTX 2080 Ti에게 성능이 점점 따라잡히는 양상이지만, RTX 3070 Ti는 성능 격차를 더욱 따돌리는 양상을 보여주었기 때문입니다. 그러나 수치적으로 그 차이가 대단한 것은 아닙니다.
DLSS와 같은 업스케일링 기술을 제외한 순수 레이트레이싱 게임 성능 테스트 결과입니다. 테스트 결과에서 인상적인 부분이라면, 실시간 레이트레이싱 분야에서 지포스 그래픽카드가 단연 뛰어난 성능을 보여준다는 것입니다. 이미 널리 알려진 사실이기도 하죠. AMD는 빅나비 그래픽카드를 위시한 RDNA 2.0 아키텍처에서부터 레이트레이싱 연산에 힘을 쏟고 있긴 하나, 아직까지는 역부족입니다. 이를 방증하는 것이 RX 6800을 쫓아가던 RTX 3070 Ti는 AMD 라데온 플래그십 모델, RX 6900 XT보다도 뛰어난 성능을 발휘하였습니다.
다음은 DLSS까지 적용한 실시간 레이트레이싱 게이밍 성능입니다. RT와 DLSS(Deep Learning Super Sampling)를 모두 활성화했기 때문에 사실상 엔비디아 전용 RTX 게임 테스트라 해도 무방합니다. DLSS는 엔비디아 전용 기술이기 때문에 라데온은 대조군에서 제외하였습니다. 4종 게임에서 QHD, 4K/UHD 해상도로 테스트를 진행하였으며, 당연하지만 해상도가 높을수록 그래픽카드별 성능 편차가 두드러집니다. 일반 게임 성능 양상과 마찬가지로 RTX 3070 Ti는 QHD 해상도에서 약 7%, 4K/UHD 해상도에서 약 9% 높은 성능을 보여주었습니다. 그 위로 존재하는 RTX 3080 성능을 바라보기엔 성능 차이가 큽니다.
RTX 3070 Ti는 RTX 3080 Ti와 마찬가지로 이더리움Ethereum 채굴 성능이 제한되었습니다. 또한, 엔비디아는 기존 그래픽카드 역시 용도 구분을 위해 LHR(Lite Hash Rate) 그래픽카드로 출시할 계획을 발표하기도 했죠. 이를 검증하기 위해 퀘이사존은 피닉스마이너PhoenixMiner 최신 버전을 통해 간단하게 이더리움 채굴 성능을 확인해 보았습니다. RTX 3070 Ti는 RTX 2070 SUPER 대비 미세하게 높은 38.1 MH/s 해시 성능을 기록하였습니다. 게임 성능과는 완전히 다른 결과이며, 해시레이트가 확실히 제한되어 있다는 말합니다. 다만 실제 전문적으로 채굴 시스템을 구성하는 유저들은 별도의 전력 제한 레벨 조정과 메모리 오버클록을 통해 채산성 효율 튜닝을 가미한다는 변수가 있습니다. 그러나 이를 감안해도, RTX 3070 Ti는 태생적 소비전력이 높아 상대적인 매력은 매우 떨어집니다.
▲ RTX 3070 Ti FE 오버클러킹 설정(GPU-Z 화면 캡처)
오버클록 잠재력도 확인해 보았습니다. 오프셋 클록 기준 코어: +180 MHz, 메모리 클록: +1,500 MHz까지 정상 작동을 확인하였습니다. 이때 유효(Effective) 메모리 속도는 19 Gbps에서 22 Gbps까지 상승합니다. 전력 제한 레벨은 최대 110%(전력 환산: 320W)까지 설정 가능합니다. 단 해당 수치는 FE 기준이며 비레퍼런스는 제조사/모델마다 상이하게 나타날 것입니다.
▲ 오버클록 적용 시 실제 부스트 클록(좌: 기본, 우: 오버클록)
둠 이터널(QHD/2560x1440 해상도)을 구동하여 오버클록으로 인한 부스트 클록 차이가 있는지 확인해 보았습니다. 기본 설정에서 1,890 MHz로 작동하지만, 전력 제한 레벨 해제와 함께 +180 MHz 오프셋 클록 적용 시 2,070 MHz까지 상승합니다. 정확히 180 MHz 차이입니다. 메모리 역시 11,002 MHz로 표기되지만, 유효 속도로 환산하면 22 Gbps 수준이 됩니다. 결과적으로 해당 구간에서의 성능도 225 FPS에서 241 FPS로 향상되었습니다.
|