퀘이사존 지포스 RTX 3060 Ti 벤치마크

Ti가 또 나와? 그런데 이번 제품, 뭔가 심상치 않다?

QM슈아
159 37521 2020.12.01 22:47





퀘이사존 지포스 RTX 3060 Ti 벤치마크

30 시리즈에서 처음 모습을 드러낸 Ti, 그 저력을 보여주다



안녕하세요. QM슈아입니다.


2020년도 어느새 막바지를 향해 달리고 있습니다. 올해는 다른 해보다도 크고 작은 사건이 많았던 느낌이네요. 특히 전 세계적으로 유행 중인 바이러스 문제는 국내에서도 큰 영향을 주었습니다. 여러 사업 분야가 직격타를 맞았고, 경기는 한층 더 꽁꽁 얼어붙는 듯했죠. 하지만 아이러니하게도 때아닌 호황을 맞이한 곳이 있었으니, 바로 PC 시장입니다. 야외 활동에 제약이 생기면서 자연스레 사람들은 실내 활동으로 시선을 돌렸고, 집에서 누구나 활용하고 있는 전자 기기 중 하나가 바로 컴퓨터이기 때문입니다. 특히 올 한 해를 돌아보면 삼성 8 nm 제조 공정으로 새로운 국면에 돌입한 NVIDIA와 최근 TSMC 7 nm 제조 공정으로 강력한 경쟁 상대로 부상한 AMD를 보고 있노라면, 하드웨어 마니아 입장에서는 절로 즐거워졌습니다.


물론 양사 신제품 모두 현시점에서는 하이엔드 제품군만 소개했을 뿐, 정작 중요한 메인스트림 라인업은 아직도 행방이 묘연했는데요. 이런 틈새시장을 놓칠 리 없는 NVIDIA에서 먼저 새로운 카드를 꺼내 들었습니다. 이번 칼럼의 주인공이자 메인스트림 시장에 큰 지각변동을 알리지 않을까 기대하는 제품, RTX 3060 Ti입니다.



RTX 3060 Ti FE(왼쪽)와 RTX 3070 FE(오른쪽) 사진


지포스 30 시리즈에서 처음 등장한 60 라인업이자, 처음 등장한 Ti 제품이라는 점은 감회가 조금 남다릅니다. 파운더스 에디션은 RTX 3070과 같은 외형이지만, 쿨러 슈라우드 색상 톤에 차별점을 두어 구분은 어렵지 않겠네요. 물론 이런 외형보다도 이 칼럼을 보고 계실 대다수에게는 게임 성능이 무엇보다도 중요할 텐데요. 구하기도 어렵고 가격도 부담이었던 하이엔드 그래픽카드에 큰 관심이 없으셨다면, 이 제품은 흥미를 느껴보기 충분한 제품이 아닐까 생각합니다. RTX 2080 SUPER와 동급 성능이라는 루머가 팽배했던 제품인데, 과연 그 루머가 들어맞았을까요? 지금부터 RTX 3060 Ti의 모든 걸 파헤쳐 봅시다.




RTX 3060 Ti 공식 티징 영상 중 일부 장면 <출처: NVIDIA>


GA104-200-A1 블록다이어그램 예상 사진 / GPC와 TPC를 각각 1개씩 비활성화한 구성으로 예상하며 총 4,864 CUDA를 탑재했습니다.


NVIDIA 그래픽카드가 RTX 20 시리즈로 들어서면서부터 그래픽카드 시장은 큰 지각변동에 돌입했습니다. 메인스트림 제품 가격이 상당히 비싸졌기 때문입니다. '주류'라는 용어와 가격 갭이 제법 커지게 된 시작점이라고 할 수 있죠. 실제로 그간 메인스트림을 담당해왔던 60 라인업 제품 중 RTX 2060은 MSRP(Manufacturer's Suggested Retail Price; 제조사 권장 소비자 가격)가 $349에 육박했는데, 이는 MSRP가 $249였던 GTX 1060보다 $100 비싼 가격이었습니다.


그럼에도 불구하고 RTX 2060은 제법 높은 판매고를 올렸습니다. RTX 20 시리즈 막내기에 RTX 관련 기술을 본격적으로 시도(사용이라고 하기엔 성능에서 부족한 게 사실이었기에)해 볼 수 있었고, 흔히 깡성능이라 부르는 기본 게임 성능은 이전 세대 하이엔드 제품인 GTX 1080에 근접했기 때문이 아닐까 합니다. 꾸준히 사랑받아온 60 라인업은 이후 등장한 RTX 20 SUPER 시리즈에서도 여전히 많은 관심을 받았는데요. RTX 2060 SUPER는 사실상 RTX 2070에 근접하는 성능을 보여주면서 가격은 불과(?) $50 비싸지는 선에 그쳤습니다. 가격 정책 자체가 썩 마음에 들진 않았지만, RTX 기술 사용과 최신 게임을 원활히 즐기기 위한 대안은 너무나도 적었습니다. 제가 적은 이야기만 본다면 부정적인 인상을 지우기 힘드시겠지만, 메인스트림 라인업으로 꾸준히 사랑받는 60 라인업이라는 점만큼은 여전히 유효했습니다.


그렇다면 NVIDIA에서 이번에 새롭게 발표한 RTX 3060 Ti는 어떨까요? 먼저 반가운 소식이 있습니다. 이번 RTX 3060 Ti는 흔히 메인스트림 라인업에서 자주 쓰이는 06 시리즈(예: GTX 960/GM206, GTX 1060 6G/GP106, RTX 2060(SUPER)/TU106) 대신 하이엔드 라인업에 가까운 GA104를 사용한단 점입니다. 이는 일부 코어를 비활성화하더라도 태생적으로 일정 수준 이상 성능을 기대해볼 수 있다는 뜻이기도 하며, 루머처럼 나오던 RTX 2080 SUPER에 견주는 성능도 결코 허황된 꿈이 아닐 수 있다는 얘기입니다. 훨씬 저렴한 가격임에도 이전 세대 하이엔드 라인업에 근접하다니, 하이엔드 제품군보다 상대적으로 저렴한 제품을 찾는 이가 많은 시장 성격상 꽤 큰 영향력을 선사할 그래픽카드가 아닐까 기대되네요. 아래에서 상세 스펙을 보면서 조금 더 자세한 이야기를 나눠보도록 합시다.





상세 스펙을 통해서 RTX 3060 Ti를 살펴보면 재미있는 점이 여럿 보입니다. 먼저 GA106을 쓰지 않았을까 하는 예상을 깨고 GA104 칩이 들어가 있는 게 눈에 띄네요. 비교적 최근에 등장했던 60 라인업 그래픽카드가 대부분 106 칩을 달고 있었기에 꽤 이례적인 상황이라고 할 수 있겠습니다. 흡사, 과거 케플러 기반인 GTX 760과 GTX 770이 GK104로 같은 칩 기반이었던 사례를 떠올리게 하네요.


이번 RTX 30 시리즈에 와서는 CUDA 코어를 FP32 유닛 하나와 FP32/INT32 하이브리드 유닛 하나로 구성하기에 숫자 자체가 확연히 늘어난 듯한 인상을 주는데, 단순 숫자로만 보면 RTX 2080 Ti(4,352 CUDA)보다 많아졌습니다. RTX 3060 Ti가 출시하기 전까지 막내 역할을 하던 RTX 3070과도 비교해볼 필요가 있겠는데요. RTX 3060 Ti는 RTX 3070보다 1,024 CUDA가 줄어든 4,864 CUDA를 지녔고, 당연히 SM 구성에서도 차이를 보이기에 텐서 코어와 RT 코어를 비롯한 전반적인 영역과 처리 성능이 조금씩 줄었습니다. 하지만 메모리는 RTX 3070과 마찬가지로 GDDR6 8GB를 탑재했고, 메모리 버스 역시 256-bit로 구성했습니다. 다만 출력단의 최종 핵심 역할을 하는 ROP(Render Output Units)는 RTX 3070보다 줄어든 80으로 구성되었습니다.


전반적으로 보면 RTX 3070과 확연한 체급 차이가 날 수 있겠다는 생각도 들지만, 길고 짧은 건 대봐야 아는 법이죠. 오히려 이전 세대 하이엔드 라인업을 차지하던 RTX 2080 SUPER와 좋은 대결을 할 수 있을지가 더 궁금해지는데요. 전원 단자도 줄었고, TGP(Total Graphics Power, 그래픽카드 전체 소비전력) 역시 줄었기에 체급 상으로는 제법 차이 나 보이네요. 또한 이전 세대와 달리 CUDA 코어 구성 차이로 인해 FP32 성능은 곧이곧대로 받아들이기가 어려워졌기에, 두 그래픽카드 중 어느 쪽이 더 우월하다고는 속단하기 어려워 보입니다. 특히 레이트레이싱이나 DLSS 성능은 숫자에서 확연히 낮은 RTX 3060 Ti가 더 낮아 보이기도 해서 알쏭달쏭하네요.


자, 이런 사전지식을 충분히 머릿속에 입력하셨다면, 이제부터 벤치마크 성능을 함께 확인해볼 차례입니다.





지난 라데온 RX 6000 시리즈 이후, 퀘이사존은 대대적으로 벤치마크 테스트 시스템에 변화를 주었습니다. 라이젠 3000 시리즈까지는 작업 성능 면에서 탁월하지만 여전히 게임 성능이 뒤처지는 느낌이었다면, 이번 라이젠 5000 시리즈부터는 인텔로부터 게임 성능마저도 뺏어오는 게 가능해졌기 때문입니다. 물론, 오버클러킹에서 상대적으로 자유로운 인텔 역시 여전히 강력한 상대지만, PCIe 4.0 인터페이스를 지원하지 않는 등 여러 측면에서 이제는 AMD 라이젠 플랫폼이 그래픽카드 성능 측정에도 더 적절하다는 판단이 들었습니다.


그래픽카드 드라이버는 리뷰어 대상으로 배포된 프레스 베타 버전을 사용했습니다. 지난 벤치마크에서도 언급했던 호라이즌 제로 던은 테스트 직전부터 1.07에서 1.08로 업데이트가 완료된 상황이기에 이전 벤치마크와는 조금 다른 양상이 펼쳐질 수 있음을 미리 알려드립니다.






대원 CTS 제공: AMD 라이젠 7 5800X(8C/16T) ※ 벤치마크(링크)


CPU는 AMD 라이젠 7 5800X로 선정했습니다. 인텔 코어 i9-10900K보다 높은 게이밍 성능(기본 상태 기준)을 보장하는 데다가, 라이젠 5000 시리즈 중에서도 상급 게이밍 성능을 가지고 있기 때문입니다. 참고로 라이젠 5000 시리즈는 부스트 클록 알고리즘 개선과 함께 실제 게이밍 구동 시 적용되는 클록이 상당히 높아져, 게이밍 성능 향상 목적으로는 오버클록 효용성이 극히 낮습니다. 그러나 벤치마크에서는 유동적으로 변하는 CPU 클록 주파수 변인을 최소화하기 위해 올 코어 4.7 GHz OC 설정으로 고정하여 테스트를 진행했음을 참고 바랍니다.




대원 CTS 제공: ASUS TUF Gaming X570-PRO (Wi-Fi)


X570 칩세트 기반, ASUS TUF Gaming X570 PRO (Wi-Fi) 모델입니다. DDR4-3800 MHz 메모리 오버클록 및 IF 1:1 동기화도 문제가 없었으며, 전원부 온도 또한 나쁘지 않은 녀석입니다. 특히 AMD가 발표한 스마트 액세스 메모리(Smart Access Memory) 활성화를 위해서는 500 시리즈 마더보드가 필수이기도 하죠. 동일한 모델은 아니지만 ASUS TUF Gaming X570-PLUS (Wi-Fi) 제품은 QM센스가 칼럼을 진행했으며, 좋은 평가를 받기도 하였습니다.(링크)




서린씨앤아이 제공: G.SKILL TRIDENT Z NEO DDR4-3,200 CL14 8GB x2(기사 링크)


일명 보석 메모리라는 별명으로 메모리 시장에 큰 영향을 준 지스킬 트라이던트 z 로열 시리즈 외에도 지스킬 메모리는 다양하게 존재합니다. 그중 트라이던트 z 네오 라인업은 비교적 최근 등장한 제품군이자 클록 별로 다양한 라인업을 보유했다는 강점을 가졌습니다. 트라이던트 z RGB와 비슷하면서도 세련된 직선미를 강조한 제품이기에 튜닝 효과 면에서는 탁월하다는 인상을 주죠. QM코리가 작성한 최신 칼럼으로 해당 메모리를 자세히 확인해 보실 수 있습니다. 벤치마크에 사용된 모델은 DDR4-3200 MHz CL14 모델이었으나 DDR4-3800 MHz CL16까지 무리 없는 설정이 가능했습니다. 현재 라이젠 5000 시리즈는 일부 2 슬롯 기반 마더보드를 제외하면 DDR4-3800 MHz(IF: 1900 MHz)가 한계치 설정으로 파악됩니다.




서린씨앤아이 제공: PATRIOT VIPER VPN100 M.2 NVMe 2TB(기사 링크)


벤치마크 시스템은 수십 종 게임을 한꺼번에 테스트해야 하므로 고용량 SSD는 필수입니다. 특히 최신 게임은 100 GB를 넘어 200 GB를 초과하는 용량을 보이는 경우도 있죠. 그래서 준비한 SSD가 바로 PATRIOT 바이퍼 게이밍(VIPER GAMING) 저장장치, VPN100 NVMe 2TB 모델입니다. 용량도 용량이지만, 알루미늄 방열판을 기본 장착하고 있다는 점에서 발열로 인한 스로틀링 걱정을 한시름 놓게 합니다. 또한, 해당 제품은 QM달려가 냉철한 시각으로 분석한 칼럼도 등록되었으니 자세한 내용은 위 링크를 참고해 주세요.




맥스엘리트 제공: 시소닉 PRIME PLATINUM PX-1000 Full Modular(기사 링크)


최신 하이엔드 그래픽카드 소비전력은 과거 250W 수준에서 벗어나 높게는 350W 수준을 보이고 있습니다(일부 RTX 3090 비레퍼런스 모델은 전력 제한 해제 시 약 500W 에 달함). 따라서 고용량 파워서플라이는 필수라 할 수 있겠죠. 최근 들어 NVIDIA와 AMD가 공개한 권장 파워서플라이 용량은 하이엔드 모델에서 750~850W에 육박하고 있는 만큼, 효율이 높고 안정적인 제품을 사용할 필요가 있습니다. 시소닉 PRIME PLATINUM PX-1000 Full Modular 제품은 제품 신뢰도가 높은 시소닉 파워 중에서도 정책을 착실히 따르는 1000W 파워서플라이로, 높은 전력 효율과 12년 무상 보증 정책, 그래픽카드에 안정적인 전력 공급을 위한 1 커넥터 1 출력 기술을 적용한 제품입니다. QM달려가 작성한 칼럼으로도 만나볼 수 있는 제품이니 자세한 내용은 링크를 참고해주시기 바랍니다.






RTX 3060 Ti가 지닌 게임 성능을 확인해 보기 위해 다양한 게임 타이틀을 선정했습니다. 소위 '깡성능'이라고 불리는 기본 게임 성능을 측정하기 위해 20종 게임을, 레이트레이싱(Raytracing) 및 NVIDIA DLSS(Deep Learning Super Sampling) 지원 게임 성능 측정을 위해 6종 게임을 준비했습니다. 기본 게임 성능을 측정하는 게임은 그래픽카드 성능 벤치마크 분야에서 상징성이 높은 타이틀과 인기가 높은 게임, GPU 최적화가 좋은 게임 등 다양한 기준을 통해 산정했습니다. 덕분에 게임 렌더링 API 종류도 다양성을 띠게 되었습니다.


테스트는 사용 빈도가 높은 3종 해상도(1920x1080, FHD / 2560x1440, QHD / 3840x2160, UHD) 조건에서 진행하며, 레이트레이싱 게임 성능은 기술 구현에 따른 성능 변화 파악에 중점을 두어 QHD 해상도 한정으로 진행했다는 점 참고 바랍니다.




※ 아래 내용부터는 벤치마크 테스트 결과로 이어집니다.

항목별 구체적인 테스트 결괏값은 세부 페이지에서 확인해 주세요.






먼저 살펴볼 벤치마크 자료는 3DMark 소프트웨어에서도 가장 대표성을 띠는 테스트, 파이어스트라이크입니다. 오늘의 주인공인 RTX 3060 Ti FE는 파이어스트라이크 그래픽 점수에서 3만 점을 조금 넘기는 수치를 기록했습니다. 이는 대조군인 RTX 2080 SUPER FE 모델보다 약 1,500점 정도 높은 점수로, 본격적인 게임 성능도 충분한 기대를 하게 만들어주네요. 상위 모델인 RTX 3070 FE와는 약 10% 정도 차이가 나기에 성능 격차는 확실하게 나타나지 않을까 예상이 됩니다.







DX11 API 기반으로 작동하는 파이어스트라이크에 이어 최신 그래픽카드 점수를 조금 더 객관적으로 반영할 수 있는 테스트, 타임스파이입니다. 이번에도 RTX 3060 Ti FE는 RTX 2080 SUPER FE보다 소폭 높은 점수를 유지하는 모습을 보여줍니다. 일반적으로 3DMark 테스트가 게임 성능으로 고스란히 반영되는 건 아니지만, 적어도 두 테스트에서 비슷한 양상을 보이기에 유의미한 성능 차를 기대해볼 수 있겠네요. 여전히 RTX 3070 FE와는 일정 수준 이상 성능 차이가 발생하는 양상이지만, 메인스트림 라인업 수준 그래픽카드라고 보기 어려운 성능을 보여주고 있습니다.






이번 테스트는 DX12 API에서 확장된 DXR(DirectX Raytracing) 즉, 레이트레이싱 연산 성능을 확인하기 위한 테스트인 포트로열입니다. 이번 테스트에서는 RTX 3060 Ti FE가 RTX 2080 SUPER FE와 대등한 수준을 보여줍니다. 레이트레이싱 성능에서는 동급이라고 보아야 하는 걸까요?


RTX 2080 SUPER FE는 1세대 RT 코어를 48개 탑재했고, RTX 3060 Ti FE는 2세대 RT 코어를 38개 탑재했습니다. RTX 3060 Ti FE 입장에서 보자면 RTX 2080 SUPER FE가 약 26% 더 많은 RT 코어를 지닌 셈이기에 힘든 싸움이 될 수 있을 텐데요. 결과적으로는 대등한 성능을 보여주기 때문에, 2세대 RT코어 성능 효율이 비약적으로 향상되었음을 다시 한번 실감하게 됩니다. 오히려 실제 게임에서는 복합적인 연산 능력이 요구되기에, 게임 성능이 역전될 가능성도 농후해 보이네요.






다음은 3DMark에 포함된 DLSS 기능 테스트입니다. 하이엔드 모델과 비교한다면 체급이 낮은 제품군이기 때문에 DLSS 테스트는 성능(Performance) 모드에 한정해서 진행했습니다. 결과는 놀라웠는데요. RTX 3060 Ti FE가 RTX 2080 SUPER FE보다 약 6.7% 정도 높은 성능을 보여주었기 때문입니다. 최신 3세대 텐서 코어가 탑재되었다고는 하나, 384 vs. 152 대결에서 152가 이기는 그림은 신선해 보이네요. 결국 이런 결과들이 복잡하게 얽혀서 실제 게임에도 영향을 주기에 게임 성능에 대한 흥미가 조금 더 커집니다.






다음은 실시간 레이트레이싱 성능에 완전한 포커스를 맞춘 테스트, DirectX Raytracing feature test입니다. 포트로열이 실시간 레이트레이싱 옵션을 적용한 종합 게이밍 성능을 대변한다면, 본 테스트는 표현 그대로 실시간 레이트레이싱 성능에만 집중했다는 게 다릅니다. 따라서 아키텍처나 적용 기술에 따른 성능 격차가 클 수밖에 없는 테스트이기도 한데요. 포트로열 때와는 달리, 이번에는 RTX 3060 Ti FE가 RTX 2080 SUPER FE를 약 24% 수준 차이로 크게 따돌리면서 최신 아키텍처의 힘을 보여줍니다.







3DMark에서 마지막으로 테스트를 진행한 항목은 VRS(Variable-Rate Shading) 테스트입니다. 최신 게임들은 처리해야 할 데이터와 연산량이 기하급수적으로 늘어가고 있기에, 조금이라도 처리량을 줄이기 위한 방법을 연구하고 있습니다. 그 일환으로 나온 기술 중 하나가 VRS로, 화면을 구성하는 오브젝트 특성에 맞게 특정 오브젝트나 영역의 셰이딩 비율을 다르게 해서 성능을 끌어올리는 기술입니다. NVIDIA에서는 이미 이전 세대인 RTX 20 시리즈부터 VRS를 지원해왔고, 최근 출시한 라데온 RX 6000 시리즈 역시 VRS를 지원하고 있기에 앞으로 더 많은 게임에서 만나볼 수 있지 않을까 기대합니다.


VRS 테스트에서는 앞선 포트로열 테스트와 비슷하게 RTX 3060 Ti FE와 RTX 2080 SUPER FE 성능이 비슷하게 측정되었고, 근소하게나마 RTX 2080 SUPER FE 쪽이 우세에 있었습니다.






해당 그래프는 각 게임에서 RTX 2080 SUPER 성능(평균 FPS)을 100%로 두고, 나머지 그래픽카드 상대 성능을 계산해서 20종 게임 전체 평균값을 도출한 그래프입니다. 흔히 '깡성능'이라고 표현하는 기본 게임 성능에 대한 종합 성능 그래프인 셈이죠. 여기서는 제법 재미있는 결과가 펼쳐졌는데요. 앞서 3DMark 테스트에서는 RTX 3060 Ti FE가 일부 테스트에서 RTX 2080 SUPER FE와 대등하거나 소폭 떨어지는 모습을 보이기도 했지만, 각 해상도별 20종 게임 종합 성능 그래프에서는 6~7% 정도 앞서는 성능을 보여주었습니다. 게임 성능에 CPU도 크게 개입하는 FHD(1920x1080) 해상도에서는 일부 대등한 게임 성능을 얻는 경우도 있었지만, 많은 게임에서는 RTX 3060 Ti FE가 조금 더 우수한 게임 성능을 유지했습니다.


RTX 2080 SUPER FE는 출시 당시 $699라는 가격으로 등장했는데요. 이번 RTX 3060 Ti는 $399이기에 가격 측면으로는 RTX 2060 SUPER FE를 대체하는 포지션입니다. 그럼에도 불구하고 게임 성능은 RTX 2080 SUPER FE를 확실하게 누르고 있다는 점이 놀랍네요.







앞서 20종 게임에 대한 '깡성능'을 확인했으니, 이번에는 최신 기술인 실시간 레이트레이싱 성능을 알아보도록 합시다. 현시점에서는 실시간 레이트레이싱 기술 자체를 제공하는 게임이 거의 없는 게 현실이기는 합니다. 하지만 선두주자인 NVIDIA를 필두로 AMD 역시 레이트레이싱에 대한 지원을 위해 별도 처리 영역을 만드는 등 이제는 하나의 산업적인 흐름이 되었다고 봐도 무방해 보입니다. 차세대 콘솔들 역시도 실시간 레이트레이싱을 지원하고 있으니, 앞으로 다양한 게임에서 적용하지 않을까 싶네요.


RTX 3060 Ti FE는 실시간 레이트레이싱을 활성화한 상태에서도 역시나 RTX 2080 SUPER FE를 약 7% 정도 차이로 따돌리고 있습니다. 실시간 레이트레이싱을 활성화한 상태에서 비교하자면, 경쟁사 막내 제품인 라데온 RX 6800보다 근소하게 높은 게임 성능을 발휘하는 셈인데, DLSS를 결합하면 더 나은 게임 성능을 기대해볼 수 있겠네요.




그래서 RT+DLSS 게임 성능에 대한 종합 그래프도 준비해보았습니다. 제품명 우측에 RT ON으로 표기한 항목은 말 그대로 실시간 레이트레이싱만 활성화한 상태, RT + DLSS는 실시간 레이트레이싱과 DLSS 기술을 함께 활성화한 상태입니다. 라데온 RX 6000 시리즈는 레이트레이싱에 대한 처리는 가능하지만, DLSS는 적용할 수 없기에 적용 항목이 없다는 점 참고 바랍니다.


RTX 3070 FE 혹은 이보다 더 강력한 하이엔드 모델들은 현실적인 성능 타깃이 4K/UHD(3840x2160)을 향해 있지만, RTX 3060 Ti FE는 현실적인 여건을 고려했을 때 QHD가 적당해 보입니다. 그렇기에 DLSS와 함께 게임 성능을 최대로 끌어올릴 수 있다는 사실은 게이머 입장에서 제법 긍정적으로 볼 수 있는 요소가 아닐까 생각합니다.


물론 여러 매체나 커뮤니티를 통해서 DLSS가 장점만으로 무장한 기술이 아니라는 점이 지적되고 있지만, 그럼에도 불구하고 더 나은 성능으로 실시간 레이트레이싱을 적용한 게임을 즐길 수 있다는 사실 자체는 부정하기 어려운 카드입니다. AMD에서도 이를 인지하고 있는지 FidelityFX로 비슷한 기능을 추가하겠다는 계획을 세우고 있는 만큼, 차후 DLSS와 경쟁 기술을 비교해보는 시간을 가져볼 기회가 생길 수 있겠네요.




오버클록을 적용한 RTX 3060 Ti FE GPU-Z 사진


오버클록 잠재력도 빼놓을 수 없는 테스트 항목 중 하나인데요. 결과를 함께 확인하기에 앞서, 본 테스트는 퀘이사존에 입고된 1개 샘플을 이용한 오버클록 테스트임을 잊어선 안 됩니다. 하나의 샘플로 모든 테스트 결괏값을 대변할 수 없고, 제품마다 특성과 한계치가 달라질 수 있기 때문입니다. 이런 점을 잘 참고하시고 후술할 내용을 읽어주시기 바랍니다.


3DMark Stress Test와 QHD 해상도 게임을 반복 테스트한 결과, 안정적으로 달성 가능한 최고 오버클록 수치는 코어 오프셋 +75 MHz, 메모리 오프셋 +500 MHz(14 Gbps → 15 Gbps) 수준이었습니다. 오버클록 마진이 그다지 높다는 인상을 주진 못하는데요. 특히 메모리 오버클록은 기대치보다 다소 낮은 값에서 만족해야 했습니다. 전력 제한은 RTX 3060 Ti FE 기준, 기본 200W에서 최대 +10% 높아진 220W 수준까지 확장 가능합니다. 해당 기능과 더불어 커스텀 수랭이나 강력한 쿨링 대책을 강구할 수 있다면, 더 높은 실제 부스트 클록을 기대해볼 수 있겠습니다.





전력 제한 해제(+10%) 시 200W에서 220W 수준까지 전력량을 허용함을 알 수 있습니다.



오버클록을 적용 후 3DMark 그래픽 점수로 비교해보았습니다. 파이어스트라이크에서는 약 4.2% 상승한 31.6K를, 타임스파이에서는 약 5.7% 상승한 12.8K를, 포트로열에서는 약 5.4% 상승한 7.4K를 기록했습니다. 압도적으로 높은 수치 상승은 아니지만, 4~5% 정도 점수를 끌어올릴 수 있었습니다.





그렇다면 실제 게임에서는 어떨까요? 3DMark보다는 근소하게 낮아졌지만, 테스트를 진행한 3종 게임에 대해서는 약 4% 후반대로 성능이 높아짐을 확인할 수 있었습니다. 다만 전력 제한을 해제하거나 코어 클록/메모리 클록 등을 올리는 데 들어가는 수고나 안정화 과정 등을 고려한다면 크게 체감될 정도로 성능이 올라가는 수치는 아닙니다. 물론 언제나 판단은 여러분의 몫입니다. 여기서는 테스트를 통해 얻은 자료를 전달하는 정도이니, 추후 오버클록 성능을 확인하는 등 참고 정도로 여겨주시면 좋겠습니다.






메인스트림과 퍼포먼스 급 성능 경계에 위치했다고 볼 수 있는 RTX 3060 Ti FE와 이전 세대 하이엔드 라인업에 속했던 RTX 2080 SUPER를 QHD 환경에서 직접 비교해보았습니다. 20종 게임 평균 성능 차이는 앞선 그래프로 충분히 확인하셨으니, 세부 게임별 성능도 확인해볼 필요가 있겠죠. 눈치채신 분도 계실 텐데, 20종에 달하는 게임 중 1% 이내로 매우 근소한 차이를 보이는 게임은 단 2개뿐입니다. 나머지 18개 게임은 크고 작은 차이는 있을지언정, RTX 3060 Ti FE가 RTX 2080 SUPER FE를 확실하게 압도한다는 의미죠. 가장 큰 성능 차를 보인 게임은 갓폴, 가장 작은 성능 차(1% 이내 게임 제외)를 보인 게임은 메트로 엑소더스였습니다.






이번에는 RTX 3060 Ti FE와 60 라인업 상위 제품인 RTX 2060 SUPER FE를 비교해 보았습니다. 같은 MSRP를 지니고 있기도 하고, RTX 2060에서는 Ti 라인업이 없으니 사실상 대체 라인업이라고 볼 수 있겠네요. 같은 가격대로 출시하는 제품임에도 성능 차이는 꽤 크게 벌어졌음을 알 수 있는데요. QHD 해상도를 기준으로 두 그래픽카드 성능 차는 평균 40%를 살짝 넘고 있습니다. 가장 큰 성능 차를 보인 게임은 둠 이터널, 가장 작은 성능 차를 보인 게임은 어쌔신 크리드 발할라였습니다.




소비 전력 측정은 NVIDIA PCAT 설루션과 WATTMAN 장비 활용(기사 링크)





소비전력은 크게 두 가지 방법으로 측정을 진행했는데요. PCAT를 이용한 그래픽카드 단독 소비전력 측정과 WATTMAN을 이용한 시스템 전체 소비전력 측정으로 나누었습니다. RTX 3060 Ti FE는 TGP가 200W로, 그래픽카드 단독 소비전력을 확인해보면 RTX 30 시리즈는 평균 소비전력이 TGP를 잘 따라가는 모양새를 보여주었습니다. RTX 2080 SUPER FE는 TDP가 250W지만 이보다는 조금 낮은 소비전력 수치를 기록했네요. 사실상 RTX 3070 FE와 RTX 2080 SUPER FE가 비슷한 소비전력 수치를 보여준 셈인데, 하나의 테스트로 진행된 결과인 만큼 시스템 구성이나 게임에 따라서 양상은 얼마든지 바뀔 수 있다는 점 참고 바랍니다.


시스템 전체 소비전력에서는 조금 양상이 달라지는데요. RTX 3070 FE 시스템이 RTX 2080 SUPER FE 시스템보다 조금 더 높은 평균 소비전력 수치를 보여주었습니다. 이는 여러 가지 요인이 있을 수 있겠지만, RTX 3070 FE는 다른 대조군보다 한층 더 높은 성능을 발휘하는 만큼 CPU 자원 등을 조금 더 많이 사용할 수 있습니다. 이런 점이 소폭 높아진 시스템 소비전력으로 나타난 게 아닌가 생각이 드네요.


어쨌든 두 그래프를 통해 RTX 3060 Ti FE는 RTX 2080 SUPER FE보다 조금 더 높은 게임 성능을 발휘하면서 소비전력은 오히려 더 낮게 유지함을 확인할 수 있었습니다. 엔비디아에서 RTX 3060 Ti를 사용하기 위해 권장하는 파워서플라이 용량은 600W인데요. 대중적으로 많이 활용하는 500~600W급 파워서플라이로도 충분히 감당할 수 있는 수치이기에 추가적인 지출도 어느 정도 막을 수 있지 않을까 생각합니다.






TGP 220W인 RTX 3070 FE와 비교했을 때 TGP 200W인 RTX 3060 Ti FE는 온도가 소폭 낮습니다. 다만 그 차이가 2℃ 정도이므로 그리 큰 차이는 아닙니다. 이는 쿨링 설루션 메커니즘에 기인한다고 예상해볼 수 있습니다. 코어 온도 타깃을 약 70℃ 수준에 설정해놓고, 그에 맞춰 쿨링팬 RPM을 조절하는 형태로 말이죠. 따라서 온도 자체는 크게 차이가 없지만, 소음에서는 차이가 날 수 있죠. 이 부분은 후술할 소음 항목에서 조금 더 자세히 확인해보겠습니다.


아시다시피 이번 RTX 30 시리즈부터 유휴 상태에서 제로 팬(혹은 0dB 팬, 부하가 낮으면 쿨링팬 회전이 완전히 멈추는 기능) 기능이 작동합니다. 그래픽카드에 높은 부하가 걸리면 쿨링팬이 열심히 작동하다가, 유휴 상태를 지속해서 코어 온도가 약 32~33℃ 수준에 도달하면 쿨링팬이 작동을 멈춥니다. 쿨링팬이 작동하지 않으면서 점점 온도가 올라가는데, 그 이유로 유휴 상태 온도가 RTX 20 시리즈보다 높은 이유이기도 합니다.






소음 측정 장비: Cirrus CR-152A 소음측정기(기사 링크)




앞서 언급했듯이 소음 측정 결과는 RTX 3060 Ti FE가 RTX 3070 FE보다 확실히 조용합니다. 게임 성능이 비슷한 RTX 2080 SUPER FE와 비교하면 그 차이는 더욱더 벌어지는데요. RTX 3060 Ti FE는 RTX 2080 SUPER가 유휴 상태일 때보다도 더 조용한 풀로드 소음을 기록했습니다. 소음 면에서는 탁월한 모습을 보여주었네요. 또한, 제로 팬 기능 탑재로 웹 서핑 등 그래픽카드에 심한 부하가 걸리지 않는 상황에서는 더욱더 조용하게 사용할 수 있다는 점도 매력적입니다.


※ 온도 / 소음 항목 참고 사항

테스트 시스템, 게임, 해상도, 측정 시간, 드라이버, 테스트실 온도 등 테스트 환경이 같지 않기 때문에 지난 콘텐츠와는 온전히 비교하기 어려운 점 참고 바랍니다.







온도와 소음, 소비전력을 측정하면서 부스트 클록에 대한 정보도 함께 확인해보았습니다. RTX 3060 Ti FE는 표기상 부스트 클록이 1,665 MHz지만, NVIDIA 그래픽카드는 보장 부스트 클록을 표기하는 경향이 있다는 점을 기억할 필요가 있습니다. 그래서 실제로는 평균 1,959.7 MHz로 작동하는 걸 확인할 수 있었습니다. 최대 부스트 클록이 2,000 MHz에 근접하고 있기에 상당히 높은 편이네요. 여기에 오버클록을 적용하면 평균 2,055.8 MHz로 꾸준히 클록을 유지했습니다. 본 테스트에서는 최대 2,100 MHz 수준까지 도달하지 못한 게 못내 아쉽네요. 하지만 기본적인 부스트 클록이 꽤 높게 형성되기에, 향후 출시할 비레퍼런스 제품군에서는 높은 부스트 클록을 유지하는 제품을 기대해볼 수 있겠습니다.







앞서 다양한 테스트 결과와 성능을 확인해보았습니다. 이런 결과들을 종합해서 두 가지 그래프를 만들어 보았는데요. 먼저 소개해드릴 그래프는 흔히 전성비라고 부르는 전력 대비 성능 그래프입니다. 이전 RTX 3070 벤치마크 칼럼에서는 RTX 3070 FE가 높은 와트당 성능비를 보여주면서 많은 인기를 누리지 않을까 예상했는데요. RTX 3060 Ti FE 역시 TGP는 10% 낮아진 200W 수준이고 게임 성능도 평균 10% 정도 벌어졌기에 비슷한 전성비를 보이지 않을까 했는데, 예상대로 비슷한 전성비를 보여주었습니다. 소수점까지 따져본다면 매우 근소한 차이로 조금 더 높은 전성비를 보여주었네요.


RTX 3060 Ti FE는 RTX 3070 FE가 지녔던 장점을 고스란히 가져왔습니다. 기존 세대보다 미세화된 공정, 개선된 아키텍처, 반도체 수율 등 여러 가지 요인이 섞인 결과겠지만, 이전 세대 하이엔드 모델과 동급 성능을 발휘하면서 소비전력은 더 낮기에 충분히 납득이 되는 결과가 아닐까 하네요. 단, 콜 오브 듀티: 블랙 옵스 콜드 워 단일 게임과 샘플 1개씩을 이용한 테스트 결과이기 때문에 모든 제품 및 게임을 대변하는 수치가 아니라는 점은 꼭 참고해주시기 바랍니다.






두 번째로 소개해드릴 그래프는 달러당 성능입니다. 국내가가 확정되지 않은 상황이기에 MSRP를 기준으로 했으며, 20종 게임 성능을 백분율로 환산한 평균값을 기반으로 결과를 도출했습니다. 이 그래프에서는 RTX 3060 Ti FE가 당당히 1위를 차지했는데요. $399에 해당하는 제품이 RTX 2080 SUPER FE를 앞서는 성능을 보여주었으니 납득이 가는 결과가 아닐까 하네요. 반면 이전 세대 최상위 제품이었던 RTX 2080 Ti FE는 달러당 성능비 그래프에서 가장 낮은 점수를 기록했는데요. $1,199 가격임에도 새로이 등장한 RTX 3070 FE에 근접하는 성능을 보여주었기에 새삼 세대교체를 알리는 지표가 아닐까 생각이 듭니다.








퀘이사존 지포스 RTX 3060 Ti 벤치마크 최종 요약



■ 새로이 부활한 60 Ti 라인업, 성능은 굉장했다

  → NVIDIA에서 마지막으로 정식 출시했던 60 Ti 라인업은 GTX 660 Ti가 마지막이다. 그간 60 라인업에 Ti가 다시 등장하느냐 하지 않느냐 문제로 말이 많았지만, 일부 OEM 제품을 제외하면 모습을 잘 드러내지 않았다. 이번 세대에서 새롭게 등장한 RTX 3060 Ti는 GA104 기반 칩을 사용했으며, RTX 3070과 비교하면 CUDA 코어가 1,024개 줄어든 4,864 CUDA가 탑재되었다. RTX 30 시리즈에 들어오면서부터는 CUDA 수 = 성능 공식이 완벽히 매칭되진 않고 있다. 하지만 RTX 3060 Ti FE는 20종 게임 테스트에서 RTX 2080 SUPER FE보다 평균 약 6.6% 나은 성능을 확실하게 보여주었다(QHD 기준). 라인업 상으로는 중간쯤에 위치하겠지만 이전 세대 하이엔드 모델을 잡았기에 성능 효율이 꽤 높은 편이라고 할 수 있다.



■ FHD/QHD 해상도에서 빛을 발하다

  → 최근 NVIDIA와 AMD 양사에서 새로운 그래픽카드를 연달아 출시하는 상황이다. 그런데 양사 모두 하이엔드 그래픽카드 라인업을 먼저 소개하면서 4K 게이밍을 강조하는 양상을 띠었다. 문제는 4K/UHD 모니터나 게임 환경은 여전히 대중화가 되지 않았다는 점. 대다수 게이머는 여전히 1080p 해상도를 활용하는 사례가 많기에 중간 라인업에 대한 요구치가 높아질 수밖에 없었다. RTX 3060 Ti는 이러한 수요층을 충분히 만족하게 해줄 수 있는 제품으로 보인다. 이전 하이엔드 제품군은 FHD(1920x1080) 및 QHD(2560x1440) 해상도에서 활용하기에 오버 스펙이라는 인상을 강하게 주었다면, RTX 3070에 이어 RTX 3060 Ti 역시 상대적으로 낮은 해상도에서 최적 성능을 기대해볼 수 있게 되었다. 물론 FHD/QHD라고 해도 360Hz 모니터 사용 등을 고려한다면 여전히 하이엔드 그래픽카드가 필요하겠지만, 일반적인 목적에서 게임을 즐기는 유저라면 충분히 만족할 수 있지 않을까. 특히 최신 게임은 실시간 레이트레이싱과 같이 화질 대비 성능을 크게 떨어트리는 경우도 많은데, 강화된 RT코어와 텐서코어를 내장하고 있는 만큼 무난한 게임 플레이가 가능하리라 기대해볼 수 있다. 4K/UHD에서는 상대적으로 하이엔드 모델보다 성능이 저하되기는 하나, 적절한 옵션 타협이 가미된다면 싱글 플레이 게임은 무난하게 즐길 수 있을 듯.



■ 200W TGP, 그리고 $399로 달성한 놀라운 달러당 성능

  → RTX 3060 Ti는 TGP가 200W로 설정된 제품군이다. RTX 3070의 TGP가 220W였으므로 약 10%가 낮아진 셈인데, 실제 성능도 약 10% 낮아진 점을 고려하면 납득이 된다. 파운더스 에디션 제품을 기준으로 최대 전력 제한은 220W(10%)까지 해제할 수 있다는 점은 참고할 부분. 실제로 그래픽카드 소비전력만을 위한 PCAT 측정에서 RTX 3060 Ti FE는 평균 200W 수준을 보여주었는데, RTX 30 시리즈에 와서는 TGP를 실제 소비전력으로 받아들여도 큰 문제가 되지 않을 듯. 시스템 전체 소비전력으로 보더라도 평균 325.7W 수준을 기록했기에, 일반적으로 많이 활용하는 500~600W급 파워서플라이로도 충분히 안정적인 활용이 가능하지 않을까 기대된다. 또한, RTX 3060 Ti는 MSRP가 $399로 설정되어 있다는 점도 매력적이다. RTX 2080 SUPER FE가 $699로 나왔다는 점을 고려한다면, 가격은 약 43% 감소하면서 성능은 오히려 우세에 있기에 달러당 성능 그래프에서도 매우 인상적인 양상이 그려졌다.



■ 기본에는 충실하다, 하지만 매우 높은 오버클록은 어려울 수 있다

  → RTX 3060 Ti FE 모델은 퀘이사존에서 자체적으로 측정한 부스트 클록이 평균 1,959.7 MHz를 기록했다. 이는 스펙 표기 부스트 클록인 1,665 MHz보다 약 295 MHz 정도 높은 수치인데, NVIDIA에서는 정책상 표기 부스트 클록을 보장 부스트 클록에 가깝게 표기하기에 실제 작동 클록은 더 높게 잡힌다. 다만, 퀘이사존에 입고된 샘플에 한해서는 오버클록 잠재력이 높다고 보기는 어려웠다. 코어 오프셋 +75 MHz, 메모리 오프셋 +500 MHz가 안정화할 수 있는 한계선이었는데, 매우 높은 잠재력을 지녔다고 보기는 어려웠다.



■ RTX 3060 Ti, 어떤 사람에게 추천할 수 있을까?

  → RTX 3060 Ti FE는 차기 메인스트림 라인업 제품을 기다리던 사람에겐 단비 같은 존재가 아닐까 한다. 그래픽카드를 제조사는 NVIDIA/AMD 모두 최근에는 하이엔드 제품군만 출시해 왔기 때문이다. RTX 3070 FE와 라데온 RX 6800은 최상위 라인업과 비교했을 때 상대적으로 저렴하기는 하지만, 일반 유저가 구매하기에는 여전히 부담되는 가격대이다. 그렇기에 $399라는 MSRP를 달고 출격하는 RTX 3060 Ti는 반가운 존재일 수 있다. 수 세대 이전 그래픽카드를 사용하는 등 업그레이드 시기를 노리고 있는데, 주력으로 활용하는 해상도가 FHD/QHD 수준이라면 값비싼 하이엔드 제품군보다는 RTX 3060 Ti가 현실적인 대안이 될 수 있다. 단, 최근 대작 게임이 연이어 출시 및 출시 예정인 덕분인지 그래픽카드 시장이 시끄러운 상황이라는 점을 고려할 필요는 있다. 퀘이사존을 비롯한 각종 커뮤니티에서는 유저들끼리 일명 '좌표'라 부르는 구매 링크를 공유하는 등 그래픽카드 구하기가 어려운 실정인데, 그래픽카드 가격도 이런 양상에 맞춰서 함께 비싸지기 마련. RTX 3060 Ti 제품군이 초기 물량을 얼마나 확보할지가 가격 안정화의 핵심 열쇠가 되지 않을까. 안정적인 가격에만 출시할 수 있다면 매력적인 제품이 되지 않을까 생각한다.





우리의 벤치마크는 계속될 것이다

늘 그랬듯이






퀘이사존 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.​

※ 본 칼럼에 쓰인 RTX 3060 Ti 파운더스 에디션은 엔비디아로부터 제공 받았습니다.


댓글: 159

신고하기

신고대상


신고사유

투표 참여자 보기