퀘이사존 지포스 RTX 3090 벤치마크 - 게임 성능 집중 해부

만 개가 넘는 CUDA 코어, 그리고 24GB GDDR6X 메모리

QM벤치
184 23298 2020.09.24 21:16






퀘이사존 지포스 RTX 3090 벤치마크

암페어 기반 '지포스' 브랜드 정점 그리고 GDDR6X 24GB



안녕하세요. QM벤치입니다.


엔비디아가 암페어(Ampere) 아키텍처 기반 최초의 지포스(GeForce) 그래픽카드, RTX 3080을 출시하였습니다. '예상'보다 저렴한 가격에 역대급 성능 향상도 인기 요소지만, 무엇보다 MSRP(Manufacturer’s Suggested Retail Price, 권장소비자가) 대비 국내 가격 이슈가 크게 터지면서 퀘이사존은 물론 하드웨어 업계 전반이 들썩이고 있습니다. 혹자는 '도대체 RTX 3080이 뭐길래 이 난리지?'라고 생각할 수도 있습니다. 그러나 여기서 논점은 RTX 3080이 아닙니다. 현재 상황과 현상은 그동안 하드웨어를 사랑하는 수많은 유저분들 마음속에 잠재된 국내 가격에 대한 불만 그리고 수요 심리(지포스 20 시리즈 가성비가 구렸던 것도 한 몫)가 RTX 3080을 시발점으로 폭발했다고 해석하는 게 더 정확한 상황 판단일 겁니다. 좋은 제품이 좋은 가격에 책정되는 것과 별개로 국내 가격을 걱정해야 하는 작금의 현실이 너무나 불합리하게 느껴지는 것이죠. 그리고 조금씩이지만 변화의 조짐이 생겨나고 있습니다. 실제로 일부 유통사에서는 터무니 없는 가격으로 형성되지 않도록 가격 정책과 유통에 대한 자사 입장을 명확하게 못박기도 하였으니까요.


저 역시 하드웨어 마니아로서 그리고 여러분과 같은 컴덕후로서 이런 변화가 가뭄에 단비처럼 반갑게 느껴집니다. 물론 MSRP에 단순 환율 적용 가격을 무턱대로 바라는 것은 결코 아닙니다. 현실적으로 어렵다는 것도 잘 알고요. 많은 분들이 이야기하시는 것처럼 대한민국은 시장 규모 자체가 작고, 또 규모가 작기 때문에 마치 연쇄효과처럼 부대비용은 더욱 커질 수밖에 없습니다. 그런데 소비자들이 이걸 몰라서 불만이 쌓였던 것이 아닙니다. 결국 해도 해도 너무한다는 느낌이 마치 내보내지 못하는 숙변처럼 체내에 쌓이다가 임계점을 돌파하고 말았습니다. 그리고 그 중심에 엔비디아 지포스가 있었습니다.


2018년 9월에 등장한 RTX 2080은 파운더스 에디션(Founders Edition, 이하 FE) 버전이 $799, 일반 모델은 $699 가격으로 나왔습니다. 그러나 2017년 $699로 출시된 GTX 1080 Ti와 큰 성능 차이가 없었죠. 엔비디아는 RTX(실시간 레이트레이싱 게이밍과 DLSS 등 새로운 기술적 특징을 통칭하는 말)를 강조하며, 게이머들을 설득했지만 소위 '깡성능'은 가격 대비 실망스러웠습니다. 여기에 더해 RTX 2080 Ti는 싱글 GPU 기반 지포스 최초로 $1,000를 넘기며 FE 버전 가격이 무려 $1,199에 달했습니다. 자연스럽게 적지 않은 유저들이 GTX 1080 Ti로 존버(X나 버티다 줄임말, 참고 때를 기다린다는 의미)의사를 밝히고 또 실제로 지포스 20 시리즈의 인기와 판매량은 10 시리즈에 비해 높지 않았습니다. 여기에 더해 AMD 라데온은 위협적인 존재가 되지 못하면서, 그래픽카드 잠재 수요층 규모는 점점 확대된 상태였습니다. 이런 상황에서 우리는 매력적인 성능과 가격을 갖춘 RTX 3080을 맞이하게 되었던 것이죠. 그리고 이제 RTX 3080을 넘어 진정한 플래그십(Flagship) 모델, RTX 3090의 시간이 왔습니다.






▲ 암페어 아키텍처 기반 최강 지포스, RTX 3090


지포스 RTX 3090 24GB. 우리는 이미 지포스 스페셜 이벤트를 통해 가격을 알고 있습니다. US $1,499! 실로 범접하기 힘든 가격입니다. 그동안 듀얼 GPU에나 사용하던 90 넘버를 부활(사실상 제조사 차원 SLI 게임 지원은 이제 몰락의 길을 걷고 있습니다, 더불어 듀얼 GPU 그래픽카드도 함께 몰락했다는 것을 상징)시키고, 풀칩에 가까운 GPU 그리고 24GB GDDR6X VRAM, 350W TGP 등 스펙에서도 규모를 달리하고 있죠. 다만 CUDA 코어만 보면 RTX 3080과 고작 20.6% 차이(10,496/8,704)입니다. 굳이 '고작'으로 표현한 이유는 지포스 20 시리즈에서 RTX 2080 Ti와 RTX 2080의 차이는 무려 47.8%(4,352/2,944)에 달했기 때문이죠. RTX 2080 Ti가 RTX 2080 대비 약 25~30% 좋은 성능이기에, RTX 3090은 RTX 3080 대비 절반 수준 성능 향상일 거라고 추측이 가능한 부분입니다.



▲ TITAN RTX와 비교한 RTX 3090 주요 성능 지표


다만 이런 숫자 싸움 외에 RTX 3090이 확실히 '고급형' 모델이라는 단서는 여기저기서 찾을 수 있는데요. 풀칩(모든 유닛이 활성화된 완전한 GPU)은 아니지만 온전하게 384-bit 메모리 인터페이스를 갖추고, ROPs 역시 112개로 풀스펙 요소가 많다는 것입니다. RTX 2080 Ti는 384-bit가 아닌 잘려나간 352-bit였고, ROPs나 기타 유닛 대부분이 풀스펙 구성이 아닌 것과 대비됩니다. 덕분에 풀칩/풀스펙 TITAN RTX가 나오기도 했고요. 이런 특징을 종합해보면 RTX 3090은 절대적인 최고 성능과 풍요로운 스펙을 탐내는 소비자가 타깃일 것입니다. 프리미엄 성격이 아주 짙은 제품인 것이죠. 당연히 가성비와는 매우 멀어집니다.


▲ 위: RTX 3090 FE 24GB, 아래: RTX 3080 FE 10GB


외형 면에서도 RTX 3090 FE는 RTX 3080 FE 대비 덩치가 매우 커졌습니다. TGP는 30W 상승하였지만, 3슬롯을 차지하는 부피와 31.3 cm 길이를 가진 대형 히트싱크를 탑재하였습니다. 이로 인해 전체 발열량은 높아졌으나, 더욱 강력해진 쿨링 능력에 힘입어 GPU 온도는 더 낮을 것으로 예상합니다.



▲ 위: RTX 3080 FE 10GB, 아래: RTX 3090 FE 24GB


이렇게 두 그래픽카드를 포개어 놓고 보면, 크기 차이 체감이 더 쉽습니다. 젠슨 황 회장이 RTX 3090을 소개하며 언급한 BFGPU(Big Ferocious GPU) 단어가 떠오르는군요. 크고 사나운 GPU라는 뜻이지만 실은 유명한 FPS 프랜차이즈, 둠(DOOM) 시리즈에 등장하는 크고 아름다운 무기 BFG 9000(Big Fxxking Gun 9000)을 오마주한 것으로 보입니다. 과거 엔비디아는 BFGD(Big Format Gaming Displays)에서도 BF 단어를 사용한 바 있죠. 물론 B와 F의 본 뜻을 엔비디아는 다르게 설명하고 있지만, 진정한 의도는 Big Fxxing 밈을 연상시키려는 것으로 추정합니다.






▲ RTX 3090 FE 24GB 및 주요 그래픽카드 상세 스펙


지포스 RTX 3090 FE 상세 스펙입니다. 이번 FE 버전은 엔비디아가 심혈을 기울여 만든 고성능 쿨링 설루션과 독특한 PCB 레이아웃을 가지고 있다는 것을 제외하면, 스펙과 MSRP에서 일반 모델과 차이점은 없습니다. 전 세대 지포스 20 시리즈가 부스트 클록/TDP/가격까지 일반 모델과 FE 버전에 차이를 두었기 때문에 이는 큰 변화입니다. GPU는 삼성 8 나노(8N NVIDIA Custom) 공정으로 탄생한 코드명 GA102-300-A1을 탑재하고 있습니다. CUDA 코어는 10,496개로 1만 개를 돌파하였으며, 112 ROPs, 328 TMUs 등 크고 아름다운 규모를 자랑합니다. RTX 3080과 비교했을 때 비교적 중요한 차이라면 메모리 용량이 2.4배인 GDDR6X 24GB를 탑재하고, 메모리 인터페이스가 384-bit인 부분입니다. 이로 인해 메모리 용량이 중요한 작업 환경이나 크리에이터에게 확실한 이점을 제공하고 메모리 대역폭은 무려 1TB/s에 근접합니다.



▲ GA102-300-A1 블록 다이어그램(비활성화를 뜻하는 빨간색 영역은 임의 지정)


RTX 3090에 탑재된 GA102 GPU 블록 다이어그램입니다. SM 2개로 구성된 TPC 1개만 비활성화되었습니다. 따라서 상위 모델 출시 가능성은 쉽게 예측할 수 없습니다. 풀칩 구성 TITAN이 나올 수 있는 그림이기는 하나, RTX 3090이 약 98% 수준의 CUDA 코어를 갖추고 있어 일반적인 게임 성능 차이는 극히 미미할 것입니다. 그러나 기존 TITAN Xp/TITAN RTX와 같이  쿼드로(Quadro) 계열 특유의 작업 성능을 개방하여 암페어 아키텍처 기반 TITAN에 적용한다면 TITAN 시리즈 고유 성능적 가치는 확보할 수 있습니다. 






▲ 퀘이사존 지포스 RTX 3090 벤치마크 시스템 사양


RTX 3090은 RTX 3080을 넘어 현존 최강 게이밍 성능을 보여줄 것임이 분명하기에 벤치마크 시스템 역시 CPU 병목현상을 최소화할 수 있도록 구성하였습니다. 이전 RTX 3080 벤치마크에서 입증한 바와 같이 비록 PCIe 4.0을 지원하지 못하고 PCIe 3.0에 머무르고 있긴 하나, 최강 게이밍 CPU인 인텔 코어 i9-10900K OC 5.0 GHz 설정입니다. 각 그래픽카드 성능 편차를 가늠함에 있어 이상적인 시스템입니다. 그럼에도 불구하고 FHD 급 해상도에서는 CPU 드로콜(drawcall) 병목 현상으로 각 그래픽카드 성능 차이가 줄어드는 걸 피할 수 없을 것입니다. 이를 감안하여 고급형 그래픽카드 성능 벤치마크는 4K/UHD 해상도를 중점적으로 참고하는 것이 좋습니다. 이것은 RTX 3090/RTX 3080에 국한된 문제가 아니며, 저해상도 환경에서 CPU/메모리 병목현상이 주원인이기 때문에, 기존 그래픽카드 세대 대비 성능이 뛰어난 향후 출시될 그래픽카드 모두에게 적용됩니다.


RTX 3090과 RTX 3080은 새롭게 업데이트된 456.38 드라이버를 설치하여 전체 게임에 대한 재테스트를 실시하였습니다. 이전 세대 그래픽카드는 RTX 3080 벤치마크 당시 얻어낸 456.16 버전 데이터를 그대로 활용합니다. 단, 배틀그라운드와 오버워치 그리고 호라이즌 제로 던은 업데이트 패치가 이루어져 전체 그래픽카드를 모두 새롭게 테스트한 데이터를 반영하였습니다.





인텔공인대리점: 인텔 코어 i9-10900K 어벤져스 에디션(기사 링크)


게임이 포함되어 있지 않은 인텔 코어 i9-10900K 어벤져스 에디션입니다. 사실 냉정하게 말하면 단순히 패키지 껍데기가 바뀐 수준으로 볼 수도 있겠지만, 마블 코믹스를 좋아하는 분들이라면 구미가 당길 수 있는 매력적인 컬래버레이션 제품이죠. 자세한 내용은 QM슈아의 퀘이사리포트를 참고해 주시기 바랍니다.


인텍앤컴퍼니: ASUS ROG MAXIMUS XII APEX 인텍앤컴퍼니(기사 링크)


ROG 그리고 APEX. 마법의 조합과도 같은 두 단어입니다. 특히나 메모리 오버클록에 있어서는 기능성과 성능을 이미 입증한 제품이기도 하고요. 실제로 퀘이사존 자체 테스트 결과 메모리 오버에서 최고 클록을 뽑아냄에 있어 이 녀석을 능가하는 제품은 아직 경험해보지 못했습니다. 퀘이사존 기사를 놓쳤던 분들은 링크를 통해 확인해 보시기 바랍니다.



서린씨앤아이: G.SKILL TRIDENT Z ROYAL DDR4-3,200 CL14 16GB x2(기사 링크)


일명 보석 메모리로 통하는 지스킬 트라이던트 Z 로열 시리즈. 이제는 모르는 분들을 찾기 힘들 정도로 유명한 제품입니다. 최초 해당 제품이 등장했을 때는 특유의 고급스러운 디자인에 녹아든 화려한 보석 RGB LED가 충격적이기까지 했죠. QM슈아의 가장 최신 트라이던트 Z 로열 칼럼을 통해 성능과 외형의 진면목을 확인해 보시기 바랍니다.


서린씨앤아이: PATRIOT VIPER VPN100 M.2 NVMe 2TB(기사 링크)


벤치마크 시스템은 수십종 게임을 한꺼번에 테스트해야 하기 때문에, 고용량 SSD는 필수입니다.(특히 콜옵 이 xxx) 그래서 준비한 SSD가 바로 PATRIOT 바이퍼 게이밍(VIPER GAMING) 저장장치, VPN100 NVMe 2TB 모델입니다. 용량도 용량이지만, 알루미늄 방열판을 기본 장착하고 있다는 점에서 발열로 인한 스로틀링 걱정을 한시름 놓게 됩니다. 또한, 해당 제품은 QM달려가 냉철한 시각으로 분석한 칼럼도 등록되었으니 참고해 주시기 바랍니다.






▲ RTX 3090 벤치마크에 동원된 게임 목록


이번 RTX 3090 벤치마크는 3D 게임 성능을 다방면으로 알아보기 위해 게임 타이틀 역시 수십 종으로 구성하였습니다. 소위 '깡성능'을 측정하기 위해 20종 게임을, 레이트레이싱(Ray Tracing)과 DLSS(Deep Learning Super Sampling)로 대표되는 RTX 게임 성능 측정을 위해 5종 게임을 마련하였습니다. 깡성능 테스트를 위한 게임들은 그래픽카드 성능 벤치마크로 상징성이 높은 게임 타이틀, 게이머들에게 인기가 높은 게임, GPU 최적화가 좋은 게임 등 다양한 기준을 통해 선정한 결과입니다. 덕분에 렌더링 API 종류도 다양성을 띠게 되었습니다. 기본적으로 3종 해상도(FHD/QHD/UHD) 조건에서 테스트를 진행하며, RTX 게임 성능은 기술 구현에 따른 성능 변화 파악에 우선순위를 두어 4K/UHD 해상도 한정으로 테스트를 진행하였습니다.



▲ RTX 3090 FE 시스템 장착샷(퀘이사존 연출 이미지로 벤치마크 사양과 관계 없음)




※ 아래 내용부터는 벤치마크 테스트 결과로 이어집니다.

항목별 구체적인 테스트 결괏값은 세부 페이지에서 확인해 주세요.






RTX 3090은 과연 50K를 달성할 수 있을까? 아쉽지만 49K로 나왔습니다. RTX 2080 Ti FE와 비교하면 약 38% 높고, RTX 3080 FE와 비교 시 약 10% 높은 점수입니다. 이  차이를 그대로 게임 성능 차이로 해석해도 될까요? 아닙니다. 사실 파스 기본 프리셋 성능은 하이엔드 그래픽카드 평균 성능이 크게 발전한 현시점에서 정확성이 점점 떨어질 수밖에 없습니다. RTX 3090이 아닌 RTX 3080만 해도 수백 FPS를 내어주기 때문에 GPU 본연의 성능을 최대한 쥐어짜기 힘들기 때문이죠. CPU(IPC 외에도 코어/스레드/캐시 변수까지)와 메모리 기타 부품 구성 요소, 모니터 해상도에 따라 수백에서 수천에 이르는 점수 차이가 발생할 수 있습니다. 실제로 테스트 시스템에 탑재된 i9-10900K 10C/20T 스레드 구성을 바이오스에서 4C/8T 구성으로 다이어트하면, 많은 스레드가 필요하지 않은 파스 특성상 오히려 스레드 운용 최적화 효과로 수백 점에 달하는 점수가 향상되기도 합니다.







DX12 API 기반 게임 성능을 대변하는 3DMark Time Spy 일명 '타스' 점수입니다. 20.4K로 측정되었습니다. RTX 2080 Ti FE와 비교 시 약 42%, RTX 3080 FE와 비교 시 약 12% 높은 성능입니다. 파스 대비 점수 차이가 커졌습니다. 최소 두 가지 원인을 꼽을 수 있는데요. 첫 번째는 파스 대비 GPU 연산량이 높아(=최종 렌더링 FPS가 더 낮음) 그래픽카드 본연의 성능 편차를 더 잘 드러낼 수 있고, 두 번째는 API가 달라져 아키텍처에 따른 성능 효율이 달라지는 것입니다. 물론 3DMark 역시 수많은 3D 프로그램 중 하나에 불과하기 때문에 모든 DX12 게임 성능을 대변할 수는 없습니다. 어디까지나 많은 이들이 사용하는 기준 툴로써 상호 간 성능 비교가 용이하다는 것에 가치가 있습니다.







타스 기본 설정 외에도 DX12 API + 4K/UHD 해상도 성능을 측정하는 3DMark Time Spy Extreme를 테스트에 포함하였습니다. RTX 3080 벤치마크 당시 RTX 3090은 1만 점을 넘길 것으로 예상한 바 있었는데, 역시 1만 점을 달성하였습니다.







마이크로소프트 DirectX Raytracing, 줄여서 DXR입니다. DXR은 DX12 API 확장 기능으로써 실시간 레이트레이싱 연산을 위한 윈도우 10 표준이기도 합니다. 3DMark Port Royal은 DXR로 레이트레이싱을 구현하며, RTX 지포스 그래픽카드의 실시간 레이트레이싱 연산 능력을 측정할 수 있습니다. 성능 측정은 2종 옵션으로 나누어 진행하였는데요. 첫 번째는 기본 설정 점수이고 두 번째는 레이트레이싱 관련 옵션 비활성화 시 점수입니다. 점수 차이가 작을수록 레이트레이싱 연산 부담이 작다는 뜻이고 동시에 실시간 레이트레이싱을 염두에 둔 미래지향적 아키텍처라는 뜻도 가집니다.


RTX 3090 FE 포트로열 점수는 13K를 돌파하며, 단연 최강 성능을 입증합니다. RTX 2080 Ti FE 대비 약 51%, RTX 3080 FE 대비 약 14% 높은 점수입니다. 다른 3DMark 측정 툴과 비교하여 가장 극적인 성능 차이를 보여줍니다. 옵션에 따른 성능 차이를 살펴보면 아키텍처에 따라 그 양상이 확연히 달라지는데요. 아래 그래프를 통해 좀 더 명확히 파악할 수 있습니다.




위 그래프는 레이트레이싱 옵션 해제 시 점수를 레이트레이싱 옵션 적용 시 점수로 나눴을 때 백분율 수치를 정리한 것입니다. 퍼센티지가 높을수록 레이트레이싱 옵션에 대한 부담이 작다는 것을 의미합니다. RTX 3090과 RTX 3080은 약 94%를 기록하였고 튜링 아키텍처 기반 모델들은 이보다 살짝 낮은 효율을 기록합니다. 그리고 파스칼 아키텍처 기반 GTX 1080 Ti는 실시간 레이트레이싱 연산을 위한 전용 RT 코어가 없어 효율이 급격하게 낮아집니다. 다만 포트로열 렌더링 씬 자체가 레이트레이싱으로만 도배된 것은 아니기 때문에, 해당 수치 자체를 순수 연산 효율로 해석할 수는 없습니다.








다음은 RTX 핵심 기술 중 하나인 DLSS 성능 테스트입니다. 3DMark에서는 DLSS 기능 테스트를 위해 DLSS 적용 유무에 따른 성능 차이를 보여주는데요. 본 벤치마크는 4K 해상도를 기준으로 합니다. RTX 30 시리즈 출시에 맞춰 DLSS 2.0 업데이트가 적용되었으며, Performance/Quality 옵션에 따른 성능 향상을 살펴볼 수 있습니다.







해당 그래프는 각 게임에서 RTX 2080 Ti FE 성능(평균 FPS)을 100% 두었을 때, 나머지 그래픽카드 상대 성능을 계산하고 이를 20종 게임으로 확장하여 평균값을 도출한 그래프입니다. RTX 게임 성능을 제외했기 '깡성능'으로 이해하시면 됩니다. 결과를 보면 최상위 성능을 가진 그래픽카드답게 해상도가 높아질수록 상대 성능 격차가 큰 폭으로 벌어집니다. 테스트 시스템에 장착된 CPU가 무려 i9-10900K OC 5.0 GHz 설정임에도 불구하고 말이죠. 반대로 말해서 중저사양 CPU를 장착하면 FHD/QHD 해상도 환경에서는 성능 격차가 더 줄어들 것입니다.


4K/UHD 해상도 기준으로 RTX 2080 Ti FE 대비 평균 150.1% 성능을 달성하였습니다. 간단하게 표현하면 RTX 3090은 RTX 2080 Ti의 약 1.5배 게임 성능을 가졌습니다. 반면 RTX 3080과 비교하면 약 13% 뛰어난 수준으로 그 차이가 크지 않습니다. 물론 RTX 3080은 VRAM 용량에서 큰 열세를 보이기 때문에 근본적인 한계는 존재합니다.








※  8K 디스플레이를 확보하지 못해, 엔비디아 제어판 '사용자 정의 해상도' 기능을 통해 8K/QUHD(7680x4320) 해상도 활성화로 네이티브 8K 테스트를 진행하였습니다. 엔비디아 DSR(Dynamic Super Resolution) 역시 방법이 될 수 있으나, DSR은 네이티브 렌더링 대비 스케일링 과정에서 발생하는 성능 저하(엔비디아 다운스케일 필터링)가 더 크기 때문에 8K 게이밍 테스트 방법론으로 적합하지 않습니다.


새로운 세대 그래픽카드가 등장한 만큼, 절대적인 성능 향상이 큰 폭으로 상승했고 RTX 3090의 대용량 VRAM 이점으로 8K 게이밍 역시 가능합니다. 다만 8K/QUHD(7680x4320) 해상도는 4K/UHD(3840x2160) 대비 4배, FHD(1920x1080) 대비 16배에 달하는 픽셀을 그려야 하는 초고해상도 영역이기에 아무리 RTX 3090 성능이 뛰어나다고 해도 네이티브 8K(DLSS 또는 기타 업스케일 기술을 제외한 순수 8K 렌더링) 게이밍은 결코 쉽지 않습니다.


8K 게이밍을 위해 총 8종 게임을 테스트하였는데요. 이 중 데스 스트랜딩과 섀도 오브 더 툼레이더는 엔비디아 DLSS 기술을 적용하였습니다. 나머지 6종 게임은 네이티브 8K로 구동하였습니다. 다만 네이티브 8K 해상도는 일부 게임을 제외하고 옵션 타협이 필수였습니다. 네이티브 8K 게이밍에서 인상적이었던 요소를 꼽는다면, 엄청난 GPU 최적화로 유명한 둠 이터널은 악몽 프리셋 옵션(차상위 옵션)에서 무려 50 FPS를 달성하였고, 배틀그라운드는 소위 '국민옵션'을 통해 60 FPS를 달성하였습니다. 마지막으로 엑스박스 게임, 포르자 호라이즌 4는 매우 높음 프리셋에서 평균 60 FPS를 달성하는 기염을 토했습니다.


8K DLSS 게임은 단연 데스 스트랜딩이 놀라운 성과를 보여줍니다. 데스 스트랜딩은 현재 리뷰어 한정으로 베타 버전 적용 시 울트라 퍼포먼스(Ultra Performance) DLSS 옵션을 사용할 수 있는데요. 해당 옵션 적용 시 8K DLSS 환경에서 무려 70 FPS를 훌쩍 넘는 성능을 기록합니다. DLSS의 가능성과 가치를 유감없이 발휘하는군요. 사실 초기 DLSS는 네이티브 해상도에 비해 텍스처 선명도 오브젝트 뭉개짐 등이 체감될 정도였으나, 데스 스트랜딩과 같이 DLSS 2.0 이후 버전이 적용된 게임에서는 네이티브 해상도가 크게 부럽지 않은 수준까지 화질을 끌어올렸기 때문에 앞으로가 더 기대되는 기술입니다. 더 많은 게임 타이틀에 적극적으로 적용되길 바랍니다.




이렇게 8종 게임에서 8K 해상도를 적용했을 때 성능은 4K/UHD 환경보다 더 극적인 성능 차이가 나게 됩니다. RTX 3090은 RTX 2080 Ti 대비 약 56% 높은 성능이며, RTX 3080 대비 약 18% 높은 성능입니다.(RTX 3080은 VRAM 병목으로 일부 게임 성능이 낮게 측정됨) 8K 게이밍 환경을 구축하기 위해서는 8K 디스플레이가 필요하기 때문에 접근성이 매우 떨어지지만, 4K 디스플레이 사용자라도 엔비디아 DSR(Dynamic Super Resolution)이나 '사용자 정의 해상도' 기능을 통한 가상 8K 해상도 구현이 가능하여, 4K 대비 훨씬 더 정교한 8K 게이밍 간접 체험이 가능합니다.







깡성능을 다각도로 살펴보았으니 RTX 게임 성능을 살펴볼 차례입니다. 각 게임의 구체적인 FPS 결괏값은 본 칼럼 8 페이지를 참고해 주시기 바랍니다. 테스트는 각각 레이트레이싱(Ray Tracing, 이하 RT)/DLSS 옵션 적용 유무에 따른 성능 차이를 확인하는 것에 목적을 둡니다. 단 게임에 따라서는 RT/DLSS 옵션을 독립적으로 조절하지 못하고 세트로 구성된 경우도 있기 때문에 이 경우에는 단독 DLSS 성능을 제외하였습니다.


1. RT on + DLSS off 4K 성능



DLSS를 제외한 순수 RT(Ray Tracing) 옵션 적용 시 게임 성능입니다. 아무래도 2세대 RT 코어를 탑재한 RTX 30 시리즈 단연 뛰어납니다. 결과적으로 RT 옵션 적용 시 성능은 RTX 2080 Ti FE 대비 약 1.6배 성능을 보여주었습니다. 또한, 해당 성능은 RT 옵션 적용에 따른 성능 하락 비율과 밀접한 관계가 있기 때문에 차후 RT 옵션을 더욱 적극적으로 사용하는 게임이 출시된다면 상대 성능 차이는 더 커질 것입니다.


2. RT on + DLSS on 4K 성능



이번에는 RT/DLSS 옵션을 모두 활성화했을 때 게임 성능입니다. 전 세대 그래픽카드와 성능 차이는 좀 더 줄어듭니다. DLSS로 인해 절대 성능이 상승(FPS 수치 자체가 높아짐)하면서 GPU 병목이 완화되는 이유와 게임 타이틀에 따라 DLSS 최적화 및 버전 차이로 인한 결과로 추측합니다.


3. RT off + DLSS on 4K 성능



RT 옵션을 제외한 순수 DLSS 적용 시 성능 비교입니다. 깡성능 비교 때보다도 성능 차이가 줄어들었습니다. 차후 DLSS 2.0 이후 게임들이 더 많아진다면 관련 콘텐츠를 통해 재검증 예정입니다.






▲ 오버클록이 적용된 RTX 3090 FE GPU-Z 화면


오버클록 잠재력도 확인해 보도록 하겠습니다. 3DMark Stress Test 및 4K 해상도 게이밍 반복 테스트를 실시한 결과, 달성 가능한 최고 오버클록 수치는 코어 오프셋 +75 MHz, 메모리 오프셋 +600 MHz(19.5 Gbps -> 20.7 Gbps) 수준이었습니다. 오버클록 마진은 크지 않았습니다. 전력 제한 레벨은 RTX 3090 파운더스 에디션 기준, 기본 350W에서 최대 114.3$ 약 400W 수준까지 확장 가능합니다. 해당 기능을 통해 커스텀 수랭 또는 본인만의 고성능 쿨링 대책을 강구할 수 있다면, 더 높은 실제 부스트 클록을 기대할 수 있습니다.



▲ 전력제한을 풀어주면 350W에서 약 400W까지 전력 허용



▲ RTX 3090 FE OC 적용 시 3DMark 3종 그래픽 점수 변화


파스 51.5K 달성!

OC 적용 시 3DMark 그래픽 점수 결과입니다. 파스에서 5.1%가 향상된 51.5K 점수를 기록합니다. 드디어 5만 점 벽이 깨졌습니다. 다만 더 먼 미래까지 내다본다면 앞으로도 파스는 실제 그래픽카드 성능 향상 대비 점수 향상은 크지 않을 것입니다. 현재 RTX 30 시리즈만 해도 4~5만 점을 달성하는 수준인데, 이때 렌더링 성능은 이미 수백 FPS에 이르기 때문입니다. 높은 FPS 수치는 결국 CPU 단에서 드로콜(drawcall) 부담이 높아진다는 뜻이기도 합니다. 쉽게 말해 CPU가 GPU 자원을 모두 활용할 수 있을 정도로 빠르게 명령을 내려주어야 하는데 이제 힘이 부친 상황이라는 거죠. 더군다나 파스는 DX11 API 기반입니다. 더욱 불리합니다.


타스 21.9K 달성!

타스는 상대적으로 CPU 부담이 덜어지면서 성능 향상폭은 더욱 커져 21.9K를 기록했습니다. RTX 2080 Ti FE가 약 14.4~14.5K 수준이라는 걸 감안하면 확실히 높은 점수라는 걸 체감할 수 있습니다.



▲ RTX 3090 FE OC 적용 시 3종 게임 4K 성능 변화


점수놀이보다는 역시 실 게임 성능 향상이 조금 더 두드러집니다. 약 6~8%에 달하는 성능 향상이 가능합니다. 일반적으로 대략 10% 이내 그래픽카드 오버클록은 사실상 얻는 것에 비해 잃는 것이 커서 추천하지 않습니다. 체감 성능 향상에도 별 도움이 안 되고요. 하지만 우리는 컴덕후입니다. 경제논리라는 건 개인 선택일 뿐 절대적 기준이 될 수 없습니다. 저 역시 5% 성능 향상을 위해 많은 희생을 치르기도 하니까요. 자료는 참고만 해주시고 여러분의 선택에 맡기겠습니다.








RTX 3090 엠바고 해제 전까지 가장 뜨거운 주제였던 RTX 2080 Ti FE 그리고 RTX 3080 FE와 게임별 성능 차이를 확인해 보겠습니다. 20종 게임 평균 성능 차이는 앞선 내용에서 살펴봤으니 게임별 성능으로 접근하겠습니다.


먼저 RTX 2080 Ti FE와 비교입니다. 전반적으로 1.4~1.6배에 달하는 게임 성능을 보이고 있고, 보더랜드 3와 배틀그라운드, 둠 이터널에서 큰 성능 차이를 보여줍니다. RTX 30 시리즈 출시 전 다양한 루머가 존재했는데, 이 중 RTX 2080 Ti 대비 50% 향상이다란 말이 결국 사실이었습니다.


RTX 3090은 RTX 3080보다도 강력한 성능을 가지고 있기 때문에 극히 일부 게임(플심, 삼탈워)을 제외하면, 대부분 게임에서 쾌적하게 4K/60fps 게이밍이 가능합니다. 또한 RTX 3080 대비 더 높은 옵션을 욕심낼 수도 있죠. 성능이 충분한 경우 DSR 적용을 통해 더 좋은 화질을 만끽하는 것 역시 RTX 3090을 활용하는 방법일 것입니다.








다음은 잘난 동생 RTX 3080과 비교입니다. 평균 12.9% 높은 성능이며 게임에 따라 10~15% 사이로 성능 차이가 나타납니다. 이를 통해 알 수 있는 건 RTX 3080 역시 값비싼 하이엔드 모델이긴 하나, 어느 정도 가성비를 고려하는 소비자라면 RTX 3090이 아닌 RTX 3080을 선택하는 것이 비교불가할 정도로 합리적인 소비입니다.


RTX 3090은 가성비를 전혀 고려하지 않은 오로지 최고 성능을 추구하는 소비자와 넉넉한 VRAM이 필요한 크리에이터에게 상품성 어필이 가능한 물건입니다. 물론, 사람은 항상 논리적이지 않기 때문에 다 필요 없고 최고를 위해 지르시는 분들도 계실 겁니다. 그 마음 잘 압니다. 






▲ RTX 3090 FE - 4K 게이밍 성능 vs. 지포스 20 시리즈 - QHD 게이밍 성능 


RTX 3090의 압도적 4K 게이밍 성능을 다른 각도에서 살펴볼 수 있도록 재밌는 자료를 준비했습니다. RTX 3090 FE가 4K 해상도에서 기록한 성능을 지포스 20 시리즈 QHD 해상도 성능과 비교한 그래프입니다.


RTX 2080 Ti FE 성능을 100%로 두었을 때 RTX 3080 성능은 86.1%를 기록하였는데요. 이는 곧 QHD 해상도에서 기대할 수 있는 RTX 2080 SUPER 성능과 4K 해상도에서 기대할 수 있는 RTX 3090 성능이 크게 다르지 않다는 뜻입니다. 다른 관점에서 예를 들면 만약 QHD 모니터 + RTX 2080 SUPER 사용자가 4K 모니터 + RTX 3090으로 업그레이드할 경우 성능 저하가 발생하지 않는다는 해석도 가능합니다.







퀘이사존 지포스 RTX 3090 벤치마크 최종 요약



■ 넉넉한 VRAM과 절대 성능은 최고, 그러나 게임 용도로는 사치스러운 가격

-> VRAM 용량을 제외하면, RTX 3090은 RTX 3080과 스펙과 게임 성능에서 가격만큼 큰 차이를 보이지 않는다. 사실 스펙 공개 시점부터 이는 예견된 것이다. 전 세대로 시선을 돌려보면 RTX 2080 Ti가 RTX 2080 대비 약 47.8% 더 많은 CUDA 코어를 가지고 있지만, RTX 3090은 약 20.6% 더 많은 CUDA 코어에 그치기 때문. 자연스럽게 게임 성능 역시 전 세대와 비교하면 그 차이가 더욱 줄어든다. 하지만 가격 차이는? RTX 3090은 무려 RTX 3080 2배가 넘는 가격을 자랑한다. 즉 가성비를 생각한다면 전혀 고려할 수 없는 물건으로 타깃 구매층이 매우 제한적인 물건이다. 넉넉한 VRAM이 필요한 크리에이터, 딥러닝 관련 업계, NVLink SLI가 필요한 유저, 특수 조건(8K 해상도 등) 게이밍을 원하는 유저, 점수놀이를 즐기는 하드웨어 마니아/오버클러커, 최고만을 지향하는 유저 등이 여기에 포함될 것.


■ 4K 기준, 소위 '깡성능'은 RTX 2080 Ti 대비 50% 향상, RTX 3080 대비 13% 향상

-> RTX(RT/DLSS) 기술을 적용하지 않은 게임 성능 기준, RTX 3090은 RTX 2080 Ti FE 대비 약 1.5배 성능을 보여준다. 반면 RTX 3080과 비교하면 약 1.13배 성능으로 평균 15% 성능 향상에도 미치지 못하는 모습.(일부 게임에서 15% 상회) 결국 최소한의 가성비와 하이엔드 성능을 모두 추구하는 소비자층을 위해 엔비디아는 RTX 3090이 아닌 RTX 3080에 힘을 실어준 것으로 보인다. 대표적인 예로 RTX 3080은 최근 엔비디아 행보와 달리 최상위 빅칩 GPU 기반으로 만들어졌다는 것.(RTX 2080, GTX 1080, GTX 980 모두 최상위가 아닌 차상위 GPU 기반)


■ DLSS 8K 또는 네이티브 8K/60fps 게이밍 가능

-> 이미 RTX 3080으로 AAA급 자본이 투여된 게임 타이틀 대부분을 4K/60fps로 구동 가능하다는 것을 확인한 바 있다. 이보다 성능이 더 좋은 RTX 3090이 더욱 쾌적한 게이밍 환경을 제공하는 것은 당연한 것. 다만 엔비디아가 내세운 8K 게이밍은 DLSS를 지원하지 않는 대표적인 고사양 게임(플심, 레데리 2, 호제던 등)을 제외하면 충분히 가능하다는 것 역시 확인. 특히 최신 DLSS 버전을 지원하는 데스 스트랜딩은 매우 높음 프리셋에서 8K/60fps가 가능하며, 배틀그라운드(국민 옵션), 오버워치, 포르자 호라이즌 4 등 게임은 DLSS 없이도 네이티브 8K/60fps가 가능하다.


■ RTX 3090 4K 성능은 RTX 2080 SUPER QHD 성능과 동급

-> 바꿔 말해 RTX 2080 SUPER가 QHD(2560x1440) 해상도에서 내어주는 성능을 RTX 3090은 4K/UHD(3840x2160) 해상도에서 내어준다. UHD 해상도는 QHD 대비 2.25배에 달하는 픽셀 수라는 걸 고려하면, RTX 3090의 4K 성능이 어느 정도인지 가늠해볼 수 있다. 참고로 이전 벤치마크에서 RTX 3080 4K 성능은 RTX 2070 SUPER QHD 성능과 동급이라는 것을 확인한 바 있다.


■ FE 기준 400W까지 전력 제한 레벨 상향 가능, 파스 점수 51.5K 달성

-> RTX 3090 역시 RTX 3080과 마찬가지로 오버클록 잠재력은 크지 않다. 다만 기본 TGP 350W에서 최고 TGP 400W까지 전력 제한 레벨 조절이 가능하여, 오프셋 클록 주파수 대비 더 높은 부스트 클록을 바라볼 수 있다. 퀘이사존에서 입수한 샘플 기준 3DMark Fire Strike 그래픽 점수 51.5K 달성이 가능하였으며, 게임 성능은 6~8% 향상되었다.


■ RTX 3090의 정체성

-> 풀칩에서 단 1 TPC만 비활성화된 CUDA 코어 규모(풀칩 대비 97.6%), 온전한 384-bit 메모리 인터페이스, GDDR6X 24GB VRAM, RTX 3080을 앞서는 최고 성능 등 RTX 3090을 수식할 수 있는 워딩은 많다. 그러나 비교적 공격적인 가격 정책이 적용된 RTX 3080과 달리 RTX 3090은 무려 $1,499 가격으로 책정되어, 정말로 살 사람들만 사게 될 그래픽카드가 되었다. 물론 하이엔드/플래그십 영역 최고 성능 그래픽카드는 가성비와 점점 멀어지는 것이 이 바닥 순리라지만, 타이탄(TITAN) 브랜드도 아닌 지포스(GeForce) 브랜드가 이 정도로 하위 모델과 가성비에서 큰 격차로 나타난 전례는 거의 없었다. 엔비디아 의도를 추측하자면 RTX 3080에게 지포스 20 시리즈의 높은 가격으로 분노했던 소비자를 달래주는 임무를 부여하고, RTX 3090은 본래 듀얼 GPU 모델에나 사용하던 '90' 숫자를 관짝에서 꺼내 부여함으로써 프리미엄 제품 성격을 더욱 강화하는 투트랙(Two track) 전략을 택한 것으로 보인다.


■ 최고를 원하는 자, RTX 3090을 질러라

-> RTX 3090은 이미 풀칩 GA102 대비 약 98%를 만족하는 CUDA 스펙이다. 역대 지포스와 타이탄 스펙 차이를 고려하면 RTX 3090은 타이탄에 한없이 가까운 지포스라는 뜻. 따라서 엔비디아가 차후 타이탄 이름으로 상위 제품을 내놓을지 지금으로서는 알 수 없다. 모든 건 시장 상황에 따른 엔비디아 의지에 달린 문제. 게다가 24GB VRAM은 풍요롭기까지 하다. 즉 타이탄이 나온다고 하더라도 적어도 게임만큼은 매우 미세한 성능 차이에 그칠 확률이 높다.(그러나 과거 세대처럼 타이탄 한정, 쿼드로 작업 성능을 개방하는 가치를 부여하게 되면 얘기는 달라진다) 따라서 RTX 3090은 당분간 그래픽카드 황제 자리를 무리 없이 지켜낼 것이기에 최고를 원하는 소비자, 그리고 넉넉한 VRAM이 필요한 크리에이터라면 미련 없이 질러도 될 것.






퀘이사존 지포스 RTX 3090 벤치마크 - 렌더링 성능/온도/소음/전성비 분석 보러 가기





우리의 벤치마크는 계속될 것이다

늘 그랬듯이





퀘이사존 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.​



※ 본 칼럼의 지포스 RTX 3090 파운더스 에디션은 엔비디아로부터 제공받은 샘플입니다.


댓글: 184

신고하기

신고대상


신고사유

투표 참여자 보기