퀘이사존 RTX 3080 Laptop GPU 벤치마크 6,144 CUDA 코어를 품은 강력한 GPU
안녕하세요. QM벤치입니다.
엔비디아는 암페어(Ampere) 아키텍처 기반 GPU를 지포스 RTX 30 시리즈를 통해 강력한 성능을 자랑하고 있습니다. 물론, AMD라고 놀고 있던 건 아니라서 최근 빅나비(Navi 20 GPU) 기반 라데온 그래픽카드를 출시하였지만, 레이트레이싱 성능까지 고려하면 여전히 성능과 상품성 모두 지포스가 뛰어난 것으로 평가받고 있죠. 저 또한 동의하는 부분입니다. 특히 강렬했던 RTX 3080을 시작으로 RTX 3090, RTX 3070, RTX 3060 Ti 등의 모델은 이미 시장에 출시된 상태고, RTX 3060 12GB 출시를 앞두고 있습니다.
그런데 위에 열거한 그래픽카드는 모두 데스크톱 PC 환경에서 사용하는 외장형 그래픽카드입니다. 이 외에도 엔비디아는 CES 2021에서 주로 노트북(Laptop) 플랫폼에서 사용될 지포스 30 시리즈도 발표한 바 있는데요. 플랫폼 특성상 절대적 성능의 우위를 보이는 데스크톱 PC 환경에 대한 관심이 더 크게 쏠리긴 하지만, 그래도 노트북 시장은 꾸준히 성장하고 또 데스크톱이 넘보지 못하는 막강한 휴대성을 가지고 있기 때문에 노트북 플랫폼의 성능 향상도 주목할 필요가 있을 것입니다. 굳이 제가 서론에 노트북 플랫폼을 언급한 까닭은 무엇일까요? 이미 눈치채셨겠죠? 네, 오늘이 바로 노트북용 지포스 RTX 30 시리즈 성능 엠바고가 해제되는 날입니다.
게이밍 노트북의 현주소, 과연 고사양 게임도 쾌적한 구동이 가능할까? 앞서 언급한 것처럼 노트북 시장은 매년 꾸준한 성장세를 기록하고 있습니다. 말해봐야 입만 아픈 휴대성이 가장 큰 무기이고, 게다가 기술 발전이 꾸준히 이루어지면서 고성능 데스크톱 PC에 필적할 만한 성능을 노트북 플랫폼에서도 얼마든지 구현 가능해졌습니다. 사실 이렇게 된 지도 꽤 시간이 흘렀기 때문에 이미 진부한 이야기겠네요. 특히 사무실과 집 등 공간에 구애받지 않고 업무나 PC 게이밍을 즐기기 용이하기 때문에, 고성능 PC가 있어도 추가로 노트북 플랫폼을 구축하는 사용자 층은 점점 늘어나는 추세입니다. 게다가 데스크톱 PC는 없이 노트북 플랫폼만으로 컴퓨팅 환경을 끝내는 사람들도 많아졌죠.
자, 그렇다면 지포스 30 시리즈 GPU가 탑재된 최신 게이밍 노트북은 어느 정도의 성능을 가지고 있을까요? 최신 AAA급 게임 타이틀을 무리 없이 구동할 수 있을까요? RTX 3080 Laptop GPU를 탑재한 MSI GS66 Stealth 10UH 노트북을 통해 알아보도록 하겠습니다.
MSI GS66 Stealth 10UH 노트북의 상세 사양입니다. 물론 이번 칼럼의 주제는 노트북 그 자체가 아니라 노트북에 탑재된 지포스 RTX 3080 Laptop GPU 성능에 중점을 두기 때문에, 참고만 해주시기 바랍니다. 어쨌거나 게이밍 노트북이라고 한다면 구매를 결정함에 있어 GPU 본연의 성능이 그 무엇보다 중요합니다. 특히 외장형 지포스 30 시리즈 그래픽카드에 적용된 암페어 아키텍처 특성이 고스란히 담겨있기 때문에 기대가 커지는데요. 사이버펑크 2077, 어쌔신 크리드 발할라, 둠 이터널, 호라이즌 제로 던과 같은 고사양 AAA급 게임의 원활한 구동은 물론, 경쟁형 멀티플레이에 유리한 환경 조건이 되어주는 고FPS와 고주사율을 노트북에서 모두 구현할 수 있다면? 상상만 해도 매력적인 휴대용 게이밍 머신입니다.
▲ RTX 3080 Laptop GPU와 외장형 그래픽카드 RTX 3080/RTX 3070 비교
GPU 상세 사양입니다. RTX 3080 Laptop GPU는 엔비디아 암페어 아키텍처 GPU 중 어떤 칩세트를 사용할까요? GPU 세부 코드명은 밝히지 않고 있으나, 유닛 구성상 RTX 3070, RTX 3060 Ti에 사용된 바 있는 GA104 GPU 구성을 따릅니다. 아무래도 엔비디아 입장에서는 데스크톱 RTX 3080에 쓰인 GA102 GPU를 그대로 가져오기엔 칩세트 규모상 소비전력과 발열 부문이 적합하지 않다고 판단했을 겁니다. 부스트 클록, 전압, 전력 제한 레벨을 대폭 낮추는 것까지 고려해도 말이죠. 대신 GA104 GPU 풀칩 구성에서 나올 수 있는 6,144 CUDA 코어가 매우 인상적입니다. GA104 풀칩 구성은 데스크톱 그래픽카드 라인업에서 찾아볼 수조차 없기 때문이죠.
무려 6,144 CUDA 코어를 갖춘 RTX 3080 Laptop GPU 결과적으로 48 SM이 모두 활성화되어 6,144 CUDA 코어(48 SM x128 CUDA)를 갖추게 되었습니다. 데스크톱 RTX 3070이 5,888 CUDA, RTX 3060 Ti의 4,864 CUDA보다 확실히 더 높은 수치이죠. 이 둘은 GA104 풀칩이 아닛 일부 유닛이 비활성화된 컷칩 구성이기에 당연한 이야기입니다.
▲ RTX 3080 Laptop GPU
하지만, 그렇다고 해서 RTX 3080 Laptop GPU가 데스크톱 RTX 3070과 비슷하거나 또는 그이상 성능을 내어줄 것이라 예상하기란 어렵습니다. 아니 그럴 가능성이 거의 없다고 봐야합니다. 노트북에서 작동하는 GPU는 데스크톱 그래픽카드에 비해 허용할 수 있는 전력이 매우 낮기 때문에, GPU 전압과 부스트 클록 수준이 비교불가하기 때문이죠. 데스크톱 수준의 성능을 가지기 위해서는 클록과 전압을 큰폭으로 끌어올려야 하는데, 이렇게 되면 소비전력이 200W를 훌쩍 넘길 것이고, 200W에 달하는 열을 해소하기 위한 쿨링 설루션 때문에 덩치는 엄청나게 커져 결국 휴대성을 챙겨야 하는 노트북 입장에서는 주객전도가 되어버릴 것입니다.
노트북용 GPU는 플랫폼 태생적 한계로 부스트 클록이 매우 낮다 덧붙여 3D 게이밍 성능을 결정짓는 핵심 스펙 요소는 다양하지만, 극도로 단순화했을 때 A: 연산유닛개수 x B: 작동클록주파수 공식에서 노트북 플랫폼은 B 항목이 매우 낮게 설정됩니다. 또한, CPU 성능도 데스크톱 환경에 비해서는 평균 클록 주파수가 낮아 최종 게이밍 성능 역시 낮아질 수밖에 없고요. 이런 특성을 종합적으로 감안해본다면 결국 우리가 RTX 3080 Laptop GPU를 탑재한 노트북에서 기대할 수 있는 게이밍 성능은 RTX 3070을 넘어서기 힘들 것입니다.
▲ RTX 3080 Laptop GPU는 노트북 제조사/모델에 따라 다양한 부스트 클록으로 설정된다
또한, 세부 스펙은 노트북 제조사/모델마다 달라질 수 있습니다. 스펙표에 표기되어 있다시피 부스트 클록이나 소비전력은 각 노트북 제조사의 통합 설계 설루션에 맞게 어느정도 유동폭이 존재합니다. 메모리 구성 역시 256-bit 메모리 인터페이스에 기반하기 때문에 GDDR6 8GB 또는 GDDR6 16GB로 구성되고요. 가장 큰 변수는 결국 부스트 클록인데 1,245~1,710 MHz 범위 안에서 더 높은 소비전력을 감당할 수 있게 설계한 노트북은 더 높은 부스트 클록을 그 반대의 경우에는 부스트 클록이 낮게 설정될 것입니다. 최저 수준을 기준으로 보면 1,245 MHz 수치인데, 이는 데스크톱 RTX 3080(1,710 MHz)의 약 72.8%에 해당합니다. 그만큼 낮은 성능을 보여줄 수밖에 없겠죠.
2세대 RT 코어와 3세대 텐서 코어 등 암페어 아키텍처 특성은 동일 그외 암페어 아키텍처에서 새롭게 선보인 아키텍처 차원의 개선점은 동일하게 가지고 있습니다. 대표적으로 2세대 RT(Ray Tracing) 코어와 3세대 텐서(Tensor) 코어, PCIe 4.0 지원, HDMI 2.1/DP 1.4a 포트 지원 등을 꼽을 수 있습니다. 비록 외장형 그래픽카드가 선보이는 수준의 부스트 클록은 기대하기 어렵더라도, 아키텍처 피처와 구성 요소에 힘입어 충분히 강력한 게이밍 성능을 기대할 수 있습니다. 그래서 그런지 엔비디아 역시 1080p가 아닌 1440p 게이밍에 초점을 맞추고 있고요. 퀘이사존에서 입수한 MSI GS66 Stealth 10UH 엔비디아 레퍼런스 노트북 역시 1440p 디스플레이를 탑재했기 때문에 게임 벤치마크는 1440p 기준에서 진행하였습니다.
이번 지포스 30 시리즈 노트북에서는 Max-Q 3세대 디자인을 표방하고 있는데요. Max-Q 디자인은 해당 설계 안에 WhisperMode 2.0과 Dynamic Boost 2.0, 그리고 얼마 전 AMD가 SAM(Smart Access Memory)이란 작명으로 알린 Resizable BAR 등 다양한 기술이 포함되어 있습니다. 여기서 제가 주목하는 건 바로 Dynamic Boost 2.0 기술입니다.
다이나믹 부스트 2.0(Dynamic Boost 2.0)은 쉽게 말해서 CPU와 GPU에 할당된 전력 레벨을 애플리케이션 특성에 맞춰 유동적으로 조절하는 기술을 말합니다. 경쟁사 AMD에서도 기술적 맥락이 유사한 스마트시프트(SmartShift) 기술을 사용하는 데, 기술 개요를 살펴보면 다이나믹 부스트 2.0과 크게 다르지 않습니다. 결국 한정된 전력을 상황에 따라 CPU와 GPU에게 적절히 배분하는 역할로 정리할 수 있습니다. AMD 스마트시프트의 경우 AMD 라이젠+라데온이 탑재된 노트북이나 소니 플레이스테이션 5(PlayStation 5) 콘솔 게임기에 적용됩니다.
다시 다이나믹 부스트 2.0으로 돌아오겠습니다. 해당 기술은 사용자 입장에서 임의로 켜고 끌 수 있는 기능은 아니기 때문에 on/off에 따른 성능을 점검하기란 어렵습니다. 대신 엔비디아가 제공한 자료에 따르면 CPU와 GPU에 할당된 전력 레벨을 고정적으로 가져가는 설정보다 최대 약 10~15% 성능 개선이 이루어진다고 합니다.
CPU 병목 현상은 획일화할 수 없다 그래서 등장한 다이나믹 부스트 2.0 실제로 동일한 게임이라도 옵션에 따라서 CPU와 GPU에 필요한 전력 레벨은 각각 다를 수 있습니다. 일반적으로 고해상도/고옵션 환경일수록 CPU 성능이 낮게 요구되고, 반대 환경일 경우 GPU가 뽑아낼 수 있는 절대 FPS(Frames per second) 수치가 높아지기 때문에 CPU 성능이 그만큼 높게 요구됩니다. GPU는 혼자서 일을 할 수 있는 것이 아니라 CPU의 명령이 있어야만 이미지를 그릴 수 있기 때문이죠. 즉 우리가 일반적으로 CPU 병목현상이라 부르는 것은 GPU가 1초에 100장을 그려낼 수 있는 능력을 가지고 있어도 CPU 성능이 부족하면 이미지를 렌더링하라는 명령을 1초에 100회 이상 내려줘야 하는데, 80~90회 명령에 그칠 때, 최종 성능은 80~90 FPS가 되는 것으로 이해할 수 있습니다.
▲ 5종 게임 다이나믹 부스트 2.0 작동 테스트 결과
이런 상황에서 안 그래도 사용할 수 있는 전력 자체가 낮은 노트북 플랫폼 입장에서는 전력을 알뜰하게 운용하는 것이 더욱 중요하겠죠. 다이나믹 부스트 2.0이 실제로 잘 작동하는 지 검증하기 위해 퀘이사존에서는 5종 게임 옵션에서 매우 낮은 옵션과 가장 높은 옵션, 극단적인 2종 옵션을 적용하여 GPU와 CPU 전력을 비교해 보았습니다.
결과를 보면 고옵션 상황에서는 CPU 성능이 상대적으로 낮게 요구되므로, CPU보다는 GPU쪽에 전력 레벨을 높게 할당해주고, 반대 상황에서는 CPU 쪽에 전력을 좀 더 허락해주는 알고리즘이 잘 작동하고 있습니다. 저옵션 적용 상황에서는 30~40W에 달하는 CPU 전력을 허용하지만, 고옵션 상황에서는 15~25W 수준에 그치고 있네요. 단 둠 이터널의 경우 옵션과 관계 없이, CPU 병목 현상이 낮고 GPU 자원 활용력이 높은 게임 엔진 특성으로 인해 다이나믹 부스트 2.0은 GPU 전력에 몰아주는 똑똑함을 보여주기도 합니다. 이렇게 GPU쪽에 높은 전력을 할당해주게 되면 자연스럽게 CPU 전압과 클록이 낮아지지만, 이를 단순히 스로틀링(Throttling)으로만 볼 것이 아니라 시스템 자원 운용의 효율성으로 해석하는 것이 더 적절할 것입니다.
▲ Advanced Optimus - 엔비디아 제어판 실행 화면(사용자 취향에 맞게 자동, 옵티머스, 엔비디아 GPU 전용 선택 가능)
노트북 지포스 30 시리즈에서는 어드밴스드 옵티머스(Advanced Optimus) 기능을 지원합니다. 엔비디아 옵티머스 기술은 기본적으로 전력 절감 및 효율 증대를 위해 내장 그래픽과 엔비디아 GPU를 전환하는 기술을 말하는데요. 이번 어드밴스드 옵티머스 기술은 이보다 더 나아가 G-SYNC 기술 구현을 통해 테어링 제거(tear-free), 미세끊김 현상 제거(stutter-free) 기능까지 통합 관리하게 됩니다. 실제로 본 칼럼에 등장한 MSI GS66 Stealth 10UH 노트북 역시 어드밴스드 옵티머스 기술을 지원하기 때문에 240 Hz 디스플레이와 G-SYNC 그리고 옵티머스를 모두 활용할 수 있습니다.
기존 엔비디아 옵티머스 기술은 노트북 환경에서 고성능 렌더링 작업을 수행할 때 엔비디아 GPU가 렌더링을 한 후 내장 그래픽 프로세서(Integrated Graphics Processor, IGP)의 프레임버퍼에 저장했습니다. 그 후 렌더링된 프레임은 IGP 프레임버퍼에서 디스플레이에 출력하는 형태였죠. 즉 옵티머스는 필요할 때만 엔비디아 GPU를 사용하고 큰 퍼포먼스가 필요하지 않을 때에는 IGP를 사용하여 배터리를 아끼는 형태입니다.
하지만 단점이 존재했죠. 엔비디아 GPU가 디스플레이와 직접 연결되는 형태가 아니기 때문에 G-SYNC와 같은 가변싱크 기술이나 고주사율 디스플레이 구동에 제한이 있었습니다. 그러나 어드밴스드 옵티머스는 옵티머스 기술의 가장 최신 버전으로 기본적인 전력 절감 및 효율성을 유지한 채로 G-SYNC 기술을 모두 제공합니다. 또한, 사용자 취향에 맞게 조절이 가능하도록 엔비디아 제어판에서 옵티머스 기능을 사용하거나 또는 엔비디아 GPU 전용(discrete GPU) 모드 선택도 가능합니다.
▲ RTX 3080 Laptop GPU를 탑재한 MSI GS66 Stealth 10UH
▲ RTX 2070 Max-Q를 탑재한 GIGABYTE AERO 17 HDR
대조군에서 전세대 RTX 2080 모바일 GPU를 탑재한 노트북을 동원한다면 좋겠지만, RTX 2080 GPU를 탑재한 노트북을 입수하지 못해 단순 참고용으로 RTX 2070 Max-Q 노트북을 동원하였습니다. 또한 데스크톱 환경도 대조군에 포함하였는데요. 주의할 점은 데스크톱과 노트북은 완전히 동일한 변인 통제가 불가능하기 때문에 이를 감안해야 합니다. 대신 데스크톱 환경 테스트 시스템은 엔비디아 레퍼런스 노트북 MSI GS66에 탑재된 i7-10870H 코어/스레드와 동일한 i7-10700K CPU를 장착하였습니다. 단, 당연하게도 i7-10700K CPU의 실제 작동 클록은 MSI GS66에 탑재된 i7-10870H보다 훨씬 높기 때문에 최종 게이밍 성능 역시 데스크톱이 유리한 환경입니다.
※ 이하 내용부터는 벤치마크 테스트 결과로 이어집니다. 구체적인 테스트 결괏값은 본 칼럼 2 페이지에서 확인해 주세요.
RTX 3080 Laptop GPU 본연의 성능은 RTX 2080? 비교적 CPU 성능이 크게 작용하지 않는 3DMark 그래픽 스코어에서 RTX 3080 Laptop GPU는 RTX 2070 SUPER 대비 높은 점수를 기록하였습니다. 그러나 RTX 2080 SUPER에 미치지는 않죠. 대략 RTX 2080 급으로 봐도 크게 무리가 없습니다. 단 이는 1,245 MHz 부스트 클록으로 작동하는 GPU에 국한된 결과로, 노트북 제조사/모델에 따라 다양한 클록을 가지게 될 RTX 3080 Laptop GPU 전체 성능을 대변하지 못합니다.
1440p 즉 QHD(2560x1440) 해상도 환경에서 15종 게임 테스트 결과입니다. 각 게임에서의 평균 FPS 성능을 백분율 수치로 환산 후 다시 15개에 달하는 해당 백분율 수치 평균을 계산한 값으로 각 그래픽카드 상대 성능과 위치를 확인할 수 있습니다.
본 벤치마크에서 사용된 RTX 3080 Laptop GPU는 평균적으로 RTX 2070 SUPER와 유사한 게이밍 성능을 가진 것으로 파악할 수 있습니다. 단 CPU가 확실한 열세이기 때문에 4K 환경이라고 한다면, RTX 2070 SUPER를 넘어 RTX 2080 이상의 성능을 내어줄 가능성도 고려할 수 있습니다. 노트북에 탑재된 CPU는 클록이 낮기 때문에 대조군에 등장한 데스크톱 PC 대비 CPU 병목 현상이 더 심할 수밖에 없기 때문이죠. 이를 뒷받침 해주는 게임들이 소수 존재합니다. 대표적으로 GPU 자원 활용 능력이 매우 뛰어난, 바꿔 말해 CPU 병목 현상이 상대적으로 낮게 나타나는 둠 이터널입니다.
둠 이터널은 CPU 드로콜 병목이 낮은 대표적인 게임 중 하나이며, 해당 게임에서의 성능은 RTX 2070 SUPER를 가볍게 제칩니다. 실제로 CPU 병목이 낮은 3DMark Time Spy 그래픽 스코어에서도 RTX 2070 SUPER와 RTX 2080 SUPER 사이의 점수를 보였기 때문에 RTX 3080 Laptop GPU 본연의 성능은 최소 RTX 2070 SUPER를 넘어 RTX 2080 급이라는 데 힘을 실어주죠. 단 부스트 클록 스펙에 따라 달라지는 부문으로 본 벤치마크에 사용된 1,245 MHz 부스트 클록 버전에 한정된 결론이라는 것을 기억해 주시기 바랍니다. 결국 RTX 3080 Laptop GPU의 스펙상 부스트 클록 범위가 최저 1,245 MHz이기 때문에 모델에 따라서는 RTX 2080 SUPER를 넘을 가능성도 있습니다.
또한, AAA급 게임에서도 1440p/60 FPS 게이밍을 기대할 수 있는 성능을 입증했고, 완벽한 풀옵션만을 고집하는 게이머가 아니라면 대부분의 고사양 게임에서도 쾌적한 성능을 누릴 수 있습니다. 새삼 기술의 발전에 놀라게 되네요. 데스크톱도 아닌 고작 2 cm도 채 되지 않는 두께를 가진 노트북에서 RTX 2070 SUPER ~ RTX 2080에 이르는 성능을 느낄 수 있으니 말입니다.
4종 RTX 지원 게임에서의 성능입니다. 최근 출시된 DLSS 지원 게임들은 DLSS 2.0을 지원하는 경우 단순히 on/off 기능으로 켜고 끄는 것 뿐만 아니라 기반 렌더링 해상도에 차등을 두어 품질/균형/성능 등의 옵션을 제공해 주기도 합니다. 이 경우 성능과 품질에서 가장 적당하다고 판단되는 '균형' 옵션을 적용하여 테스트를 진행하였습니다.
사실, 실시간 레이트레이싱 연산 옵션 자체가 GPU 자원을 매우 높게 요구하기 때문에 해당 옵션 활성화 시 큰 폭의 성능 하락을 피할 수 없습니다. 그러나 엔비디아는 레이트레이싱과 DLSS를 RTX란 이름으로 패키지화하여 양 기술을 함께 가져가도록 유도하고 있고, 또 실제로 DLSS 렌더링 품질이 상당하기 때문에 어느정도 성능 하락의 약점이 상쇄됩니다. 위 결과에서도 DLSS와 RT를 함께 가져갈 경우 RTX off 환경에 비해 큰 성능 차이가 나지 않는 경우가 있습니다. 오히려 성능이 향상되는 경우도 존재하는군요. 결과적으로 RTX 3080 Laptop GPU 성능을 통해 노트북 플랫폼에서도 RTX 게이밍 구동은 무리가 아니라는 것을 말해줍니다.
|