▲ 78종 그래픽카드에 대한 간략 스펙/세팅 정보 ※ 벤치마크 데이터 참고 사항 - 모든 그래픽카드는 레퍼런스/FE 클록 기준으로 테스트 - 벤치마크 툴 구동 외에 불필요한 윈도 프로세스/프로그램은 서비스 목록에서 제외 - LuxMark OpenCL 성능 테스트의 경우 메모리 사양/메모리 종류/드라이버에 따른 편차가 적지 않게 발생하여 일반적으로 알려진 성능 순서와 다를 수 있음(대표 예: GTX 1070 > GTX 1080) - 배정도(Double-Precision FLOPS) 성능 테스트 시, 엔비디아 제어판에서 배정도 모드 적용(케플러 아키텍처 기반 GTX TITAN Z/GTX TITAN 해당) - 동일 GPU 기반에 VRAM 용량만 다른 모델의 경우, VRAM 병목이 발생하는 상황이 아니라면 오히려 VRAM 용량이 작은 모델이 더 좋은 성능을 내어주기도 함(램 타이밍 차이로 인한 결과로 추측) 3DMark Fire Strike 1.1 - 기본 프리셋
아직까지는 가장 많은 하드웨어 마니아/게이머들이 참고하는 파이어스트라이크 테스트 결과입니다. 일명 파스라고 하죠. DX11 API 기반으로 구동되는 벤치마크 툴이며, 일반적으로 알려져 있는 각 그래픽카드의 게임 성능을 비교적 잘 대변해줍니다. 그러나 GPU 아키텍처/세대별로 실제 게임 성능과의 괴리감 차이가 상당하기 때문에, 정확한 게임 성능은 실제 게임 성능 테스트 결과를 따져보아야 한다는 한계가 있습니다. 3DMark Time Spy 1.1 - 기본 프리셋
최신 제품 기준, AMD보다는 엔비디아에서 그리고 튜링(Turing) 아키텍처에서 강점을 보이는 벤치마크 툴입니다. 앞으로 출시될 게임에서의 성능은 지켜봐야겠지만, 실제 게임 성능 대비 튜링 아키텍처의 지포스 그래픽카드가 점수를 잘 내어주는 특성이 있습니다. 3DMark Fire Strike 1.1/Time Spy 1.1 종합
▲ 3DMark Fire Strike/Time Spy 그래픽 점수 - GPU/아키텍처 세대별 정렬 성능 순서가 아닌 아키텍처/세대별로 정렬한 테스트 자료입니다. 해당 데이터를 통해 양 제조사의 대략적인 게이밍 성능 발전 상황을 파악할 수 있습니다. AMD의 경우 전성비는 논외로 두고 순수 성능만 따져봤을 때, 엔비디아의 맥스웰(Maxwell) 아키텍처 시점(GTX 980 Ti 등)까지는 어느 정도 경합을 벌이는 양상이었으나, 지포스 10 시리즈의 파스칼(Pascal) 아키텍처의 등장 이후로는 밸런스가 많이 무너진 양상입니다. 바꿔 말하면, 엔비디아가 맥스웰 -> 파스칼 아키텍처로 이어지는 시점에서의 지포스 그래픽카드 성능 발전이 대단한 것으로 평가할 수 있습니다. 3DMark Port Royal 1.1 - 기본 프리셋
지포스 RTX 시리즈의 핵심 특징인 레이트레이싱(Ray Tracing) 성능을 측정하는 포트로열 테스트 결과입니다. 포트로열은 마이크로소프트 DX12 DXR API를 활용하여 구동되며, RT 코어를 탑재하고 있는 RTX 그래픽카드 전용 툴입니다. 하지만, TITAN V도 구동이 가능하다는 예외적 특성이 존재하는데요. 테스트는 가능하지만 RT 코어가 존재하지 않기 때문에 RTX 2060보다도 낮은 성능을 보여줍니다. 그 외 파스칼 아키텍처 기반의 지포스 10 시리즈나 라데온 계열 그래픽카드는 테스트가 불가능했습니다. OpenCL 렌더링 성능 측정 - LuxMark 3.1
OpenCL 성능을 대변해주는 LuxMark 벤치마크 결과입니다. 라데온 계열 그래픽카드가 훌륭한 성능을 보여주는 분야이기도 합니다. 특히 TITAN RTX/TITAN V보다도 뛰어난 성능의 라데온 VII이 인상적입니다. 또한, 앞서 참고사항에서 밝힌 것과 같이 이론적인 스펙 대비 성능 순서가 다르게 나타나기도 합니다. 대표적으로 GTX 1070보다도 성능이 낮은 GTX 1080을 들 수 있습니다. 이는 메모리 사양/메모리 종류/램타이밍 등의 변인으로 인한 결과이며, 특히 드라이버 버전에 따른 성능 격차도 발생하는 경우가 있기 때문에 자료 해석에 참고해주시기 바랍니다. 단정도 성능 측정 - AIDA64 EE v5.99.4952
3D 게임 성능과 큰 관계가 있는 단정도(Single-Precision) 연산 성능 테스트입니다. 하지만, 제조사/GPU 아키텍처가 다르다면 동일 선상에서 수치상의 차이로 게임 성능의 우위를 예측하기란 힘들다는 한계가 있습니다. 3D 게임 성능은 단정도 연산 수치만 가지고 결정되는 것이 아니기 때문이죠. 따라서 성능 순서를 봐도 구형 아키텍처의 경우 최신 아키텍처와 비교했을 때, 게임 성능 대비 연산 성능 수치가 높게 나타나고 있음을 알 수 있습니다. 가장 강력한 게이밍 성능을 보장하는 TITAN RTX의 경우 약 18 TFLOPS를 보여주며, 메인스트림급 그래픽카드로 많이 회자되는 GTX 1060 6GB는 4.6 TFLOPS, RX 580은 6.1 TFLOPS를 가집니다. 반면, 가장 최신 지포스 그래픽카드인 GTX 1660 Ti의 경우 약 6.0 TFLOPS에 그칩니다. 그러나 실제 게임 성능은 약 6.8 TFLOPS의 GTX 1070과 비슷한 수준을 보여주죠. 앞서 말씀드렸듯이 제조사/GPU 아키텍처가 다르다면 수치만 가지고 게임 성능의 높낮이를 예단하기 힘든 데이터입니다. 배정도 성능 측정 - AIDA64 EE v5.99.4952
데이터 센터 또는 과학 연산 분야에 주로 활용되는 배정도(Double-Precision) 연산 성능 테스트입니다. 사실, 배정도 성능은 게이밍 영역과는 별 상관이 없는 영역이죠. 따라서 NVIDIA/AMD 역시 해당 분야에 특화된 별도의 제품 라인업이 존재하기는 하지만, 일반 소비자용 그래픽카드에서도 우수한 배정도 성능을 보이는 모델들이 존재합니다. 바로 결과를 보면 TITAN V가 단연 압도적인 성능을 보여줍니다. 그 뒤를 이어 얼마 전 출시된 AMD 라데온 VII과 배정도 제한이 해제된 케플러 아키텍처 기반의 GTX TITAN Z가 우수한 성능을 보여주고요. 그 이하 모델들의 성능 양상을 살펴보면, GCN 아키텍처 기반의 AMD 라데온 계열 그래픽카드가 상대적으로 우수한 성능을 자랑합니다. |