하이엔드급 지포스 SLI 테스트 결과 종합 3DMark Fire Strike/Time Spy/Port Royal
먼저 대표적인 3D 벤치마크 툴인 3DMark 시리즈 테스트 결과를 살펴보도록 하겠습니다. 굉장히 희망적인 점수를 보여주고 있네요. Fire Strike의 경우 출시된 지 시간이 꽤 흘렀기 때문에, 최신 하이엔드 그래픽카드에서 굉장히 높은 프레임을 관측할 수 있습니다. 따라서, SLI 구성 시에는 CPU 성능 한계로 인해 성능 효율이 다소 떨어질 수밖에 없죠. GTX 1080/GTX 1080 Ti에서는 약 1.9배에 달하는 점수 향상을, RTX 2080/RTX 2080 Ti는 약 1.8배에 달하는 점수 향상을 보여줍니다. RTX 2080 Ti NVLink SLI의 61.7K 점수가 인상적이군요. 단일 그래픽카드에서는 구경하기조차 힘든 점수입니다. Fire Strike 이후에 등장한 DX12 벤치마크 툴인 Time Spy에서는 보다 높은 SLI 효율을 보여주게 됩니다. 모든 그래픽카드가 약 1.9배를 초과하는 점수 향상을 보여주며 이상적인 결과를 기록했습니다. 이러한 양상은 레이트레이싱 벤치마크 툴인 Port Royal에서도 동일하게 관측됩니다. 전반적으로 Fire Strike의 효율이 조금 아쉽긴 해도 매우 훌륭한 수준의 성능 향상을 확인할 수 있습니다. 그러나 벤치마크 툴과 실제 게임은 엄연히 다른 영역이죠. 이제 게임 테스트 결과를 확인해보도록 하겠습니다. 게임별 SLI 성능 효율
게임별 SLI 성능 효율을 정리한 그래프입니다. 각 게임별 구체적인 성능은 세부 페이지에서 확인해주시기 바랍니다. 그래프 해석은 실로 간단합니다. 만약 수치가 100%라면 단일 그래픽카드와 동일한 성능이라는 뜻이고 200%라면 2배의 성능을 보여줬다는 뜻입니다. 전반적으로 들쭉날쭉한 양상을 보여주는데요. 하나씩 따져보도록 하겠습니다. 테스트에 동원된 게임 중에서 별도의 설정 없이도 SLI 구성을 통해 성능 향상이 발생했던 게임은 콜 오브 듀티: 블랙 옵스 4, 크라이시스 3, 데스티니 가디언즈, 더 위쳐 3, 섀도 오브 더 툼레이더 DX12, 토탈 워: 워해머 2 DX11 정도가 있습니다. 반면, 배틀그라운드나 에이펙스 레전드의 경우 기본 설정에서 SLI를 통한 성능 향상은 없었으나 NVIDIA Inspector 유틸리티를 사용하여 커스텀 프로파일을 적용할 경우 성능을 향상시킬 수 있습니다. 그 외의 게임들은 SLI를 적용해도 성능 향상이 전혀 없었거나 혹은 방법이 있었지만, 너무 복잡하게 요구되는 설정(그래픽 옵션 조절 필수, 과도한 프로파일 작업 등)이 수반되어 테스트에서 제외하였습니다. 전반적으로 벤치마크 툴에서 보여줬던 이상적인 상황만 펼쳐지는 것이 아니라는 건 분명합니다. 특히 SLI를 지원하지 않는 게임의 경우 단일 그래픽카드보다 성능이 낮아지기도 하죠. 이런 일이 발생하는 이유는 SLI 구성으로 인한 지연시간 발생, 불필요한 GPU 자원 누수 등을 꼽을 수 있습니다. 특히 이러한 성능 저하는 NVLink SLI 환경에서 더 심하게 나타나네요. 비교적 효율이 우수한 게임을 꼽으라면 콜 오브 듀티: 블랙 옵스 4, 크라이시스 3, 토탈 워: 워해머 2 정도를 꼽을 수 있으며, 특이사항이라면 섀도 오브 더 툼레이더의 경우 DX12 모드에서 SLI(AFR 방식)를 지원하고, 토탈 워: 워해머 2는 DX11 모드에서 SLI를 지원합니다. NVLink SLI 방식은 비록 SLI를 지원하지 않는 게임에서 HB SLI보다 성능 하락이 더 크게 나타났으나, SLI 지원 게임에 한정할 경우 전반적으로 더 우수한 성능 향상을 보여주었습니다. 특히 NVLink는 대역폭의 이점 외에도 기존 SLI 방식이 VRAM을 2배로 활용하지 못하고 복제된 데이터를 각각 가져다 쓰는 한계를 개선했기 때문에 성능 향상에 유리한 요소가 작용할 수 있죠. 자신이 주로 즐기는 게임에서 SLI 성능 효율이 나쁘지 않다면 SLI 구성을 고려해볼 수 있을 것입니다. 그리고 테스트 진행 간에 발생했던 문제점입니다. 먼저, 에이펙스 레전드의 경우 커스텀 프로파일을 적용하여 성능 향상에 성공하기는 했으나, 간혹 네모난 형태의 검은색 픽셀 집합이 화면에 나타나면서 불쾌감을 주며, 순간순간 프레임이 요동치는 현상을 겪기도 하였습니다. AFR 방식의 DX12 모드 섀도 오브 더 툼레이더의 경우 빠른 화면 전환 시 일부 텍스처가 겹쳐 보인다던가(마치 모션블러가 걸린 것처럼) 잠시 멈칫거리는 느낌을 주는 부작용이 확인되었습니다. 이렇게 렌더링 품질에 민감한 유저라면 SLI 구성은 추천할 수 없겠죠. SLI로 인한 성능 향상 그리고 렌더링 품질이 양호했던 게임은 크라이시스 3, 데스티니 가디언즈, 배틀그라운드 정도를 꼽을 수 있는데요. 사실 크라이시스 3의 경우 지금 시점에서는 너무 오래된 게임이라 의미가 크게 없고 결국 배틀그라운드와 데스티니 가디언즈가 남게 되는데, 전체 테스트 게임 수를 감안해보면 정말 초라한 성적표입니다. 개인적인 기준으로는 적어도 70~80% 이상의 게임에서 별다른 오류 없이 최소 1.7배 이상의 확실한 성능 향상이 보장되어야 SLI에 대한 가치가 바로 서는 것이라 생각하는데... 실망스러운 결과입니다. 투자되는 비용에 비해 결과물은 참담하죠. 특히 최근의 게임들은 개발비가 점차 증가하고 SLI에 대한 엔비디아의 지원이나 관심도 줄고 있으며, 마이크로소프트 스토어에 등록된 게임들은 대부분 SLI를 지원하지 못합니다. 여기에 DX12 SLI 기술에 대한 진입장벽도 한몫하고 있는 상황입니다. 결과적으로 현재 그래픽카드 시장의 기술적 화두와 게임 개발 환경 그리고 플랫폼까지 모든 요소가 향후 SLI 지원 부문에 있어 암울한 미래를 그리게 합니다. 과거에 비해 최신 게임을 위한 SLI 구성은 가성비가 너무나 떨어지게 되었습니다. 하지만... 작업 환경이라면 어떨까요? LuxMark 3.1/OctaneBench 4.00b
OpenCL 성능을 측정하는 LuxMark 3.1 테스트 결과입니다. 실로 환상적인 성능 향상을 보여주네요. 그래픽카드를 2개 꼽았더니, 성능도 2배로 보답해주고 있습니다. 병렬형 연산에 최적화된 탓도 있지만, 게임에 비해 성능 향상에 방해가 되는 요소가 상대적으로 적기 때문에 이러한 결과를 보여줄 수 있는 것으로 판단됩니다. 실시간 GPU 렌더링을 지원하는 렌더러, 옥테인렌더(OctaneRender) 성능을 측정하는 옥테인벤치(OctaneBench) 테스트 결과입니다. 더 바랄 게 없는 이상적인 결과죠. 옥테인렌더를 사용하는 3D 작업자라면 예산이 허락하는 대로 복수의 그래픽카드를 구성하시는 게 좋겠습니다. CPU 플랫폼 종류별 SLI 성능 - 3DMark Fire Strike/Time Spy 다음은 CPU 플랫폼에 따른 SLI 성능 차이를 알아보도록 하겠습니다. 앞서 살펴보았듯이 SLI 성능 효율이 우수한 3DMark Fire Strike 결과부터 살펴볼 텐데요. 사실 단일 그래픽카드 시스템에서는 CPU에 따른 점수 차이가 크지 않지만, 하이엔드급 그래픽카드 SLI 환경이라면 상황은 달라집니다. 가장 높은 GPU 성능을 보장하는 RTX 2080 Ti FE NVLink SLI 조건에서 i9-9900K는 61.1K 점수를 기록했지만, 클록 주파수가 낮은 i9-9980XE의 경우 고작 46.7K에 그치고 있습니다. 그 차이가 무려 14.4K에 이르게 되는 것이죠. 물론, 실질적인 의미가 크지 않은 벤치마크 점수놀이일 뿐이지만, 시사하는 바는 분명합니다. 고성능의 GPU 환경에서는 CPU 차이로 인한 성능 차이가 얼마든지 발생할 수 있다는 것이죠. AMD 라이젠 7 2700X는 어떨까요? 전반적으로 i9-9980XE와 비슷한 양상이지만 조금 더 우수한 성능을 보여줍니다. 그러나 i9-9900K의 막강한 성능 앞에서는 비할 바가 되지 못하죠. 물론, CPU 가격을 생각해본다면 비교 대상이 전혀 아니지만, 어쨌든 AMD CPU 제품군에서 가장 높은 게임 성능을 가진 제품이기에 넣어봤습니다. 반면, Time Spy의 경우 Fire Strike 대비 GPU 연산 부하가 높아 절대적인 프레임 수치가 낮은 특성을 가지고 있기 때문에 CPU 종류에 따른 성능 차이는 줄어들게 됩니다. 그럼에도 불구하고 i9-9900K는 의미있는 수준 차이로 가장 높은 성능을 보여줍니다. CPU 플랫폼 종류별 SLI 성능 - 콜 오브 듀티: 블랙 옵스 4
벤치마크 결과를 봤으니 게임 성능도 확인해봐야겠죠. 앞서 게임 성능 테스트에서 비교적 우수한 SLI 효율을 보여준 콜 오브 듀티: 블랙 옵스 4 테스트 결과를 대표로 살펴보겠습니다. 3DMark 결과와는 조금 다른 양상이네요. i9-9900K가 가장 높은 성능을 기록했으며, 라이젠 7 2700X는 인텔 i9-9980XE에 비해 낮은 성능을 보여줍니다. 이러한 결과는 60 Hz 주사율 모니터 사용자라면 실질적인 의미가 작겠지만, 고주사율 모니터 사용자라면 인텔 CPU가 더 만족스러운 성능을 보여준다고 볼 수 있겠죠. 역시 벤치마크 툴의 결과와 실제 게임 성능 양상은 다를 수 있다는 걸 말해줍니다. SLI 시스템 소비전력 측정 시스템 전체 소비전력 측정 결과입니다. SLI 구성 시 큰 폭으로 증가하는 소비전력을 확인하실 수 있습니다. 전반적으로 GTX 1080/RTX 2080 대비 GTX 1080 Ti/RTX 2080 Ti의 풀로드/피크치 소비전력 차이가 크다는 걸 알 수 있습니다. 이러한 결과가 나타난 이유는 GPU 전체 발열량이 후자쪽이 훨씬 높기 때문에 풀로드 환경이 지속됨에 따라 클록/전압 하락 폭이 더 크다는 것에 기인하고 있습니다. 다음 GPU 온도를 살펴보시죠. SLI 시스템 GPU 온도 측정 본 칼럼의 전반부에서 언급했던 SLI의 단점이 바로 여기서 드러납니다. 바로 GPU 1번의 온도인데요. SLI 구성 시 상단에 위치한 그래픽카드는 하단 그래픽카드에 비해 GPU 발열 해소 능력이 떨어질 수밖에 없습니다. 쿨링을 위한 흡기 과정에서 하단 그래픽카드 후면에서 발생하는 뜨거운 공기를 빨아들이고 있기 때문이죠. 특히 이러한 구조적 특징은 블로워팬 타입이 아닌 플라워형 타입의 쿨링팬을 갖춘 RTX 그래픽카드에 조금 더 극적으로 작용하여 GPU 간의 온도 차이가 무려 20도에 이르게 됩니다. 반면, 블로워팬 타입의 GTX 1080/GTX 1080 Ti는 양 GPU 간의 온도 차이가 10도 안팎에 머물면서 RTX 그래픽카드와 극명한 대비를 이룹니다. 결국 블로워팬 타입의 쿨러가 SLI 구성에서는 조금 더 이상적인 구성으로 볼 수 있겠죠. 물론, 가장 좋은 건 커스텀 수랭 쿨링 환경입니다. SLI 시스템 소음 측정 그래픽카드가 2장이 되었으니 조금 더 시끄러워지는 것은 자연스러운 결과입니다. 그러나, RTX 2080 Ti NVLink SLI의 경우 유독 높은 소음을 기록한 것에 주목할 필요가 있습니다. 무려 1번 그래픽카드의 쿨링팬이 4,500 RPM을 돌파하고 있는데요. 이에 따라 소음 수치도 57.3 dBA를 기록하면서 체감적으로도 매우 시끄러운 수치를 보여주었습니다. 왜 이런 일이 발생하게 된 것일까요? 먼저 RTX 2080 Ti의 절대적인 발열량이 높다는 것이 근본적인 원인이겠죠. 여기에 더해 RTX 2080 Ti FE의 쿨링팬 작동 알고리즘이 GPU 온도가 87도를 돌파하려는 순간 쿨링팬 RPM이 급격하게 상승하여 어떻게든 88도가 되지 않도록 방어를 하도록 설계되었다는 것입니다. 이러한 설계는 단일 그래픽카드 환경에서는 문제가 되는 경우가 거의 없지만, SLI 구성에서는 GPU 발열 해소가 더욱 어려워지기 때문에 87도를 방어하기 힘든 상황이 펼쳐지게 되고, 결국 급격한 RPM 상승으로 귀결됩니다. 대부분의 레퍼런스 디자인이 왜 블로워팬 타입으로 설계되는지 알 수 있는 대목이죠. 하지만, RTX 2080 Ti는 거대한 다이 면적과 높은 발열량으로 인해 블로워팬 타입으로는 엔비디아가 원하는 GPU 발열 억제력과 소음 수준을 달성할 수 없었던 것으로 판단됩니다. 따라서 GPU 발열 해소 능력이 상대적으로 우수한 플라워형 듀얼 쿨링팬으로 디자인했으나, SLI 환경까지 만족시키지는 못했던 것으로 추측합니다. |