[부스트 클록] 2,730 MHz(지포스 RTX 4070 Ti 레퍼런스 부스트 클록 2,610 MHz)
[TGP] 285 W(지포스 RTX 4070 Ti 레퍼런스 TGP 285 W)

[부스트 클록] 2,730 MHz(지포스 RTX 4070 Ti 레퍼런스 부스트 클록 2,610 MHz)
[TGP] 285 W(지포스 RTX 4070 Ti 레퍼런스 TGP 285 W)

























레이트레이싱이란?(눌러서 펼치기)
오늘날 TV나 극장에서 만날 수 있는 각종 영상물(영화, 드라마, 광고 등)에는 다양한 컴퓨터 그래픽, 우리에게 익숙한 용어로 CG가 첨가됩니다. CG를 사용하는 이유는 여러 가지가 있지만, 현실적인 여건(촬영 조건, 환경, 기후, 가상 생명체나 물체 등)이나 배우에게 들어가는 비용, 위험성(폭발과 같은 고난도 스턴트 등)과 같은 복합적인 문제를 해소할 목적이 큽니다. 하지만 현실과 동떨어진 품질로 CG를 삽입한다면 몰입감을 해치고 조잡하게 느껴질 수 있습니다. 그렇기에 최대한 현실과 비슷하게 만드는 게 중요한데, 현실성을 더해주는 CG 요소 중 하나는 바로 레이트레이싱(Ray Tracing, 광선 추적)입니다.
레이트레이싱은 표현 그대로 광선, 즉 빛을 발하는 물체로부터 발산하는 빛이 어떤 경로로 이동하는지를 그대로 보여주는 데 목적을 두고 있습니다. 빛을 추적하는 게 어떻게 현실감을 주는지 궁금하실 수 있는데, 레이트레이싱이 접목됨으로 인해 가장 두드러지게 보이는 표현 차이 중 하나는 바로 사물 반사입니다. 그간 일반적인 게임에서는 유리나 금속 재질과 같은 사물에 반사되는 물체를 미리 렌더된 화상으로 대체하거나 여러 기법을 이용해 눈속임해 왔습니다. 레이트레이싱은 매우 높은 시스템 성능을 요구해왔고, 비교적 최근까지도 실시간 렌더링에는 상당한 제약이 뒤따랐기 때문입니다. 하지만 NVIDIA에서 RT 코어를 탑재하면서부터는 얘기가 달라졌습니다. 레이트레이싱 처리를 위한 전용 RT 코어가 탑재되면서 레이트레이싱 성능을 비약적으로 상승시킬 수 있었고, 후발주자로 따라온 AMD 역시 레이트레이싱을 앞으로 게임 산업을 이끌어갈 중요 기술로 받아들이고 RA(Ray Accelerator) 코어를 탑재하기 시작했습니다.
조금 더 현실에 가까운 그래픽을 표현하고자 그래픽카드 제조사들이 고군분투하는 가운데, 게이머 입장에서는 사양을 깎아 먹는 주원인으로 여겨 이를 잘 활용하지 않는 경우도 어렵지 않게 볼 수 있습니다. 하지만 앞으로 레이트레이싱 처리를 위한 성능은 더욱더 가속화될 테고, 머지않은 시점에서는 진정한 의미로 누구나 레이트레이싱 옵션을 활성화해서 조금 더 현실적인 그래픽으로 게임을 즐길 수 있는 날이 오지 않을까 합니다. 레이트레이싱 테스트 분야에서는 3DMark Port Royal 테스트와 레이트레이싱 지원 게임 성능을 함께 측정해보았습니다.
레이트레이싱 & RTX 소개 칼럼 보러 가기
언리얼 레이트레이싱 테크 데모 영상



▲ 미래에 등장할 DLSS 3 지원 게임에서는 성능을 매우 높은 지점까지 끌어올릴 수 있습니다. DLSS 클릭 시 큰 이미지로 감상할 수 있습니다.
DLSS 3란?(눌러서 펼치기)


RTX 40 발표와 함께 공개된 신기술인 DLSS 3는 DLSS 2에 모션 보간을 이용한 프레임 생성을 더해 훨씬 더 높은 프레임레이트를 제공합니다. 프레임 생성은 GPU에서 연속한 두 프레임의 연관성을 분석하여 수행하기에 CPU 병목을 극복하는 효과도 노리고 있습니다.
결과적으로 DLSS 3는 (성능 모드 기준) 게임이 실제로 렌더링한 픽셀인 Traditional Render의 8배를 보여주기에 그만큼 막대한 프레임레이트 상승을 기대할 수 있습니다. 설명을 쉽게 하기 위해 단순화하여 예를 들자면 4K 해상도 DLSS 3 성능 모드로 180 FPS가 나온다면 게임 자체는 FHD 90 FPS로 구동하고 있는 셈입니다.
우선 각각의 1920x1080 프레임을 가로세로 각각 2배로 확대합니다. 이건 DLSS 2 성능 모드는 물론 경쟁사의 FSR 성능 모드도 결과물의 품질 차이를 제외하면 같습니다만, DLSS 3는 보간으로 생성한 프레임을 하나 더 보여줍니다. 결국 '각 화면 4배 확대' x '프레임 보간으로 2배' = 8배라는 얘기입니다.
실제로는 각 단계에서 추가적인 처리가 필요하기에 프레임레이트가 8배가 되지는 않습니다. 4K 해상도의 DLSS 2 성능 모드가 FHD 해상도보다는 대체로 낮은 성능이 나오는 것처럼 말이죠. 그래도 픽셀 수 기준 8배라는 수치는 프레임레이트가 고픈 상황에서 큰 도움이 될 수 있습니다.
특히 Topaz Video Enhance AI는 딥 러닝 인공지능을 이용한 고품질 영상 확대 및 보간으로 입지를 다지고 있는 프로그램이라 퀘이사존에도 사용하시는 분들의 글이 올라오기도 합니다. 이런 프로그램으로 오랜 시간을 거쳐 영상 보간을 적용한 결과보다 DLSS 3가 훨씬 더 좋은 화질을 보입니다. 단순히 화질을 희생해서 프레임레이트를 올리는 기술과는 거리가 있다 할 수 있겠습니다. 아마도 영상의 화면만을 분석해서 보간해야 하는 영상 보간과 달리 게임 엔진의 지오메트리 정보 등을 사용하기에 생기는 차이로 보입니다.
물론 어떠한 보간도 완벽할 순 없기에 게임을 즐기기에 충분한 화질을 보장할 수 있을지는 실제 게임 플레이에서 검증할 필요가 있습니다. 게임이나 플레이어 개인의 차이에 따라서 만족도가 달라질 가능성도 있습니다.


* 사이버펑크 2077에 한정해서 DLSS 3 테스트를 진행해보았습니다. 사이버펑크 2077 v1.6 Press 버전에서 DLSS3를 지원하는데, DLSS Frame Generation 기능을 켜고 끄는 걸로 간단히 DLSS 3 성능을 연출할 수 있습니다. 해당 기능은 지포스 RTX 40 시리즈에서만 사용이 가능합니다.
* FE: Founders Edition | Ref.: Reference
게임 그래프 0.1%, 1% Low Framerate란?(눌러서 펼치기)
일반적인 FPS 측정 툴은 1초라는 시간 간격을 두고 FPS 수치를 기록합니다. 이는 우리가 흔히 FPS 레이트로 보는 수치가 FPS, 즉 초당 프레임 수(Frame per Second)이기 때문입니다. 다만 FPS 수치로 프레임을 기록할 경우 FPS 수치가 간헐적으로 떨어지는 끊김 현상, 스터터링(Stuttering)을 제대로 체크해내지 못하는 경우가 많습니다. 게임에서 FPS 수치는 60 FPS 이상을 가리키고 있지만, 낮게 느껴지는 현상이 여기에서 기인합니다. 이런 순간적인 FPS 드롭을 감지해내기 위해서는 PresentMon 계열 툴을 이용하는 경우가 많은데요. NVIDIA에서 새롭게 제공하는 FrameView나 AMD에서 제공하는 OCAT 역시 PresentMon 계열 FPS 측정 도구입니다. PresentMon과 같이 FPS 타임을 기록할 수 있는 툴을 이용하면 벤치마크를 진행하는 동안 생성되는 모든 FPS를 기록할 수 있으며, 이렇게 측정된 원시 값(RAW Data)을 활용해 조금 더 원론적인 의미의 FPS 수치를 다양하게 계산할 수 있습니다.
0.1%나 1% 같은 수치는 이렇게 측정해낸 모든 FPS 수치를 백분위로 환산했을 때 하위 0.1% 및 1%에 해당하는 수치를 기록한 값입니다. 0.1% Low Framerate는 게임을 즐기면서 체감할 수 있는 FPS 드롭 수치, 1% Low Framerate는 일반적인 FPS 측정 툴이 잡아내는 최소 FPS 수치라고 이해한다면 그래프를 읽는 데 도움이 되지 않을까 합니다.