퀘이사존
성능비교
퀘이사플레이
컴퓨텍스 이벤트
이벤트
필드테스트
특가/예판
행사판매
퀘플래플
퀘플이벤트
리뷰
벤치마크
기획기사
게임기사
비디오
리포트
컴퓨텍스 2024
하드웨어 성능비교 •
시네벤치(CPU)
3DMark(GPU)
하드웨어
게임
모바일
파트너뉴스
사용기/필테
팁/노하우
PC조립/견적
스팀/PC게임
플스/엑박/스위치
모바일/스마트폰
노트북/태블릿PC
가전제품/TV
CPU/메인보드/램
그래픽카드
오버클록/언더볼팅
케이스
커스텀수랭/튜닝
공랭/수랭쿨러
SSD/HDD/USB
파워서플라이
키보드/마우스
하이파이 •
게이밍오디오
모니터
네트워크/인터넷
OS/소프트웨어
기타/주변기기
자유게시판
애니/피규어
유머게시판
자동차
반려동물
음식/여행
영화/TV
데스크셋업
IT/하드웨어
박물관
나눔게시판
핫딜
타세요
장터
라이브스트리밍
:
퀘이사존 컴퓨텍스 2024 특집 기사 바로가기 + Point
안녕하세요. QM크크리입니다. 다시 RTX 4090 병목 이슈를 다뤄보고자 합니다. 이번에는 구형 마더보드 사용 등의 상황에서 PCIe 병목이 게임 성능에 얼마나 영향을 미치는지 5종 게임으로 점검해보고자 합니다.
RTX 4090 그래픽 카드의 압도적인 성능은 이를 받쳐줘야 할 CPU의 성능이 부족하지 않을까 염려할 정도입니다. 그렇기 때문에 CPU 병목 이슈에 관심이 쏠렸고 퀘이사존에서도 8종 CPU와 5종 게임으로 이를 확인한 바 있습니다.
그런데 그래픽 카드와 게임 성능의 병목 이슈에는 오랫동안 다뤄진 주요 주제가 하나 더 있습니다. 바로 CPU와 그래픽 카드 사이를 연결하는 PCI Express 인터페이스, 약칭 PCIe입니다. 그래픽 카드보다 CPU 성능이 떨어져서 병목이 생길 수 있다면 그 둘이 소통하는 경로인 PCIe가 느려도 병목이 생길 수 있다고 쉽게 짐작할 수 있습니다.
그래서 오래전부터 상급 그래픽 카드에서 PCIe 구성에 따른 병목 여부를 점검하는 벤치마크가 세대마다 하나 정도는 나온 바 있습니다. 일례로 PCIe 레인을 절반만 쓸 수 있는 상황은 나름 꽤 있는 편이기에 PCIe 병목을 다룰 때 빼놓지 않고 점검하는 사안이지요.
RX 5500 XT에서는 그래픽 카드 자체가 통상적인 그래픽 카드의 PCIe 구성보다 레인을 절반으로 제한한 구성이 구형 마더보드의 PCIe 버전 지원 제한과 겹치면 게임 성능이 얼마나 떨어질까는 이슈도 추가되었습니다. 퀘이사존에서도 RX 6600 XT에서 점검을 진행(보러 가기)한 바 있습니다.
특히 구형 AM4 마더보드에 CPU만 5800X3D로 업그레이드한 경우 마더보드의 PCIe 3.0 지원 제한이 게임 성능을 얼마나 발목 잡을지 신경 쓰이는 부분도 있습니다. PCIe 주요 버전을 올릴 때마다 속도와 대역폭을 2배씩 올렸기에 구버전을 사용하면 레인을 절반만 사용하는 것과 같은 대역폭을 쓰게 됩니다. 지금까지 나온 벤치마크에서는 대역폭이 비슷하더라도 구버전을 사용하는 쪽이 미세하게 성능이 더 떨어지는 결과가 많았습니다.
그래서 RTX 4090이 지원하는 최대 사양인 PCIe 4.0 / 16x부터 다소 극적인 제한인 PCIe 3.0 / 4x까지 가능한 6가지 조합 모두를 5종 게임 성능으로 비교해보았습니다.
PCIe 지원 사양 및 현재 작동 상황은 GPU-Z로 쉽게 확인할 수 있습니다.
위 예시에서 그래픽 드라이버는 PCIe 16x에 4.0 버전까지 지원한다고 보고하였으며 PCIe 16x에 1.1 버전으로 작동하고 있는 상황입니다. GPU-Z만 실행하는 중에는 PCIe 버전을 뜻하는 오른쪽 끝의 숫자가 떨어지는 건 절전 기능이므로 정상입니다.
GPU-Z는 이를 정확히 확인하는 기능도 지원합니다. Bus Interface 오른쪽의 파란색 ? 버튼을 클릭하면 렌더 테스트 메뉴가 나옵니다. 그래픽카드에 약간의 부하를 줘서 PCIe 절전 기능을 해제하고 그래픽 카드가 지원하는 최대 사양으로 작동하는 상태를 볼 수 있습니다.
※ 절전 기능을 해제하기 위한 최소한의 부하를 줄 뿐, 최대 부하를 시험하는 스트레스 테스트가 아닌 점은 주의 바랍니다.
렌더 테스트 실행 중에는 그래픽 카드가 지원하는 PCIe 사양으로 작동하는 걸 확인할 수 있습니다.
반면 마더보드 사양 등 외부적인 요인으로 제약이 걸린 상황에서는 렌더 테스트 실행 중에도 그래픽 드라이버가 보고한 PCIe 사양에 도달하지 못합니다. 이렇게 제한된 구성으로 작동할 경우 주로 점검해볼 사안은 다음과 같습니다.
※ 마더보드의 CPU 설정은 메모리 설정을 위한 부분을 제외한 모든 설정을 기본값으로 두어 소위 '순정 설정'으로 작동하는 상태에서 테스트하였습니다. 그래픽 드라이버 제어판 설정은 로스트아크의 수직동기 작동을 제어하기 위한 설정을 제외하고 모두 기본값으로 진행하였습니다.
PCIe 구성에 따른 RTX 4090 FE 성능의 변화를 알아보기 위해 주요 게임 5종을 테스트하였습니다. 많은 사용자가 플레이하는 온라인 게임 2종과 최신 기술을 지원하고 싱글 플레이 경험을 강조하는 일명 AAA급 3종을 사용하였습니다.
DLSS 3를 지원하는 사이버펑크 2077(프레스 빌드)과 스파이더맨 리마스터(정식)는 DLSS 3 품질 설정을 활성화하여 측정하였습니다. DLSS 3는 그래픽 카드 자체적으로 모션 보간을 통해 추가 프레임을 생성하기에 CPU 병목 상황에 유용할 수 있다는 점은 공식 발표에서부터 언급된 바 있습니다. 특히 스파이더맨 리마스터는 자체적으로 250 FPS 제한이 있기에 RTX 4090과 같은 고성능 카드에서는 자칫하면 모든 결과가 250 FPS로 동일하게 나오기 쉬운데요. 이를 피하기 위해 RT 설정까지 그래픽 관련 설정을 모두 최대로 활성화한 상태에서 DLSS 3 품질을 사용했을 때의 성능을 측정했습니다. 그 결과 스파이더맨 리마스터의 250 FPS 제한에 영향받는 것을 피하면서도 DLSS 3의 보간 프레임으로 높은 프레임레이트가 나오는 환경에서 테스트를 진행할 수 있었습니다.
포르자 호라이즌 5는 최고 설정 프리셋에서 RT 설정만 최곳값으로 변경한 설정을 사용하였으며, DLSS 관련 지원이 없는 온라인 게임 2종은 자체 그래픽 설정을 최대로 하여 측정하였습니다.
5종 게임 성능을 종합하여 비교해보니 RTX 4090 그래픽 카드의 지원 사양인 PCIe 4.0 / 16x(64 GB/s 대역폭)의 절반 수준인 PCIe 4.0 / 8x나 PCIe 3.0 / 16x까지는 성능 차이가 크지 않습니다. 2 ~ 3% 정도의 성능 저하를 보여 프레임레이트를 면밀히 비교하지 않으면 알아차리기 힘들 정도의 작은 차이라고도 할 수 있습니다.
같은 대역폭일 때는 PCIe 구버전인 3.0의 성능이 조금 더 떨어지는 편이나, 대체로 1% 미만의 작은 차이라 무시해도 되는 수준입니다. 사실 이러한 종합 결과는 지금까지 거의 모든 PCIe 비교 벤치마크에서 나왔던 전형적인 결과이기도 합니다.
그럼 정말 이 정도 요약으로 끝날 일일까요? 각 게임 결과를 통해 살펴보도록 합시다.
배틀그라운드에서는 5종 게임 종합보다 차이가 작게 나왔습니다. 가장 큰 성능 저하를 보인 UHD 해상도 - PCIe 3.0 / 4x의 1% 하위 프레임레이트는 119로 같은 해상도에서 가장 잘 나온 결과인 128의 93% 수준입니다. 종합 결과에서 나온 78.9%보다 훨씬 작은 하락만을 보인 셈입니다.
로스트아크는 배틀그라운드보다도 훨씬 차이가 작고 테스트한 어떤 구성이라도 게임 성능에 별 영향을 주지 않는 결과로 보입니다.
포르자 호라이즌 5는 얼핏 봐도 평균과 비슷하거나 조금 더 하락을 보이는 편입니다. 일례로 PCIe 3.0 / 4x의 1% 하위 프레임레이트는 테스트한 두 해상도 모두에서 최고 수치의 75% 수준입니다. 5종 게임 종합 결과인 76.6%(FHD 해상도)/78.9%(UHD 해상도)보다 성능 저하가 조금 더 있는 편입니다.
스파이더맨 리마스터는 테스트한 5종 게임 중 가장 극적인 차이를 보입니다. PCIe 4.0 / 8x나 PCIe 3.0 / 16x도 성능 저하로 인한 그래프 막대 차이가 눈에 띄는 편이며, 더 낮은 구성에서는 극적인 성능 하락이 나타났습니다.
사이버펑크 2077은 FHD 해상도에서는 5종 종합 결과보다 약간 더 차이를 보이지만, UHD 해상도에서는 상대적으로 작은 차이를 보입니다.
▲ 클릭하면 커집니다(원본 크기로 보실 수 있습니다).
※ 위쪽이 프레임타임, 아래쪽이 퍼센타일 그래프입니다. 프레임타임과 퍼센타일 그래프 특성상 대부분 결과에 매직그래프가 기본적으로 적용된 점을 주의하여 보시기 바랍니다.
위쪽 그래프의 프레임타임은 각 화면 하나하나를 만들어서 보여주는 데 걸리는 시간을 측정한 것입니다. 일반적으로 알고 있는 성능 기준인 FPS의 역수에 가까우며, 높은 값일수록 좋은 성능인 FPS와 반대로 낮은 값일수록 적은 시간을 들여 빨리 처리한다는 뜻이라 좋은 성능을 뜻합니다. 각 부분에서 위로 툭 튀어나온 부분이 특히 오래 걸린 부분으로 이때 끊김을 체감하는 경우가 많아 스터터링이라 합니다.
아래쪽 그래프의 퍼센타일은 오래 걸린 프레임타임만 따로 집계한 결과입니다. 각 프레임을 오래 걸린 순으로 정렬했을 때 상위 90%(하위 10%)부터 99.95%(하위 0.05%)까지에 해당하는 프레임타임입니다. 당연히 낮은 값일수록 적은 시간을 들여 빨리 처리한다는 뜻이라 좋은 성능을 뜻하며, 그래프가 평탄하게 쭉 낮은 값을 보여주는 결과가 스터터링이 거의 없는 가장 이상적인 결과입니다. 실제로는 99%(하위 1%)보다 오른쪽으로 갈수록 극단적으로 오래 걸린 하윗값을 집계하므로 그래프가 위로 솟구치는 경향을 자주 보입니다. 이는 순간적인 끊김을 반영한 결과이기도 하지만 그만큼 측정 오차에 취약하다는 점을 주의해서 볼 필요가 있습니다.
※ 베리언스 그래프는 연속한 두 프레임 간의 프레임타임 차이를 집계하는 방식입니다. 절대적으로 스터터링이 심하다고 해석할 수 있는 부분인 그래프의 노란색~빨간색 부분을 주로 보면 됩니다.
베리언스 그래프 특성상 자동 정렬과 매직그래프가 기본적으로 적용된 점을 주의하여 보시기 바랍니다. 위 그래프는 식별을 쉽게 하려고 그래프 시작 지점이 약 96.8% 정도로 설정되었습니다. 따라서 실제보다 과장된 그래프입니다. 실제 스터터링이 얼마나 심한지를 알려면 그래프의 노란색~빨간색 부분으로 보여주는 스터터링 구간이 100% 전체 범위에서 어느 정도에 해당할지 생각하며 볼 필요가 있습니다.
# 배틀그라운드 스터터링 결과 해석
배틀그라운드는 스터터링 비교에서도 역시 차이가 작게 나왔습니다. 특히 프레임타임 그래프는 모든 결과가 겹쳐서 구별하기 힘든 양상을 보입니다. 이는 각 결과 간 차이가 그만큼 작다는 얘기가 됩니다.
# 로스트아크 스터터링 결과 해석
로스트아크 역시 스터터링 비교에서도 차이가 작게 나왔습니다. 여기서도 프레임타임 그래프는 모든 결과가 겹쳐서 구별하기 힘든 양상을 보입니다. 이는 각 결과 간 차이가 그만큼 작다는 얘기가 됩니다.
# 포르자 호라이즌 5 스터터링 결과 해석
포르자 호라이즌 5도 프레임타임 그래프는 모든 결과가 겹쳐 있는 편이나, UHD 해상도에서 보라색 그래프가 다소 위로 튀어나와 보입니다. 이는 PCIe 3.0 / 4x 구성에서 그만큼 스터터링이 더 발생했다는 뜻입니다. 퍼센타일과 베리언스 그래프는 좀 더 차이를 보이는 편입니다.
# 스파이더맨 리마스터 스터터링 결과 해석
성능 비교에서 가장 극적인 차이를 보인 스파이더맨 리마스터는 스터터링 비교에서도 가장 극적인 차이를 보입니다. 프레임타임 그래프를 보면 각 결과가 겹친 정도가 극명한 차이를 보입니다. 이는 PCIe 4.0 / 16x(기본 설정, 가장 좋음) =< PCIe 4.0 / 8x, PCIe 3.0 / 16x1) << PCIe 4.0 / 4x, PCIe 3.0 / 8x <<< PCIe 3.0 / 4x(가장 나쁨) 식으로 스터터링 양상에 극적인 차이가 난다는 뜻입니다.
1) PCIe 3.0 / 16x 결과는 그래프 겹침으로 잘 보이지 않으나 PCIe 4.0 / 8x과 비슷한 결과이며, 이는 성능 비교와 비슷한 양상입니다.
퍼센타일과 베리언스 그래프도 마찬가지로 극적인 차이를 보입니다. 특히 PCIe 3.0 / 4x 베리언스 그래프는 붉은색 막대로 거의 꽉 찬 양상을 보이는데 이는 측정 구간의 70 ~ 80% 동안 상당히 나쁜 스터터링이 발생했다는 뜻입니다.
# 사이버펑크 2077(DLSS 3 지원 프레스 빌드) 스터터링 비교 결과 해석
스파이더맨만큼 극적이진 않지만 사이버펑크 2077도 스터터링 양상은 상당한 차이를 보입니다. 특히 PCIe 3.0 / 4x 구성은 다른 구성보다 스터터링이 심한 결과를 보입니다.
테스트한 5종 게임의 결과를 종합해보면 PCIe 4.0 / 8x나 PCIe 3.0 / 16x까지는 2 ~ 3% 정도의 성능 저하로 RTX 4090이 지원하는 최대 사양인 PCIe 4.0 / 16x와 차이가 크지 않습니다. 스터터링을 비교해봐도 딱히 큰 차이는 보이지 않았습니다. 이들 구성의 대역폭이 32 GB/s로 그래픽 카드 지원 사양인 PCIe 4.0 / 16x의 64 GB/s 대역폭과 비교해도 절반이기 때문입니다. 비슷한 대역폭이면 구버전인 PCIe 3.0 구성이 약간 더 낮은 성능을 보이나 대체로 1% 미만의 사소한 차이입니다. 이는 지금까지 PCIe 비교 벤치마크에서 거의 항상 보아왔던 전형적인 결론이기도 합니다.
하지만 더 낮은 설정인 PCIe 4.0 / 4x나 PCIe 3.0 / 8x로 가면 성능 저하가 커져서 특히 FHD 해상도의 1% 하위 프레임레이트는 10%P를 넘는 성능 저하폭을 보였습니다. 테스트한 설정 중 최하 설정인 PCIe 3.0 / 4x는 1% 하위 프레임레이트에서 20%P를 넘는 성능 저하를 보입니다. 그래픽 카드를 4x 이하 구성으로 잘 쓰지 않는 이유라고도 할 수 있겠습니다. RX 6400 같이 하위 제품에서나 간혹 예외가 나오는 정도입니다.
■ RTX 4090에 구형 마더보드도 괜찮다, PCIe 3.0 / 16x으로 사용한다면
따라서 구형 AM4 마더보드에 5800X3D를 사용하느라 PCIe 3.0으로 제한받더라도 RTX 4090의 평균 게임 성능 자체를 발목 잡을까 염려하지 않아도 됩니다. B660 마더보드 중에도 PCIe 5.0을 지원하는 제품이 여럿 있는데 그보다 나중에 출시된 고성능 플래그십 그래픽 카드인 RTX 4090이 PCIe 5.0을 지원하지 않는 이유로도 볼 수 있겠습니다.
다만 구형 마더보드인데 8x 구성으로 쓰게 되면 PCIe 3.0 / 8x 구성이 되어 성능 저하가 커지는 점은 주의할 필요가 있습니다.
■ 스파이더맨 리마스터처럼 게임별로 차이가 클 수 있는 점은 주의해야
테스트한 5종 게임 중 배틀그라운드와 로스트아크는 모든 설정에서 차이가 작게 나타나 대부분 구성에서 실제 체감 성능에는 영향이 없을 듯한 결과를 보였습니다. 반면 포르자 호라이즌 5나 사이버펑크 2077은 어느 정도 성능 차이를 보여 종합 결과와 개괄적으로 비슷해 보이는 양상입니다.
특히 스파이더맨 리마스터는 테스트한 5종 게임 중 가장 극적인 차이를 보였습니다. 종합 결과에서는 괜찮다고 나온 PCIe 4.0 / 8x나 PCIe 3.0 / 16x 구성에서도 어느 정도 성능 저하가 보입니다. 일례로 FHD 해상도의 1% 하위 프레임레이트 결과를 보면 RTX 4090이 지원하는 최대 사양인 PCIe 4.0 / 16x에서는 142 프레임레이트가 나왔는데 PCIe 4.0 / 8x나 PCIe 3.0 / 16x 구성에서는 133, 131 프레임레이트가 나와서 6 ~ 8%P 정도의 성능 저하폭를 보입니다.
■ 차이가 큰 게임을 자주 즐긴다면 고민해볼 필요가 있어
스파이더맨 리마스터가 보인 1% 하위 프레임레이트 6 ~ 8%P 정도의 성능 저하를 구형 마더보드 활용의 가성비 대가로 괜찮다고 생각할 수 있을까요? 이는 개인차가 큰 영역이므로 각자 스스로 판단할 필요가 있겠습니다. 테스트한 5종 게임 외에도 이런 양상을 보이는 게임이 더 있을 수 있습니다. 따라서 해당 게임을 자주 즐긴다면 구형 마더보드 활용의 가성비와 RTX 4090 성능 활용을 극대화하는 업그레이드의 장단점을 고민해볼 필요가 있겠습니다.
물론 RTX 4090의 성능을 최대한 테스트하기 위한 설정에서 나온 결과임을 유의할 필요가 있습니다. 레이 트레이싱을 포함한 모든 설정을 최대로 잡고 DLSS 3 품질 설정을 활성화한 테스트에서 측정한 결과입니다. 4K 해상도에서도 DLSS 없이(또는 DLSS 2 품질 설정으로) 프레임레이트를 확보하기 위해 그래픽 옵션을 타협하면 다른 양상을 보일 가능성도 있겠습니다.
퀘이사존 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.
RTX4090FE병목 RTX4090FEPCIE병목 PCIE구버전RTX4090FE병목 구형메인보드RTX4090FE 5800X3DRTX4090FE 4090FE병목 4090FEPCIE병목 PCIE구버전4090FE병목 구형메인보드4090FE 5800X3D4090FE 4090병목 4090PCIE병목 PCIE구버전4090병목 구형메인보드4090 5800X3D4090
PCIe 배속? 버전? 구형 보드? RTX 4090 제 성능 내려면
댓글: 40개
RTX 5090은 1.7배 성능 향상???
차세대 RTX 50 시리즈? 엔비디아 블랙웰 루머 정리
지포스: 너네 AFMF 기능 좋더라? 나도 좀 쓰자
세계 최초 발견! 지포스에서 AFMF 사용하기
게임 성능 2배 뻥튀기! AFMF 제대로 쓰는 방법
AFMF 프레임 생성 기능 파헤치기
상상 그 이하를 보게될 것! CPU 내장그래픽 vs. GTX 750
당신은 얼마나 알고있나, CPU 내장그래픽 게임 성능
저퀄을 고퀄로, 인공지능이 만져주는 이미지 향상
Adobe Camera Raw에서 활용할 수 있는 AI 기반 이미지 향상 기능
똥손도 할 수 있는 미소녀 그리기
스테이블 디퓨전 web UI 활용 가이드
RTX 4070 vs. RTX 3070 동클록 비교 테스트
RTX 40 시리즈의 성능 향상 비법은?
옛날 이상한 그래픽카드 모음zip
그냥 듀얼 그래픽카드부터 혼종까지
드라이버로 얼마나 성능이 올라가겠어? 이게 되네?
드라이버별 인텔 아크 A770 성능 변화
지포스를 두고 굳이 라데온을 쓴다? 대체 왜?!
라데온 브랜드 이미지는 왜 이렇게 되었을까?
AMD가 강조하는 가성비, 효율적인 아키텍처의 특징은 무엇?
RX 7900의 핵심, RDNA 3 아키텍처 살펴보기
다시 혼돈으로
엔비디아와 AMD, 그리고 인텔 그래픽카드 역사 2화
혼돈의 시기를 지나 2강 체재로 돌입
엔비디아와 ATi(AMD) 그래픽카드 역사 1화
PCIe 4.0 / 16x부터 PCIe 3.0 / 4x까지 5종 게임 성능 비교
전력 제한 vs. 언더볼팅 5종 게임 비교
RTX 4090 FE 전력 제한 vs. 언더볼팅 전성비 테스트
퀘이사존-전 우주급 커뮤니티: 우주의 시작부터 끝까지
퀘이사존 로그인
아이디·비밀번호 찾기 회원가입
공식기사
리포트/취재
그동안의 어항 케이스는 가짜다
컴덕들에게 커세어가 근본인 이유
살벌한 마우스 장비빨! (근손실 방지 OK)
실물 깡패는 이럴 때 쓰는 거지!!
남자들의 추억의 브랜드(공감하면 개추~)
퀘이사존을 다양한 미디어에서 만나보세요
신고하기
투표 참여자 보기