퀘이사존
성능비교
퀘이사플레이
컴퓨텍스 이벤트
이벤트
필드테스트
특가/예판
행사판매
퀘플래플
퀘플이벤트
리뷰
벤치마크
기획기사
게임기사
비디오
리포트
컴퓨텍스 2024
하드웨어 성능비교 •
시네벤치(CPU)
3DMark(GPU)
하드웨어
게임
모바일
파트너뉴스
사용기/필테
팁/노하우
PC조립/견적
스팀/PC게임
플스/엑박/스위치
모바일/스마트폰
노트북/태블릿PC
가전제품/TV
CPU/메인보드/램
그래픽카드
오버클록/언더볼팅
케이스
커스텀수랭/튜닝
공랭/수랭쿨러
SSD/HDD/USB
파워서플라이
키보드/마우스
하이파이 •
게이밍오디오
모니터
네트워크/인터넷
OS/소프트웨어
기타/주변기기
자유게시판
애니/피규어
유머게시판
자동차
반려동물
음식/여행
영화/TV
데스크셋업
IT/하드웨어
박물관
나눔게시판
핫딜
타세요
장터
라이브스트리밍
:
퀘이사존 컴퓨텍스 2024 특집 기사 바로가기 + Point
RTX 40 시리즈는 RTX 30 시리즈 대비 비약적인 성능 향상을 달성했습니다. RTX 40 시리즈는 L2 캐시 용량, 클록 등 다방면에서 개선이 이루어졌죠. 그런데 RTX 30 대비 RTX 40 시리즈의 아키텍처 성능 향상은 어느 정도일까요? 일각에선 RTX 40 시리즈의 성능 향상의 원천이 클록에 있는 소위 '클록 빨'이란 이야기가 나옵니다. 만약 클록 상승이 없었다고 하면 RTX 40 시리즈는 얼마나 성능이 더 올랐을까요?
이러한 아키텍처 성능을 가늠하기 위해 IPC 테스트를 진행하곤 합니다. IPC(Instruction Per Clock)란 클록당 처리하는 명령어의 수로, 아키텍처의 성능을 이야기할 때 가장 핵심이 되는 키워드 중 하나입니다. 그런데 이러한 IPC 테스트는 CPU 테스트에서 많이 찾아볼 수 있고 그래픽카드에서는 찾아보기 어렵습니다. 이 IPC를 그래픽카드에서는 진행할 수 없는 걸까요? IPC 테스트로 RTX 40 시리즈의 에이다 러브레이스(Ada Lovelace) 아키텍처 개선 정도를 알 수 있지 않을까요? 이번 칼럼에서 이 궁금증에 대한 답을 찾아가 보도록 하겠습니다.
사실 서론에서 이야기한 IPC는 온전한 측정이 어렵습니다. 이 IPC가 자주 거론되는 CPU를 예로 들면, 실제 제품 성능에는 이 아키텍처 IPC뿐 아니라 각 코어가 연결된 방식, 캐시 용량 및 전력 등 기타 다양한 변수의 영향을 받기 때문입니다. 결국 이러한 변수를 배제해야 아키텍처 IPC 측정이 가능한 것인데, 이는 어려운 과제입니다.
때문에 이 IPC 측정이라고 이야기하는 것은 실제 아키텍처 IPC를 측정하는 것은 아닙니다. 대신, CPU를 예로 들어 비교 군의 코어 및 스레드 수, 클록 등 주요 스펙을 동일하게 하여 싱글 코어 성능을 측정하는 동일 클록 비교 테스트를 진행합니다. 이 동일 클록 비교 테스트를 유저들 사이에서 통상적으로 IPC 측정, IPC 성능이라 이야기하죠. 하지만 이 동일 클록 비교 방식은 앞서 언급한 여러 변수의 영향이 있기 때문에 엄밀히 말해 IPC와 동일하거나 혹은 대변한다고 하기엔 어려운 부분이 있습니다.
이러한 한계는 그래픽카드도 마찬가지입니다. 게다가 그래픽카드는 CPU와 달리 사용자가 코어 수, VRAM 등 굵직한 변수를 통제하는 것도 더 어렵습니다. 당장 아키텍처가 다르면서 동일한 연산 유닛(쿠다 코어) 수를 가진 제품을 찾는 것부터가 난관이죠.
하지만 RTX 30 시리즈와 RTX 40 시리즈의 경우 마침 동일한 쿠다 코어를 가진 제품이 존재합니다. 바로 RTX 3070과 RTX 4070입니다. 이번 테스트의 주인공인 두 제품은 동일한 5,888개 쿠다 코어를 가짐으로써 그나마 비슷한 조건에서의 비교가 가능합니다.
RTX 30 대비 RTX 40 시리즈 아키텍처 성능 개선폭을 엿보기 위해 동일 클록 비교 방식을 이용했습니다. 두 그래픽카드 모두 GPU 클록 1,905 MHz와 메모리 대역폭을 512 GB/s로 설정했습니다. 또한 VRAM 용량 변수를 최소화하기 위해 모니터링 간 VRAM 사용량이 8 GB를 넘지 않게끔 게임과 옵션을 설정했습니다. 그래픽카드 클록 설정은 MSI 애프터버너(Afterburner)를 이용했으며, 구체적인 설정값은 아래 자료에서 확인하실 수 있습니다.
클록과 메모리 대역폭을 맞췄지만, 그럼에도 두 그래픽카드 간 스펙 차이는 여전히 존재합니다. ROP(Render Output Unit)와 L2 캐시, 메모리 용량 등 여러 변수가 여전히 남아있습니다.
이번 테스트는 각 세대 간 특정 1개 제품끼리의 비교이고, 진행된 테스트도 광범위하게 이루어진 것은 아니기 때문에 이번 테스트 결과를 RTX 30과 RTX 40간 아키텍처 성능 차이라고 일반화할 수 없다는 점, 짚고 넘어가겠습니다.
▲ 클릭 시 큰 이미지로 보실 수 있습니다.
■ 애프터버너 V/F 커브(Voltage/Frequency Curve) 조정을 통해 GPU 클록 1,905 MHz으로 설정
■ RTX 3070은 메모리 클록 +1,000 MHz 설정으로 16 Gbps 속도, GPU-Z상 클록 2,000 MHz 설정, 대역폭 512 GB/s
■ RTX 4070은 메모리 클록 +160 MHz 설정으로 21.3 Gbps 속도, GPU-Z상 클록 1,333 MHz 설정, 대역폭 511.9 GB/s
■ 테스트간 소프트웨어에서 모니터링되는 VRAM 사용량이 8 GB를 넘지 않도록 해상도, 게임, 옵션을 선정
커스텀 설정 이후 AIDA64 GPGPU 벤치마크를 진행했을 때, 두 그래픽카드 간 FP32(부동소수점) 연산 성능은 동일하게 22.1 TFLOPS(테라플롭스)로 나온 것을 확인할 수 있었습니다.
그러나 GPU와 CPU 간 통신 대역폭, 그리고 GPU에 탑재된 VRAM 간 대역폭 성능은 RTX 4070쪽이 매우 큰 성능 차이를 보여주었습니다. 이는 두 제품 사이 통제하지 못한 다른 변수가 영향을 준 것으로 추측됩니다.
*메모리 읽기/쓰기(Memory Read/Write): GPU와 CPU간의 대역폭. 시스템 메모리에서 GPU 메모리로 데이터를 가져오는 속도를 측정
*메모리 복사(Memory Copy): GPU 자체 메모리 성능. 탑재한 VRAM 내부에서 데이터가 오가는 성능을 측정
아래 내용부터는 테스트 결과로 이어집니다.
항목별 구체적인 테스트 결과는 세부 페이지에서 확인해 주세요.
예상외의 결과로 동클록 비교에서 오히려 RTX 3070이 RTX 4070보다 더 높은 성능을 보여주었다. GPU 클록과 메모리 대역폭을 동일하게 설정하였음에도, 통제되지 않은 다른 변수: ROP 개수 및 L2 캐시 등으로 인해 이러한 성능 차이가 발생했을 것으로 추측된다.
3DMark 포트 로열(Port Royal) 및 다이렉트X 레이 트레이싱(DirectX RayTracing) 테스트에서는 RTX 4070쪽이 더 높은 점수를 보여주었다. 이는 RTX 40 시리즈에서 탑재된 최신 RT 코어 및 텐서 코어(Tensor Core)의 성능이 반영된 것으로 추측된다.
RTX 4070은 RTX 3070과 동클록에서는 소폭 떨어지는 모습을 보여주었지만, 원래 스펙에서는 RTX 4070이 큰 폭의 성능 격차를 보여준다. 동클록 환경을 조성하기 위해 RTX 3070는 오버클록을, RTX 4070은 오히려 GPU 클록을 크게 낮추었기 때문에, RTX 4070의 성능 향상의 상당 부분은 2.5 GHz에 육박하는 높은 부스트 클록이 큰 몫을 한 것으로 풀이된다.
퀘이사존의 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.
RTX 3070, RTX 4070, 그래픽카드, 동일 클럭 비교, 암페어, 에이다 러브레이스, Ampere, Ada Lovelace
RTX 4070 vs. RTX 3070 동클록 비교 테스트
[DX11] 배틀그라운드 | PUBG: BATTLEGROUNDS
[DX12] 바이오하자드 RE:4 | BIOHAZARD RE:4
[DX12] 사이버펑크 2077 | Cyberpunk 2077
[DX12] 포르자 호라이즌 5 | Forza Horizon 5
[VULKAN] 둠 이터널 | DOOM Eternal
댓글: 72개
RTX 5090은 1.7배 성능 향상???
차세대 RTX 50 시리즈? 엔비디아 블랙웰 루머 정리
지포스: 너네 AFMF 기능 좋더라? 나도 좀 쓰자
세계 최초 발견! 지포스에서 AFMF 사용하기
게임 성능 2배 뻥튀기! AFMF 제대로 쓰는 방법
AFMF 프레임 생성 기능 파헤치기
상상 그 이하를 보게될 것! CPU 내장그래픽 vs. GTX 750
당신은 얼마나 알고있나, CPU 내장그래픽 게임 성능
저퀄을 고퀄로, 인공지능이 만져주는 이미지 향상
Adobe Camera Raw에서 활용할 수 있는 AI 기반 이미지 향상 기능
똥손도 할 수 있는 미소녀 그리기
스테이블 디퓨전 web UI 활용 가이드
RTX 40 시리즈의 성능 향상 비법은?
옛날 이상한 그래픽카드 모음zip
그냥 듀얼 그래픽카드부터 혼종까지
드라이버로 얼마나 성능이 올라가겠어? 이게 되네?
드라이버별 인텔 아크 A770 성능 변화
지포스를 두고 굳이 라데온을 쓴다? 대체 왜?!
라데온 브랜드 이미지는 왜 이렇게 되었을까?
AMD가 강조하는 가성비, 효율적인 아키텍처의 특징은 무엇?
RX 7900의 핵심, RDNA 3 아키텍처 살펴보기
다시 혼돈으로
엔비디아와 AMD, 그리고 인텔 그래픽카드 역사 2화
혼돈의 시기를 지나 2강 체재로 돌입
엔비디아와 ATi(AMD) 그래픽카드 역사 1화
PCIe 4.0 / 16x부터 PCIe 3.0 / 4x까지 5종 게임 성능 비교
PCIe 배속? 버전? 구형 보드? RTX 4090 제 성능 내려면
전력 제한 vs. 언더볼팅 5종 게임 비교
RTX 4090 FE 전력 제한 vs. 언더볼팅 전성비 테스트
퀘이사존-전 우주급 커뮤니티: 우주의 시작부터 끝까지
퀘이사존 로그인
아이디·비밀번호 찾기 회원가입
공식기사
리포트/취재
이건, 진짜 사고 싶은데? LG OLED 끝판왕 등장
구독제 좀 그만해!!!!!!!!!
RTX 5090 루머 총정리!
인텔 논K CPU 그리고 ASUS B760M 보드
펫캠, 베이비캠, 가게 CCTV 종결!
퀘이사존을 다양한 미디어에서 만나보세요
신고하기
투표 참여자 보기