퀘이사존
성능비교
퀘이사플레이
컴퓨텍스 이벤트
이벤트
필드테스트
특가/예판
행사판매
퀘플래플
퀘플이벤트
리뷰
벤치마크
기획기사
게임기사
비디오
리포트
컴퓨텍스 2024
하드웨어 성능비교 •
시네벤치(CPU)
3DMark(GPU)
하드웨어
게임
모바일
파트너뉴스
사용기/필테
팁/노하우
PC조립/견적
스팀/PC게임
플스/엑박/스위치
모바일/스마트폰
노트북/태블릿PC
가전제품/TV
CPU/메인보드/램
그래픽카드
오버클록/언더볼팅
케이스
커스텀수랭/튜닝
공랭/수랭쿨러
SSD/HDD/USB
파워서플라이
키보드/마우스
하이파이 •
게이밍오디오
모니터
네트워크/인터넷
OS/소프트웨어
기타/주변기기
자유게시판
애니/피규어
유머게시판
자동차
반려동물
음식/여행
영화/TV
데스크셋업
IT/하드웨어
박물관
나눔게시판
핫딜
타세요
장터
라이브스트리밍
:
퀘이사존 컴퓨텍스 2024 특집 기사 바로가기 + Point
RTX 40 시리즈는 RTX 30 시리즈 대비 비약적인 성능 향상을 달성했습니다. RTX 40 시리즈는 L2 캐시 용량, 클록 등 다방면에서 개선이 이루어졌죠. 그런데 RTX 30 대비 RTX 40 시리즈의 아키텍처 성능 향상은 어느 정도일까요? 일각에선 RTX 40 시리즈의 성능 향상의 원천이 클록에 있는 소위 '클록 빨'이란 이야기가 나옵니다. 만약 클록 상승이 없었다고 하면 RTX 40 시리즈는 얼마나 성능이 더 올랐을까요?
이러한 아키텍처 성능을 가늠하기 위해 IPC 테스트를 진행하곤 합니다. IPC(Instruction Per Clock)란 클록당 처리하는 명령어의 수로, 아키텍처의 성능을 이야기할 때 가장 핵심이 되는 키워드 중 하나입니다. 그런데 이러한 IPC 테스트는 CPU 테스트에서 많이 찾아볼 수 있고 그래픽카드에서는 찾아보기 어렵습니다. 이 IPC를 그래픽카드에서는 진행할 수 없는 걸까요? IPC 테스트로 RTX 40 시리즈의 에이다 러브레이스(Ada Lovelace) 아키텍처 개선 정도를 알 수 있지 않을까요? 이번 칼럼에서 이 궁금증에 대한 답을 찾아가 보도록 하겠습니다.
사실 서론에서 이야기한 IPC는 온전한 측정이 어렵습니다. 이 IPC가 자주 거론되는 CPU를 예로 들면, 실제 제품 성능에는 이 아키텍처 IPC뿐 아니라 각 코어가 연결된 방식, 캐시 용량 및 전력 등 기타 다양한 변수의 영향을 받기 때문입니다. 결국 이러한 변수를 배제해야 아키텍처 IPC 측정이 가능한 것인데, 이는 어려운 과제입니다.
때문에 이 IPC 측정이라고 이야기하는 것은 실제 아키텍처 IPC를 측정하는 것은 아닙니다. 대신, CPU를 예로 들어 비교 군의 코어 및 스레드 수, 클록 등 주요 스펙을 동일하게 하여 싱글 코어 성능을 측정하는 동일 클록 비교 테스트를 진행합니다. 이 동일 클록 비교 테스트를 유저들 사이에서 통상적으로 IPC 측정, IPC 성능이라 이야기하죠. 하지만 이 동일 클록 비교 방식은 앞서 언급한 여러 변수의 영향이 있기 때문에 엄밀히 말해 IPC와 동일하거나 혹은 대변한다고 하기엔 어려운 부분이 있습니다.
이러한 한계는 그래픽카드도 마찬가지입니다. 게다가 그래픽카드는 CPU와 달리 사용자가 코어 수, VRAM 등 굵직한 변수를 통제하는 것도 더 어렵습니다. 당장 아키텍처가 다르면서 동일한 연산 유닛(쿠다 코어) 수를 가진 제품을 찾는 것부터가 난관이죠.
하지만 RTX 30 시리즈와 RTX 40 시리즈의 경우 마침 동일한 쿠다 코어를 가진 제품이 존재합니다. 바로 RTX 3070과 RTX 4070입니다. 이번 테스트의 주인공인 두 제품은 동일한 5,888개 쿠다 코어를 가짐으로써 그나마 비슷한 조건에서의 비교가 가능합니다.
RTX 30 대비 RTX 40 시리즈 아키텍처 성능 개선폭을 엿보기 위해 동일 클록 비교 방식을 이용했습니다. 두 그래픽카드 모두 GPU 클록 1,905 MHz와 메모리 대역폭을 512 GB/s로 설정했습니다. 또한 VRAM 용량 변수를 최소화하기 위해 모니터링 간 VRAM 사용량이 8 GB를 넘지 않게끔 게임과 옵션을 설정했습니다. 그래픽카드 클록 설정은 MSI 애프터버너(Afterburner)를 이용했으며, 구체적인 설정값은 아래 자료에서 확인하실 수 있습니다.
클록과 메모리 대역폭을 맞췄지만, 그럼에도 두 그래픽카드 간 스펙 차이는 여전히 존재합니다. ROP(Render Output Unit)와 L2 캐시, 메모리 용량 등 여러 변수가 여전히 남아있습니다.
이번 테스트는 각 세대 간 특정 1개 제품끼리의 비교이고, 진행된 테스트도 광범위하게 이루어진 것은 아니기 때문에 이번 테스트 결과를 RTX 30과 RTX 40간 아키텍처 성능 차이라고 일반화할 수 없다는 점, 짚고 넘어가겠습니다.
▲ 클릭 시 큰 이미지로 보실 수 있습니다.
■ 애프터버너 V/F 커브(Voltage/Frequency Curve) 조정을 통해 GPU 클록 1,905 MHz으로 설정
■ RTX 3070은 메모리 클록 +1,000 MHz 설정으로 16 Gbps 속도, GPU-Z상 클록 2,000 MHz 설정, 대역폭 512 GB/s
■ RTX 4070은 메모리 클록 +160 MHz 설정으로 21.3 Gbps 속도, GPU-Z상 클록 1,333 MHz 설정, 대역폭 511.9 GB/s
■ 테스트간 소프트웨어에서 모니터링되는 VRAM 사용량이 8 GB를 넘지 않도록 해상도, 게임, 옵션을 선정
커스텀 설정 이후 AIDA64 GPGPU 벤치마크를 진행했을 때, 두 그래픽카드 간 FP32(부동소수점) 연산 성능은 동일하게 22.1 TFLOPS(테라플롭스)로 나온 것을 확인할 수 있었습니다.
그러나 GPU와 CPU 간 통신 대역폭, 그리고 GPU에 탑재된 VRAM 간 대역폭 성능은 RTX 4070쪽이 매우 큰 성능 차이를 보여주었습니다. 이는 두 제품 사이 통제하지 못한 다른 변수가 영향을 준 것으로 추측됩니다.
*메모리 읽기/쓰기(Memory Read/Write): GPU와 CPU간의 대역폭. 시스템 메모리에서 GPU 메모리로 데이터를 가져오는 속도를 측정
*메모리 복사(Memory Copy): GPU 자체 메모리 성능. 탑재한 VRAM 내부에서 데이터가 오가는 성능을 측정
아래 내용부터는 테스트 결과로 이어집니다.
항목별 구체적인 테스트 결과는 세부 페이지에서 확인해 주세요.
예상외의 결과로 동클록 비교에서 오히려 RTX 3070이 RTX 4070보다 더 높은 성능을 보여주었다. GPU 클록과 메모리 대역폭을 동일하게 설정하였음에도, 통제되지 않은 다른 변수: ROP 개수 및 L2 캐시 등으로 인해 이러한 성능 차이가 발생했을 것으로 추측된다.
3DMark 포트 로열(Port Royal) 및 다이렉트X 레이 트레이싱(DirectX RayTracing) 테스트에서는 RTX 4070쪽이 더 높은 점수를 보여주었다. 이는 RTX 40 시리즈에서 탑재된 최신 RT 코어 및 텐서 코어(Tensor Core)의 성능이 반영된 것으로 추측된다.
RTX 4070은 RTX 3070과 동클록에서는 소폭 떨어지는 모습을 보여주었지만, 원래 스펙에서는 RTX 4070이 큰 폭의 성능 격차를 보여준다. 동클록 환경을 조성하기 위해 RTX 3070는 오버클록을, RTX 4070은 오히려 GPU 클록을 크게 낮추었기 때문에, RTX 4070의 성능 향상의 상당 부분은 2.5 GHz에 육박하는 높은 부스트 클록이 큰 몫을 한 것으로 풀이된다.
퀘이사존의 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.
RTX 3070, RTX 4070, 그래픽카드, 동일 클럭 비교, 암페어, 에이다 러브레이스, Ampere, Ada Lovelace
RTX 4070 vs. RTX 3070 동클록 비교 테스트
[DX11] 배틀그라운드 | PUBG: BATTLEGROUNDS
[DX12] 바이오하자드 RE:4 | BIOHAZARD RE:4
[DX12] 사이버펑크 2077 | Cyberpunk 2077
[DX12] 포르자 호라이즌 5 | Forza Horizon 5
[VULKAN] 둠 이터널 | DOOM Eternal
댓글: 72개
좋은 모니터, 그냥 사용하지 말고 제대로 사용하세요
모니터 사용 전 반드시 확인해야 할 것
CPU 쿨러에 따라 M.2 슬롯 온도 차이가 있을까?
공랭 쿨러가 M.2 슬롯에 미치는 영향을 알아보자
Photoshop 생성형 AI 기능, 가장 큰 영향을 주는 것은?
Adobe Photoshop (Beta)로 알아본 생성형 AI 속도 비교
서멀이 없는데, 이런 거 써도 괜찮나요?
서멀컴파운드 대신 사용해 본 생활용품 17종
M.2 슬롯에 따른 온도 차이를 알아보자
NVMe SSD 슬롯 위치에 따라 온도 차이는?
팬 RPM 조절로 소음 스트레스에서 벗어나자!
마더보드 제조사별 쿨링팬 속도 조절하기
RTX IO에 따른 게임 로딩 시간 단축은 얼마나 될까?
라쳇 & 클랭크: 리프트 어파트로 알아보는 RTX IO 로딩 시간 비교
삼성 갤럭시 신제품 디스플레이를 모조리 측정했습니다
갤럭시 Z 폴드5 · 플립5 · 탭 S9 · 워치6 디스플레이 성능은?
방법만 알면 어렵지 않아요~
커스텀 키보드 조립 가이드
가변 주사율, HDR, 컬러, 잔상... 모니터 인증이 이렇게 많다고?
모니터 관련 인증은 무엇이 있을까?
커스텀 키보드, 나만 살 순 없지
커스텀 키보드 구매 가이드
보급형 CPU 쿨러, 쿨링팬을 바꾸면 효과가 있을까?
CPU 쿨러, 쿨링팬 교체하면 온도가 내려갈까?
새로산 쿨링팬 어디에 연결해야 하나요?
쿨링팬을 새로 샀는데, 연결할 곳이 없다고요?
RTX 40 시리즈의 성능 향상 비법은?
옛날 이상한 그래픽카드 모음zip
그냥 듀얼 그래픽카드부터 혼종까지
퀘이사존-전 우주급 커뮤니티: 우주의 시작부터 끝까지
퀘이사존 로그인
아이디·비밀번호 찾기 회원가입
공식기사
리포트/취재
국가권력급 비밀병기(2024년 최신판)
이 파워라면 가보로 물려줘도 인정 (2200W)
차세대 라이젠 대공개!!!!! (ZEN5 7월 출시 확정)
레전드 컴백! 오씨포뮬라 떴다!!!
이건, 진짜 사고 싶은데? LG OLED 끝판왕 등장
퀘이사존을 다양한 미디어에서 만나보세요
신고하기
투표 참여자 보기