AMD 젠3 성능 무쳤다! 대체 뭐 땜에? 해답은 아키텍처

무려 14년 만에 인텔 게이밍 성능을 누른 비밀

QM벤치
285 19727 2020.11.05 22:47

▲ 2 페이지에서 눈물 없이 볼 수 없는 AMD 역사를 감상해보세요






안녕하세요. QM벤치입니다.


AMD 라이젠 5000 시리즈 CPU 성능 어떠셨나요? 제품을 바라보는 기준과 평가는 각기 다를 수 있겠지만, 적어도 매우 인상적인 성능 향상을 일구어냈다는 점은 이견이 없을 것 같습니다. 특히나 동일한 7 nm 공정 기술을 유지하고도 그동안 게이밍 성능만큼은 단연 최고였던 인텔 CPU를 확실히 제압하는 모습은 컴덕후로서 만감이 교차하기도 하였습니다. AMD가 드디어 해낸 것이죠. 물론 라인업별 가격이 $50씩 일률적으로 상승한 것은 확실히 아쉬운 지점이긴 합니다. 이렇게 되면 하위 라인업으로 갈수록 상대적으로 비싸졌다는 체감이 더 커지기 때문이죠. 제품에 대한 자신감으로 해석할 수도 있고, 어쩌면 가격을 올릴 수밖에 없는 내부사정이 있을지도 모르겠습니다. 그러나 분명한 건 가격이 상승했고, 더이상 가성비로만 승부하지 않겠다는 뜻으로 해석됩니다. 그만큼 상대적 지위가 상승한 것 또한 사실이니까요.


어떻게 이런 성능 향상이 가능했을까요? 답은 바로 프로세서 내부, 즉 아키텍처(Architecture) 개선에 있습니다. 라이젠 5000 시리즈는 바로 이전 세대 라이젠 3000 시리즈가 사용했던 젠2(ZEN2) 아키텍처를 대폭 개선한 젠3(ZEN3) 아키텍처를 사용했는데요. 따라서 본 기사에서는 젠3 아키텍처를 들여다보려고 합니다. 그러나 자신이 '찐' 컴덕후가 아니라면 ‘아키텍처따위 알 바 아냐! 어렵다구!’ 이런 생각 가지신 분들 적지 않으실 겁니다. 전문용어가 난무하는 아키텍처 내부는 사실 컴덕후에게도 어려우니까요. 따라서 이를 염두에 두고 최대한 쉽게 다뤄보도록 하겠습니다.

자 이제 지루한 아키텍처 세상으로 힘차게 출발해볼까요?






AMD 젠 아키텍처 여정은 ZEN/ZEN+로부터 시작합니다. 상품명은 각각 라이젠 1000/2000 시리즈였죠. 사실 젠 등장 전까지의 AMD는 ‘불도저(Bulldozer)’ 그리고 ‘파일드라이버(Piledriver)’ 아키텍처로 데스크톱 프로세서 제품군을 꾸렸으나, 그야말로 처참한 IPC 성능과 당시 시장상황에 맞지 않는 성능 특징으로 암흑기를 보내야만 했습니다. 그러다 무성한 소문과 루머를 양산하던 젠 아키텍처 기반 라이젠(Ryzen) 프로세서가 등장하면서, 드디어 쓸만한 성능의 AMD CPU가 나타났다는 평가를 받았습니다. 무엇보다 라이젠 프로세서가 가진 매력이라면, 인텔 대비 동가격대에서 더 많은 스레드를 갖춰 인텔이 가격 대비 스레드 증식 시점을 앞당겼다는 것이었습니다.


이어서 등장한 젠+ 아키텍처 기반 2세대 라이젠은 아키텍처 변화는 크지 않았으나 공정(14 nm -> 12 nm)과 레이턴시(Latency)를 개선하고 클록을 향상시켜 상품성을 끌어올렸습니다. 이런 노력이 성능 향상으로 이어진 건 명백한 사실이지만, 여전히 게이밍 성능은 인텔 대비 낮은 성능이었습니다, 시장에서는 다소 아쉬운 부분을 감수하더라도 출중한 작업 성능과 쓸만한 게이밍 성능을 갖춘 가성비 CPU 이미지가 형성되었죠. 특히 사용자 용도에 따라서는 인텔 CPU 대비 큰 만족감을 주기도 하였습니다.

그리고 젠2 아키텍처 기반 3세대 라이젠에서 제법 많은 변화가 일어났습니다. TSMC 7 nm를 사용하여 공정이 대폭 개선되었고, 코어와 IO를 각기 별도 다이로 분리하는 구조적으로 큰 변화도 있었습니다. 더불어 클록과 IPC가 제법 향상되었고, 캐시 메모리와 인피니티 패브릭(Infinity Fabric) 그리고 메모리 확장성까지 많은 부분을 손 본 물건이었죠. 덕분에 게이밍 성능 역시 인텔 CPU 대비 넘어서지는 못해도 꽤나 근접하는 수준까지 도달하였습니다. 사실 상대적으로 더 뛰어난 멀티스레드 성능은 라이젠의 패시브 능력과도 같았기에, 게이밍 성능의 발전은 결국 상품성을 높이는 열쇠로 작용했습니다.





그리고 이제 라이젠 5000 시리즈라는 이름으로 우리에게 다가온 젠3 아키텍처입니다. 쉽게 알아볼 수 있는 차이는 클록과 IPC 향상 그리고 새로운 복합 코어 구조 즉 CCX(Core Complex) 당 코어 구성을 4코어에서 8코어로 개편하여 L3 캐시 효율이 대폭 향상된 점을 꼽을 수 있습니다. 젠 3 아키텍처를 설계함에 있어 AMD의 목표는 명확했는데요 단일 스레드 성능을 크게 향상시키고, CCX 구조 개편으로 레이턴시를 줄여 결과적으로 효율성을 끌어올리는 것이었습니다.





앞서 언급한 CCX 개편 외에도 프론트 엔드 및 연산 영역 전반에 걸쳐 개선이 이루어져 19% IPC 향상을 달성했는데요. 여기에는 캐시 프리페칭(Cache Prefetching 캐시에 메모리 데이터를 미리 올려두는 과정), 실행 엔진, 분기 예측기(Branch Predictor), 마이크로-op 캐시, 프론트 엔드(Front End) 로드/스토어 등 개선사항이 포함됩니다. 너무 어렵다고요? IPC 향상을 위해 아키텍처 구조 효율성을 높인 것으로 이해하시면 됩니다. 무엇보다 가장 와닿는 변화는 바로 CCX와 L3 캐시 구조 개선입니다.



▲ 라이젠 3 3100과 라이젠 3 3300X 토폴로지


CCX 구조가 중요한 이유는 게임 성능에 상당한 영향을 끼치기 때문인데요. 2020년 5월에 출시된 라이젠 3 3300X와 라이젠 3100의 성능 양상이 이를 뒷받침 합니다. 당시 두 모델은 동일한 4코어 8스레드 구성이었지만, 3100은 2코어 4스레드/8MB L3 캐시로 구성된 반쪽자리 CCX 2개를 사용하였고, 3300X는 4코어 8스레드/16MB L3 캐시의 온전한 CCX 1개를 사용하였습니다. 결과적으로 온전한 CCX 1개를 사용한 3300X 게임 성능이 매우 뛰어났습니다. 물론 두 모델은 클록 등 세부 스펙에서 차이가 있긴 했으나, 게이밍 성능에서는 표면적인 스펙 차이를 벗어나는 수준이었기 때문이죠. 즉 젠3 아키텍처의 CCX 구조 개편은 게이밍 성능에 직접적인 영향을 끼칠 수밖에 없습니다.



▲ CCD 레이아웃 비교(좌: 젠2 아키텍처, 우: 젠3 아키텍처)


▲ 젠2 아키텍처 CCD + cIOD 토폴로지



▲ 젠3 아키텍처 CCD+ cIOD 토폴로지


위 슬라이드 이미지가 젠2와 젠3 아키텍처 차이를 단적으로 잘 보여줍니다. 예를 들어 8코어 프로세서를 만들고자 할 때, 젠2 아키텍처는 CCD(Core Compute Die)에 4개 코어와 16 MB L3 캐시가 묶인 CCX를 2개 탑재합니다. 즉 단일 코어가 직접 액세스(Access, 접근)하는 L3 캐시 용량은 16 MB입니다. 그러나 젠3 CCD는 단일 CCX가 8개 코어와 32MB L3 캐시를 품는 것으로 바뀌었습니다. 즉 8코어 프로세서의 L3 캐시 용량만 보면 32 MB로 동일하지만, 16 MB + 16 MB과 32 MB는 효율 면에서 차이가 날 수밖에 없는 것이죠. 다소 어렵게 느껴질 수 있기에 라이젠 7 3800X와 라이젠 7 5800X를 대표 모델로 선정하여, 완전히 정확하진 않더라도 일상적 언어로 비유해보겠습니다.


▲ 젠2 아키텍처와 젠3 아키텍처의 핵심 차이를 도식화한 이미지(퀘이사존 제작)

32종 음식을 제공하는 뷔페에 8명이 방문하는 상황을 가정하겠습니다. 젠2 아키텍처로 만든 뷔페는 테이블이 4석 규모라 8명이 A 테이블과 B 테이블로 나누어 앉았습니다. 음식 또한 각 테이블에 32종이 모두 있는 것이 아니고 16종씩 놓여있고요. 여기서 만약 A에 앉은 사람이 B 테이블 음식을 먹고 싶다면, 의자에서 일어나 B 테이블로 이동해야 합니다. 불편한 건 당연하고 B 테이블 음식을 먹는 과정에서 상대적으로 더 많은 지연시간(Latency)이 발생하게 되죠. 


그러나 젠3 뷔페는 8석 규모 테이블에 32종 음식이 모두 놓여 있습니다. 즉 8명이 모두 같은 테이블에 둘러 앉아 32종 음식을 자리에서 이동하지 않고 먹을 수 있습니다. 젠2는 한 사람이 이동하지 않고 먹을 수 있는 음식이 16종에 한정되었지만, 젠3는 앉은 자리에서 32종 모든 음식을 먹을 수 있는 것이죠.


뷔페=아키텍처

테이블=CCX

손님=코어

음식=L3 캐시


이해가 되셨나요? 물론 이 개념을 확장시킨다면, 모자란 음식을 보충하기 위해 요리가 이루어지는 공간, 즉 주방은 램(RAM), 음식 재료가 보관되어 있는 창고는 스토리지(SSD/HDD 등) 개념으로 설명하는 것 역시 가능합니다. 방금 비유한 내용을 토대로 라이젠 3000 시리즈와 라이젠 5000 시리즈 제품 라인업을 도식화하였습니다.




그림에 등장하는 빨간색 X 표시는 비활성화된 코어라는 뜻입니다. 일명 컷칩으로 불리기도 하는데요. 이러한 형태의 컷칩은 반도체 제조공정 수율 상황이나 제조사 전략에 따라 일부 코어가 비활성화된 칩을 하위 라인업으로 판매합니다. 비단 AMD만 취하는 전략은 아니며, 인텔, NVIDIA 등의 회사에서도 유사한 전략으로 라인업을 구성합니다.

전반적으로 라이젠 5000 시리즈의 젠3 아키텍처는 젠2 대비 단일 코어와 직접 액세스하는 L3 캐시 용량이 2배가 되면서 효율성이 향상된 것으로 풀이할 수 있습니다. 구조는 간단할수록 좋기 때문이죠.





당당하게 월드 베스트 게이밍 프로세서라고 명시한 대목에서 AMD의 근거있는 자신감이 폭발합니다. 아키텍처 개선이 중요한 이유입니다. 실로 드라마틱한 성능 향상을 달성하는 데 성공하였기 때문에 저 역시 인정합니다. 19% IPC 향상, CCX 구조 변화로 레이턴시 감소 및 메모리 액세스 효율 향상, 더 높은 클록과 대폭 향상된 게이밍 성능 등으로 귀결되는 젠3 아키텍처는 확실히 AMD가 일구어낸 쾌거입니다.





그리고 고성능을 향한 AMD 모멘텀(Momentum)은 계속됩니다. 젠3 아키텍처 외에도 5 nm 공정 기반 젠4 아키텍처가 로드맵에 등장합니다. 젠3로 입증한 역량이 충격적인 탓인지 사뭇 감상에 젖어 젠 아키텍처 이후 AMD가 걸어온 길은 곰곰이 곱씹게 됩니다. 신제품 출시 전까지 ‘암레발’로 불리며 빈축을 샀던 적도 있었고, 때로는 부정적인 요소가 과장되어 억울한 입장에 놓이기도 했습니다. 물론 전례가 있었기에 AMD가 마냥 깨끗하다고 볼 수 없는 측면이 있죠. 게다가 AMD만 특별한 상황에 놓이는 것이 아니라 소비자에게 평가를 받는 모든 제조사들이 같은 처지이기에 굳이 동정표를 주고 싶지 않습니다.







강력한 성능으로 완성된 젠3


그러나, 이제는 전혀 다른 상황으로 바뀌었습니다. AMD가 내놓은 라이젠 5000 시리즈는 모든 부문에서 실로 놀라운 성능 향상을 입증하였고, 시장의 평가를 기다리고 있습니다. 물론 UEFI 안정성과 프로세서 운용 알고리즘에 대한 사용자 검증 영역이 남아있기에 섣부르게 찬양하는 것은 지양해야겠으나, 2006년 이후 단 한번도 넘지 못했던 인텔의 벽을 부수는 이 순간은 저 역시 컴덕후로서 그저 놀랍기만 합니다. 이런 일이 일어나기까지 무려 14년이란 세월이 흘렀습니다. 젠 아키텍처 등장 이전까지 CPU 시장은 그야말로 인텔 천하였기에, 제품 라인업과 코어 구성별 가격대 등 모든 영역이 인텔의 의지대로 조정되었고 흘러갔습니다. 그러다 라이젠 프로세서가 등장하면서 변화가 생겨났고, 젠2를 거쳐 젠3에 와서는 급기야 인텔의 마지막 자존심 ‘게이밍 성능’까지 무참히 짓밟았습니다.


향후 CPU 시장은 어떻게 될까요? 과거 콘로 등장 이전 최고 성능을 자랑하던 AMD 애슬론 64 FX CPU의 높은 가격을 생각해보면 바로 답이 나옵니다. 이제는 인텔이 분발해야 할 때라는 것이죠. 늘 그랬듯이 서로 피튀기는 경쟁을 유지하는 게 소비자 입장에서는 가장 좋습니다. 그리고 소비자의 선택은 늘 냉정한 법이죠. 그동안 이런 그림을 그리며 AMD를 응원하셨던 분들 역시 완전히 같지는 않더라도 놀라운 마음과 함게 만감이 교차하실 거라 생각합니다. 마지막으로 이러한 경쟁 구도 안에서 퀘이사존 회원분들 나아가 소비자분들 각자에게 적합한 판단과 선택을 할 수 있도록, 퀘이사존 역시 노력을 아끼지 않겠습니다.


이상, QM벤치였습니다.







퀘이사존의 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.​


댓글: 285

신고하기

신고대상


신고사유

투표 참여자 보기