CPU에 대한 10년의 이야기 변화하는 아키텍처, 변화하는 코어 수 10년이라는 시간은 절대 짧지 않습니다. 이를 방증하듯 위 도표의 프로세서들도 꾸준히 변화하는 모습을 보여주네요. 단순하게는 최신 프로세서로 올수록 코어 수와 클록 수치가 높아진다고 볼 수 있지만, 메모리 지원 클록이나 캐시 증설 등 IPC(Instruction Per Cycle, 사이클 당 명령어 처리 횟수)를 높이고 시스템 성능을 개선하기 위한 시도가 곁들여져 있습니다. 게다가 도표에서는 미처 언급하지 못한 내용, 이를테면 아키텍처의 개선점과 내부 구조의 변화도 결코 잊어서는 안 되죠. CPU 목록은 많은 유저가 사용했거나 이슈가 되었던 제품 중, 제조사별로 6개의 프로세서를 선정해 보았습니다. 아래에서 다시금 서술하겠지만, CPU 스펙 비교에 등장한 프로세서는 고스란히 테스트에도 활용되었다는 점 참고해주세요.
먼저 인텔 프로세서부터 살펴보도록 합시다. 인텔은 현재 9세대 코어 시리즈를 메인스트림 데스크톱 프로세서로 판매 중이며, 최대 8 코어 16 스레드의 i9-9900K/KF/KS부터 4 코어 4 스레드의 i3-9100까지 다양한 제품군을 만나볼 수 있습니다. 모바일에 한정해서는 10세대 코어 시리즈라 불리는 코멧레이크/아이스레이크 프로세서 탑재 노트북이 공개되는 추세죠. 여기서 9세대 혹은 10세대라 부르는 코어 시리즈는 네할렘(Nehalem) 아키텍처가 적용된 최초의 코어 시리즈(정확히는 코어 i 시리즈)부터 시작하는데요. 45 nm 제조 공정과 32 nm 제조 공정이 혼재하는 시기였기에 네할렘/웨스트미어(Westmere)로 나뉘어 모바일부터 서버군까지 다양한 프로세서를 폭넓게 생산했습니다. 여기서부터 인텔이 현재까지도 활용하는 LGA115X 소켓 규격이 처음 등장하죠. 다만, 네할렘의 핵심이었던 블룸필드(Bloomfield)는 LGA1366이라는 확장된 소켓 규격을 활용했는데, 메모리 채널을 듀얼 채널에서 트리플 채널로 늘려 고성능 컴퓨팅 환경을 구현할 수 있는 토대를 마련했습니다. 오늘날 HEDT(High-End Desktop)이라 부르는 고성능 제품군의 시작점이라고 볼 수도 있겠네요.
코어 시리즈가 본격적으로 출시하기 전부터 인텔은 틱-톡(Tick-Tock) 전략을 활용해 왔는데요. 인텔의 틱-톡 전략은 12 ~ 18개월 주기로 제품 생산 텀을 두고 두 가지 제조 방향을 번갈아 적용하는 것을 의미합니다. 틱-톡 전략의 두 가지 제조 방향은 다음과 같습니다.
* 틱(Tick) : 제조 공정 전환과 아키텍처의 개선 * 톡(Tock) : 새로운 아키텍처 개발
이렇게 두 가지 방향으로 나누어 교대로 진행한 생산 전략은 제법 효과적이었습니다. 틱-톡 전략의 출발점이라고 볼 수 있는 펜티엄 D(Pentium D) 제품군부터 6세대 코어 시리즈인 스카이레이크(Skylake)에 이르기까지 지속적인 성능 발전을 도모할 수 있었으니까요. 새로운 아키텍처를 발전하는 것이 무조건 긍정적인 방향으로 작용하지는 않았지만, 연구팀을 여럿 나누어 개발 기간을 최대한 오래 가져갈 수 있도록 하는 내부 운영 전략과 경쟁할 만한 제품이 시장이 없다는 상황이 맞물려 실험적인 프로세서나 매력적인 프로세서를 만나볼 수 있기도 했습니다. 대표적인 실험 성향의 기능으로는 CPU의 내부 콤포넌트에 인가되는 전압을 CPU 내에서 직접 조절하는 FIVR(Fully Integrated Voltage Regulator) 기능, 위 스펙 비교표에는 언급되지 않았지만 브로드웰(Broadwell)에서 최초이자 최후의 L4 캐시로 활용된 eDRAM 기능 등이 먼저 떠오릅니다.
인텔 코어 프로세서에 대한 전반적인 이야기를 했으니, 위 도표에 언급된 6개의 프로세서도 간략히 언급해볼 필요가 있겠습니다. 1세대 코어 시리즈 중 네할렘(Nehalem) 아키텍처가 적용된 블룸필드 i7-920은 4 코어 8 스레드로 구성된 프로세서로, LGA1366 소켓 규격을 지닌 X58 마더보드에서 구동되는 제품이었습니다. DDR3 메모리가 적용됨과 동시에 트리플 채널로 동작했기에 6개의 메모리 슬롯을 가득 채운다는 로망이 있던 제품이죠. 오버클록도 제법 높은 선까지 가능했기 때문에 의외로 오랫동안 살아남은 플랫폼이기도 합니다.
다음은 본격적으로 코어 시리즈 독주의 포문을 연 제품, 2세대 코어 시리즈인 샌디브리지(Sandy Bridge)와 4세대 코어 시리즈인 하스웰(Haswell)입니다. 두 제품 모두 강력한 존재감을 드러냈을 뿐만 아니라 경쟁사의 제품을 깊은 수렁으로 빠지게 만든 프로세서죠. 하스웰 프로세서에 와서는 FIVR이라는 새로운 도전을 시도했지만, 차후 나올 플랫폼의 저전력 구동에 걸림돌이 되는 문제와 오랜 기간 개발해온 온 다이 인덕터(On-Die Inductor)가 완성되지 않은 시기적 상황, 무엇보다 많은 개발비가 들어가면서 신제품 출시를 늦출 수는 없는 노릇이기에 5세대 코어 시리즈인 브로드웰을 끝으로 FIVR을 포기하게 되었습니다.
마지막은 레이크 형제로 일컫는 6세대~9세대 코어 시리즈입니다. 14 nm 제조 공정이 적용되면서 기본 클록과 부스트 클록, 오버클록 잠재력이 더욱더 높아지게 되었죠. 또한 기존까지 취하던 틱-톡 전략을 포기하고 P-A-O(Process-Architecture-Optimization)으로 불리는 3단계 제조 전략을 적용하기 시작합니다. 물론 다들 아시다시피 이 전략은 공정 전환의 지연 문제와 얽히면서 14 nm라는 늪에 빠져 실패로 돌아가죠. 결국 인텔은 새로운 아키텍처를 적용하는 대신 코어 수를 늘리고 클록을 높이는 방향으로 선회하게 됩니다만, 제조 공정 자체의 숙련도가 상승하면서 코어 클록의 잠재력을 극한까지 끌어올릴 수 있었습니다. 결국 8세대와 9세대 코어 시리즈에서는 코어 수와 클록 수치를 한계치까지 끌어올리면서 높은 성능을 구사하는 것 자체는 가능했죠. 특히 코어 수보다는 클록 수치와 메모리 레이턴시에 민감하게 동작할 수밖에 없는 게임에서는 독보적인 게이밍 머신의 역할을 수행해 냅니다.
하지만 모든 부분에서 긍정적인 상황만 펼쳐졌던 것은 아닙니다. 코어 시리즈 아키텍처의 기본 토대라고 할 수 있는 P6 아키텍처에서 적용된 OOE(Out of Order Excution, 비순차적 실행)는 2018년 최대의 CPU 보안 게이트를 야기했고, 대다수의 코어 시리즈는 이 보안 문제에서 벗어날 수 없었습니다. 게다가 새로운 아키텍처 적용이나 공정 전환이 이루어지지 못하던 시기, 더는 경쟁 업체로 보이지 않았던 AMD가 젠(ZEN) 아키텍처를 적용한 라이젠 시리즈를 새롭게 공개하면서 시장 상황은 점차 바뀌어가기 시작했죠. 최초 로드맵보다 이미 상당히 늦어져버린 아이스레이크의 등장 소식을 아직까지도 듣기 어려운 상황에서, 인텔은 앞으로 해결해야 할 숙제가 여전히 많이 남은 것 같습니다.
다음은 AMD 프로세서에 관해 얘기해볼 차례겠네요. AMD는 현재 2세대 및 3세대 라이젠 프로세서를 절찬리 판매 중이며, UEFI 펌웨어가 업데이트된 AM4 소켓 마더보드를 이용하면 세대를 막론하고 시스템 구성이 가능하다는 장점이 있습니다. 라이젠 시리즈에 대한 호환성을 2020년까지 약조했으며, DDR5 메모리가 등장할 것으로 예상되는 2021년부터는 마더보드 소켓이 교체될 예정이죠. AMD는 국내외 시장을 막론하고 젠2 프로세서로 성공적인 판매고를 올리고 있는 상황입니다. 오랫동안 침묵을 유지하던 기업의 반전 스토리가 시작된 셈이죠.
AMD의 현대 마이크로프로세서는 명확한 경계를 짓기가 조금 복잡합니다. 인텔과 경쟁 관계에 있으면서도 '세계 최초'라는 타이틀(세계 최초 1 GHz 돌파, 세계 최초 x86 호환 64비트 CPU 제조 등)을 몇 차례 선점한 AMD는 인텔보다 확실한 우위를 점하기 위해 세계 최초 네이티브 듀얼 코어로 구성된 애슬론 X2를 야심 차게 출시했으며, 출시 초반부에는 인텔 최악의 제품 중 하나인 펜티엄 D 시리즈와 경쟁 구도를 이어가면서 상대적으로 좋은 분위기를 이어갔습니다. 하지만 인텔이 만들어낸 회심의 제품, 코어 2 시리즈의 시작인 콘로(Conroe)가 등장하자 분위기는 확연히 달라졌습니다.
이후 가격 하락과 다양한 라인업을 구축하면서 AMD 나름대로 경쟁 구도를 이어가기 위한 노력을 계속하지만, 콘로 이후 분위기 반전에 성공한 인텔은 차근차근 다음 단계로 전환을 해나갔습니다. AMD 역시 지속적인 경쟁을 위해 K9 아키텍처를 포기하는 대신 AM2라는 통합형 소켓으로 프로세서를 생산하기 시작했는데, 당시 출시하던 브리즈번 계열 프로세서는 한 번쯤 사용해본 유저들이 많을 것 같네요. 이후 AMD는 시장 경쟁을 위해서 K10 아키텍처가 적용된 페넘(Phenom) 프로세서를 출시하기 시작합니다. 다만, 페넘 시리즈는 전체적으로 K8 아키텍처를 계승하면서 최적화한 형태인 만큼 인텔처럼 혁신적인 성능 향상으로 이어지지는 않았다는 차이가 있습니다. 게다가 절대적인 성능에서 경쟁사의 제품군보다 상당히 밀리는 추세였기 때문에 점차 입지가 좁아지고 있었죠.
아마 여러분도 들어보았거나 사용해보았을 법한 제품군은 K10 아키텍처의 마이너 업그레이드 버전인 K10.5 아키텍처* 제품이 아닐까 생각합니다. 바로 페넘 II(Phenom II) 제품군이죠. 어쩌면 페넘 II나 K10.5 아키텍처라는 명칭보다는 데네브(Deneb)나 헤카(Heka), 칼리스토(Calisto)와 같은 별의 이름이 더 친숙하게 느껴지실 수도 있겠네요. 페넘 II 제품군은 AM2+와 AM3로 각각 등장했지만, 추후 AM3+ CPU가 나올 때까지 장수했던 제품군으로도 유명합니다. 하지만 페넘 II를 더욱더 유명하게 만든 것은 따로 있었으니, 바로 '코어 부활'입니다. 이유는 여러 가지가 있겠지만, AMD는 코어의 일부를 소프트웨어적으로 잠근 상태로 헤카나 칼리스토 프로세서로 판매했으며, SB710 이상 사우스 브리지(South Bridge)가 활용된 마더보드에서 ACC(Advanced Clock Calibration/제조사에 따라 다른 명칭으로도 불림) 기능을 활성화하는 것만으로도 간단히 잠긴 코어를 활성화하는 것이 가능했습니다. 그래서 당시 '칼네브'나 '헤네브'와 같은 별명을 지닌 부활 CPU가 다양하게 등장했고, 조금 더 범주를 넓혀 L3 캐시를 탑재하지 않은 프로푸스(Propus)나 라나(Rana) 프로세서에서도 드물기는 했지만 L3 캐시 혹은 코어를 부활시킨 '프네브'와 '라카', '라네브'가 존재했습니다.
* 본문에서는 쉬운 이해를 위해 K10.5 아키텍처라고 표기를 했으나, 매체나 커뮤니티의 표현 방식에 따라서는 K10 아키텍처로 통합하여 부르기도 하는 경우도 많았습니다. 따라서 한쪽이 잘못된 표현이 아니라는 점 참고 바랍니다.
하지만 K10 프로세서 이후 '바르셀로나'로 알려져 있던 차세대 CPU(다만, 이 코드네임의 CPU는 초기 루머와 달리 차후 옵테론 라인업으로 분류됩니다)의 개발이 지연되면서 유저들의 불안감은 증폭했습니다. 결국 우여곡절 끝에 출시된 불도저(Bulldozer) 아키텍처 CPU, AMD의 상위 모델에 부여되던 'FX'를 물려받은 AMD FX 프로세서는 기대보다 실망을 안겨주기에 충분했습니다. 앞으로 다가올 미래에는 멀티스레딩 작업이 활발하게 이루어지고 멀티코어가 작업 효율을 높여줄 것으로 기대되었기에, AMD는 기존에 고수해오던 방식에서 벗어나 CMT(Clustered Multi-Threading) 구조를 채용했습니다. 하나의 온전한 코어 대신, 일부 내부 유닛(대표적으로 엄격하게 스케줄링된 부동 소수점 유닛)을 공유하는 소형 코어 2개를 하나의 모듈로 구성해서 필요에 따라서 하나의 코어 혹은 두 개의 코어처럼 활용할 수 있는 범용성을 노렸습니다. 하지만 이 시기의 AMD는 기업 규모의 축소를 위해서 엔지니어를 대거 이탈시키고, 코어 제조 과정 역시 자동 공정화를 도입하면서 인건비를 줄이려는 모습을 보였습니다. 당연하겠지만 결과물이 좋기는 어려웠죠. 경쟁사의 코어 시리즈가 세대를 거듭하면서 긍정적으로 발전하는 모습을 보였다면, AMD는 기업 존속 자체가 위험해 보일 정도로 부정적인 방향으로 돌아갔습니다.
다행히도 회사의 수장이 바뀌고 아키텍처 설계의 권위자인 짐 켈러(Jim Keller)를 영입하면서, AMD는 절치부심하는 마음으로 젠(ZEN) 아키텍처를 설계해 나갔습니다. 몇 세대에 걸쳐 개량해보려고 시도했지만 한계점을 돌파하지 못했던 불도저 시리즈와는 달리, 라이젠 시리즈는 인텔과 마찬가지로 SMT(Simultaneous Multi-Threading) 구조를 적용하기 시작했습니다. 게다가 코어 수도 최대 8개로 늘려서 메인스트림 데스크톱 라인업에서 가격 대비 성능을 극한까지 끌어올리는 데 성공했죠. 앞으로도 지속적인 제조 공정 전환과 아키텍처 개선을 약속한 만큼, 그 약속이 꾸준히 지켜지기를 기대해봐야겠네요.
인텔 프로세서 소개 내용과는 달리, AMD는 10여 년간의 변화와 CPU 소개를 함께 마쳤으니 각 제품은 가볍게 살펴보도록 하죠. 먼저 K10 아키텍처의 핵심 제품군이었던 투반 1055T와 데네브를 대체할 조스마 960T 프로세서, 불도저 아키텍처의 개량형인 파일드라이버 FX-8350 프로세서가 테스트 제품군으로 채택되었습니다. APU 라인업을 제외하기는 서운하니, 라이젠 시리즈 등장과 함께 공개된 마지막 엑스커베이터 APU인 A12-9800 프로세서도 포함시켜 보았습니다.
라이젠 시리즈는 1세대 라이젠의 완성형이라고 할 수 있는 2세대 라이젠 프로세서, 라이젠 7 2700X를 포함시켜 두었고, 일반 사용자가 구매할 수 있는 마지노선 영역이라 생각되는 3세대 라이젠 프로세서, 라이젠 9 3900X도 포함되었습니다.
이것으로 총 12개의 프로세서와 10여 년간 각 제조사의 변화 방향에 대해 길고 장황한 설명이 끝났네요. 여기까지가 지루한 영역이었다면, 아래에서 후술할 내용은 본격적인 성능 측정에 대한 풀이입니다. 10여 년 전에 사용하던 프로세서와 최신 프로세서는 어느 정도의 성능 차를 보여줄 것인지 저 또한 상당히 궁금했고, 그 결과는 예상보다 훨씬 큰 차이로 느껴졌는데요. 항목별로 차근차근 살펴보도록 합시다.
|