퀘이사존 35 Intel vs AMD 프로세서 비교: 어느 것이 더 낫습니까?

CPU/MB/RAM
퀘이사존 QM지림
39 6072

2021.07.22 10:24

하드웨어에 미치고 유저들을 사랑하는 남자, 퀘이사존 최고운영자 QM지림입니다.

본 뉴스는 해외 매체의 단순 번역본으로 퀘이사존의 주관적인 견해가 포함되지 않았음을 밝혀드립니다.

여러분들의 소중한 댓글은 콘텐츠, 뉴스 번역/창작자에게 큰 힘이 됩니다.


퀘이사존


Intel과 AMD는 50년 이상 동안 두 개의 주요 프로세서 회사였습니다. 둘 다 x86 ISA를 사용하여 칩을 설계하지만 지난 10여 년 동안 CPU는 완전히 다른 경로를 택했습니다. 2000년대 중반에 Bulldozer 칩이 도입되면서 AMD는 Intel에 대해 입지를 잃기 시작했습니다. 낮은 IPC와 비효율적인 디자인의 조합은 회사를 거의 바닥으로 몰아넣었습니다. 이것은 거의 10년 동안 계속되었습니다. 2017년 Zen 마이크로아키텍처가 등장하면서 상황이 바뀌기 시작했습니다.


퀘이사존


새로운 Ryzen 프로세서는 IPC, 단일 스레드 성능, 특히 MCM 또는 모듈식 칩렛 설계로의 전환에 중점을 두어 CPU에 대한 AMD의 접근 방식을 완전히 재구성했습니다. 한편 Intel은 2011년 Sandy Bridge가 출시된 이후로 어느 정도 정확하게 작업을 계속하고 있습니다.


모든 것은 Zen에서 시작되었습니다.

1세대와 2세대 Ryzen은 Core i5-7600K와 같은 부품보다 더 많은 코어와 더 많은 스레드를 제공하여 Intel의 미드레인지 노력에 스포일러가 되었습니다. 그러나 대기 시간과 같은 하드웨어 측면 문제와 Ryzen에 최적화된 게임이 부족하다는 것은 Intel이 여전히 게임 워크로드에서 상당한 성능 우위를 차지하고 있다는 것을 의미합니다.


퀘이사존


Zen 2 기반 Ryzen 3000 CPU의 도입으로 게임 섹션에서 AMD의 상황이 개선되기 시작했으며 마침내 Zen 3 기반 Ryzen 5000 CPU의 출시로 Intel의 게임 왕관을 빼앗겼습니다. IPC의 급격한 개선은 AMD가 더 많은 코어를 제공할 수 있었지만 단일 스레드 워크로드에서도 Intel과 견줄 수 있음을 의미했습니다. Skylake 리프레시-리프레시-리프레시를 구입한다고 해서 반드시 더 나은 프레임 속도를 얻을 수 있는 것은 아닙니다.


퀘이사존


AMD와 Intel은 근본적으로 다른 프로세서 설계 철학을 가지고 있거나 가지고 있었습니다. 차이를 이해하는 데 도움이 될 수 있는 성가신 초등학교 비유입니다. 어떤 게 더 많은 과일이죠? 수박이요, 사과 1킬로요? 하나는 정말 큰 과일이에요. 그리고 다른 하나는, 음, 많은 작은 과일들이에요. 다음 섹션에서 자세히 살펴볼 때 참고하시기 바랍니다.


Intel 모놀리식 프로세서 설계 대 AMD Ryzen Chiplets

인텔은 프로세서 설계에 대한 모놀리식 접근 방식을 따릅니다. 이것이 본질적으로 의미하는 바는 주어진 프로세서의 모든 코어, 캐시 및 I/O 리소스가 물리적으로 동일한 모놀리식 칩에 있다는 것입니다. 이 접근 방식에는 몇 가지 분명한 이점이 있습니다. 가장 눈에 띄는 것은 대기 시간 감소입니다. 모든 것이 동일한 물리적 기판에 있기 때문에 서로 다른 코어가 통신하고 캐시에 액세스하고 시스템 메모리에 액세스하는 데 훨씬 적은 시간이 걸립니다. 대기 시간이 감소합니다. 이는 최적의 성능으로 이어집니다.


퀘이사존

인텔의 모놀리식 디자인



다른 모든 것이 동일한 경우, 단일 접근 방식은 항상 최고의 성능을 제공합니다. 하지만 큰 단점이 있습니다. 이는 비용과 규모 면에서 볼 수 있습니다. 이제 실리콘 수율의 경제성을 잠깐 살펴볼 필요가 있습니다. 


모놀리식 CPU는 최고의 성능을 제공하지만 비싸고…

파운드리가 CPU(또는 그 문제에 대한 모든 실리콘 조각)를 제조할 때 100% 수율을 거의 관리하지 않습니다. 수율은 만들어진 사용 가능한 부품의 비율을 나타냅니다. Intel의 14nm++++와 같은 성숙한 프로세스 노드에 있는 경우 실리콘 수율은 70%를 초과합니다. 이것은 당신이 사용 가능한 CPU를 많이 얻는다는 것을 의미합니다. 하지만 그 반대는 CPU 10개를 제조할 때마다 적어도 2~3개의 결함이 있는 장치를 폐기해야 한다는 것입니다. 폐기된 단위는 분명히 돈을 벌기 위해 비용이 들므로 그 비용은 최종 판매 가격에 포함되어야 합니다.


퀘이사존


코어 수가 적으면 모놀리식 접근 방식이 잘 작동합니다. 이것은 대부분 인텔의 메인스트림 소비자 CPU 라인이 최근까지 4코어를 차지한 이유를 설명합니다. 그러나 코어 수를 늘리면 모놀리식 접근 방식을 사용하면 비용이 기하급수적으로 증가합니다. 왜 이런 걸까요?


모놀리식 다이에서는 모든 코어가 작동해야 합니다. 8코어 칩을 만들고 8코어 중 7코어가 작동하면 여전히 사용할 수 없습니다. 수익률이 70%를 초과하는 것에 대해 우리가 말한 것을 기억하십니까? 수학적으로, 10%의 결함률은 모놀리식 다이의 추가 코어마다 누적되며, 예를 들어 20코어 Xeon의 경우 Intel은 실제로 사용 가능한 모든 코어에 대해 하나 또는 두 개의 결함 칩을 버려야 합니다. 기능적이어야 합니다. 비용은 코어 수에 따라 선형적으로 확장될 뿐만 아니라 낭비로 인해 기하급수적으로 확장됩니다.


퀘이사존


또한 14nm 용량을 확장할 때 새로 시작된 공장은 기존 공장과 동일한 수준의 프로세서 수율을 갖지 않습니다. 이것은 이미 인텔의 프로세서 부족과 그로 인한 F 시리즈 CPU로 이어졌습니다.


이 모든 것의 결과는 인텔의 프로세스가 낮은 코어 수에서 가격과 성능 경쟁력이 있지만 적은 마진이나 손실로 판매하지 않는 한 더 많은 코어 수에서는 유지될 수 없다는 것입니다. AMD가 Ryzen 3 SKU를 제공하는 것보다 듀얼 코어 및 쿼드 코어 프로세서를 제조하는 것이 틀림없이 더 저렴합니다. 이제 그 이유를 알아보겠습니다.


퀘이사존


칩, 칩렛 및 다이

AMD는 프로세서 설계에 대해 칩렛 기반 또는 MCM(다중 칩 모듈) 접근 방식을 채택합니다. 각 Ryzen CPU를 AMD 말에서 Superglue-Infinity Fabric과 함께 결합된 여러 개별 프로세서로 생각하는 것이 합리적입니다. 하나의 Ryzen CCX는 L3 캐시와 함께 4코어/8코어 프로세서를 갖추고 있습니다. 두 개의 CCX(Zen 3이 포함된 단일 8코어 CCX)가 CCD에 함께 붙어 Zen 기반 Ryzen 및 Epyc CPU의 기본 빌딩 블록인 칩렛을 만듭니다. 최대 8개의 CCD를 단일 MCM(다중 칩 모듈)에 스택할 수 있으므로 Threadripper 3990X와 같은 소비자 Ryzen 프로세서에서 최대 64개의 코어를 허용합니다.


퀘이사존


이 접근 방식에는 두 가지 큰 이점이 있습니다. 우선 비용은 코어 수에 따라 다소 선형적으로 확장됩니다. AMD의 낭비율은 기껏해야 기능적인 4코어 블록(단일 CCX)을 생성할 수 있는 것에 비례하기 때문에 결함이 있는 CPU를 대량으로 버릴 필요가 없습니다. 두 번째 장점은 결함이 있는 CPU 자체를 활용할 수 있다는 점입니다. Intel이 그냥 버리는 반면, AMD는 CCX별로 기능 코어를 비활성화하여 다른 코어 수를 달성합니다.


퀘이사존


예를 들어, Ryzen 7 5800X와 5600X는 모두 8개의 코어가 있는 단일 CCD를 특징으로 합니다. 후자는 2개의 코어가 비활성화되어 8개가 아닌 6개의 기능 코어를 제공합니다. 당연히 6코어 부품을 인텔보다 경쟁력 있는 가격으로 판매할 수 있습니다.


퀘이사존


칩렛 접근 방식에는 대기 시간이라는 큰 단점이 있습니다. 각 칩렛은 별도의 물리적 기판에 있습니다. 물리 법칙 때문에 Ryzen CPU는 Infinity Fabric을 통한 통신에 대해 대기 시간 패널티가 발생합니다. 이것은 1세대 Ryzen에서 가장 두드러졌습니다. 인피니티 패브릭 속도는 메모리 클럭 및 메모리 오버클러킹과 관련이 있으므로 CPU 성능이 눈에 띄게 빨라졌습니다.


퀘이사존


AMD는 Ryzen 3000 CPU로 이 문제를 해결한 다음 새로 출시된 Ryzen 5000 제품군으로 이를 더욱 개선했습니다. 전자는 "게임 캐시"라고 불리는 대형 L3 캐시 버퍼를 도입했습니다. L3 캐시는 시스템 메모리와 로우 레벨 CPU 코어 캐시(L1 및 L2) 사이의 중개자입니다. 일반적으로 소비자 프로세서는 L3의 양이 적습니다. 예를 들어 Intel의 i7 9700K는 L3의 용량이 12MB에 불과합니다. 그러나 AMD는 3700X와 32MB의 L3를 넣고 3900X는 무려 64MB의 L3를 실장했습니다.


L3 캐시는 서로 다른 코어 간에 고르게 분산됩니다. 캐시 양이 증가하면 약간의 지능형 스케줄링으로 코어가 필요한 것을 더 많이 캐싱할 수 있습니다. 버퍼는 Infinity Fabric에 대해 발생하는 지연 시간 페널티 대부분을 제거합니다.


퀘이사존


Ryzen 5000 CPU는 한 단계 앞서서 4개의 코어 CCX를 제거하여 8개의 코어 콤플렉스를 선호했으며 각 코어는 CCX/CCD에서 서로 직접 연결되었습니다. 이를 통해 코어 간 대기 시간, 캐시 대기 시간 및 대역폭이 향상되고 각 코어에 두 배의 L3 캐시가 제공되어 게임 성능이 크게 향상됩니다.


Chiplet 또는 Monolithic: 어느 것이 더 낫습니까?

칩렛 접근 방식은 AMD와 Intel 모두에서 CPU 및 GPU에 대해 향후 몇 년 동안 널리 채택될 것입니다. 이는 주로 다이 축소(56nm에서 28nm > 28nm에서 14nm > 14nm에서 7nm)의 결과로 처리 능력을 두 배로 늘리도록 규정한 무어의 법칙이 전반적으로 느려졌기 때문입니다. Intel은 15년 이상 14nm 노드에 갇혀 있었으며, 6-7년이 지난 지금도 10nm 노드는 이전의 14nm 프로세스 노드보다 2배(밀도 측면) 빠르지 않습니다.


아이러니한 점은 인텔이 이미 미래의 프로세서 대부분에 칩렛 디자인을 채택했다는 것입니다. Ponte Vecchio Data Center GPU, Xe HP GPU 및 Meteor Lake는 모두 칩렛을 활용할 예정이며 유일한 차이점은 명명법에 관한 것입니다. 인텔은 이를 타일이라고 부릅니다.


원문 출처 hardwaretimes

댓글: 39

하드웨어 뉴스

추천 제목
1
3
3
8
2
퀘이사존 12
6
퀘이사존 15
5
퀘이사존 12
3
퀘이사존 14
퀘이사존 17
퀘이사존 12
6
6
퀘이사존 11
퀘이사존 29
퀘이사존 22
퀘이사존 11
8
2

Raspberry Pi 4는 160TB Chia Farm을 제어합니다. 2

기타/주변기기

퀘이사존 88mm플라크 735 07-30

2
6

이더리움 5% 상승…280만원 근접 15

업계동향

퀘이사존 88mm플라크 1.4k 07-30

7
9
퀘이사존 12
7
퀘이사존 15
퀘이사존 20

신고하기

신고대상


신고사유

투표 참여자 보기