퀘이사존
성능비교
퀘이사플레이
컴퓨텍스 이벤트
이벤트
필드테스트
특가/예판
행사판매
퀘플래플
퀘플이벤트
리뷰
벤치마크
기획기사
게임기사
비디오
리포트
컴퓨텍스 2024
하드웨어 성능비교 •
시네벤치(CPU)
3DMark(GPU)
하드웨어
게임
모바일
파트너뉴스
사용기/필테
팁/노하우
PC조립/견적
스팀/PC게임
플스/엑박/스위치
모바일/스마트폰
노트북/태블릿PC
가전제품/TV
CPU/메인보드/램
그래픽카드
오버클록/언더볼팅
케이스
커스텀수랭/튜닝
공랭/수랭쿨러
SSD/HDD/USB
파워서플라이
키보드/마우스
하이파이 •
게이밍오디오
모니터
네트워크/인터넷
OS/소프트웨어
기타/주변기기
자유게시판
애니/피규어
유머게시판
자동차
반려동물
음식/여행
영화/TV
데스크셋업
IT/하드웨어
박물관
나눔게시판
핫딜
타세요
장터
라이브스트리밍
:
퀘이사존 컴퓨텍스 2024 특집 기사 바로가기 + Point
요즈음의 제품을 보면 캐시 혹은 램 부분에서의 성능을 강조하곤 합니다. Intel은 L4 캐시를 탑재한 CPU를 선보였었고, AMD는 CPU에서 3D V-캐시 그리고 그래픽카드에선 인피니티 캐시(Infinity Cache)를 선보이며 큰 캐시 용량을 강조했습니다. 또, NVIDIA는 GDDR6X 메모리를 통한 1TB/s의 상당한 대역폭의 제품을 선보였죠. 이렇듯 캐시/램은 성능에서 빠질 수 없는 중요한 요소 중 하나이고, 오래전부터 함께 성장해왔습니다. SDR부터 시작해서 오늘날 DDR5와 GDDR6X까지, 오늘날의 고성능 메모리는 어떠한 변화를 겪어왔을까요? 이번 글에서는 램에 대해 간단하게 짚어보도록 하겠습니다.
RAM(Random Access Memory)이라고 하면 요즈음의 컴퓨터에서는 크게 두 종류의 RAM이 사용되죠. SRAM과 DRAM이 바로 그것입니다. 간단하게 설명하면 SRAM은 CPU/GPU에 탑재되는 캐시 메모리, DRAM은 흔히 램, 메모리라고 말하는 것에 해당하죠.
SRAM은 Static RAM입니다. 정적인 RAM이라는 뜻인데, SRAM은 전력이 공급되는 한 내부 데이터가 보존되는 특징을 갖고 있습니다. SRAM의 경우 속도와 레이턴시 성능이 우수하지만 집적도와 비용 면에서 단점을 갖고 있죠. 때문에 CPU와 GPU의 캐시 메모리로 사용됩니다. L1, L2, L3 캐시가 바로 그것이죠.
Toshiba의 1Mbit SRAM
반면 DRAM은 Dynamic RAM, 동적인 RAM인데 커패시터로 이루어져 있어 데이터를 유지하기 위해 주기적인 재충전(Refresh)가 필요합니다. 이렇게 지속적으로 재충전 과정이 필요해 동적이라는 명칭이 붙었습니다. SRAM과 반대로 DRAM은 속도와 레이턴시는 조금 떨어지지만 집적도와 가격 면에서 경쟁력을 갖고 있습니다.
Intel의 1kbit DRAM
DRAM의 등장 이후 보다 발전된 형태인 SDRAM이 등장했습니다. SDRAM은 Synchronous(동기식) DRAM입니다. SDRAM는 DRAM 동작을 CPU와 동기화한 작동 방식입니다. 특히 FSB(Front Side Bus) 클럭과 동기화하였으며, 이를 통해 레이턴시와 성능 향상을 얻어냈습니다.
초기 SDRAM 방식은 SDR(Single Data Rate) 방식을 사용했습니다. 이는 램이 1번의 사이클에 데이터를 1번 보낸다는 뜻이죠. 하지만 SDR 방식으로는 램 성능을 향상시키는 데 한계가 있었습니다. 그래서 새로운 DDR(Double Data Rate) 방식을 적용했습니다. SDR과 다르게 1번의 사이클에 데이터를 2번 보내게 되죠. 이러한 구조를 통해 클럭을 증가시키지 않고도 램의 전송 속도를 2배 늘릴 수 있었습니다.
이러한 SDR 램은 인텔 펜티엄 시리즈에서 사용이 되었습니다. 당시에는 CPU가 소켓 타입이 아니라 그래픽카드처럼 슬롯 방식으로 장착이 되곤 했습니다. 펜티엄 3로 와서는 소켓 방식으로 되어 소켓 370도 지원하였죠.
SDR 메모리를 사용는 인텔 펜티엄2와 펜티엄3. 슬롯 1 방식(좌)와 소켓 370(우) 방식이 있었다
DDR의 첫 세대인 DDR1은 1998년 출시되었고 2.5~2.6V의 전압을 통해 200~400MT/s의 전송 속도를 구현했습니다. SDR과 비교해 전송 속도가 최소 2배 이상 되었고 작동 전압도 3.3V에서 많이 낮추어졌습니다. 인텔 소켓 478을 쓰는 Pentium 4 와 AMD 소켓 462에서 DDR1 메모리를 사용했죠.
DDR1 메모리를 사용한 AMD Athlon XP 3200+와 Intel Pentium 4
2003년의 DDR2로 오면서 더 효율적이고 성능이 개선되었습니다. DDR2에서는 400~800MT/s로 2배의 전송 속도의 스펙을 지녔습니다. 전압도 2.5V에서 1.8V로, 저전력 솔루션에서는 1.5V까지 낮아졌죠. 구성할 수 있는 램 용량도 8GB까지 늘어났습니다. DDR2는 인텔의 유명한 보일러죠, LGA775 기반의 프레스캇에서 지원했으며 AMD는 AM2 플랫폼에서 DDR2를 지원했습니다.
DDR2를 사용하는 Intel Core 2 Duo 시리즈 그리고 AMD Athlon
그리고 2007년, DDR3로 오면서 또 한 번 전송 속도가 2배, 그 이상 뛰었습니다. 최소 800MT/s에서 최대 2133MT/s까지 높아졌습니다. 작동 전압도 1.5V로, 저전력에서는 1.35V까지 낮아졌죠. 구성할 수 있는 소비자용 제품의 용량도 16GB로 2배가 되었죠.
DDR3에서 Intel은 XMP(eXtreme Memory Profile)이란 기술을 도입했습니다. 이를 바탕으로 유저들은 손쉽게 램오버가 가능하게 되었죠. DDR3는 인텔 코어-i 시리즈 그리고 AMD 패넘 시리즈 DDR2/DDR3 메모리 컨트롤러를 탑재하며 지원하기 시작했습니다.
DDR3가 적용된 AMD 패넘 2 시리즈 그리고 Intel Core i 시리즈 제품
2014년, DDR4 등장으로 또다시 성능이 2배가 되었습니다. 1600~3200MT/s까지 높아졌고 구성 가능한 용량도 모듈당 32GB로 늘어났습니다. 전압도 1.35V에서 1.2V로 더 낮아졌죠. 소비자용 제품 중에서 DDR4를 사용하기 시작한 건 2015년에 나온 Intel 6세대 스카이레이크 그리고 2017년에 나온 AMD Ryzen 1000 시리즈였죠.
또 DDR4 이후, 본격적으로 배틀그라운드 붐이 일면서 16GB 램 구성에 대한 수요가 대폭 증가했고, 가격이 많이 상승하기도 했습니다. 램오버에 대한 소비자의 관심도 높아지면고 특히 삼성 B-다이의 활약으로 정말 다양한 램오버 정보가 공유되었습니다. 3200MHz CL14와 4000MHz CL15 같은 키트가 오버용으로 인기가 많았죠. 이후에는 DDR4-5333MHz 같은 XMP 키트가 공개되기도 했습니다.
마지막으로 2020년, 가장 최근의 DDR5가 나왔습니다. 전송속도는 3200~6400MT/s으로 알려졌지만 이후 8400MT/s까지 나올 것으로 예상됩니다. 작동 전압은 1.1V로 더욱 낮아졌고 램에 필요한 전력반도체(PMIC)를 메인보드가 아닌 메모리 모듈로 옮기고 On-Die ECC 같은 기능을 추가하는 등 많은 변화가 이루어졌습니다.
DDR5를 채택한 소비자용 제품은 2021년에 출시한 인텔 12세대 엘더레이크, 그리고 2022년에 출시한 AMD Ryzen 7000 시리즈가 있습니다. DDR5를 통해 8000~8500MHz의 고클럭 달성 사례가 나오면서 머지 않은 미래에 10,000MHz 돌파가 가능할 것으로 예측됩니다.
시스템 메모리가 SDR일 때 이러한 메모리 솔루션을 그래픽카드에 이식하려는 시도가 있었습니다. 바로 SG(Synchronous Graphics) 램입니다. SG 램은 SDR SDRAM을 그래픽카드에 맞게 변형한 램인데요. 그래픽 처리에 초점을 두어 픽셀의 깊이 정보를 담기 위해 Z 버퍼 지원이 추가되었습니다. SDR 메모리가 머지않아 DDR1 메모리로 넘어가면서 이 SG 램은 본격적으로 GDDR 이란 이름을 갖게 되었습니다.
그래픽 메모리는 레이턴시 보다 클럭, 대역폭이 더 중요합니다. 그래서 GDDR1은 DDR1과 비교해 레이턴시가 더 늘어지는 구조를 지녔죠. 하지만 클럭은 DDR1과 GDDR1은 차이가 없었습니다. 이후 GDDR1의 클럭 개선판이 나오게 되면서 본격적으로 시스템용 DRAM과 그래픽 DRAM의 차이가 벌어지게 되었습니다.
NVIDIA GeForce 256 모델. 좌측 모델은 SDR 램이, 우측 모델은 DDR 램이 적용되었다
후속작인 GDDR2가 2002년 출시하였습니다. 하지만 DDR2를 기반으로 했다기엔 핵심인 I/O(입출력) 클럭 2배 기능이 누락되어 있어서 DDR과 DDR2 그 사이의 어중간한 느낌이 되었습니다. 더구나 고전압, 고발열, 높은 소비전력이라는 큰 단점이 작용하여 빠르게 시장에게서 잊혀졌습니다. 이후 이러한 단점을 개선해 저가용 제품을 위한 GDDR2 2세대가 나왔지만 사실상 시스템 메모리에서 쓰는 DDR2였습니다.
보급형 제품에 쓰인 GDDR2 2세대
GDDR2가 사용된 NVIDIA GeForce FX 5800 (사진: TechPowerUp)
3세대 GDDR, GDDR3가 나왔습니다. GDDR3지만 아이러니하게도 GDDR3는 DDR2 기술을 기반으로 합니다. 그래픽카드 제조업체인 NVIDIA과 AMD(당시 ATi)가 메모리 표준을 정하는 기구인 JEDEC에 합류하게 되면서 좀 더 그래픽카드에 최적화된 메모리를 개발하게 되었죠.
GDDR3는 GDDR2에서 제기된 발열, 전력소비 등의 문제를 해결하고 전송 효율을 최적화해 레이턴시로 인한 단점을 상쇄하고자 했습니다. 시간이 지나며 공정개선에 힘입어 보다 효율적이고 클럭이 높은 GDDR3 모듈이 나왔죠.
GDDR3가 사용된 GeForce 6800 Ultra (사진: TPU)
그리고 DDR3를 기반으로 한 GDDR4가 나왔습니다. GDDR4에선 DDR3에서 변경된 구조에 힘입어 전송 속도를 최대 2배 높였습니다. 하지만 레이턴시의 문제가 발생하였습니다. 거기에 GDDR4의 제조 단가 문제와 설상가상 공정 개선과 클럭 향상된 GDDR3 모듈이 GDDR4보다 클럭이 높은 상황이 오면서 GDDR4는 사람들에게 외면받게 되었습니다.
GDDR4가 사용된 ATi Radeon HD 3870 (사진: TPU)
그리고 5세대, GDDR5가 나왔습니다. GDDR5도 동일하게 DDR3 기술을 기반으로 하고 있으며, 앞선 GDDR4의 문제를 극복하고자 했습니다. 또한 GDDR5는 2개의 16bit 버스가 병렬로 구성되었습니다. 클램쉘 구성이 더 간소화되었고, DDR 방식이지만 이러한 병렬 구조 덕분에 실제 유효 클럭은 QDR(Quad Data Rate)에 상응하는 결과가 나왔죠. GDDR5는 GeForce 400 시리즈부터 GTX 1650까지 정말 오랜기간 동안 사용되었습니다.
이후 클럭을 더 높인 GDDR5X가 나왔습니다. GDDR5X는 GDDR5 대비 동일 클럭에서 대역폭을 2배 늘릴 수 있게 구조를 개선했죠. 이러한 높은 클럭을 달성할 수 있게끔 DDR이 아닌 QDR 방식을 적용했습니다. 여기에 앞서 GDDR5의 변화에서 언급한 병렬 구조 덕분에 유효 클럭은 실제 클럭(CK, Command Clock)의 8배인, ODR(Octa Data Rate)에 상응하게 되었죠.
Micron의 GDDR5X 메모리
GDDR5 메모리가 도입된 GeForce GTX 480과 Radeon HD 6950
GDDR5X 메모리가 적용된 GeForce GTX 1080 Ti
GDDR6로 오면서 기반 기술이 DDR4로 업그레이드되었습니다. GDDR6에서는 GDDR5X처럼 QDR 방식을 적용해 유효 클럭은 ODR에 상응하는 구조를 갖게 되었습니다. 또한 데이터 채널도 기존 1개에서 2개로 증가하게 되었죠.
이후 Micron이 NVIDIA와 함께 개발한 GDDR6X에서는 신호를 전달하는 방식을 변경했습니다. GDDR6에서는 NRZ 방식을 통해 1사이클당 1bit를 전송했다면, GDDR6X에서는 PAM4 방식을 통해 1사이클당 2bit를 전송했습니다. 이를 통해 동일 클럭에서 2배 더 많은 데이터 전송과 대역폭을 얻게 되었죠. GDDR6X에서 이를 통해 24Gbps까지 달성 할 수 있었습니다.
GDDR6는 초기에 12~16Gbps여서 GDDR6X가 분명한 성능의 이점을 제공했습니다. GDDR6도 지속적인 개선이 이루어져 18~20Gbps는 물론, 24Gbps를 달성했습니다. GDDR6X 메모리는 NVIDIA RTX 30 시리즈를 통해 처음 도입되었는데, 8Gbit로 비교적 밀도가 적었고 게이밍에서 100℃가 넘는 온도를 보여주는 경우도 있어 발열 문제가 대두되기도 했죠.
GDDR6 메모리가 적용된 GeForce RTX 2060과 Radeon RX 5700 XT
GDDR6X 메모리가 적용된 GeForce RTX 4090
그리고 최근 삼성전자는 새로운 GDDR6W 메모리를 공개했습니다. 2개의 GDDR6 메모리를 1개의 칩으로 구현한듯한 이 GDDR6W 메모리는 패키지면에서 변경이 이루어졌습니다. 2개의 메모리를 적층 시키면서 용량과 성능을 2배 높일 수 있었습니다.
현재 24GB의 VRAM을 구현하기 위해서는 16Gbit(2GB) 램을 12개를 장착해야만 합니다. Ray Tracing과 앞으로의 8K와 같은 고해상도, 고퀄리티의 그래픽 작업을 생각하면 갈수록 VRAM의 요구 용량은 늘어날 전망인데 그래픽카드 PCB의 한정된 공간의 여유를 확보해 줄 것으로 기대가 되고 있죠.
아직 공개는 안되었지만 차세대 메모리인 GDDR7에 대한 일부 정보가 있습니다. GDDR7에서는 GDDR6X가 대역폭, 전송 속도의 상승을 가져온 방식처럼 시그널 방식을 바꿨습니다. NRZ에서 PAM3 방식으로 바꾸어 2사이클에 3bit를 전송하게끔 하였습니다. 또한 36Gbps의 유효 클럭을 갖게 될 것으로 알려졌죠.
이렇게 램은 시간이 지나면서 보다 높은 클럭, 많은 대역폭 동시에 저전력이라는 목표를 향해 발전했습니다. 이러한 성능 향상은 궁극적으로 병목 해소에 있습니다.
고성능, 고대역폭의 SRAM으로 컴퓨터의 저장 장치를 모두 구성하면 좋겠지만 가격이 감당할 수가 없겠죠. 그렇기 때문에 적절하게 타협을 해야 합니다, 성능과 가격 면에서 말이죠. 공통적으로 고성능일수록, 고용량일수록 가격이 높아집니다. 성능과 용량 그리고 가격까지 세 마리의 토끼를 잡기는 힘들죠. 이러한 맥락에서 메모리 계층이라는 개념이 도입되었습니다.
각 메모리의 계층을 구분하고 컴퓨터가 필요하는 다양한 특징을 갖는 저장 장치를 활용해 최적의 효율을 낼 수 있도록 설계하는 것입니다. 시간이 지나며 이 메모리 계층은 더욱 세분화되었고, 각 계층별 차이를 최소화하기 위한 많은 노력이 있어왔습니다. 대표적으로 캐시 레벨, Optane을 예로 들 수 있겠습니다.
CPU에도 캐시라는 이름으로 SRAM이 탑재되죠. 이 캐시에도 급이 있습니다. L1, L2 등 캐시에도 레벨이 있죠. 숫자가 작을수록 성능이 좋지만 탑재되는 용량이 작습니다. 보통 CPU는 L3까지, 그리고 GPU는 L2까지 탑재되어 있습니다.
이러한 구조에서 CPU의 L3 캐시 용량을 보다 크게 늘리기 위해 3D V-Cache와 같은 솔루션이나 혹은 아예 L4 캐시를 탑재하기도 했습니다. 그래픽카드에서도 L2까지 밖에 없는 기존 구조를 벗어나 L3 캐시를 도입하거나 L2 캐시의 용량을 크게 늘리기도 했죠.
Intel의 128MB의 L4 캐시, eDRAM을 시도
AMD의 L3 용량을 크게 늘리기 위한 3D 적층 구조
그래픽카드에 L3 캐시를 도입한 AMD의 Infinity Cache
DRAM과 SSD 사이의 성능 차이를 메꾸고자 인텔은 Optane 이란 솔루션을 도입하기도 했었습니다. 기존 DRAM과 SSD 사이의 간극을 매우며 새로운 메모리 계층을 제시하고자 했지만, 결국 이도 저도 아닌 애매한 제품이라는 평가를 받으며 사라지게 되었습니다.
프로세서의 발전과 함께, 메모리도 함께 발전을 해왔습니다. 병목을 최소화하여 프로세서의 성능을 가능한 최대로 끌어내는 것이 언제나 공통적인 과제이죠. 메모리도 그러한 과제를 해결하고자 데이터 전송 방식, 병렬 구조, 공정 미세화와 최적화 등 다양한 방법을 통해 성능과 함께 전력효율을 잡고자 했습니다. 그중에는 3D V-Cache와 같은 성공적인 사례도 있었지만 eRAM이나 RDRAM 같이 기억 속으로 자취를 감춘 사례도 있습니다.
그래픽 메모리의 경우 시스템 메모리보다 조금 더 자주 세대 변화 진행되었습니다. 기존 DDR이라는 방식을 넘어 QDR을 넘어 이제는 유효 클럭이 8배에 달하는 ODR에 상응하는 결과를 만들었죠. 그 외에도 HBM(High-Bandwidth Memory)와 같이 좀 더 고성능을 달성하기 위한 시도도 많이 있었습니다.
앞으로도 메모리의 발전은 계속될 것입니다. 특히 4차 산업혁명으로 인해 다루어지는 데이터의 양은 기하급수적으로 늘어날 뿐만 아니라, 그래픽카드만 해도 하드웨어 레이 트레이싱(Ray Tracing)과 같은 기술의 발전과 4K, 8K 같은 고해상도로 인해 요구되는 메모리 기술이 더 고도화되고 있죠.
이제 소비자용 그래픽카드에서 메모리 대역폭은 1TB/s를 넘어가고, 시스템 메모리도 DDR5 세대를 통해 10,000MHz 도달이 가능할 것으로 예상됩니다. 시간이 지나 DDR6에서는 MHz가 아니라 GHz 단위로 부를지도 모를 일이죠. 과거 100MHz에서 시작한 기술이 몇십 년 만에 몇십 배의 성능 향상에 도달했습니다. 고속 메모리 기술은 과거의 발전만큼이나 앞으로의 발전이 기대됩니다.
SDR부터 GDDR7까지 알아보자
출처 및 참고 자료
댓글: 36개
써 볼 만한 것 같긴 한데...
인텔 13세대 보드에 BCF 적용 시 온도 변화는?
SRAM, DRAM 그리고 Optane
메모리(RAM)의 발전 과정 - DDR, GDDR 메모리
AMD가 강조하는 가성비, 효율적인 아키텍처의 특징은 무엇?
RX 7900의 핵심, RDNA 3 아키텍처 살펴보기
다시 혼돈으로
엔비디아와 AMD, 그리고 인텔 그래픽카드 역사 2화
혼돈의 시기를 지나 2강 체재로 돌입
엔비디아와 ATi(AMD) 그래픽카드 역사 1화
PCIe 4.0 / 16x부터 PCIe 3.0 / 4x까지 5종 게임 성능 비교
PCIe 배속? 버전? 구형 보드? RTX 4090 제 성능 내려면
전력 제한 vs. 언더볼팅 5종 게임 비교
RTX 4090 FE 전력 제한 vs. 언더볼팅 전성비 테스트
역대급 성능이기에 어떤 CPU도 따라올 수 없다? 정말일까?
4K인데 CPU 병목? RTX 4090 병목 현황 살펴보자
16+2페이즈? DrMOS는 MOS 박사라는 뜻이야?
컴덕 필수 과목: 전원부(VRM)란 무엇인가
4종 CPU와 2종 그래픽 카드로 살펴본 온라인 게임 성능 비교
온라인 게임, 어떤 시스템 조합이 가성비가 좋을까?
FHD 해상도 & 360 Hz 게이밍 모니터로 알아보는 소비 전력 차이
모니터 주사율에 따라 시스템 소비 전력은 얼마나 차이 날까?
레이 트레이싱, 인공지능 연산, DLSS 3와 Optical Flow 가속기, AV1 지원 듀얼 인코더
RTX 40 뭐가 좋아졌지? Ada GPU 아키텍처 살펴보기
에코 모드, 커브 옵티마이저 등을 더하면 멋진 CPU로 살아날 수 있을까?
라이젠 7000 좀 더 살펴보기, 에코 모드/CO/메모리/내장 그래픽
매년 나오는 새 버전의 윈도우, 써야 할 이유는?
인텔 CPU는 윈도우 10보다 11이 낫다? 윈도우 버전별 성능 비교
인간의 욕심은 끝이 없고 같은 실수를 반복한다
인텔과 AMD의 북치기박치기역사 2화
퀘이사존-전 우주급 커뮤니티: 우주의 시작부터 끝까지
퀘이사존 로그인
아이디·비밀번호 찾기 회원가입
공식기사
리포트/취재
어항 케이스의 문제점 완벽 극복?!
이제 AMD의 시대인가?(진짜로)
신제품 보러 갔다가 따귀 맞은 썰 들려준다ㅋㅋ
국가권력급 비밀병기(2024년 최신판)
이 파워라면 가보로 물려줘도 인정 (2200W)
퀘이사존을 다양한 미디어에서 만나보세요
신고하기
투표 참여자 보기