이 정도는 알아야 컴덕이지! 퀘이사존 공식 기획 기사

RX 7900의 핵심, RDNA 3 아키텍처 살펴보기

AMD가 강조하는 가성비, 효율적인 아키텍처의 특징은 무엇?

퀘이사존

35 5406 25 2022.12.12 22:45

<img src="https://img2.quasarzone.com/editor/2022/12/12/14e5061801b23c5c5351273a8aa3fad4.png" alt="퀘이사존"> <h3 style="text-align: center; line-height: 1.5;">RX 7900의 핵심, RDNA 3 아키텍처 살펴보기</h3><h5 style="text-align: center; line-height: 1.5;">AMD가 강조하는 가성비, 효율적인 아키텍처의 특징은 무엇?</h5> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    안녕하세요. QM크크리입니다. 이번에 출시된 RX 7900 제품군의 기반 설게인 RDNA 3 아키텍처를 살펴보며 그 구조의 특징을 짚어보고자 합니다.     AMD가 RDNA 3 GPU의 고성능 게임 그래픽 카드 제품군인 RX 7900 XTX / XT를 출시했습니다. 그에 맞춰 벤치마크도 공개되었습니다. <h5 style="text-align: center; line-height: 2; min-height: 30px;"><a href="https://quasarzone.com/bbs/qc_bench/views/83037" target="_blank">퀘이사존 라데온 RX 7900 XTX/RX 7900 XT 벤치마크 보러 가기</a></h5>     이번 RX 7900 제품군은 첫 공개부터 가성비에 초점을 맞춘 발표가 특징입니다. 특히 세부 내용이 공개될수록 경쟁사의 RTX 4080을 저격하는 의도를 직설적으로 드러내었습니다. 이번에 같이 소개해 드리는 가장 최근 브리핑에는 달러당 가성비 그래프와 카드의 체적(부피) 비교까지 등장했습니다.     그렇기에 무엇을 믿고 이렇게까지 가성비를 강조하는지 궁금할 분도 늘어날 터입니다. 가성비는 그 제품이 제공하는 성능이나 감성 같은 가치에 비해서는 싸게 팔겠다는 이야기이기에 RX 7900 같은 상급 제품에서는 크게 강조하려 들지 않는 경우가 보통이기 때문입니다. 이에 대한 AMD의 주장은 세계 최초의 게임 GPU용 칩렛 구조를 필두로 한 RDNA 3 아키텍처의 훌륭한 효율입니다. </td></tr></tbody></table></div>  <img src="https://img2.quasarzone.com/editor/2022/12/12/f7df3c4aaf497083b36ae2c19f6bbf96.jpg" alt="퀘이사존" style="cursor: pointer;">※ AMD 공식 달러당 가성비 그래프, 일반적인 성능 비교 그래프가 아닌 점을 주의 바랍니다 <img src="https://img2.quasarzone.com/editor/2022/12/12/e489c23ecb63e07cffde5b886dd9eafc.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    성능 비교에 사용한 모든 제품의 MSRP를 표기하는 것도 모자라 달러당 성능 그래프 등장에다가 카드 체적Volume까지 cm3로 계산해서 비교할 정도로 가성비와 효율을 강조하고 있습니다. 세대를 거듭할수록 다른 부품보다 급격히 비싸지고 있는 그래픽 카드 가격에 회의를 느끼는 사용자가 늘어나고 있는 상황에서 AMD가 아키텍처 차원에서부터 내세우고 거듭 강조하는 가성비와 효율이 앞으로 가격 문제를 얼마나 개선할 수 있을지 지켜볼 필요가 있겠습니다.     그렇기에 그 원천인 RDNA 3 아키텍처에 어떤 특징이 있는지 짚어보고자 합니다.</td></tr></tbody></table></div>   <div align="center"><div table="" align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(37, 37, 37) rgb(37, 37, 37) currentColor currentColor; width: 600px; max-width: 100%;" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><div class="txc-textbox" style="background-color: rgb(25, 25, 25); width: 600px; border: 1px solid rgb(25, 25, 25); padding: 10px; line-height: 2;">
<ul style="list-style-type: disc;" data-ke-list-type="disc"><div style="text-align: left; line-height: 2;">목차</div><div style="text-align: left; line-height: 2;"> </div><h5 style="text-align: left; line-height: 2;">

<a href="#p1">1. RX 7900 XT 한정 전력 사양 증가 </a>
<a href="#p2">2. RDNA 3 특징: 게임 GPU용 칩렛 구조 </a>
<a href="#p3">3. RDNA 3 특징: 높은 클록 주파수 달성 </a>
<a href="#p4">4. RDNA 3 특징: 개선된 레이 트레이싱 가속 </a>
<a href="#p5">5. RDNA 3 특징: AI 가속 능력 </a>
<a href="#p6">6. RDNA 3 특징: 듀얼 미디어 엔진 </a>
<a href="#p7">7. RDNA 3 특징: 범용 연산 구조 재편 </a>
<a href="#p8">8. RDNA 3 전체 구조 블록 다이어그램 및 요약 </a>
<a href="#p9">9. RDNA 3 아키텍처 살펴보기 종합 요약</a>

</h5><div style="text-align: right;">뒤로가기를 누르면 목차로 되돌아옵니다.    </div></ul></div></div>  <a id="p1"> </a> </div> 
<img src="https://img2.quasarzone.com/editor/2022/12/12/8f50a171f798f6cf7c7cdbbdb9f2b114.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/12/12/4e33404e3ecd11468e7d52e9a0d47bcb.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    그 전에 이번 브리핑에서 가장 먼저 눈에 띄는 부분이자 새로 밝힌 사실 하나부터 보도록 하겠습니다. 바로 RX 7900 XT의 전력 소모 기준값인 TBP를 300 W에서 315 W로 상향 조정했다는 점입니다. 사용자에게 가능한 최고의 경험best possible experience을 선사하고자 추가적인 성능additional performance을 확보하는 조치라고 합니다.     RX 7900 제품군의 성능과 가격이 알려진 후 나온 비판 중 하나가 두 제품의 체급 차이에 비해 가격 차이가 작지 않으냐는 점을 생각하면 조정 자체는 긍정적인 변화로 보입니다. $899는 $999의 90%에 가깝고 심리적으로도 $999에서 $100 정도 빠지는 건 한 체급 차이로 보기엔 약간 작은 느낌이긴 합니다. 심지어는 '경쟁사처럼 차상위 제품을 일부러 나쁘게 내놓아서 최상위 제품을 더 팔려는 상술 아니냐'는 주장도 있었습니다. AMD가 이런 여론에 대응하고 RX 7900 XT 구매를 고려하는 사용자에게 더 좋은 성능을 제공하려는 시도 자체는 긍정적입니다.     다만 이 15 W 전력 증가가 어느 정도의 성능 향상을 가져올지에 관한 직접적인 내용은 없었습니다. 이 칼럼을 사용자들이 보고 계실 때는 벤치마크 결과가 나와 있을 테니 RX 7900 XTX 기준 성능 비율을 기존 발표 내용과 비교하면 알 수 있겠지요. </td></tr></tbody></table></div>  <a id="p2"> </a> <img src="https://img2.quasarzone.com/editor/2022/12/09/1d28dc2c6c09e28d3ea5742eb4cd336a.png" alt="퀘이사존"><img src="https://img2.quasarzone.com/editor/2022/12/12/a83154445839d98254b6b3cff193b0c5.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/11/b35f6575a06803b98b8ea67b7a49a1bb.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    AMD가 생각하는 RDNA 3 아키텍처의 가장 핵심 사안은 하나의 거대한 칩세트 대신 작은 칩 여러 개에 구조를 분산시키는 칩렛 방식을 통한 효율입니다. 특히 게임용 GPU로는 최초로 칩렛 구조를 도입했으며, 세계 최고 속도의 인터커넥트 기술을 적용했다고 강조하고 있습니다. CPU나 산업용 GPU(H100)로는 이미 MCM 또는 칩렛 구조가 출시된 바 있습니다만, 게임용 GPU로는 RX 7900 제품군이 최초가 됩니다.     세대를 거듭할수록 다른 부품보다 급격히 비싸지고 있는 그래픽 카드 가격에 회의를 느끼는 사용자라면 AMD가 칩렛을 통해 내세우는 효율이 앞으로 이 문제를 얼마나 개선할 수 있을지 지켜볼 필요가 있겠습니다.</td></tr></tbody></table></div>   <img src="https://img2.quasarzone.com/editor/2022/11/15/8843bd5b0b932a3396e87dd2b13a459f.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    AMD는 이미 자사 CPU 제품군 대부분에 칩렛 구조를 적극적으로 활용하여 그 효율을 보여준 바 있습니다. 이러한 효율은 많은 코어 수 등의 이유로 거대한 구조일수록 더욱 빛나기 마련입니다. 일례로 7 nm 16코어인 라이젠 9 5950X 를 단일 칩 구조로 만들었다면 실제 생산한 단가의 2배가 더 넘는 비싼 비용이 들었을 거라고 합니다. 옆에 같이 비교한 8코어의 단가는 그렇게까지 큰 차이는 나지 않는 것과 대조적입니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/15/b439fd723566fd167107b81314142f4b.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    칩렛의 효율을 강조하는 배경에는 14 nm 이후 급격히 더 비싸지는 미세 공정 가격이 있습니다. 그나마 로직 구조는 미세 공정의 이득을 최대한 볼 수 있어 비싼 비용을 상쇄할 수 있지만, IO나 메모리는 상대적으로 적은 이득만 보기에 전체 비용을 증가시키는 주범이 됩니다.     그래서 전체를 하나의 칩으로 생산하기보다는 로직 구조만 최신 공정으로 생산하고 IO는 비교적 구공정으로 만드는 칩렛 구조를 통해 비용 효율을 달성할 수 있습니다. AMD CPU는 이미 2019년 Zen 2 아키텍처의 라이젠 3000 제품군부터 IOD를 별도로 분리한 구조로 효율 최적화를 꾀하고 있습니다. 소켓 외부의 메모리나 그래픽 카드와 통신하는 부분을 별도의 칩렛으로 분리하여 약간 이전 공정으로 생산하면 최신 공정의 비싼 가격을 효율적으로 상쇄할 수 있습니다.     하지만 GPU는 훨씬 늦게 이번 RX 7900에서야 최초로 칩렛 구조와 IO 분리를 도입합니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/15/8ea248fe7cc13f7e4a84c69b77ca38d8.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    왜 이렇게 시간 차가 났을까요? 가장 큰 이유는 라이젠식의 칩렛을 게임용 GPU에 그대로 적용할 수 없다는 점입니다. 12코어 이상 라이젠이나 스레드리퍼, 에픽은 CPU 코어도 여러 개의 CCD에 분산되어 있지만 GPU를 이런 식으로 나누면 현재의 인터커넥트 기술로는 감당할 수 없는 통신 요구가 발생합니다. 과거에도 16코어 라이젠이나 스레드리퍼에서 게임 구동 시 서로 다른 CCD간 통신에 따른 병목 현상 때문에 1 CCD 8코어만 쓰게 강제하는 쪽의 게임 성능이 상대적으로 높게 나오는 등 이슈가 있었는데, GPU에서는 훨씬 더 큰 문제가 되는 셈입니다.     경쟁사의 H100은 여기서 문제 삼는 방식의 칩렛 구조를 문제없이 쓰고 있습니다만, 게임용이 아닌 산업용 거대 칩이기에 가능한 일입니다. 같은 기술을 활용한 게임용 최상위 제품인 RTX 4090의 AD102 칩이 칩렛 구조가 아닌 점이 이를 방증합니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/15/f79feca6c63e002fd92909ecde2ed030.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    그래서 AMD가 생각한 게임용 GPU에 걸맞은 똑똑한 칩렛 방식이 바로 MCD입니다. 기존 GPU 구조 대부분은 5 nm GCD 칩 하나에 그대로 남겨두고 미세 공정을 발목 잡기 쉬운 IO 회로(메모리 인터페이스)와 캐시 메모리만 6개의 6 nm MCD 칩렛에 분산시키는 방식입니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/11/7163bc963d801cf21506266bcc622021.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/11/b6c9239e2e2b67ce96087f69fc0163c1.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    이러한 칩렛 구조 덕분에 최상위 제품도 GCD 면적은 300 mm2에 불과합니다. 이전 세대 최상위 칩인 Navi 21은 7 nm 520 mm2였고, 경쟁사의 AD102 칩(RTX 4090)은 전용 커스텀 공정인 TSMC 4N을 사용하여 통상 5 nm 공정 대비 6% 밀도 감소를 받고도 608 mm2인 점을 생각하면 상당히 작은 크기입니다.     물론 6개의 MCD 면적까지 다 더하면 522 mm2에 달합니다만, 면적이 커질수록 생산 단가가 급격히 높아지는 반도체 생산의 특성이 최신 공정의 가격 문제로 더 심해졌음을 생각하면 522 mm2 단일 칩 생산과는 비교할 수 없는 차이가 발생하겠죠. </td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/12/06/0b2d088c9888bfbd77d249e0e5c396c8." alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    마이크론 테크놀로지 사가 제공하는 칩 면적이 수율이 영향을 주는 예시를 보면 4배의 면적 차이는 5배 가까운 생산량 차이를 불러옵니다. 가장 작은 칩인 오른쪽 예시는 하나의 웨이퍼에서 658개의 양품 칩을 생산했지만, 면적을 4배로 키운 가운데 예시는 1/5에 가까운 136개만 양품으로 나왔습니다. 가운데 예시와 왼쪽을 비교해도 칩 면적은 정확히 4배 차이지만 양품 생산량은 5배 가까운 차이가 납니다.     물론 RX 7900의 GCD 면적을 AD102(RTX 4090) 전체 면적과 비교해도 2배 정도의 차이기에 위 예시처럼 생산량이 5배씩 차이 나지는 않겠지만, 칩렛 구조의 효율을 짐작하는 데 참고는 되겠죠. 그렇기에 경쟁사도 산업용 고가 제품인 H100에는 칩렛 구조를 도입했습니다. </td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/11/0e8ce6f76d4c901f1ca3fde946487c45.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    이러한 효율 덕분에 RX 6000 제품군부터 도입한 특유의 구조인 인피니티 캐시도 더욱 고성능으로 설계할 수 있었다고 합니다. MCD에 탑재된 2세대 인피니티 캐시는 전 세대의 단일 칩 구조에 탑재된 1세대 인피니티 캐시보다 최대 2.7배 높은 전체 대역폭을 자랑합니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/12/06/d679c1540b989e871660f4e7090c77dc.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    하지만 이렇게 최적화를 해도 MCD와 GCD가 원활히 통신하려면 EPYC의 CCD에 사용하는 대역폭의 10배가 필요하다고 합니다. 라이젠식의 칩렛을 게임용 GPU에 그대로 적용할 수 없음을 설명한 슬라이드에선 100배가량 차이가 났으니 상당한 개선입니다만, 여전히 라이젠식의 인터커넥트를 그대로 사용할 순 없는 상황입니다. 이는 AMD가 RDNA 3 개요에서 세계 최고 속도의 인터커넥트를 강조하는 이유기도 합니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/15/2af36b9696327881bbb88356b882dd69.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/7ae74f3d1344c1fd3d3fdf83528447d3.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/24135558fab091a081b713b1de5459a1.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/a742d108b68dc327a8397b751500782a.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    세계 최고 속도의 인터커넥트는 MCD와 GCD가 원활히 통신하는 데 최적화된 인피니티 링크 기술을 말합니다. 그래도 지연이 발생하는 부분은 높은 클록 주파수 달성을 통해 보완하였다고 합니다. 결과적으로 전 세대보다 약 10% 빠른 캐시 메모리 응답 속도를 얻었습니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/15/b4342c078afb1ba30e081b47c2c8e0e5.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    칩렛 관련 설명의 최종 결론은 칩렛의 장점인 비용 효율은 취하면서 단점은 피하였다는 점입니다. 이런 똑똑한 최적화는 RDNA 3의 최대 54%에 달하는 전성비 개선에도 이바지한다고 주장합니다.</td></tr></tbody></table></div>  <a id="p3"> </a> 
<img src="https://img2.quasarzone.com/editor/2022/12/09/b55da0f6d6912f2d05c229a8e12bbd1f.png" alt="퀘이사존"><img src="https://img2.quasarzone.com/editor/2022/11/15/20b0eed7766a920eb37b2f27ac290ba9.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/605fb52e7e50c584f244a85ea6bf64ee.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/11/8ce4d62e29cf8d866f444c3d7029f056.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    RDNA 3 설계에서 AMD가 자랑하는 또 하나의 핵심 특징은 좋은 효율을 유지하면서도 매우 높은 클록 주파수를 달성했다는 점입니다. 다만 경쟁사 제품이 3 GHz로 손쉽게 오버클록이 가능한 상황에서 셰이더 클록만 따로 분리하여 낮췄다는 점 때문에 회의적으로 보는 시각도 있습니다. 무언가 한계에 부딪혔거나 원가를 절감하기 위한 꼼수 아니냐는 의혹입니다. 과연 최고의 효율을 위한 용단이 맞는지는 벤치마크 결과를 통해 확인할 수 있겠죠.</td></tr></tbody></table></div>  <a id="p4"> </a> <img src="https://img2.quasarzone.com/editor/2022/12/09/aea605e19222c1a23ebd20c392c3ec2e.png" alt="퀘이사존"><img src="https://img2.quasarzone.com/editor/2022/11/11/8f78f77e02eb9ed1b0df4e48d67f553b.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/4831d75f1f8a1349f146e0e9d1fdfcb2.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/b07bf1e9d701c0aa56118495956b84e5.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/da8b7aa8e4eafeac13b4476151abab44.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/96265daa3098a7ec84dbcc66de034622.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/12/06/7b4587f5fc1e80fed2ce3d2c3bedfb9a.png" alt="퀘이사존">  <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    게이머들이 주목할만한 RDNA 3의 또 다른 특징은 2세대 레이 트레이싱 가속 유닛입니다. 전 세대인 RX 6000 제품군도 레이 트레이싱 가속 유닛 자체는 있었으나 텍스처 유닛과 자원을 공유하는 하이브리드 방식이라는 한계가 있었습니다. 레이 트레이싱 주요 연산 중 하나인 Ray Box Intersection의 이론상 최대 성능은 경쟁사 제품의 2배에 달했으나 그 성능을 최대로 발휘하면 텍스처 처리가 멈추기 때문에 실제 성능에는 제약이 심한 편입니다.     그 외에도 다른 주요 연산인 Ray Triangle Intersection에서는 이론상 최대 성능조차 RTX 30 제품군보다는 떨어지는 등의 한계로 RX 6000 제품군의 레이 트레이싱 지원 게임 성능은 인상적이지 못했습니다. 영화나 현실 같은 그래픽을 위해서는 레이 트레이싱을 꼭 거쳐 가야 한다는 점을 생각하면 미래 지향적인 설계는 아니었습니다.     반면 RDNA 3는 훨씬 개선된 하드웨어 가속 지원을 갖추고 있으며, 최근 브리핑에서도 풀 하드웨어 레이 트레이싱 능력full hardware ray tracing capability을 몇 번이나 강조하였습니다. RX 7900 성능 자료에서 전 세대 최고 제품인 RX 6950 XT보다 최대 82% 개선된 레이 트레이싱 성능을 내세우고 있기도 합니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/12/12/898d4444b0bf7d95d4242ae12cb0de85.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/12/12/a5e4aa5fb3c9e4546583cfc7385afb85.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    다만 최근 브리핑에서는 비교 대상에 RTX 4080이 추가되어 RX 7900 제품군보다 높은 성능을 보이는 결과도 있어 다소 아쉽습니다. 아무래도 하드웨어 가속 지원만으로는 경쟁사의 전 세대인 RTX 30에 비견할 정도이고 RTX 40에서 더욱 강화된 레이 트레이싱 성능을 이기기는 힘들어 보입니다.     그래도 달러당 그래프에서는 상대적으로 나은 결과를 보입니다. 레이 트레이싱 연산 요구가 특히 높은 사이버펑크 2077만 제외하면 RTX 4080과 대등하거나 더 나은 가성비를 나타냅니다. RX 7900으로 사이버펑크 2077같이 레이 트레이싱 연산 요구가 특히 높은 게임을 즐길 예정이라면 레이 트레이싱을 포기하거나 RX 7900에 유리하게 그래픽 설정을 타협할 생각을 해봄이 좋겠습니다.</td></tr></tbody></table></div>  <a id="p5"> </a> <img src="https://img2.quasarzone.com/editor/2022/12/09/f9e2e35a55ebf2e5c0e4c758c7bd8f9e.png" alt="퀘이사존"><img src="https://img2.quasarzone.com/editor/2022/11/11/3b950fdb2a9b2330c7f514f406e6f98b.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/834d3155ece35530c81587dbf6e4d428.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/04942440aa5cfc6f2709e63176fb7d92.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    RX 6000 제품군이 미래 지향적이지 못했던 부분은 또 하나 있습니다. 인공지능AI 방식의 대세이자 알파고 이후 세간에도 인지도가 높은 딥러닝을 효과적으로 처리하기 위한 텐서 연산 가속 기능의 부재입니다. 딥러닝의 텐서 연산은 대규모의 행렬 연산을 집중적으로 다루기에 범용 연산 기능으로 대응하면 막대한 연산 요구가 발생합니다. 그렇기에 경쟁사는 레이 트레이싱보다 먼저 전용 가속 유닛을 탑재해왔고 이름도 텐서 코어라고 붙였습니다.     RNDA 3에서는 행렬 연산 가속 능력을 탑재하여 인공지능 관련 연산에서 이전 세대보다 최대 2.7배 빠른 성능을 자랑합니다. 밑에 듀얼 미디어 엔진에서 자세히 설명 드리겠지만 인공지능 필터를 활용한 기능도 과시하고 있습니다.</td></tr></tbody></table></div>  <a id="p6"> </a> <img src="https://img2.quasarzone.com/editor/2022/12/09/bc84107f1f83731570265233ed20fae1.png" alt="퀘이사존"><img src="https://img2.quasarzone.com/editor/2022/11/11/d9f21917e4a789fb243a09b27b3d5bce.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    새롭게 도입된 듀얼 미디어 엔진에서는 AV1 인코딩 지원뿐 아니라 인공지능 필터와의 시너지 효과를 자랑합니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/15/d83f707eaa363729840ed52141275991.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    AV1은 고화질 영상을 효율적으로 다룰 공개 규격으로 유튜브 등을 중심으로 점점 활용처를 늘려나가고 있습니다. 경쟁사 역시 자사 제품군의 지원을 홍보하며 관련 성능을 과시하거나, QHD 해상도에 8 Mbps라는 제한된 비트레이트로 스트리밍 영상을 송출할 때 H.264 코덱보다 얼마나 더 좋은 화질을 보여줄 수 있는지 비교하는 자료를 공개하기도 하였습니다.     라이브 스트리밍, 영상 통화, 영상 편집, 게임 플레이를 영상으로 녹화하는 상황 등 고해상도 고화질 영상을 효율적으로 다루어야 할 때 AV1 인코딩 가속 지원을 유용하게 활용할 수 있으며, 앞으로 활용처는 점점 더 늘어날 것이라는 이야기입니다. 일부 사용자는 SW 인코딩보다 화질이 떨어진다는 점을 들어 일부러 활용을 피하기도 합니다만, 주로 같은 코덱 같은 비트레이트 설정에서 성립하는 비교입니다. 비트레이트에 다소 여유를 주면 충분한 화질을 얻을 수 있으며, AV1 코덱이 제공하는 효율과 화질을 생각하면 기존보다 인코딩 가속 지원의 빠른 인코딩 속도가 더 유용할 가능성이 높아졌다 할 수 있습니다.     AMD는 FHD 해상도에 3.5 Mbps라는 매우 제한적인 비트레이트로 화질을 비교했습니다. 대신 AV1 코덱 자체의 효율에만 의존하지 않고 인공지능 필터의 힘도 더했습니다. 화면 아래의 343 Ellis라는 글자를 비교하면 명백한 화질 차이가 보입니다. 이는 비트레이트가 제한된 스트리밍 환경에서 큰 매력으로 작용할 수 있습니다. 아무래도 위에서 설명해드린 인공지능 가속 능력과의 시너지 효과를 노린 시연으로 보입니다.</td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/12/07/bba7291c07c6a25bd8f7b27af7193ebd.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    이러한 인공지능 필터의 이점을 제대로 누리려면 소프트웨어 지원을 통한 플랫폼 전체적인 완성도가 필수입니다. 여기서 AMD가 내세우는 점은 자사 마이크 노이즈 제거 필터의 완성도입니다. 경쟁사의 노이즈 제거 기능보다 더 좋은 음질을 제공하면서도 성능을 나눠 써서 생기는 게임 FPS 하락도 작게 발생합니다. 이렇게 AMD가 자랑하는 소프트웨어 완성도가 RX 7900 제품군의 인공지능 가속 능력과 시너지를 발휘하여 사용자가 체감하는 결과로 나타나길 바랍니다.</td></tr></tbody></table></div>  <img src="https://img2.quasarzone.com/editor/2022/11/15/aac0b1edaf36fe99175291432bf28032.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/11/3c2739605a2e2681b9cd82f15cc0c61c.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    이러한 영상 처리 성능은 스트리밍에도 좋지만, 그에 국한되지 않고 영상 제작에도 매력을 제시하고 있습니다. 듀얼 미디어 엔진이기에 디코딩과 인코딩을 독립적으로 가속할 수 있는 능력은 영상을 다른 규격으로 변환하는 작업에서 더 큰 성능 향상을 누릴 수 있습니다. 영상 편집 프로그램에서 빠릿빠릿한 성능을 확보하는 데도 도움이 될 수 있습니다.</td></tr></tbody></table></div>  <img src="https://img2.quasarzone.com/editor/2022/12/07/c9e99dcd2cfcd53ff93fbc2b656a6c5e.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    그 외에도 AMD의 스마트엑세스 비디오 기술을 활용하면 라이젠 CPU와 라데온 그래픽 카드에 원활히 작업을 분배하여 최적의 성능으로 영상을 처리할 수 있다고 합니다. 이는 여러 개의 4K 영상을 동시에 변환하는 상황에서 최대 30%의 추가 성능 향상으로 나타납니다.</td></tr></tbody></table></div>  <a id="p7"> </a> <img src="https://img2.quasarzone.com/editor/2022/12/09/ed8320f718be2500d08cd99d3dd382ef.png" alt="퀘이사존"><img src="https://img2.quasarzone.com/editor/2022/11/11/ddae8a3285ff142dc5cd08a8091ece83.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/410692094b0b06aa36a121194062b314.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/7309d449c90b01e61df5a3036de7ad30.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/f0a53cfa98a315ea09ab0d5182e1b66d.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    RDNA 3 아키텍처는 범용 연산 성능도 강화했습니다. 그 대표적인 변화는 똑똑한 하이브리드 구조를 통해 확보한 효율로 높은 성능을 확보한 점입니다. 이전 세대에서는 레이 트레이싱 가속 유닛이 하이브리드 구조였습니다만, 이는 성능을 다소 희생하더라도 효율을 더 챙기기 위한 안배에 가까웠습니다. RDNA 3에서는 레이 트레이싱 가속 지원을 개선하면서 나머지 구조도 성능을 더 높이기 위한 하이브리드 구조로 재편되었습니다.     그래서 게임에서 많이 사용하는 FP32 연산 능력이 2배가 되었다고 합니다. 공식 발표가 나오기 전 루머에서는 RX 7900 XTX의 범용 연산 프로세서인 SP 개수를 공식 사양 6,144개의 2배인 12,288개로도 표기하던 이유이기도 합니다. 이는 경쟁사가 사용하는 표기이기도 합니다. 일례로 RTX 4090의 CUDA 코어 개수를 AMD 식으로 표기하면 공식 사양 16,384개의 절반인 8,192개가 됩니다.     바꿔 말하자면 경쟁사가 해당 구조를 도입한 RTX 30 제품군처럼 이전 세대보다 최대 2배의 성능을 확보할 수 있다는 얘기도 됩니다. RTX 20에서는 FP32 연산 코어와 정수INT 연산 코어가 완전히 별개였던 반면, RTX 30 제품군은 정수 연산 코어도 FP32 연산을 수행할 수 있는 하이브리드 구조기에 이론상 최대 FP32 연산 능력은 말 그대로 2배가 되었습니다. AMD는 RDNA 3에서 비슷한 개선을 도입했으며 코어 개수를 2배로 표기하는 대신 '듀얼 이슈' SIMD라는 표현을 사용하고 있습니다. 칩 전체로는 높아진 클록 주파수와의 시너지로 최대 2.7배가 되어 61 TFLOPs라는 수치를 뽐냅니다.     물론 RTX 30 제품군의 실제 성능이 RTX 20 제품군의 2배는 나오지 않은 것처럼 이론상 최대 성능이 그대로 게임 성능 향상으로 반영되기는 어렵습니다. 그래도 공식 표기인 SP 6,144개라는 숫자에서 느껴지는 수준보다는 더 높은 성능을 볼 수 있겠지요.     공식 표기를 12,288로 하지 않는 이유는 알려지지 않았지만, 과거 불도저 아키텍처 CPU에서 특유의 N 모듈 2N 코어 구조가 소송을 당한 경험 때문이 아니냐는 추측이 있습니다. </td></tr></tbody></table></div> <img src="https://img2.quasarzone.com/editor/2022/11/15/5bec638cf9201041a188a6a41f2a342a.png" alt="퀘이사존"> <img src="https://img2.quasarzone.com/editor/2022/11/15/463fe1e19bb9ffbb9c4c8257d297ba79.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    그 외에도 L0 ~ L1 캐시도 강화해 전체 캐시 구조를 고효율 고성능으로 최적화했으며, CPU 오버헤드를 줄이고 게임 성능을 강화하기 위한 다양한 최적화를 적용했습니다.</td></tr></tbody></table></div>   <a id="p8"> </a> <img src="https://img2.quasarzone.com/editor/2022/12/07/74af46594487c332974d3404cdbac115.png" alt="퀘이사존"><img src="https://img2.quasarzone.com/editor/2022/11/15/bdd623167d1d5d8e22e0801ef9767ee1.png" alt="퀘이사존" style="background-color: initial; width: 100%;"> <div align="center">▲ 클릭하면 커집니다(원본 크기로 보실 수 있습니다).</div><div align="center"> </div><div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);">    RDNA 3 전체를 간단하게 도식화한 블록 다이어그램의 좌우에는 AMD가 중요하게 생각하는 내용을 요약해 두었네요. 위에서 설명한 사항을 포함하여 AMD가 강조하고 싶어하는 특징을 모두 모아놓았기에 하나하나를 전부 이해하지는 못해도 괜찮습니다.     중요한 건 효율적으로 게임 성능을 강화하기 위해 여러 분야에 유닛들이 강화되었다는 점입니다. 결국 AMD가 보여주고 싶어 하는 핵심 개선 사항을 다시 요약하면 아래와 같습니다.<ul><li style="text-align: justify; line-height: 2; min-height: 30px;">MCD 칩렛 구조로 좋은 효율 달성
</li><li style="text-align: justify; line-height: 2; min-height: 30px;">높은 클록 주파수 및 범용 연산 성능 강화: 이론상 최대 FP32 성능 2.7배(61 TFLOPs)</li><li style="text-align: justify; line-height: 2; min-height: 30px;">인공지능 연산 가속을 위한 행렬 계산 가속 능력 탑재</li><li style="text-align: justify; line-height: 2; min-height: 30px;">레이 트레이싱 성능 개선을 위한 하드웨어 가속 지원 탑재</li><li style="text-align: justify; line-height: 2; min-height: 30px;">인피니티 캐시뿐 아니라 L0 ~ L1 캐시도 강화해 전체 캐시 구조를 고효율 고성능으로 최적화</li><li style="text-align: justify; line-height: 2; min-height: 30px;">AV1 인코딩 지원뿐만 아니라 듀얼 미디어 엔진과 인공지능 연산 가속의 시너지로 강력한 부가 기능 제공</li><li style="text-align: justify; line-height: 2; min-height: 30px;">그 외에도 CPU 오버헤드를 줄이고 게임 성능을 강화하기 위한 다양한 최적화 적용 </li></ul></td></tr></tbody></table></div>  <a id="p9"> </a>  <img src="https://img2.quasarzone.com/editor/2022/12/07/4c709e2209e52b3b32bdc24236d86d2f.png" alt="퀘이사존"> <div align="center"><table align="center" class="__se_tbl" style="border-width: 1px 1px 0px 0px; border-style: dashed dashed none none; border-color: rgb(199, 199, 199) rgb(199, 199, 199) currentColor currentColor;width:800px;max-width: 100%" border="1" cellspacing="0" cellpadding="0" attr_no_border_tbl="1"><tbody><tr><td width="800" style="border-width: 0px 0px 1px 1px; border-style: none none dashed dashed; border-color: currentColor currentColor rgb(199, 199, 199) rgb(199, 199, 199);"><h6 style="text-align: justify; line-height: 2;min-height: 30px">■ 칩렛 구조를 필두로 효율을 강조하는 아키텍처</h6>    이번 RX 7900 제품군은 상급 제품임에도 첫 공개부터 가성비에 초점을 맞춘 발표가 가장 큰 특징입니다. 특히 최근 브리핑에서 세부 내용을 더 공개할 때마다 달러당 가성비 그래프와 카드의 체적 비교까지 등장시켜가며 거듭 강조하고 있습니다. 상급 제품에서 이렇게까지 가성비를 강조하는 배경에는 칩렛 구조를 필두로 효율을 강조하는 RDNA 3 아키텍처가 있습니다.     AMD는 이미 라이젠 CPU에서 칩렛 구조의 효율성을 보여준 바 있으며, RDNA 3 아키텍처에서는 게임용 GPU에 걸맞은 칩렛 방식인 MCD를 통해 칩렛의 단점은 피하면서 그 효율을 극대화했다고 주장합니다. 그 외에도 좋은 효율로 높은 성능을 달성하는 여러 최적화를 적용했기에 가성비를 강조한다는 이야기입니다.     그래픽 카드는 세대를 거듭할수록 다른 부품보다 급격히 비싸지고 있는 가격에 회의를 느끼는 사용자가 늘어나고 있는 상황입니다. AMD가 칩렛 구조를 필두로 상급 그래픽 카드 제품에서 가성비와 효율을 앞세우는 전략이 앞으로 가격 문제를 얼마나 개선할 수 있을지 지켜볼 필요가 있겠습니다. <h6 style="text-align: justify; line-height: 2;min-height: 30px">■ 개선된 레이 트레이싱 가속 지원</h6>    레이 트레이싱은 영화나 현실 같은 그래픽을 위해서는 꼭 거쳐 가야 할 기술입니다. 그렇기에 AMD도 이전 RX 6000 제품군보다 개선한 RX 7900 제품군의 레이 트레이싱 성능을 내세우고 있습니다. 최근 브리핑에서도 RDNA 3 아키텍처의 하드웨어 레이 트레이싱 가속 지원을 몇 번이나 강조하였습니다.     비록 RTX 40에서 더욱더 강화된 레이 트레이싱 성능을 이기기는 힘들어 보여도 달러당 레이 트레이싱 성능 효율 그래프에서는 RTX 4080과 대등하거나 더 나은 가성비를 나타냅니다. 레이 트레이싱 연산 요구가 특히 높은 사이버펑크 2077만 예외적으로 AMD 공식 발표에서도 모든 레이 트레이싱 비교에서 RTX 4080에 유리한 결과를 보입니다. RX 7900으로 해당 게임을 즐길 예정이라면 레이 트레이싱에 대한 기준을 다소 낮춰서 RX 7900에 유리하게 그래픽 설정을 타협할 생각을 해봄이 좋겠습니다. <img src="https://img2.quasarzone.com/editor/2022/12/08/2191f695c98138ba80715bf54637b1f2.png" alt="퀘이사존"> <h6 style="text-align: justify; line-height: 2;min-height: 30px">■ 인공지능 가속 능력 탑재로 기대되는 부가 기능</h6>    딥러닝은 기계학습ML 인공지능 연산의 대세가 되었으며 알파고 이후 세간에도 높아진 인지도에 힘입어 더욱 발전을 거듭하고 있습니다. 최근 특정 키워드만 주면 그림을 그려주는 인공지능이 화제가 되는 등 응용 분야가 점점 넓어지는 추세이기에 AI 가속 처리 능력은 더욱더 중요해졌습니다. RDNA 3는 딥러닝에서 많이 사용하는 행렬 연산(텐서 연산) 가속 능력을 탑재하여 이전 세대보다 최대 2.7배 빠른 성능을 확보했습니다.     이런 인공지능 가속 성능의 이점을 시연하고 AV1 인코딩 지원과의 시너지 효과를 보여주기 위해 FHD 해상도에 3.5 Mbps라는 매우 제한적인 비트레이트로 스트리밍 송출 화질을 비교했습니다. 경쟁사가 시연한 QHD 해상도에 8 Mbps보다도 좀 더 제한이 심한 설정인데요. AV1 코덱 자체의 효율에만 기대지 않고 기계학습 인공지능 필터의 힘까지 더한 시너지 효과를 보여주려는 설정입니다. 343 Ellis라는 글자를 비교하면 왼쪽의 x264와는 명백한 화질 차이가 보입니다.     이렇게 인공지능 가속을 부가 기능에 적극적으로 도입하면 여러 분야에서 기존 기능보다 더 나은 결과를 기대할 수 있겠습니다. 마이크 노이즈 제거나 FSR에 인공지능을 도입해 개선한 버전을 볼 수 있기를 기대해봅니다.
<h6 style="text-align: justify; line-height: 2;min-height: 30px">■ 재편된 연산 구조, 최대 12,288개급 FP32 처리 능력</h6>    CUDA 코어(경쟁사)나 SP 개수로 이야기하는 범용 연산 능력은 게임에선 소위 깡성능에 주로 관여하는 편입니다. 레이 트레이싱이나 인공지능 가속 덕에 이전보단 덜 중요해졌지만, 여전히 게임 성능의 기본기에 해당하는 주요 성능 지표입니다. 그래서 똑똑한 하이브리드 구조를 통해 확보한 효율로 높은 성능을 확보한 점은 RDNA 3의 대표적인 변화로 꼽을 수 있겠습니다.     이전 세대의 하이브리드 레이 트레이싱 가속 유닛은 성능을 다소 희생하더라도 효율을 더 챙기는 최적화에 가까웠던 반면, RDNA 3에서는 레이 트레이싱 가속 지원을 개선하면서 나머지 구조도 성능을 더 높이기 위한 하이브리드 구조로 재편되었습니다. 경쟁사가 해당 구조를 도입한 RTX 30 제품군처럼 게임에서 많이 사용하는 FP32 연산 능력이 이전 세대보다 최대 2배가 되었다는 얘기입니다. 칩 전체로는 높아진 클록 주파수와의 시너지로 최대 2.7배가 되어 61 TFLOPs라는 수치를 뽐냅니다.     RTX 20에서는 FP32 연산 코어와 정수 연산 코어가 완전히 별개였던 반면, RTX 30 제품군은 정수 연산 코어도 FP32 연산을 수행할 수 있는 하이브리드 구조기에 이론상 최대 FP32 연산 능력은 말 그대로 2배가 되었습니다. AMD는 RDNA 3에서 비슷한 개선을 도입했으며 코어 개수를 2배로 표기하는 대신 '듀얼 이슈' SIMD라는 표현을 사용하고 있습니다. 공식 발표가 나오기 전 루머에서는 RX 7900 XTX의 범용 연산 프로세서인 SP 개수를 공식 사양 6,144개의 2배인 12,288개로도 표기하던 이유이기도 합니다.      물론 RTX 30 제품군의 실제 성능이 RTX 20 제품군의 2배는 나오지는 않았듯이 이론상 최대 성능에서 보이는 숫자가 그대로 게임 성능 향상에 반영되지는 않습니다. 그래도 공식 표기인 SP 6,144개라는 숫자에서 느껴지는 수준보다는 더 높은 성능을 볼 수 있겠지요.</td></tr></tbody></table></div> <div style="line-height: 2;" align="center"><img src="https://img2.quasarzone.co.kr/editor/2020/05/11/22322c398032dd46898cd9812349cd1e.jpg" style="width: 800px; cursor: pointer;"><a href="https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ko" target="_blank">퀘이사존 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.</a>RX7900구조 라데온구조 RDNA3아키텍처 라데온아키텍처 라데온레이트레이싱 라데온가성비 RX7900살펴보기 RDNA3살펴보기</div>