컴퓨텍스 2026에서 AMD의 최고 소프트웨어 책임자(CSO)인 안드레이 즈드라브코비치(Andrej Zdravkovic)와 소프트웨어 부문 수석 이사인 테리 마케돈(Terry Makedon)을 만나 AMD 연구소에서 진행 중인 다양한 개발 상황에 대해 이야기를 나눌 기회를 가졌습니다. 특히, 현재 RDNA 4 아키텍처 기반의 라데온 RX 9000 시리즈 그래픽 카드에만 적용되는 FSR 4.1 업스케일링 알고리즘에 대해 질문했습니다. 이 알고리즘은 오는 7월 RDNA 3 기반의 라데온 RX 7000 시리즈 GPU에도 적용될 예정입니다. 저희는 RDNA 4에서 사용되는 FSR 4.1 업스케일링 모델이 RDNA 3에서도 동일한지 궁금했습니다. AMD는 기본 모델은 약간 다르지만 최종 결과물의 품질은 동일할 것이라고 설명했습니다. 이는 특히 최근 몇 년 동안 PC 하드웨어 업그레이드가 어려워진 상황에서 전 세계 수많은 RDNA 3 및 RDNA 2 사용자들에게 매우 반가운 소식입니다.
예를 들어, 마이크로아키텍처 측면에서 RDNA 세대 간에는 몇 가지 근본적인 차이가 있다는 것을 알고 있습니다. RDNA 3의 경우, 최신 RDNA 4에서만 FP8을 지원하기 때문에 이전 세대에서는 8비트 부동 소수점 연산을 지원하지 않습니다. RDNA 3에서 FSR 4.1 업스케일링 모델을 실행하려면 AMD는 이를 8비트 정수 데이터로 변환해야 합니다. RDNA 3 하드웨어는 FP8을 지원하지 않는 INT8 데이터 타입을 사용하기 때문입니다. 일반적으로 이러한 모델을 최적화하는 데에는 정수 연산만으로도 충분하지만, 변환 작업이 필요하므로 RDNA 4와 RDNA 3 지원 사이에 시간차가 발생합니다. 이러한 차이로 인해 AMD는 새로운 데이터 타입에 맞게 FSR 4.1 모델을 완전히 수정하고 최종 영상 출력에서 품질 저하가 없도록 해야 합니다. AMD 소프트웨어 담당자는 이 문제 해결에 심혈을 기울이고 있으며, 출시가 가까워지는 다음 달(7월)에 더 자세한 정보를 공개할 예정이라고 밝혔습니다.
 
그렇다면 RDNA 2는? RDNA 2의 경우는 상황이 훨씬 더 복잡합니다. 첫째, RDNA 2 하드웨어는 GPU 마이크로아키텍처 내에 전용 AI 가속기가 없습니다. 즉, RDNA 2 GPU는 FSR 4.1 업스케일링을 구현하기 위해 GPU 구성의 스트림 프로세서에 의존해야 합니다. 결과적으로, 추가적인 AI 연산 없이 순수 GPU 연산 능력만으로 업스케일링 모델이 처리됩니다. 따라서 효율적인 처리를 위해서는 상당한 최적화 작업이 필요합니다. AMD는 FSR 4.1 업스케일링에 필요한 셰이더 사이클 수를 줄이는 것이 매우 어려운 과제라고 밝혔습니다. 이에 따라 AMD는 최적화 작업에 더 많은 시간을 투자하고 있으며, 2027년 중 지원을 시작할 계획입니다. AMD가 언제 이 목표를 달성할지는 구체적인 일정이 제시되지 않았지만, 성능 저하 없이 RDNA 2 게이머들에게 원활한 경험을 제공하기 위해서는 필요한 최적화 작업이 계속 진행될 것입니다.

AMD는 어떻게 최적화를 진행할까? TechPowerUp 팀은 AMD가 이 개발 작업을 어떻게 관리하고 전체 프로세스를 어떻게 이해하는지 궁금했습니다. AMD는 FSR 4.1 업스케일링 알고리즘의 개발, 개선 및 최적화를 위한 다단계 시스템을 설명했습니다. 첫 번째 단계는 Instinct MI 가속기에서 FSR 4.1을 일반 학습하는 것입니다. FSR 업스케일링 알고리즘은 ChatGPT, Claude, Grok, Gemini 등 오늘날 사용되는 많은 언어 모델만큼 크지 않기 때문에 몇 개의 소규모 클러스터만 필요합니다. 계산 요구량이 훨씬 적기 때문에 슈퍼컴퓨터 규모의 컴퓨팅은 필요하지 않습니다. 다음으로 AMD는 워크스테이션급 Radeon Pro GPU를 사용하여 모델을 더욱 개선하고 전체 환경을 준비합니다.

이러한 Radeon Pro 시스템에서 최종 마무리 작업은 ROCm 플랫폼을 사용하여 수행됩니다. ROCm은 현재 일반 Radeon, Radeon Pro 및 Instinct MI 가속기에서 지원됩니다. 모든 GPU에서 동일한 소프트웨어 프레임워크를 지원하므로 개발이 더욱 쉬워집니다. AMD는 FSR 모델을 출시하기 전에 일반 라데온 GPU를 사용하여 수십만 가지 PC 구성을 테스트합니다. 이러한 테스트는 다양한 CPU, RAM 구성, 마더보드, 전원 공급 장치 및 테스트에 영향을 미칠 수 있는 기타 모든 요소를 포함하는 광범위한 PC 설정에서 수행됩니다. |