하드웨어 뉴스 - 최신 IT/하드웨어 정보를 만나보세요

NVIDIA는 GeForce RTX 30 시리즈에 대한 자세한 정보를 제공합니다.

Railgun0

18 9142 14 2020.09.03 20:17

출처 : videocardz 번역기 돌린 거라 오역이 많습니다. 커뮤니티 질문에 대한 NVIDIA 답변<img src="https://img2.quasarzone.com/editor/2020/09/03/c16254d17ae5a36db4989049b26ee30e.jpg"> Reddit에 대한 Q&A 세션 동안 NVIDIA 직원들은 Subreddit 커뮤니티의 가장 성가신 질문 몇 가지에 답변했다. 암페어 RTX 시리즈 발표가 너무 많은 세부사항을 제공하지 않았다는 것은 비밀이 아니다. 사실, 그것은 기술 발표, 제품 디자인, 가격 결정으로 제한되었다. 훨씬 더 자세한 내용은 나중에 NVIDIA와 GeForce 웹사이트에서 블로그 게시물과 공식 사양을 통해 제공되었다. 질의응답 시간에는 엔비디아 커뮤니티 매니저들의 직접 답변도 있었지만 이번 주 예정된 언론 브리핑과 첫 암페어 카드 출시(9월 17일) 이후 많은 것을 배울 것으로 기대된다. HDMI 2.1 사양GhostMotley – Ampeare가 48Gbps의 전체 대역폭으로 HDMI 2.1을 지원하는지 여부 [Qi Lin] 네. NVIDIA 암페어 아키텍처는 4개 레인 모두에서 12GBS/레인 중 가장 높은 HDMI 2.1 링크 속도를 지원하며, 디스플레이 스트림 압축(DSC)이 HDR에서 최대 8K, 60Hz까지 전력을 공급할 수 있도록 지원한다. 암페어에 대한 SSD 요구 사항Pengwin17523 – RTX I/O에 대한 특정 ssd 속도 요구사항이 있는가? [Tony Tamasi] RTX IO를 위한 SSD 속도 요구 사항은 없지만, 최신 Gen4 NVMe SSD와 같은 SSD의 속도가 빨라지면 더 나은 결과를 얻을 수 있으며, 이는 로딩 시간이 단축되고 게임이 더 많은 데이터를 동적으로 전 세계에 스트리밍 할 수 있다는 것을 의미한다. 일부 게임은 향후 SSD 성능에 대한 최소 요구 사항을 가질 수 있지만, 이러한 요구 사항은 게임 개발자가 결정할 것이다. RTX IO는 I/O에 필요한 CPU 로드를 줄이고 GPU 기반 압축을 가능하게 함으로써, 게임 자산을 압축된 형식으로 저장할 수 있도록 하며 잠재적으로 수십 개의 CPU 코어를 오프로드하여 SSD 성능을 가속화할 것이다. 압축비는 일반적으로 2:1이므로 SSD의 읽기 성능을 2배 더 효과적으로 증대시킬 수 있다. RTX IOSBMS-A-Man108 – RTX IO로 SSD 공간을 VRAM으로 사용할 수 있는가? 아니면 내가 완전히 오해하고 있는 것일까? [Tony Tamasi] RTX IO는 기존 방식보다 훨씬 빠른 속도로 SSD에서 데이터를 읽을 수 있으며, GPU에서 압축 해제 및 사용을 위해 데이터를 압축된 형식으로 저장하고 읽을 수 있도록 하며, SSD가 프레임 버퍼 메모리를 대체할 수는 없지만 SSD의 데이터가 GPU 및 GPU 메모리에 훨씬 더 빠르게 도달하고 CPU 오버 헤드가 훨씬 적다. Aztec47 – Pytorch와 같은 기계 학습 라이브러리에 RTX IO가 들어오는 것을 볼 수 있는가? 실시간 애플리케이션 성능에 매우 적합 [Tony Tamasi] NVIDIA는 약 1년 전 NVIDIA GPU DirectStorage를 통해 다양한 데이터 분석 플랫폼을 위한 고속 I/O 솔루션을 제공했다. GPU와 스토리지 간의 고속 I/O를 제공하며, 특히 AI와 HPC 유형 애플리케이션 및 워크로드에 적합하다. 자세한 내용은 https://developer.nvidia.com/blog/gpudirect-storage/를 참조하십시오. Qrios1ty – RTX I/O 기능이 마음에 드는데 부분적으로 정확히 어떻게 작동하는지? [Tony Tamasi] RTX IO와 DirectStorage는 애플리케이션에서 새로운 API를 통합하여 이러한 기능을 지원하도록 요구할 것이다. 마이크로소프트는 내년 게임 개발자를 위한 DirectStorage for Windows 개발자 프리뷰를 목표로 하고 있으며, 엔비디아 RTX 게이머들은 출시되는 대로 RTX IO 강화 게임을 활용할 수 있게 된다. NVIDIA 암페어 스트리밍 멀티프로세서redsunstar – 쉐이더 유닛의 예상 성능 관련:• 이 두 배의 CUDA 코어에 대해 좀 더 자세히 설명해 주시겠습니까? 
• 그것은 GPC의 일반적인 구조에 어떻게 영향을 미치는가? 
• 저 FP32 유닛들을 먹이로 유지하는 것이 얼마나 어려운 일인가? 
• 높은 점유율을 보장하기 위해 어떤 조치를 취했는가? [Tony Tamasi] 암페어 30 시리즈 SM의 주요 설계 목표 중 하나는 튜링 SM에 비해 FP32 운영 처리량의 두 배를 달성하는 것이었다. 이 목표를 달성하기 위해 암페어 SM은 FP32 및 INT32 작동을 위한 새로운 데이터 패스 설계를 포함한다. 각 파티션의 데이터 패스는 클록당 16개의 FP32 연산을 실행할 수 있는 16개의 FP32 CUDA 코어로 구성된다. 또 다른 데이터 파트는 16개의 FP32 CUDA Core와 16개의 INT32 Core로 구성된다. 이 새로운 설계의 결과로, 각 암페어 SM 파티션은 클럭당 32개의 FP32 연산을 실행하거나 클럭당 16개의 FP32 연산과 16개의 INT32 연산을 실행할 수 있다. 4개의 SM 파티션을 결합하면 모두 128개의 FP32 연산을 실행할 수 있는데, 이는 튜링 SM의 FP32 비율의 2배인 128개의 FP32 연산을 실행하거나, 클럭당 64개의 FP32 및 64개의 INT32 연산을 실행할 수 있다. FP32의 처리 속도를 두 배로 높이면 다수의 일반적인 그래픽과 계산 작업 및 알고리즘의 성능이 향상된다. 현대의 셰이더 워크로드에는 일반적으로 FFMA, 부동 소수점 추가(FADD) 또는 부동 소수점 곱셈(FMUL)과 같은 FP32 산술 지침이 혼합되어 있으며, 데이터 주소 지정 및 가져오기를 위한 정수 추가, 부동 소수점 비교, 처리 결과 등을 위한 최소/최대값과 같은 단순한 지침이 결합되어 있다. 성능 향상은 지침의 조합에 따라 셰이더 및 적용 수준에 따라 달라질 수 있다. Ray tracking denoising shader는 FP32 처리량을 두 배로 늘리면 큰 이익을 얻을 수 있는 좋은 예다. 
연산 처리량을 두 배로 늘리기 위해서는 이를 지원하는 데이터 경로가 두 배로 필요했고, 그래서 암페어 SM은 SM에 대한 공유 메모리와 L1 캐시 성능도 두 배로 향상시켰다. (Turing의 경우 64바이트/클록 대비 암페어 SM 당 128바이트/클록). GeForce RTX 3080의 총 L1 대역폭은 GeForce RTX 2080 Super의 경우 116 GB/sec보다 219 GB/sec다. 
이전의 NVIDIA GPU와 마찬가지로 암페어는 그래픽 처리 클러스터(GPC), 텍스처 처리 클러스터(TPC), 스트리밍 멀티프로세서(SM), 래스터 오퍼레이터(ROPS), 메모리 컨트롤러로 구성되어 있다. GPC는 모든 핵심 그래픽 처리 장치가 GPC 내부에 상주하는 지배적인 고급 하드웨어 블록이다. 각 GPC에는 전용 Raster Engine이 포함되어 있으며, 현재는 NVIDIA Ampere Architecture GA10x GPU의 새로운 기능인 ROP 파티션(각각 ROP 유닛 8개를 포함하는 파티션) 2개가 포함되어 있다. NVIDIA 암페어 아키텍처에 대한 자세한 내용은 NVIDIA의 암페어 아키텍처 다이어그램을 참조하십시오. <img src="https://img2.quasarzone.com/editor/2020/09/03/044780ff686437440d81aaf316d07068.jpg"><img src="https://img2.quasarzone.com/editor/2020/09/03/2adfd063713902f0e8133e58a0697e8e.jpg"> 
HardwareLuxx vs NVIDIA 튜링 SM에 따른 NVIDIA 암페어 스트리밍 멀티프로세서 비교를 위해 NVIDIA는 튜링 스트리밍 멀티프로세서(SM)를 다음과 같이 도입했다. 튜링은 새로운 프로세서 아키텍처인 튜링 SM을 도입하여 셰이딩 효율을 획기적으로 높여 Pascal 세대 대비 CUDA Core 당 전달 성능 50% 향상을 달성했다. 이러한 개선은 두 가지 주요 구조 변경에 의해 가능해진다. 먼저 튜링 SM은 플로팅 포인트 산술 데이터 패스와 동시에 명령을 실행할 수 있는 새로운 독립 정수 데이터 패스를 추가한다. 이전 세대에서는 이러한 지침을 실행하면 부동 소수점 지침의 발행이 차단되었을 것이다. 둘째, SM 메모리 경로가 공유 메모리, 텍스처 캐싱 및 메모리를 통합하도록 재설계됨 
캐싱을 하나의 장치에 로드하십시오. 이는 공통 워크로드에 대해 L1 캐시에 사용할 수 있는 대역폭과 용량이 2배 이상 증가함을 의미한다. PCI-Express 3.0 vs 4.0PCIe 3.0이 RTX 3090에 병목 현상을 일으킬 것인가? 내 인텔 시스템이 4.0을 지원하지 않기 때문에 걱정된다. [Tony Tamasi] – 시스템 성능은 많은 요인에 의해 영향을 받고 그 영향은 애플리케이션마다 다르다. 그 영향은 일반적으로 x16 PCI 4.0에서 x16 PCI 3.0으로 몇 퍼센트 미만이다. CPU 선택은 종종 성능에 더 큰 영향을 미친다. 잠재적인 성능 향상을 위해 Gen4 기능을 충분히 활용할 수 있는 새로운 플랫폼을 기대한다. GeForce RTX 3070tldrdoto – RTX 3070이 2080Ti보다 같거나 빠르다는 슬라이드가 기존의 래스터화 또는 DLSS/RT 워크로드를 가리키는 것인지 명확히 설명해달라. 기존 래스터화 벤치마크가 나타나지 않아 RT/DLSS 지원 게임만 제공되므로 정리할 수 있다면 매우 중요하다. [Justin Walker] 둘 다 얘기하는 겁니다. 기존의 래스터화만 지원하는 게임과 RTX(RT+DLSS)를 지원하는 게임. https://www.nvidia.com/en-us/geforce/news/introducing-rtx-30-series-graphics-cards/의 론칭 기사를 참조하십시오. DLSS 2.1EeK09 – DLSS에서 기대할 수 있는 발전은 무엇인가? 대부분의 사람들은 DLSS 3.0 또는 적어도 DLSS 2.1과 같은 것을 기대하고 있었다. DLSS를 계속 개선하고 동일한 버전을 유지하면서 더 많은 게임에 대한 지원을 제공할 계획인가? [NV-Randy] DLSS SDK 2.1이 출시되었으며 다음과 같은 3가지 업데이트가 포함되어 있다. 
– 8K 게임을 위한 새로운 초고성능 모드 새로운 9배 확장 옵션으로 GeForce RTX 3090에서 8K 게임 제공 
– VR 지원. DLSS는 이제 VR 타이틀에 대해 지원된다. 
– 동적 해상도 지원. 입력 버퍼는 출력 크기가 고정된 상태에서 프레임 간에 치수를 변경할 수 있다. 렌더링 엔진이 동적 해상도를 지원하는 경우 DLSS를 사용하여 디스플레이 해상도까지 필요한 업스케일을 수행할 수 있다. 전원 케이블Halogen19 – 두 개의 별도 케이블 대신 분할 커넥터에서 3080을 분리하는 것이 얼마나 나쁠까? 내가 오버클럭을 하지 않는다면 시스템에 위험할 수 있을까? [NV_Tim] 권장사항은 두 개의 개별 케이블을 실행하는 것이다. 여기 도표가 있다. https://www.nvidia.com/en-us/geforce/graphics-cards/30-series/rtx-3080/?nvmid=systemcomp RTX 인코더Carmen813 – Turing Release에서 살펴본 것과 유사한 RTX 인코더의 개선 사항이 있는가? Broadcast 소프트웨어에 대한 정보는 봤지만, 같은 비트 전송률로 전반적인 이미지 품질의 향상을 좀 더 생각해보고 있다. [Jason Paul] RTX 30 시리즈의 경우 비디오 디코딩 측면에 개선을 집중하기로 결정하고* AV1 디코딩 지원을 추가했다. 인코딩 측면에서는 RTX 30 시리즈가 당사의 RTX 20 시리즈 GPU와 동일한 훌륭한 인코더를 보유하고 있으며, 최근에는 NVIDIA 인코더 SDK도 업데이트하였다. 앞으로 몇 개월 이내에 livestream 애플리케이션은 스트리머의 새로운 성능 옵션을 잠금 해제하면서 SDK의 새로운 버전으로 업데이트될 것이다. NVIDIA ReflexAkanash94 – Nvidia Reflex 작용이 파스칼 GPU와 함께 작동할 것인가, 아니면 이것은 튜링/암페어 기능뿐인가? [NV_Tim] RTX 20시리즈를 포함해 900시리즈 + GPU로 동작한다. 시원한 디자인과 공기 흐름iCinn – 이중 공기 흐름 설계가 거꾸로 된 케이스로 인해 엉망이 될 지 아십니까? 이전 디자인보다? CPU를 날려버릴 것 같다. 하지만 CPU 쿨러는 여전히 그 케이스를 날려버릴 것이다. 그렇게 나쁘지 않을지도 모른다. 
두 번째 질문. 3090 타이탄보다 10배 더 조용한 것이 2080 슈퍼(예: Evga Ultra fx)보다 더 조용한가? [Qi Lin] u/iCinn 냉각 설계를 통한 새로운 흐름은 섀시 팬이 GPU에 신선한 공기를 공급하도록 구성한 다음 GPU를 통해 흐르는 공기를 섀시 밖으로 이동시키는 한 크게 작동할 것이다. 섀시가 뒤집어져도 상관없다. 
 파운더스 에디션 RTX 3090은 타이탄 RTX와 파운더스 에디션 RTX 2080 슈퍼보다 조용하다. 우리는 특정 파트너 디자인에 대해 테스트하지는 않았지만 당신이 듣는 것에 감명을 받을 것이라고 생각한다… :-)

Railgun0

행성: 블랙홀

포인트: 439,275 exp

작성물 댓글

모든회원 자기소개 펼치기

댓글: 18개

하드웨어 뉴스 - 최신 IT/하드웨어 정보를 만나보세요

공지 뉴스게시판 특별 규정(23.09.07)

퀘이사존

20.4k

11-08

전체 CPU/MB/RAM 그래픽카드 케이스 쿨링솔루션 저장장치 파워 키보드/마우스 음향기기 디스플레이 네트워크 소프트웨어 노트북 업계동향 기타/주변기기

추천	제목
8	[이벤트] 제품 평균 가격을 맞혀라 이벤트! 11 업계동향 제닉스홀릭 5.3k 09-11
17	RTX3000 시리즈도 시소닉과 함께~!! 33 파워 맥스엘리트 5.5k 09-11
8	[이벤트] 콩콩분을 잡아라 이벤트! 9 업계동향 제닉스홀릭 2.4k 09-11
17	RTX 3080 게임 성능 유출 : 2080 Ti보다 30% 더 강함 44 그래픽카드 QM지름 11.4k 09-11
7	[이벤트] 제닉스 타이탄 인이어 2BA 이어폰 퀴즈이벤트 9 업계동향 제닉스홀릭 1.8k 09-11
2	제닉스 대박 이벤트 오픈, 게이밍의자 키보드 마우스 등 증정 3 업계동향 제닉스홀릭 2.3k 09-11
12	MSI, AMD MAG B550 어뢰(TORPEDO) 마더보드 발표 22 CPU/MB/RAM Wormhole 5.3k 09-11
16	RTX 3080 성능 엠바고 및 판매일정 27 그래픽카드 전생의도박사 9.3k 09-11
3	디앤디, 4개의 디스플레이 포트를 제공하는 애즈락 A520M-HDVP 출시 9 CPU/MB/RAM 다이나믹DnD 4k 09-11
5	Intel 및 UCSC는 DLSS와 유사한 AI 스케일링 기술을 보여줍니다. 11 소프트웨어 Railgun0 3.2k 09-11
19	아이노비아, INNO3D RTX30 시리즈 ICHILL X3, X4 제품 정보 발표 30 그래픽카드 아이노비아 4.8k 09-11
11	인텔은 TSMC에 6nm 및 기타 용량을 외주 18 업계동향 QM지름 6.3k 09-11
11	Microsoft는 과도한 조각 모음으로 SSD를 손상시킨 Windows 10 버그를 수정했습니다. 26 CPU/MB/RAM Railgun0 15.1k 09-11
13	10월 28일 발표되는 AMD RX 6000 그래픽카드가 256-bit로 우려 24 그래픽카드 QM지름 6.2k 09-11
4	Patriot, "VIPER 4 BLACKOUT"에 최고 4,400MHz의 고클럭 모델 추가 3 CPU/MB/RAM Wormhole 4.6k 09-11
1	2개의 ARGB 팬을 표준 장비 전면 메쉬 미니 타워, SilverStone "PS15 PRO" 4 케이스 Railgun0 2.5k 09-11
1	MS. 윈도우10 내부자 미리보기 20211빌드 공개. WSL2에서 ext4 디스크 접근가능 2 CPU/MB/RAM 스퀴니 5.4k 09-11
0	인텔 공인대리점, 10세대 인텔 코어 프로세서 “싹3” 프로모션 실시 7 CPU/MB/RAM 인텔공인대리점 6.3k 09-11
11	Asus와 Zotac, GeForce RTX 2000 시리즈 가격 대폭 인하 35 그래픽카드 Railgun0 8.4k 09-11
16	Xbox Series X\|S 실물 영상 26 기타/주변기기 jch98 5.6k 09-11
20	LG, 163인치 MicroLED TV 공개 32 CPU/MB/RAM Railgun0 11.3k 09-11
4	AMD Threadripper Pro 3995WX가 탑재된 Thinkstation이 18,000달러에 상장되었습니다. 3 CPU/MB/RAM Railgun0 6.8k 09-11
11	RTX 3080 및 RTX 3090의 수율 정보 24 그래픽카드 QM포시포시 10.9k 09-10
4	Rambus, AI/ML 교육 애플리케이션을 위해 HBM2E 성능을 4.0Gbps로 향상 5 CPU/MB/RAM Railgun0 2.8k 09-10
6	ASUS, ROG STRIX B550-A Gaming 11 CPU/MB/RAM Railgun0 6.2k 09-10
10	엔비디아 공식 RTX 3080 언박싱 15 그래픽카드 루민 6.8k 09-10
1	Google, AMD의 최신 EPYC 프로세서 기반으로 메모리 암호화를 Kubernetes로 확장 2 업계동향 Railgun0 3k 09-10
25	NVIDIA GeForce RTX 3090 케이스 장착 사진 54 그래픽카드 Wormhole 14.4k 09-10
15	NVIDIA는 크리스마스까지 암페어 공급이 안정화될 것으로 예상합니다. RTX 3060, 3070 Ti 출시 예정 24 그래픽카드 Railgun0 5.9k 09-10
9	인텔의 R&D 지출은 수년간 AMD보다 4~5배 높았으며, NVIDIA는 둘보다 지출이 적었습니다. 25 업계동향 Railgun0 6.8k 09-10