이전 리뷰를 통해 NVIDIA 워크스테이션 그래픽카드인 RTX A2000 12GB의 게임 성능(리뷰 바로가기)을 확인해본 바 있습니다. 게임 성능 자체는 RTX 3050 8GB에 조금 못미치지만, 보조 전원 없이 약 170%에 달하는 높은 전력 대비 성능을 보여 RTX A2000만의 메리트를 여실히 보여주었습니다. 코어 클록 240 MHz, 메모리 클록 4,000 MHz를 추가할 수 있는 오버클록 잠재력도 매우 인상적이었습니다. 또한 Low Profile 규격 덕분에 슬림, 미니 케이스에도 장착할 수 있다는 것도 빼놓을 수 없는 장점입니다.
이 정도만 해도 NVIDIA RTX A2000 12GB의 매력을 충분히 알 수 있지만, 워크스테이션 그래픽카드인 만큼 작업 성능은 어떤지 확인해 봐야겠지요. 일반적인 개인 사용자 측면에서는 크게 와닿지 않는 테스트겠지만 전문가 작업에 종사하는 사용자, 작업 공간이 부족해 고민이 있는 사용자, 집에서 간단하게 작업을 이어서 하기 원하는 사용자라면 한 번 눈여겨볼 필요가 있겠습니다. 그럼 지금부터 NVIDIA RTX A2000 12GB의 작업 성능은 어떤지 직접 확인해보시기 바랍니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/12/df8e2308b1dd72121f31d9652f559a1c.png)
▼ 제품 상세 스펙(눌러서 펼치기)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/12/6125974cb0e486c4b1da97f7bdad5fdd.png)
NVIDIA RTX A2000 간단 소개 INTRODUCING
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/93b665d0cc5413d37420f0aab02b6f85.jpg)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/0bc0fdee0911352e94fc07555fb8e589.jpg)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/6351459392614304dded3a8c76f608fb.jpg)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/7dc346acab7b1f3939b1678506d33d02.jpg)
[브래킷 제외 실측 크기] 길이 169 mm, 너비 69 mm, 두께 34 mm
[쿨링팬] 37 mm 1개
[출력 포트] Mini DisplayPort 1.4a 4개
[출력 해상도] 4x 4096 x 2160 @ 120 Hz, 4x 5120 x 2880 @ 60 Hz, 2x 7680 x 4320 @ 60 Hz
NVIDIA RTX A2000 12GB의 가장 큰 특징은 Low Profile 타입이라는 점입니다. 200 mm가 채 되지 않는 169 mm 길이와 2 슬롯 미만의 34 mm 두께로 슬림 또는 미니 케이스에 적합한 형태를 갖추고 있습니다. 기본적으로 LP 타입 브래킷이 장착되어 있지만 T6, T8 규격의 별 모양 드라이버를 사용하여 일반 크기의 브래킷으로 교체할 수 있습니다. 그래픽카드 크기로 인해 출력 포트는 Mini DisplayPort 1.4a 4개로 구성되어 있으며, Mini DP to DP 젠더 1개가 기본 제공됩니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/dbc6c3c13e22ab83deeafa850693ca78.jpg)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/ebd8b13beafe90c6ebb19ab1dc9dc9cd.jpg)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/44a77ce4760d7694bb4d20435e8ee52e.jpg)
[히트싱크 방식] GPU, 메모리 일체형
[전원부] 3+2 페이즈
[GPU 전원부 모스펫] Vishay SiC653A 50 A Dr.MOS
[메모리 전원부 모스펫] Alpha & Omega AOE6932 N-Channel
□ NVIDIA RTX A2000 12GB features
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/0ed4a0e3e0ed3fd08b912f028068c645.png)
NVIDIA 워크스테이션 그래픽카드(Quadro 및 NVIDIA RTX)는 NVIDIA Mosaic technology를 지원합니다. 단일 시스템에서 최대 4개의 GPU와 16개의 디스플레이를 연결할 수 있는 기술로, 여러 디스플레이를 통합된 단일 환경으로 활용할 수 있습니다. 또한 테어링과 같은 끊김 현상을 방지해주며, 베젤 사이의 간격을 보정하여 모든 디스플레이에서 정렬된 이미지를 볼 수 있습니다. 블렌딩을 지원하는 여러 프로젝터를 사용 중이라면, 단일 통합 이미지를 위해 프로젝터 오버랩 기능을 사용할 수 있습니다.
디스플레이 지원은 4x 4096 x 2160 @ 120 Hz, 4x 5120 x 2880 @ 60 Hz, 2x 7680 x 4320 @ 60 Hz로 일반 그래픽카드 대비 특별한 점은 없으나, NVIDIA Mosaic technology 지원을 통해 최대 16개의 디스플레이를 통합된 단일 환경으로 사용할 수 있다는 것이 차별점이라 할 수 있습니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/97ac960c7a5eaa869e72a68a4885c6b4.jpg)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/18/efba1c1b67109a8dbf397db4cd4bedd7.jpg)
▲ 이미지 출처: www.nvidia.com
간단한 예시로 RTX A2000 12GB 1~4대를 장착한 PC 1대만 있으면, 일반 소매점이나 호텔 로비, 박람회, 이벤트 회장, 회의실, 브리핑 센터와 같은 장소에서 디지털 사이니지를 쉽게 구축할 수 있습니다. RTX A2000 12GB 자체가 저전력으로 작동하기 때문에 부담도 적으며, 연결할 디스플레이 갯수가 적다면 PC 케이스의 크기도 더 줄일 수 있습니다. 이외에도 GeForce RTX 30 시리즈부터 가능해진 AV1 디코딩 지원, UHD 영상 저작물 보호 규격인 HDCP 2.2 지원 등의 특징이 있습니다.
Blender 테스트 Blender TEST
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/12/e579f932f3536a3963a4faebf7819951.png)
기존의 Blender Render 테스트는 CPU 성능을 측정하기 위해 사용했으나, 본 테스트에서는 CUDA 코어를 활용하는 설정으로 바꾸어 진행하였습니다. 소스는 이전 그대로 BMW27 Source를 사용했고 references > Cycles Render Devices > CUDA 선택, Blender 우측 패널 > Scene > Render Engine: Cycles 및 Device: GPU Compute로 설정 후 테스트했습니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/14/57f121574e511a82aa80a38b400111fe.png)
Blender 테스트에서는 드라이버에 상관없이 34초 대의 렌더링 시간을 기록했으며, OC 적용 시에는 30초 대까지 시간이 줄어듭니다. 동일한 Ampere 아키텍처 기반의 RTX 30 시리즈에서는 RTX 3060과 RTX 3050 사이에 위치하며, RTX 3060에 더 가까운 모습을 보입니다. 단순한 결괏값으로는 RTX 2060과 가장 근접한 모습입니다.
Stable Diffusion 테스트 Stable Diffusion TEST
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/13/1fae9c202c0d552384ca9cad6817e4bb.png)
Stable Diffusion은 오픈 소스로 제작된 그림 생성 AI입니다. 바탕이 되는 '모델'을 기반으로 Text to Image, Image to Image와 같은 방식을 활용해 그림을 생성합니다. 본 테스트는 프롬프트를 사용한 Text to Image 방식으로 진행하였으며, 자세한 설정은 아래와 같습니다.
- Model: ChilloutMIX
- Sampling steps : 150
- Width x Height : 512 x 512
- Batch count : 4
- Batch size : 1
- CFG Scale : 15
결괏값은 일종의 생성 속도라 할 수 있는 Iteration Per Second(it/s)입니다. ( Sampling steps(150) x Batch count(4) ) ÷ Time taken, 즉 600 ÷ 이미지 생성 시간(초)입니다. 위 설정으로는 모든 그래픽카드에서 6 GB 가량의 VRAM을 사용하는 것으로 확인되었습니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/6ef07aadbdfa59fd7fc0271650523809.png)
Blender 테스트와 마찬가지로, RTX 3060과 RTX 3050 사이에 위치하는 성능이지만 역시 RTX 3060에 좀 더 근접하며 OC를 적용하면 거의 동급의 성능을 보입니다.
AutoCAD Cadalyst 테스트 AutoCAD Cadalyst TEST
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/13/29162ca1dd97d76b35d5232d90cfff0a.png)
CAD(Computer Aided Design)는 PC에서 드로잉이나 디자인을 하여 도면, 3D 객체 파일 등을 생성하는 것을 말합니다. AutoCAD는 Autodesk에서 개발한 2D CAD 소프트웨어로 국내에서도 꽤 유명하지요. 현재는 대체 프로그램이 많아서 예전처럼 많이 쓰이지는 않지만, 상대적으로 데이터 구성이 덜 복잡하여 파일 호환성이 좋은 편이고 학생 인증을 하면 Autodesk의 프로그램 대부분을 1년 간 무료로 사용해볼 수 있다는 장점도 있습니다. 이러한 AutoCAD의 성능을 알아보기 위한 벤치마크 툴로 Cadalyst Systems Benchmark 2015 v5.5를 사용하여 3D Graphics Index, 2D Graphics Index 값을 확인해보았습니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/14/21637457299d9c86bc5d4162a0b26e51.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/14/e8f189c7f82d5885446b725ea4d446a0.png)
앞선 벤치마크 결괏값과는 달리 그래픽카드 별로 차이가 그리 크진 않지만, 성능의 양상은 RTX 3060 및 RTX 3050과 비슷한 수준인 것으로 확인됩니다. 그래픽카드 별 차이가 눈에 띄게 크지 않다면 전성비를 고려한다는 선택지도 있는데, 그런 의미에서는 RTX A2000이 좀 더 유리한 위치에 있다고 할 수 있습니다.
SPECviewperf 테스트 SPECviewperf TEST
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/12/0b120068063232f3974fbaa11adc0f46.png)
SPECviewperf는 OpenGL 및 DirectX 애플리케이션을 기반으로 3D 그래픽 성능을 측정하는 벤치마크 프로그램입니다. Catia V5, Creo 4, Siemens NX 8.0 등의 애플리케이션을 설치할 필요 없이 Viewset를 통해서 실제 애프리케이션의 그래픽 콘텐츠와 동작을 구현하여 성능을 측정할 수 있습니다. 본 테스트에서는 SPECviewperf 2020 v3.1 Benchmark를 사용하였으며 기본 해상도인 1920x1080으로 진행하였습니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/aa2d949daf1766e081e54d6c8ce5b02b.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/77811c0baec0eee19bf2bd8cfde1b571.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/27c339f1bbe4312fcebf2a1ed60e0c66.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/9a6186d2a30569b2d1208a67252c3b42.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/a7fa1726faba5a332e8fe5838764cc6d.png)
3D CAD 및 제품 수명주기 관리 소프트웨어인 Catia Viewset에서는 OC를 적용하지 않아도 RTX A2000이 비교군 중 가장 높은 점수를 보였으며, 동일한 3D CAD 소프트웨어인 Creo Viewset에서도 Catia와 동일한 양상으로 우수한 성능을 나타냈습니다. OpendTect 지진 시각화 애플리케이션 기반의 energy Viewset 역시 RTX 4060을 제치고 높은 성능을 발휘했습니다.
놀라운 것은 Tuvok 시각화 라이브러리를 활용한 medical Viewset와 제품 수명주기 관리 소프트웨어인 Siemens NX Viewset입니다. ※ 이 두 Viewset의 경우 성능이 압도적으로 높게 측정되어 현 세대 최상위 그래픽카드인 RTX 4090도 비교군에 넣어보았습니다. medical Viewset는 GameReady 드라이버 성능도 나쁘지 않지만, Quadro 드라이버 사용 시 성능이 68% 가량 상승하여 RTX A2000과 일반 그래픽카드의 성능 차이를 크게 벌립니다. OC까지 적용하면 최상위 RTX 4090과의 차이는 16%까지 좁혀집니다. Siemens NX Viewset에서는 그야말로 압도적인 성능을 보이는데, RTX A2000이 GameReady 드라이버를 설치한 상태에서도 RTX 4090과 360% 가량의 성능 차를 나타냅니다.
SPECworkstation 테스트 SPECworkstation TEST
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/12/7858826e43388d43332fad07c9e87c9e.png)
SPECworkstation은 SPECviewperf와 비슷하게 다양한 전문 애플리케이션을 기반으로 워크스테이션 성능을 측정하는 벤치마크 프로그램입니다. 3D 그래픽에 치중된 SPECviewperf와는 달리 CPU, 그래픽, I/O 및 메모리 대역폭을 측정하는 140개 가량의 테스트가 포함되어 있습니다. 하지만 본 테스트는 RTX A2000의 성능을 알아보기 위한 것이므로, GPU 워크로드에 있는 항목 중 SPECviewperf와 겹치지 않는 딥 러닝 프레임워크 caffe, 질병 연구를 위한 분산 컴퓨팅 프로젝트 Folding@home(fah) 워크로드 2종을 테스트하였습니다.
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/14/36c69dd50cac13de550ed8e511d4b286.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/14/8440e6c18158225c170639b5e7836624.png)
caffe 및 fah 워크로드 테스트에서는 SPECviewperf와 달리, 이전 벤치마크 결괏값처럼 RTX 3060과 RTX 3050 사이에 위치하는 성능이 확인되었습니다.
소비전력 테스트 POWER CONSUMPTION TEST
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/5be2fcc8c1035d207d2c37a8f57ad4c2.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/cf8fb670369052a7b4b6bc02fa483319.png)
![퀘이사존](https://img2.quasarzone.com/editor/2023/09/19/65ae588f53142c3a4512fc2a2755e8c7.png)
RTX A2000은 GameReady 드라이버로 테스트한 이전 게임 성능 리뷰에서 RTX 3050 대비 170% 가량 높은 전력 대비 성능을 보여준 바 있습니다. SPECviewperf 전체 테스트 1회로 진행한 작업 성능 벤치마크는 게임 벤치마크에 비해 평균 소비전력은 낮지만 피크 수치가 높게 측정되었습니다.
우수한 전력 대비 성능은 그대로였는데요. SPECviewperf 전체 테스트 1회 진행 시 Quadro 드라이버에 OC를 적용한 RTX A2000이 가장 높은 효율을 보였고, 그 다음으로는 OC를 적용하지 않은 Quadro 드라이버의 RTX A2000이 우수한 효율을 나타냈습니다. 그 뒤를 이은 GameReady 드라이버 설치 상태의 RTX A2000도 좋은 효율을 보였습니다.
이 전력 대비 성능을 백분율로 계산해보면, 일반 그래픽카드 대비 RTX A2000의 메리트가 더욱 두드러지는데요. RTX 3050을 100% 기준으로 두었을 때 RTX A2000은 무려 360%가 넘는 전력 대비 성능을 갖춘 것으로 확인됩니다. 물론 SPECviewperf 벤치마크가 여러 개의 테스트를 진행하기 때문에 모든 애플리케이션에서 3배 이상의 효율을 보인다고 할 수는 없지만, 앞선 SPECviewperf 벤치마크 결과처럼 Tuvok 시각화 라이브러리 활용 프로그램이나 Siemens NX 애플리케이션을 사용하는 경우 높은 전력 대비 성능을 얻을 수 있겠고, Catia나 Creo 애플리케이션에서도 적지 않은 전성비를 확보할 수 있겠습니다.