지포스 언더볼팅! Ti의 전성비를 높이는 방법이 있다고?

전력은 줄이면서 성능을 한번 뽑아보자~

퀘이사존 QM크크리
86 7898 2021.09.01 19:43

퀘이사존



    안녕하세요. QM크크리입니다. 컴퓨터 부품의 성능 경쟁 덕분에 세대를 거듭할수록 기하급수적으로 올라가는 성능을 개개인들도 누릴 수 있게 되었습니다. 지금 우리가 쓰는 PC나 노트북, 스마트폰은 다소 구형일지라도 NASA가 처음 달에 사람을 보낼 때 인류가 가졌던 모든 컴퓨터를 합친 것보다 더 강력할지도 모릅니다. 이런 막대한 성능을 개인도 누릴 수 있게 된 덕분에 당시로써는 상상도 하기 힘들 정도로 고해상도로 표현되는 돼지에게 새를 쏘아 보낼 수 있게 되었습니다. 아, 요즘은 다른 게임 한다고요?

     이러한 성능 개선이 게임을 즐기는 개인들에게 항상 유리하게만 작용한 것은 아닙니다. GPU에 집적된 막대한 병렬 연산 자원은 워크스테이션과 AI에도 활용되고 있고, 결국 "암호화폐 채굴(cryptocurrency mining)"에까지 이르게 됩니다.




퀘이사존

▲ 사진 출처: Shutterstock

 

    이로 인한 여파는 지금도 현재진행 중이니 구구절절한 설명은 생략하겠습니다. 현재의 그래픽카드 공급 문제에는 코로나19로 인한 각종 부품 공급 차질이 엮여 있고, 이는 경제학의 글로벌 가치사슬(Global Value Chains) 차원에서 논의되고 있습니다. 그러나, 소위 '채굴' 문제도 커다란 한 축을 잡고 있음을 부정할 수 있는 사람은 없을 것입니다.


    그에 비해 당장은 덜 심각할 수 있어도, 앞으로 계속 안고 가야 되는데 점점 더 악화할 것으로 예상되는 문제도 있습니다. 세대가 거듭할수록 늘어가는 전력 소모로 인한 발열 문제입니다.




퀘이사존

▲ 클릭하면 커집니다.(원본 크기로 보실 수 있습니다.)


    NVCleanstall 칼럼에서 보여드렸던, QM벤치 님이 보관하고 계신 '지포스2 Ti(NVIDIA GeForce2 Ti)'의 모습입니다. 여러모로 요즘 그래픽카드와는 다른 외양을 볼 수 있습니다. 요즘 그래픽카드에 저 정도 냉각 장치만으로 구동하려 한다면 부팅조차 어려울 것으로 보입니다.


"지포스 드라이버를 내 맘대로 깔끔하게 설치한다고? NVCleanstall을 살펴보자" 칼럼 바로 가기




 퀘이사존


    52종 그래픽카드 3DMark 벤치마크에서 보여드린 현세대 그래픽카드들의 모습입니다. 대부분 RTX 3090 FE의 압도적인 크기에 눈이 가셨겠지만, 이 중에서 가장 작은 축에 속하는 제품들조차 과거 세대와 비교한다면 압도적으로 큰 냉각 장치를 사용합니다.


"퀘이사존 NVIDIA/AMD 52종 그래픽카드 3DMark 벤치마크" 바로 가기


    그러다 보니 점점 관심이 커지고 있는 주제 중 하나가 '언더볼팅undervolting'입니다. 과거에도 발열 공간에 제약이 심한 노트북이나, 라데온 그래픽카드의 특정 세대를 중심으로 언더볼팅에 대한 관심이 높아지기도 하였으나, 최근에는 지포스 RTX 30 시리즈의 언더볼팅에 대한 관심이 높아지고 있는 것으로 보입니다.


 

 


▲ 영상 출처: 유튜브 Optimum Tech


    이러한 지포스 언더볼팅은 주로 MSI 애프터버너Afterburner 등의 유틸리티로 접근할 수 있는 NVIDIA OC Scanner라는 도구를 사용합니다. 원래 자동 오버클록 기능을 제공하기 위한 목적으로 공개된 도구지만, 전압마다 클록이 따로 설정된 부스트 클록 곡선을 직접 보고 특정 전압의 설정을 조절할 수 있다는 점이 적극적인 사용자들의 응용력을 자극하는 점이 있었죠. 결국 일부러 낮은 전압에서 비교적 높은 클록을 설정하면, 전력 소모는 줄이면서 성능은 그대로 보존하거나 오히려 소폭 높일 수도 있다는 사실이 밝혀졌습니다.


 


퀘이사존


    NVIDIA OC Scanner는 MSI 애프터버너 기준으로 Core Clock 설정 근처에 있는 세로 막대 그래프형 아이콘을 통해 접근할 수 있습니다. 단축키는 Ctrl + F입니다.


 


퀘이사존

 

    ※ 애프터버너에는 다양한 스킨이 있으며, 스킨에 따라 위치나 표현 방식이 다소 다를 수 있는 점을 주의 바랍니다. 물론 단축키는 변하지 않음으로 Ctrl + F로 진입하셔도 됩니다.




퀘이사존

▲ 클릭하면 커집니다(원본 크기로 보실 수 있습니다).

※ 설명을 위해 일부러 잘못 설정한 예시입니다. 아래 설명을 참고해 주시기 바랍니다.


    이렇게 특정 전압에서 원하는 클록을 설정할 수 있습니다. 다만 위 화면은 일부러 잘못 설정한 것을 보여드린 것인데요. 이처럼 오른쪽에 튀어나온 부분이 있으면 거기서 동작할 때가 많아서 언더볼팅이 되지 않습니다. 언더볼팅 설정을 하기 전에 코어 클록(Core Clock)을 -200 ~ -300 정도로 낮춰 설정하라는 얘기가 그래서 나온 겁니다. 이는 애프터버너의 코어 클록 설정에서도 할 수 있지만, OC Scanner상에서도 할 수 있습니다. 간단하게 Shift 키를 누른 상태에서 전압/클록 곡선상의 아무 점이나 잡고 내려주면 전체가 그만큼 내려갑니다. 여기서는 곡선 오른쪽에 튀어나오는 지점을 없애려는 목적이니, 곡선 가장 오른쪽의 기본 클록 설정이 가장 높은 지점을 Shift 키를 누른 상태에서 잡고, 언더볼팅으로 설정할 클록보다 조금이라도 낮아지도록 내리면 되겠습니다.




퀘이사존



#1: 기본 설정 확인


    기본 설정의 전압과 부스트 클록을 대략 확인합니다. 가능하면 GPU를 최대한 많이 사용하는 게임으로 확인하는 것이 좋습니다. 일례로 RTX 3080 Ti FE로 레드 데드 리뎀션2를 구동할 경우 대략 1.02~1.08 V와 1,920~1,965 MHz 정도를 보입니다.



#2: 초기 설정 잡기


    원하는 전압과 클록을 대략 생각하여 설정합니다. 본 칼럼 진행 중 테스트에서는 50 mV를 내릴 때마다 75 ~ 120 MHz를 낮추는 결과가 나왔으니 참고하여 적당히 설정합니다. 이 때 위에서 말씀드린 '오른쪽에 튀어나온 부분'이 생기지 않도록 Shift 키를 누른 상태에서 맨 오른쪽을 끌어내려 "설정할 클록"보다 조금이라도 더 낮게 만들어줍니다.


#2-1: 설정 적용 시 주의할 사항

    한 가지 주의할 점은, 이러한 방식으로 클록을 설정하더라도 완벽하게 설정한 값으로만 작동하는 건 아니라는 점입니다. 부스트클록 자체의 가변적인 특성 때문인지 몰라도, 설정할 때 한 스텝(15 MHz) 정도 다른 값이 들어갈 때가 있습니다. 또한, 게임을 구동할 때도 설정된 값에서 한 스텝(15 MHz) 정도 변동이 있을 수 있으며, 이는 전력 제한으로 인한 부스트클록 저하와는 별개의 현상입니다. 이는 내가 1,920 MHz를 설정하더라도 게임에 따라서 1,935 ~ 1,950 MHz까지 변동할 수도 있다는 얘기입니다. 만약 해당 전압에서의 안정적인 클록 한계가 1,930 MHz 정도인 하드웨어라면 클록 변동 때문에 게임이나 시스템이 다운될 상황입니다. 따라서 1에서 사용한 'GPU를 최대한 많이 사용하는 게임'을 창 모드(전체 창모드 포함)로 실행해두고 수십 초 정도는 클록 변동을 확인해가며 설정을 잡는 것이 좋습니다.


 


퀘이사존

 


#3: 부하 검사를 통한 안정성 확인


    부하 검사(Stress Test)를 통해 안정성을 확인합니다. 가능하면 GPU를 최대한 많이 사용하면서도, 혼자 켜놓은 채로 내버려둬도 되는 게임을 사용하는 것이 좋습니다. 본 칼럼에서는 "호라이즌 제로 던(Horizon Zero Dawn)"과 "레드 데드 리뎀션 2(Red Dead Redemption 2)"를 이용하여 진행하였으며, 최종적으로 레드 데드 리뎀션 2를 사용하였습니다. 레드 데드 리뎀션 2의 스토리 모드에 진입한 후 벤치마크 기능을 실행하면, 벤치마크를 끝낸 후 다시 스토리 모드로 돌아갈 수 있습니다. 이를 이용하면 비교적 짧은 시간에 안정성을 어느 정도 확인할 수 있습니다.



#4: 안정성 확인 결과를 통한 설정 구체화


    클록을 조절하면서 안정적으로 구동 가능한 최대 클록 설정을 찾습니다. 기본적으로는 부하 검사에서 안정적으로 잘 작동하면 클록을 높이고, 뭔가 문제가 발생하면 클록을 낮추는 방식입니다. 추가로 약간의 팁을 드리자면, 처음에는 1~3분 정도의 짧은 시간만 확인하면서 4 스텝, 또는 8 스텝씩 대충 조절하다가, 어느 정도 윤곽이 잡히면 테스트 시간을 늘려가며 세세하게 조절하는 방법이 있습니다(현재 지포스 그래픽카드의 부스트클록은 15 MHz가 한 스텝이기 때문에, 4 스텝은 60 MHz, 8 스텝은 120 MHz가 됩니다). 이는 바이너리 서치(Binary Search, 이진 탐색 알고리듬)를 상식선에서 응용하여, 비교적 이른 시간에 최적 클록 설정을 찾는 방법입니다.




퀘이사존

▲ 클릭하면 커집니다(원본 크기로 보실 수 있습니다). 도해 출처: jojozhuang.github.io(바로 가기)


    바이너리 서치는 많은 데이터가 있고 특정한 순서대로 정렬되어 있지만, 그 이상의 조건은 모를 때 원하는 값을 찾기 위한 가장 빠른 방법으로 알려져 있습니다. 예를 들어서 1860 MHz를 테스트하여 안정적임을 확인한 후 120 MHz를 올려서 1980 MHz는 실패한 것을 확인한 직후를 생각해 봅시다.




퀘이사존

▲ 클릭하면 커집니다(원본 크기로 보실 수 있습니다).

 

    ① 여기서 그 둘의 중간값인 1,920 MHz를 확인하는 것이 이진 탐색의 논리에 가장 가깝습니다.

    ② 1,920 MHz는 안정적이라면, 다시 성공한 가장 높은 클록인 1,920 MHz와 실패한 가장 낮은 클록인 1,980 MHz의 중간인 1,950 MHz를 확인합니다.
    ③ 1,950 MHz에서 문제가 생겼다면, 다시 성공한 가장 높은 클록인 1,920 MHz와 실패한 가장 낮은 클록인 1,950 MHz의 중간인 1,935 MHz를 확인합니다.
    ※ 결론: 1,935 MHz가 안정적이라면 이것이 바로 찾던 설정입니다. 반면 1,935 MHz에서 문제가 생겼다면 그 바로 아래 값인 1,920 MHz가 답이 됩니다.


    이렇게 이진 탐색에 가까운 방법을 사용하여 3번의 검사로 답을 도출했습니다. 일반적인 오버클록 설정 찾기 팁처럼 1,860 MHz에서 한 스텝씩 올리면서 확인한다면, 최초 실패 지점인 1,935MHz (또는 1,950MHz)에 도달하기까지 5회 (또는 6회)의 검사가 필요한 것에 비해 효율적입니다.


    물론 클록 조절에 따른 안정성 확인은 어떤 프로그램으로 검사하느냐, 얼마나 오랫동안 구동하느냐에 따라 결과가 달라질 수 있어서 이진 탐색의 논리가 완벽하게 맞아떨어지긴 힘듭니다. 그래도 위와 같은 방법으로 빠르게 설정값을 한 번 찾아본다면 이를 참고할 기준으로 삼을 수 있습니다. 그 설정부터 출발하여 장시간의 부하 검사를 통해 실사용에 적용할 값을 찾는다면, 비교적 시간은 적게 쓰면서도 효율적으로 안정성을 확인할 수 있습니다.


    이러한 언더볼팅은 단순히 전력 제한을 조절하는 방식에 비해 같은 전력 소모로 더 높은 성능을 얻을 수 있습니다. 물론 설정한 전압에 비해서는 최대한 높은 클록을 설정하는 일종의 오버클록overclocking으로 얻는 성능이기 때문에, 오버클록처럼 시스템 불안정 실패 증상을 초래할 수 있습니다. 전압을 낮추는 만큼 일렉트로마이그레이션(Electromigration)이나 과열로 인한 영구적인 손상 위험은 적을 것이라는 점이 그나마 다행입니다. 전압을 너무 낮추면 그 자체로도 문제가 생길 수 있다고도 합니다만, 일반적인 PC 부품의 언더볼팅은 해당 부품을 사용하지 않는 유휴idle 상태일 때 자체적인 절전 기능으로 낮추는 전압(idle voltage)보다는 훨씬 높은 전압을 사용하기 때문에 그러한 문제에 해당한다고 보기 힘듭니다. 참고로 자체적인 절전 기능으로 전압을 낮추는 방식은 "동적 전압 스케일링(DVFS: Dynamic Voltage and Frequency Scaling)"이라고 하며, 영문 이름을 최대한 그대로 번역하여 "동적 전압 및 주파수 조정"이라고도 합니다.


    아무튼, 전압은 최대한 낮추면서도 그 낮춘 전압에 비해서는 최대한 높은 클록을 설정하기 때문에 생기는 시스템 불안정을 미리 상정하고 대응할 필요가 있습니다. 각각의 설정을 조절할 때마다 안정성을 확인하고 진행하여야 하며, 실사용까지 안정성을 확인한 상황이라도 새로운 게임을 즐기거나, 윈도우 운영체제, 그래픽 드라이버의 업데이트 등으로 인해 다시 불안정해질 수 있다는 점을 주의할 필요가 있습니다.


 


퀘이사존
퀘이사존

 

    ※ 본 칼럼에 사용한 설정은, 테스트 기간의 한계로 NVIDIA사의 FE(파운더스 에디션) 단일 샘플을 사용하여 벤치마크 진행에 필요한 최소한의 안정성 확인만을 통해 진행한 설정입니다. 실사용에 적용하기 위해서는 별도의 안정성 확인을 거쳐야 하는 점을 주의 바랍니다. 또한, 메모리 오버클록 설정으로 기본 설정보다 다소 높은 VRAM 클록으로 작동한 점도 유의바랍니다.


     900 mV부터 50 mV씩 줄여나가며 900 mV, 850 mV, 800 mV, 750 mV의 네 가지 설정을 비교하였습니다. 단, RTX 3070 Ti FE에서는 750 mV로 설정하여도 800 mV로 작동하는 관계로 800 mV까지의 세 가지 설정만 비교하였습니다.


 


퀘이사존


퀘이사존




퀘이사존

 

    ※ 기본 부스트 클록은 제품 카탈로그상의 명목상 클록 주파수입니다. 실제 작동 클록은 각 카드의 측정 결과 페이지에서 게임별 부스트 클록(Boost Clock) 측정 그래프를 참고하기 바랍니다.


    기본 설정의 성능을 100% 기준으로 하여 환산한 상대 성능 %입니다. 각 게임의 성능 측정 결과를 별도로 환산한 후에, 3개 게임의 상대 성능을 평균한 결과입니다. 이를 보면 900 mV에서는 성능이 약간 향상되나 전압을 더 낮출수록 성능이 떨어지는 결과입니다. 평균 전력 소모는 900 mV에서는 약간만 줄어들지만, 전압을 더 내리면 대폭 감소하는 경향을 보입니다.


 


퀘이사존


    상대 성능만을 다시 정리한 그래프를 보면, 1% 하위 프레임 역시 비슷한 경향을 보임을 알 수 있습니다. 다만 평균 프레임과 달리 전반적인 변동과 900 mV에서의 성능 향상 모두 적은 편입니다.




퀘이사존

 

    성능을 전력 소모 대비 효율로 환산한 소위 '전성비'는 전압을 낮출수록 향상됩니다. 이는 성능이 떨어지더라도 그 이상으로 전력 소모가 줄어든다는 의미입니다.


 


퀘이사존


퀘이사존

 

    전력 소모를 평균한 결과를 보면 전압을 낮출수록 전력 소모가 대폭 줄어드는 것을 확인할 수 있습니다. 이로 인해 온도도 낮아지거나 냉각팬의 속도가 느려지는 것을 확인할 수 있습니다. 자세한 것은 개별 게임 결과들이 다른 점도 있음으로 각 카드의 측정 결과 페이지에서 게임별 측정 그래프를 참고하기 바랍니다.


     단, 900 mV는 기본 설정에 비해 전력 소모 감소는 크지 않으며 최댓값은 약간 늘어났습니다.


 


퀘이사존


퀘이사존

 

    ※※ RTX 3070 Ti FE에서는 750 mV로 설정하여도 800 mV로 작동하는 관계로 800 mV까지의 세 가지 설정만 비교하였습니다.


 


퀘이사존

 

    ※ 기본 부스트 클록은 제품 카탈로그상의 명목상 클록 주파수입니다. 실제 작동 클록은 각 카드의 측정 결과 페이지에서 게임별 부스트 클록(Boost Clock) 측정 그래프를 참고하기 바랍니다.

    기본 설정의 성능을 100% 기준으로 하여 환산한 상대 성능 %입니다. 각 게임의 성능 측정 결과를 별도로 환산한 후에, 3개 게임의 상대 성능을 평균한 결과입니다. 이를 보면 900 mV에서는 성능이 약간 향상되나 전압을 더 낮출수록 성능이 떨어지는 결과입니다. 평균 전력 소모는 900 mV에서 대폭 줄어들지만, 전압을 더 내리면 약간씩 감소하는 경향을 보입니다.


 


퀘이사존

 

    상대 성능만을 다시 정리한 그래프를 보면, 1% 하위 프레임은 850 mV까지는 조금만 떨어지나, 800 mV에서는 대폭 떨어지는 모습을 보입니다.




퀘이사존


    성능을 전력 소모 대비 효율로 환산한 소위 '전성비'는 전압을 낮출수록 향상됩니다. 이는 성능이 떨어지더라도 그 이상으로 전력 소모가 줄어든다는 의미입니다. 다만 900 mV에서는 기본 설정 대비 대폭 향상되는 데 반해, 전압을 더 내릴 때의 향상 폭은 상대적으로 작은 편입니다.


 


퀘이사존


퀘이사존

 

    전력 소모를 평균한 결과를 보면 전압을 낮출수록 전력 소모가 대폭 줄어드는 것을 확인할 수 있습니다. 이로 인해 온도도 낮아지거나 냉각팬의 속도가 느려지는 것을 확인할 수 있습니다. 자세한 것은 개별 게임 결과들이 다른 점도 있음으로 각 카드의 측정 결과 페이지에서 게임별 측정 그래프를 참고하기 바랍니다.

    다만 900 mV에서는 기본 설정 대비 대폭 줄어드는 데 반해, 전압을 더 내릴 때의 변화는 상대적으로 작은 편입니다.


 


퀘이사존


퀘이사존




퀘이사존

 

    ※ 기본 부스트 클록은 제품 카탈로그상의 명목상 클록 주파수입니다. 실제 작동 클록은 각 카드의 측정 결과 페이지에서 게임별 부스트 클록(Boost Clock) 측정 그래프를 참고하기 바랍니다.

    기본 설정의 성능을 100% 기준으로 하여 환산한 상대 성능 %입니다. 각 게임의 성능 측정 결과를 별도로 환산한 후에, 3개 게임의 상대 성능을 평균한 결과입니다. 이를 보면 전압을 내리면서 성능과 전력 소모 모두 줄어드는 경향을 보입니다.




퀘이사존

 

    상대 성능만을 다시 정리한 그래프를 보면 전압을 내리면서 성능이 계속 떨어지는 경향을 보입니다. 단, 900 mV 설정의 1% 하위 프레임은 기본 설정에 비해 성능 저하가 크지 않습니다.




퀘이사존


    성능을 전력 소모 대비 효율로 환산한 소위 '전성비'는 전압을 낮출수록 향상됩니다. 이는 성능이 떨어지더라도 그 이상으로 전력 소모가 줄어든다는 의미입니다.


 


퀘이사존


퀘이사존


    전력 소모를 평균한 결과를 보면 전압을 낮출수록 전력 소모가 줄어드는 것을 확인할 수 있습니다. 이로 인해 온도도 낮아지거나 냉각팬의 속도가 느려지는 것을 확인할 수 있습니다. 자세한 것은 개별 게임 결과들이 다른 점도 있음으로 각 카드의 측정 결과 페이지에서 게임별 측정 그래프를 참고하기 바랍니다.


 


 퀘이사존


■ 오버클록과 비슷하면서도 다른, 사촌 같은 방법입니다

    이번에 알아본 언더볼팅 방법은 애초에 오버클록 도구의 응용에서 출발하였고, 세부적인 시행 방법도 오버클록과 유사합니다. 단지 오버클록은 적극적으로 할 수록 전력 소모를 감수하고 전압을 높여가며 사용할 수 있는 가장 높은 클록을 찾는 반면, 언더볼팅은 전압을 낮춰가면서 성능과 전력 소모의 타협점을 찾는다는 점이 다릅니다.


■ 안정성 확인에 노력과 시간을 투자할 의향이 있다면 충분히 해볼 만한 가치가 있습니다

    설정한 전압에 비해서는 최대한의 클록 설정으로 성능을 얻으려 한다는 점이 오버클록과 유사합니다. 따라서 오버클록과 같은 수준의 안정성 확인이 필요하며, 과열 걱정이 적다는 점이 다를 뿐입니다. 실사용에 만족할만한 설정을 찾았어도 이후의 변동(윈도우나 그래픽 드라이버, 게임의 업데이트, 다른 게임을 즐기게 될 경우 등등)으로 인해 다시 불안정해질 수 있다는 점도 불편한 점입니다. 그러나, 테스트 결과에서 볼 수 있듯이 언더볼팅은 성능 저하보다 훨씬 더 많은 전력을 아낄 수 있으며, 이는 소위 '전성비'가 거의 모든 결과에서 일관되게 향상됨으로써 나타납니다. 특히 일부 결과에서는 약간이지만 성능이 향상되기도 했습니다. 따라서 안정성 확인에 필요한 노력과 시간을 투자할 의향이 있는 적극적인 사용자들에게 언더볼팅은 매력적인 선택지가 될 수 있습니다.


 


댓글: 86

신고하기

신고대상


신고사유

투표 참여자 보기