본문 바로가기

Tech ZOOM

고성능 저전력 서버 시대, ARM 서버가 데이터센터에 가져올 변화

 

AI가 세상을 혁신적으로 변화시키고 있지만 부작용도 만만치 않다. 그중 하나는 딥러닝 모델이 갈수록 복잡해지면서, AI 모델의 학습과 추론에 필요한 전력 소비가 급증하고 있다는 점이다.

챗GPT의 아버지 샘 올트먼 오픈AI CEO는 “AI는 예상을 뛰어넘는 전력을 소모할 것”이라고 경고했으며, 빌 게이츠 마이크로소프트(MS) 창업자도 “AI 데이터센터의 수익성을 결정하는 핵심 요소는 전력이 될 것”이라며 전력 관리의 중요성을 강조한 바 있다. 문제는 AI 인프라에만 해당하지 않고 모든 데이터센터에서 기존 서버로 인한 전력 문제가 발생하고 있다는 것이다.


데이터센터 전력 비용의 가파른 상승

현대의 데이터센터는 전력 사용량이 점점 많아지고 있으며, 전력 비용 역시 가파르게 상승할 것이라는 예측이 지배적이다. 그간 다른 OECD 국가들보다 우리나라는 비교적 저렴하게 전력을 사용할 수 있었다. 덕분에 기업들은 데이터센터 운영에 있어서 전력 비용 문제를 후순위에 두었던 것도 사실이다. 하지만 더 이상 그런 정책은 지속되지 않을 전망이다.

2023년 11월부터 전기요금은 지속적으로 오르고 있으며, 올해 6월 ‘분산에너지 활성화 특별법’ 시행으로 대부분 지방에서 생산되는 발전소의 전력을 수도권으로 가져오면, 예전과 달리 더 비싼 요금을 지불해야 한다. 국내 대부분의 데이터센터가 수도권에 몰려 있음을 감안할 때 실질적인 비용 상승으로 이어질 것으로 예상된다. 거기에 탄소 배출을 줄여야 하는 제로 에너지 건축물 인증 규제 정책도 시행을 앞두고 있어 기업이 느끼는 압박감은 더욱 커질 전망이다.


 

산업용 전기 판매 단가 추이

어디에서 그 많은 전력이 소모되고 있는가?

전력 비용 문제를 살펴보기 전에, 데이터센터에서 전력이 많이 소모되는 부분부터 먼저 파악해야 한다. 데이터센터의 에너지 소비 구성을 살펴보면, 일단 서버 자체에서 사용하는 전력 비용도 많지만, 서버의 발열을 낮추기 위한 IT 쿨링에 50% 가까운 비용이 들어간다. 기존 x86 서버는 발열에 매우 취약하기 때문에 적정한 온도를 유지하지 못하면 성능과 안정성에 있어서 큰 문제가 되기 때문이다. 그렇다면 기업들은 어떻게 전력 문제에 대응해야 할까? 해결책은 단순하다. 기본 전력 소비량이 낮고, 열에 강해 쿨링 비용이 적게 들며, 더 나아가 상면 공간까지 효율화할 수 있는 서버들로 데이터센터를 구성하면 되는 것이다. 그리고 현재 이러한 요구를 충족할 수 있는 대안으로 ARM 서버가 등장해 시장의 관심이 높다.


 

데이터센터의 전형적인 에너지 소비 구성도

ARM 서버가 전력 문제를 해결할 수 있는 이유

ARM 서버는 ARM 아키텍처 기반의 프로세서를 사용하는 서버를 의미한다. 영국의 ARM 홀딩스가 개발한 RISC 기반의 아키텍처로 제작한 ARM 프로세서는 전통적으로 모바일 기기에서 널리 사용되어 왔으며, 낮은 전력 소비와 높은 효율성이 강점이다. 최근 몇 년간 ARM 칩 기술이 발전하면서 서버용 CPU 시장에서도 ARM이 주목받고 있다. 바로 이 ARM 프로세서를 채택한 것을 통칭 ARM 서버라고 한다. ARM 서버는 어떻게 데이터센터의 전력 문제를 해결할 수 있을까? 3가지 측면에서 살펴볼 수 있다.

첫 번째, 전력 소비량이 기존 x86 서버에 비해 현저히 낮다는 것이다. 다음 표는 ARM 기반 서버와 기존 AMD, Intel 프로세서 기반의 x86 서버의 전력 효율성을 비교한 결과다.

ARM 기반 서버는 프로세서가 최대로 소비하는 전력량을 의미하는 TDP(Thermal Design Power)가 250W로, 280W인 x86 서버보다 10% 이상 낮다. 더 중요한 것은 대부분 TDP가 최대치로 사용되거나 일부 허용 범위를 넘어서는 x86 서버 대비해서, ARM 기반 서버는 값이 대부분 최대전력 하단에서 균일하게 소비되어 전체 전력효율 측면에서 월등한 것을 확인할 수 있다.


 

ARM과 x86 서버의 전력 소모량 차이

 

둘째, ARM 프로세서는 낮은 전력 소모 덕분에 발열이 적고, 무엇보다 열 자체에 강하다. 달리 말하면 성능 저하나 과부하를 방지하기 위해 많은 쿨링 비용을 들여 데이터센터를 매우 낮은 온도로 유지할 필요가 없다는 의미다. 또한 기존의 Intel, AMD 프로세스 기반의 x86 서버는 열 문제로 랙에 모든 서버를 꽉 채울 수 없었지만, ARM 서버는 랙에 더 많은 서버를 설치할 수 있어 공간 효율성은 크게 향상되고, 운영 비용도 절감할 수 있다.

마지막으로 AI 등 전력소모량이 극심한 업무 영역에서 x86 대비 월등한 성능을 보인다는 것이다. 아래 그림을 보면, AI 추론 환경에서 쓰루풋과 응답속도 측면에서 ARM 서버가 성능이 더 뛰어나다는 것을 확인할 수 있다. 그 이유는 Intel, AMD와 같은 x86 아키텍처의 서버 프로세서는 하이퍼스레딩 기술을 통해 물리적 코어를 가상으로 확장하여 성능을 높이려 하지만, 이 방법은 AI, 멀티미디어 스트리밍 등 실시간 고성능 연산이 필요한 작업에는 성능 저하를 유발할 수 있다. 반면 ARM 서버는 다수의 물리적 코어를 탑재해 이런 상황에서도 성능 저하 없이 안정적인 성능을 제공한다.


 

AI 추론 환경에서의 서버 성능 비교

 

특히 최신 ARM 서버 칩은 5나노미터 또는 7나노미터 공정으로 제작되어, 더 작은 칩 크기로도 뛰어난 전력 효율과 성능을 제공한다. Intel 서버의 경우 여전히 10나노미터 공정을 사용하고 있으며, ARM 서버는 이보다 훨씬 앞선 공정 기술을 사용하고 있다. Intel도 3나노미터 공정의 Intel 3 기반의 6세대 Xeon 프로세서를 생산할 것이라고 최근 발표했지만, 현재 사용하는 Intel의 최신 서버 프로세서인 5세대 Xeon 프로세서는 10나노미터 공정이다.


ARM 서버, 데이터센터의 핵심 인프라로 부상

ARM 서버는 이제 데이터센터를 운영하는 모든 기업에서 고려해야 할 핵심 인프라가 되어 가고 있다. 아마존, 애플, 오라클 등 빅테크 기업들이 앞다투어 ARM 프로세서 개발이나 ARM 서버 도입에 열을 올리고 있는 이유이기도 하다. 엔비디아가 반도체 설계기업인 ARM 홀딩스(ARM Holdings) 인수에 관심을 가지고 자체 ARM 프로세서인 ‘그레이스’를 개발한 것도 이 때문이다. 따라서 국내 기업들도 이제는 ARM 서버 도입을 적극적으로 검토하여 데이터센터의 변화를 추구해야 할 때다.

HS효성인포메이션시스템은 최근 엑세스랩과 협력하여 국내 환경에 최적화된 ARM 서버를 공동 개발해 시장에 공급하고 있으며, 국내외 다양한 레퍼런스를 보유하고 있다.

자동차 관련 기관의 경우, Intel 서버로 구성한 백업 서버를 ARM 서버로 교체하고, 오픈소스 스토리지 프로젝트인 Ceph 구축까지 담당해 소프트웨어 기술력까지 검증받았다. 국내 대형 연구기관에서는 ARM 서버를 슈퍼 컴퓨터 모니터링 시스템으로 활용 중이며, 다수의 대기업과 플랫폼 기업에서도 ARM 서버를 사용하고 있다. 국내뿐만이 아니다. 미국 하와이 주립대학에 ARM 서버 납품 이후 추가로 계속 증설해 오고 있는데, 지난 몇 년간 유지보수를 진행하며 다운타임 한번 없이 안정적으로 운영 중이다.

현재 다수의 서버 벤더들이 ARM 서버를 판매하고 있지만, 대부분 단순히 제품을 딜리버리 하는 수준에 그치고 있으며 전문 엔지니어를 보유하지 않은 경우가 많다. 반면, HS효성인포메이션시스템은 엑세스랩과 함께 ARM 아키텍처에 대한 깊은 이해를 바탕으로 자체 서버 개발 인력과 다양한 레퍼런스를 보유하고 있어, 보다 전문적인 기술지원 서비스를 제공할 수 있다.

HS효성인포메이션시스템은 국내에서 업계 최대 규모의 LAB실인 DX센터에서 이미 GreenCore 시리즈에 대해 테스트를 완료하고, 성능과 소프트웨어 연계 등 다양한 부분을 직접 시연할 수 있는 환경을 마련했다는 점도 강점이다.