본문 바로가기

IT TREND

AI 데이터센터, 이것 하나면 끝!

 

생성형 AI가 급성장함에 따라 정부를 비롯한 많은 기업이 미래 산업의 핵심 인프라로 ‘AI 데이터센터’에 주목하고 있다. AI로 재편되는 글로벌 경쟁력을 확보하고, 미래 먹거리를 창출하겠다는 포부다. AI 데이터센터의 특징과 주요 구성 요소, 그리고 이를 완벽하게 구현할 HS효성인포메이션시스템의 전략까지 꼼꼼히 살펴본다.

 

 

차세대 국가 전략사업으로 떠오른 AI 데이터센터

 

AI 데이터센터는 AI 애플리케이션과 서비스를 학습, 배포, 제공하는 데 필요한 AI 인프라를 위한 것으로, 기 존 데이터센터가 감당하지 못하는 막대한 연산과 데이터 처리를 위해 등장했다. AI 워크로드를 처리할 수 있는 고성능 컴퓨팅, 네트워크 및 스토리지, 아키텍처 등을 갖춘 AI 데이터센터는 AI 기술의 이점을 활용하 기 위해서는 반드시 필요한 인프라다.

 

기존 데이터센터는 웹, DB, 클라우드, 엔터프라이즈 앱 등 일반 컴퓨팅을 작동시키기 위한 목적이었다면, AI 데이터센터는 AI와 머신러닝에 특화되어 있는 고성능 솔루션의 집약체다. 고성능의 GPU 기반 연산 자원을 처리해야 하기 때문에 기존 데이터센터에 비해 많은 전력이 필요하고, 높은 발열 현상 역시 동반된다. 따라서 AI 데이터센터는 발열을 낮출 수 있는 쿨링 기법이 동반되어야 원하는 성능을 낼 수 있다.

 

특히 기존 데이터센터의 PUE(전력 사용 효율성)가 1.5~1.8 정도라면, AI 데이터센터는 최신 기준으로 1.1~1.5를 나타내고 있으며, 최대 1.0까지 도달할 수 있도록 꾸준히 개발 중이다. PUE는 데이터센터의 전체 전력 소비량을 IT 인프라 전력 소비량으로 나눈 값으로, 1.0이라는 수치는 데이터센터에 들어오는 모든 전력을 IT 리소스 운영에 전부 소비한다는 의미로 볼 수 있다.

 

 

AI 데이터센터의 네 가지 구성 요소

 

국내외에서 미래 산업의 핵심으로 돌풍을 일으키고 있는 AI 데이터센터의 주요 구성 요소는 크게 네 가지로 구분할 수 있다. 첫째, AI를 처리하기 위해서는 GPU 등을 포함한 고성능 컴퓨팅(HPC)이 필수적이다. 다음으로 AI 분석을 위한 효율적이면서 고성능의 데이터 저장소가 필요하며, 세 번째는 고성능의 연산 자원을 효율적으로 사용하기 위한 리소스 효율화 솔루션, AIOps Stack 등이 포함된다. 마지막 구성 요소는 탄소 절감, 냉각 등 ESG를 위한 전력 효율화 솔루션이다.

 

AI 데이터센터를 구성하는 주요 요소를 구체적으로 다루기에 앞서, AI 데이터센터를 구축하려는 기업들이 공통적으로 토로하는 이슈 몇 가지를 살펴본다.

 

가장 먼저, AI 데이터센터의 기본은 ‘고성능’이다. 고성능 GPU 서버, 고성능 스토리지 및 AIOps 솔루션, 데이터 거버넌스 등 다양한 솔루션이 복합적으로 통합되어 있기 때문에 새로운 기술 역시 무궁무진하다. 현업 담당자들이 이러한 기술을 학습하고 활용하는 데 많은 시간과 에너지를 할애하는 것은 현실적으로 어려운 일이다.


다음은, 소프트웨어와 하드웨어를 개별적으로 도입할 경우 발생하는 높은 초기 투자 비용에 대한 부담이다. 세 번째는 기업 내에 AI 데이터센터를 컨트롤할 수 있는 전문 인력의 부재, 그리고 AI 전문 파트너사 역량에 대한 고민이다. 


이처럼 AI 데이터센터 구현에 앞서 맞닥뜨리는 다양한 과제를 해결하고자 HS효성인포메이션시스템은 ‘AI 플랫폼’을 기반으로 고객의 AI 전환 및 최적의 데이터센터 구현을 지원하고 있다.


 HW부터 AIOps Stack까지, AI를 위한 최적의 선택 ‘HS효성 AI 플랫폼’

 

HS효성인포메이션시스템의 AI 플랫폼은 저전력, 데이터 오케스트레이션 등 AI 데이터센터에 대한 고객의 니즈 및 트렌드를 지속적으로 반영함으로써 기업들이 더욱 편리한 환경을 구축할 수 있도록 에코 파트너와 협업하며 라인업을 확장시키고 있다. 

 

HS효성인포메이션시스템 AI 플랫폼

 

AI 플랫폼은 크게 Compute Fabric과 Storage Fabric, 그리고 AIOps Stack으로 구성되어 있다. 


Compute Fabric은 GPU 서버 라인업과 친환경 저전력의 Arm 서버로 구성되어 있고, Storage Fabric은 AI 스토리지 레이어에 고성능 병렬파일시스템 HCSF와 Weka, 그리고 데이터 오케스트레이션 솔루션인 Hammerspace로 구성되어 있다. 또한 데이터 레이크 스토리지는 전통적인 오브젝트 스토리지 HCP를 기반으로 S3 API를 지원한다. AIOps Stack으로는 NVIDIA를 위 Backend.AI, AMD GPU를 위한 MoAI를 지원하고 있다. 

 


고성능 AI HW - GPU & 스토리지


가장 먼저, HS효성인포메이션시스템은 글로벌 GPU 서버 시장 점유율 1위를 달성한 슈퍼마이크로의 GPU 서버를 제공한다. 슈퍼마이크로는 전년 대비 55% 성장하며 글로벌 시장의 강자로 활약하고 있는데, 그 이유는 슈퍼마이크로의 FTM 전략이 주효했다.


 FTM(First  To Market) 전략은 급변하는 AI 관련 기술을 가장 먼저 시장에 선보인다는 의미다. 슈퍼마이크로는 연구에 투자를 많이 함으로써 기술력을 향상시켜 출시 과정을 간소화하고, 안정성과 호환성이 뛰어난 제품을 발 빠르게 출시하면서 마켓 쉐어를 확장했다. 


특히, 슈퍼마이크로는 AI 데이터센터의 전력 효율화를 위한 냉각 방식으로서 Liquid Cooling 기법을 지원한다. 최근 출시한 ‘DLC-2’는 고성능과 에너지 효율을 동시에 실현하는 차세대 직접 수냉식 솔루션으로, 전력을 40%까지 절감하고 더 나아가 냉각 용수도 40%까지 절감할 수 있으며, 서버의 98%를 Liquid Cooling으로 냉각시킬 수 있다. 


다음으로, GPU가 고성능을 유지하기 위해서는 스토리지 역시 고성능이어야만 한다. HS효성인포메이션시스템의 HCSF 및 Weka 라인업은 AI 업무를 위해 필요한 IOPs 성능과 다양한 인터페이스, 대용량 확장을 제공하는 고성능 스토리지다.

초고성능 분산 병렬파일시스템과 대용량 오브젝트 스토리지 HCP가 만나 HCSF로 제공되며, 안정적인 데이터 처리 환경을 제공하고, 다양한 프로토콜 호환성으로 유연한 애플리케이션 연동 환경을 지원하는 이상적인 데이터 분석용 스토리지라고 할 수 있다.

 


 AIOps, AI 데이터센터 완성의 촉진제


하드웨어 인프라만 도입했다고 AI 데이터센터가 완성된 것은 아니다. 예를 들어, 기업이 고성능 GPU를 구축했음에도 이용률이 저조하거나, 개발자마다 다른 개발 라이브러리에 대해 편리한 환경을 제공받고 싶을 수도 있다. 또는 기존에 도입한 GPU와 차후 도입할 GPU를 함께 관리 및 사용할 수 있는 환경, 즉 하이브리드 GPU 환경을 도입하기 원하는 고객들도 있다. 


이처럼 다양한 환경에 최적화될 수 있도록 HS효성인포메이션시스템은 많은 에코파트너사의 제품을 제공하고 있는데, 대표적으로 두 가지 AIOps 솔루션을 소개한다.


기존에 사용하는 인프라 환경이 NVIDIA GPU라면, 국내 기업 래블업의 Backend.AI를 채택할 수 있다. Backend.AI는 아태지역 최초로 NVIDIA가 공식적으로 인증한 소프트웨어로, NVIDIA GPU에 최적화된 솔루션이다.


반면, AMD GPU를 사용 중이거나 도입을 검토하고 있다면, AMD사가 직접 투자한 국내 AI 소프트웨어 기업 모레(MOREH)가 개발한 MoAI를 제안한다. 


많은 기업이 NVIDIA GPU를 사용할 수밖에 없는 이유는, GPU 컴퓨팅 성능을 극대화하기 위해 설계된 소프트웨어 도구 모음인 CUDA 라이브러리 종속성이 주 원인이라고 할 수 있다. 반면, MoAI 솔루션은 CUDA 종속성을 제거하는 레이어를 제공해, 기존 CUDA 기반의 분석 모델 소스가 AMD GPU(ROCm) 환경에서도 100% 호환되도록 지원한다.


이 외에도 MoAI는 GPU 가상화 기술 및 자동 병렬화, 네트워크 최적화 등 개발의 편의성과 네트워크 비용 절감, 하드웨어 장애 대응에 탁월한 장점이 있다.

 

 

지금 주목해야 할 솔루션, Arm 서버 & Hammerspace


최근 빅테크 기업들이 앞다퉈 자체 Arm 서버를 출시하고 있는데, 이는 전력 소모 대비 뛰어난 성능을 나타내는 Arm 서버만의 강점 때문이다. Arm 서버는 저전력 및 저발열 서버로, 고성능 AI데이터센터에 적합한 형태의 서버라고 할 수 있다. x86서버의 워크로드를 Arm 서버로 수행하며 , 절감된 전력을 고성능 AI인프라에 사용함으로써, AI데이터센터의 PUE를 높이는 방안이 될 수 있다.


HS효성인포메이션시스템은 엑세스랩과 공동으로 국산 Arm 서버를 개발해 기업들에게 제공하고 있다. 양사의 합작 솔루션 ‘GreenCore’는 Arm 하드웨어 보드를 직접 설계 및 개발하고, 소프트웨어 일체형을 지원하는 국내 유일의 Arm 서버로, 기업별 맞춤형 관리 환경을 통합 제공함으로써 편리한 사용이 가능하다.


마지막으로, 과거에는 데이터를 모으는 데 치중했다면, 이제는 위치 제약 없는 데이터 운영과 활용도 극대화, 그리고 데이터 사일로를 해소하는 기능이 더 필요한 시대다. 이러한 트렌드를 반영해 HS효성의 AI 플랫폼은 데이터 통합 관리 솔루션으로서 글로벌 파일시스템 ‘Hammerspace’를 제공한다.


Hammerspace는 모든 환경의 스토리지에 구축이 가능하고, 물리적으로 데이터를 이관할 필요가 없으며, 병렬 처리를 위한 빠른 데이터 액세스를 제공함으로써 데이터 활용을 극대화하는 솔루션이다.

 

데이터 통합 솔루션, Hammerspace 특장점

What Inspires Sustainable Technology?