본문 바로가기

IT TREND

디지털 시대, 움직이는 고객을 잡자


민첩하게 움직이는 디지털 플레이어들로 인해 산업과 시장이 급변하고 있다. 이처럼 디지털 경제가 급성장하는 환경에서 경쟁력을 확보하려면 데이터센터의 변화는 불가피하다. 현업 담당자들이 미래 비즈니스에 초점을 맞출 수 있도록 데이터센터 운영자는 AI(인공지능), 머신러닝, 자동화 등의 방식을 적극적으로 수용해야 한다. 데이터센터 현대화로 집약된 최근 IT 업계의 화두를 짚어본다.


데이터센터 현대화란 무엇인가

날로 치열해지는 경쟁 속에서 데이터센터는 현대화의 압박을 받고 있다. 데이터센터 운영이 점점 더 복잡해짐에 따라, 운영 효율성이 악화되어 시스템 중단이나 데이터 손실 위협이 높아질 수 있다. 관리 소프트웨어가 IT 담당자 대신 단순 관리 작업을 처리하고, 더 나아가 프로비저닝과 같은 데이터센터 관리에 대한 의사결정을 내릴 수 있어야 한다.

데이터센터 현대화는 데이터의 새로운 가치 창출을 위한 필수 조건이다. 데이터센터 현대화를 통해 기업은 데이터의 새로운 물결에 적극적으로 대응할 수 있으며 디지털 트랜스포메이션 또한 성공적으로 끌어낼 수 있을 것이다.


애자일(Agile)과 AI가 데이터센터 현대화의 전제 조건이 되는 이유는

고객은 좋은 상품이나 서비스 기업을 찾아 언제든지 거래 기업을 바꿀 수 있다. 기존 기업의 고객을 빠르게 잠식해가고 있는 디지털 스타트업들이 고객을 공략하는 가장 큰 특징은 민첩성이다. 고객들의 요구에 신속하게, 심지어 한 발 앞서 민첩하게 대응하는 것이다. 물론 비즈니스의 변화 속도에 발맞추기 위해 IT 인프라 기술도 빠르게 변해야 한다.

이런 민첩성의 일환으로 이미 애자일 방법론과 데브옵스(DevOps)가 애플리케이션 개발 및 배포의 차세대 표준으로 퍼지고 있다. 물리적으로 변경이 쉽지 않은 IT 인프라 영역에서도 애자일 개념을 적용하려는 시도가 이어지고 있다. 핵심은 기존의 서버를 가장 작고 다루기 쉬운 단위로 최적화한 컨테이너 기술이다.

문제는 인프라 관리가 점차 복잡해진다는 것이다. 사람이 직접 개입해 처리하는 것이 더 이상 효율적이지 않게 되었다. 이 때문에 AI를 IT 인프라 관리에 적용해 더욱 효율적이고 민첩해지자는 것이다. 이를 통해 기업은 시장 대응력 향상, IT 인프라 관리 운영의 최적화, 신속한 문제 해결, IT 성과 향상 등을 기대할 수 있다.


애자일 방법론의 핵심이 컨테이너 기술이라고 했는데, 기존 가상화와 어떻게 다른가

가상머신은 운영체제를 포함한 전체를 가상화해 가상 서버를 구현한다. 그런데 운영체제를 설치하고 그 위에 애플리케이션을 배치하게 되면, 보통 30GB 정도의 작지 않은 크기가 된다. 일단 이렇게 가상머신 이미지를 생성하면, 이후로는 크든 작든 같은 이미지를 그대로 사용하게 된다.

컨테이너는 가상머신보다 한층 더 가볍고 민첩성을 극대화한 서버 인스턴스라고 보면 된다. 기본적으로는 운영체제를 공유하면서, 펌웨어, 라이브러리 등 애플리케이션 구동에 필요한 부분만 설치하면 되기 때문에 기본 용량이 크게 줄어든다. 또한 호스트 운영체제, 하이퍼바이저 등의 라이선스가 필요 없기 때문에 라이선스 비용을 절감할 수도 있다.


가상머신 대신 컨테이너 기술을 실제 적용한 기업은 있는가

페이스북, 아마존, 우버와 같은 디지털 선도업체들은 이미 컨테이너 기술을 이용해 자사 서비스를 민첩하게 변화하고 확장하고 있다. IDC는 2020년이면 1억 대에 가까운 컨테이너 인스턴스가 배포될 것으로 예측하고 있다. 2018년에 컨테이너 설치 수가 가상머신을 추월하며, 2020년이면 5배에 가까운 수치를 기록할 전망이다. 하지만 이렇게 설치 수는 몇 배에 달하지만, IT 인프라 자원에서 차지하는 비중은 20%에 불과할 것으로 예상된다.


(그림) 전 세계 컨테이너 및 VM 인스턴스 설치 기반(서비스 업체 내부 인프라 제외)


출처 : IDC Container Forecast 2016



스토리지 관점에서 컨테이너를 활용하면 좋은 점은

스토리지 인프라는 모든 데이터 처리를 외장형 스토리지가 관장하면서 성능을 보장한다. 컨테이너 환경에서도 스토리지는 같은 역할을 해야 한다. 히타치 스토리지는 플러그인을 통해 기존의 모든 스토리지 기능을 컨테이너 환경에서도 같이 제공한다. 플러그인 방식이기 때문에 자동화 역할을 하는 오케이스트레이션 툴에 별도의 스크립트를 추가할 필요가 없으며, 기존 스토리지 인프라에서도 바로 사용할 수 있다.

기존 외장형 스토리지가 제공하던 스냅샷, 클론 등의 기능도 그대로 이용할 수 있다. 또한, 컨테이너 환경은 새로운 오픈소스 코드를 기반으로, 성능 분석, 원격 지원, 재해복구 등 기존의 안정적인 데이터 서비스를 그대로 활용할 수 있다.


최근 인프라 관리 영역에서 AI를 적용한 AIOps가 화두라고 하던데

머신러닝 기반 AI가 IT 업계 최대의 화두인 만큼, 인프라 관리 영역에서도 이를 적용하는 것은 당연하다. AIOps는 빅데이터 분석, 머신러닝 및 기타 AI 기술을 활용해 IT 인프라의 문제를 파악하고 해결책을 제시하는 과정을 자동화한다. 사람이 직접 개입하는 대신 AI를 통해 실수를 줄이고 더 효율적으로 IT 인프라를 운영하는 것이다. 데이터센터가 최상의 상태를 유지하면서, 동시에 증가하는 복잡성에도 대응할 수 있게 해주는 것이 AI의 역할이다.


(그림) AI 운영



스토리지 관점에서 AIOps는 구체적으로 어떤 형태로 구현되는가

히타치 밴타라는 지난 5월, 새로운 고성능 스토리지 시스템과 함께 AI 분석 및 IT 자동화 소프트웨어를 공개해 AIOps를 구체화하며, 분석, 실행, 확장의 세 단계로 나누었다.

가장 먼저 생각해야 할 것은 역시 분석, 즉 두뇌 역할이다. 히타치는 같은 데이터를 머신러닝 기술을 이용해 분석해 문제를 예측하고 대응 방안을 제시한다. 특히 데이터센터 전반에 걸친 포괄적인 분석을 통해 향상된 인사이트를 제공하며, 다른 벤더사의 스토리지는 물론, 네트워크, 서버 운영체제, 하이퍼바이저까지 분석 가능하다. 또한 장애 원인 데이터를 DB화해 솔루션에 적용했으며, AI 기반 학습을 통해 장애 임계치를 보다 정확하게 조정할 수 있다.

분석만으로는 충분하지 않다. 실행이 필요하다. 기존에는 분석 결과를 기반으로 관리자가 직접 대응 조치를 취했으나, 실수가 발생하기도 했다. 이런 위험을 방지하기 위해 대응 방안을 정형화해 자동화하는 것이 실행 엔진으로, 자동화 툴 HAD(Hitachi Automation Director)가 이런 기능을 수행한다.

HAD는 히타치 스토리지뿐만 아니라 SAN 스위치, 하이퍼바이저, 애플리케이션까지 자동화 하는 것이 특징이다. AWS 같은 퍼블릭 클라우드 서비스의 셀프 서비스 템플릿과 같은 방식으로, 인프라 자원을 할당하고 변경하는 등의 기능을 쉽게 사용할 수 있다. HAD의 궁극적인 목표는 IT 부서가 좀 더 전략적인 업무에 집중하도록 지원하는 것이다.

마지막은 스토리지 외에 서버나 전력 등 데이터센터의 주요 구성 요소로 분석과 실행을 연계하고 확장하는 것이다. 히타치는 API를 통해 히타치의 다른 툴은 물론 서드파티 업체의 다양한 툴과의 연계를 지원한다.


데이터 보호를 위한 솔루션이 중요한 이유가 있나

글로벌 시대의 IT 인프라는 24시간 쉴 수 있는 시간이 없다. 따라서 재해복구 시스템은 기업의 기본 인프라로 자리 잡았으며, 실제로 백업 대용으로도 사용할 정도이다.

문제는 이런 재해복구 시스템이 상당히 복잡하다는 것이다. 히타치는 이에 대한 해법으로 HDID(Hitachi Data Instance Director)를 제시한다. HDID는 히타치 스토리지를 기반으로 대용량 데이터베이스에 대한 백업 및 재해 복구 자동화를 제공한다. 스냅샷 기능으로 즉각적인 데이터 보호가 가능하며, 증분 백업으로 백업 윈도우를 최소화해 더 많은 복구 지점을 생성할 수 있다. 동기, 비동기, 액티브-액티브 구성 등 다양한 재해 복구 방식을 지원하며, 애플리케이션에 대한 즉각적이고 완전한 복구를 지원한다. 특히 CDM(Copy Data Management)을 지원해 프로덕션의 원본 소스를 개발과 데이터 분석에 동시에 사용할 수 있어 스토리지 수요를 줄일 수 있다. 적합한 사본 데이터에 대한 빠르고 쉬운 액세스로 애플리케이션 개발 사이클을 가속화하고 의사결정을 개선하고 효율성과 생산성을 높일 수 있다. 당연히, 이 모든 것은 분석 및 자동화 단계와 유기적으로 연동되어 모든 볼륨 생성과 데이터 보호를 하나의 통합 보호 체계로 자동화한다.


(그림) HAD와 HDID를 이용한 자율 운영 데이터센터


데이터센터 운영이 자동화되는 시기는 언제쯤 가능할 것인가

자동화는 아직 진화 중이다. 장기적으로는 AI가 자동으로 최적의 조건을 설정하고, 문제가 생겼을 때 복구까지 백그라운드에서 수행하는 것을 목표로 한다. 최종 목적지는 자율 주행 자동차처럼 스스로 동작하는 자율 운영 데이터센터이다. 현재는 완전 자동화 직전 단계로, 문제가 생겼을 때 관리자가 필요한 부분을 다시 가동하는 데 몇 번의 클릭이면 충분하다.