본문 바로가기

IT TREND

클라우드 환경에서의 새로운 스토리지 최적화 방안

최근 한 금융사는 퍼블릭 클라우드에서 운영하던 업무를 온프레미스로 전환한다고 밝혔다. 이를 위해 클라우드에 저장했던 데이터를 온프레미스로 마이그레이션하고 클린징(삭제) 작업도 해야 한다. 해당 금융사 측은 금융감독원의 클라우드 삭제 가이드라인을 준수할 것이라고 밝혔으나 완전한 삭제에 대한 증빙과 함께 관계 당국으로부터의 감사는 불가피할 것으로 보인다.


클라우드 전환의 핵심, 데이터

최근 퍼블릭 클라우드의 인기가 높아지면서 도입을 검토하는 기업들이 많아지고 있다. 반면 위 금융사처럼 퍼블릭 클라우드에서 다시 온프레미스로 전환하거나, 다른 퍼블릭 클라우드로 옮기는 사례도 늘고 있다. 이는 단순한 변심 때문만은 아니다. 금융보안원 관계자가 밝힌 것처럼 ‘클라우드 서비스 프로바이더의 파산, 서비스 제공 중단 또는 품질 저하, 규제 환경의 변화 그리고 기타 사유’ 등 때문이다.

이처럼 기업들은 다양한 애자일 전략에 따라 여러 퍼블릭 클라우드와 온프레미스 자원을 구성해서 사용할 것이다. 그리고 앞에서 밝힌 것처럼 클라우드 서비스 벤더를 변경하거나 온프레미스로 전환하는 사례도 늘어날 것으로 보인다.

이때 가장 문제가 되는 것은 ‘데이터’다.

가상머신, 컨테이너와 같은 컴퓨팅 리소스는 필요에 따라 간단하게 리소스를 늘리거나 줄이면 된다. 사용한 만큼 과금하는 클라우드 환경이라면 비용을 최적화할 수 있다.

하지만 데이터의 경우는 다르다. 가상머신과 컨테이너를 파워오프 하더라도 로그, 데이터베이스 등 데이터를 보존해야 하는 경우가 있다. 대부분의 기업은 고객정보, 거래내용 등의 데이터를 저장하고 이를 백업, 실시간 동기화 방식의 재해복구 솔루션을 적용해 보호할 것이다.

데이터는 이런 특성 때문에 클라우드에 데이터를 보관할 경우, 장기적 보관에 따른 TCO 분석을 해야 한다. 장기 임대비용은 구매 비용보다 일반적으로 비쌀 수밖에 없기 때문이다.

그렇다면 대세가 된 클라우드 전략을 추진하면서 데이터 스토리지 구성을 최적화하는 방법은 무엇일까. 몇 가지 고려해야 할 사항을 알아본다.


데이터 스토리지 최적화 전략 Top 4

01 / 데이터의 중요성 파악

현재 대부분 퍼블릭 클라우드의 서비스 가용성 보장 수준은 생각보다 높지 않다. 기존 기업용 스토리지는 대부분 식스 나인(99.9999%) 이상의 가용성을 보장한다. 하지만 퍼블릭 클라우드 서비스는 일반적으로 99.9~99.95% 정도의 서비스 가용성을 보장한다. 따라서 핵심 데이터베이스 등 중요 데이터는 온프레미스 같은 기존 방식이 유리할 수 있다.

기존 엔터프라이즈 스토리지에는 히타치의 GAD(Global Active Device)와 같은 Active-Active Mirroring 등 시장에서 이미 검증된 실시간 데이터 동기화 기술을 통해 높은 수준의 서비스 가용성을 보장한다.

또한 데이터 절감기술 등 다양한 스토리지 효율화를 지원해 계속 비용을 지불해야 하는 퍼블릭 클라우드 모델보다 TCO 관점에서 비용 절감 효과를 얻을 수 있다. 무엇보다 데이터 소유권이 기업 내부에 있기 때문에 각종 규제와 보안에 대해 신경을 덜 써도 된다. 물론 한시적으로 접속 기록을 저장하는 NoSQL 데이터베이스, 데이터 보호 필요성이 낮은 임시 데이터 등은 퍼블릭 클라우드 서비스를 이용해 저장하는 방안을 고려해볼 수 있다.


02 / 데이터의 생명 주기 고려

오래전부터, 정보 생명 주기(ILM, Information Life-cycle Management)라는 이름으로 대용량 데이터를 효율적으로 저장하는 방법들이 제시되어 왔다. 대표적으로 액세스 빈도가 낮아진 데이터는 테이프와 같은 저가의 저장장치에 저장 및 관리했다. 요즘은 기술의 발전으로 데이터 티어링과 같은 방식으로 비활성 데이터를 온프레미스의 오브젝트 스토리지 혹은 아마존 S3와 같은 퍼블릭 클라우드 오브젝트 스토리지 등으로 자동 이관이 가능하다.

오브젝트 스토리지 기반의 저장장치는 보관 주기를 통해 데이터를 원하는 기간 동안 보관하거나 특정 기간이 지난 후 안전하게 폐기하는 것을 자동화할 수 있다. 예를 들어, 보존 연한이 다해 가는 데이터는 아마존 S3로 보낸 뒤 지정된 기간에 자동 삭제를 수행함으로써 불필요한 데이터 저장으로 인한 추가 비용을 방지할 수 있다. 또한, 데이터 증가에 따라 부족한 온프레미스 스토리지의 저장 공간을 퍼블릭 클라우드 스토리지로 충당함으로써 즉각적인 증설 효과와 함께 일시적인 저장 공간에 대한 도입 시간과 비용을 절감할 수 있다.

HNAS는 DM2C(Data Migrator to Cloud)를 통해 NAS에 저장된 데이터를 투명하게 클라우드 스토리지 또는 오브젝트 스토리지로 이관할 수 있다.

해당 데이터는 NAS에서 언제든지 기존 방식대로 액세스할 수 있다. 대신, 잘 쓰지 않는 파일의 물리적 위치는 클라우드의 저장공간을 사용함으로써 NAS의 용량을 최적화할 수 있다. 특히 퍼블릭 클라우드에 데이터를 암호화하여 저장하기 때문에 해당 클라우드가 해킹을 당하더라도 데이터를 안전하게 보호할 수 있다. 또한, 클라우드에 저장된 데이터는 사용자가 필요할 때 언제든지 온프레미스의 HNAS 저장공간으로 이동할 수 있다. 위에서 언급한 금융사가 이런 방식의 하이브리드 클라우드를 구축했다면, 데이터의 마이그레이션이나 데이터 삭제 등의 작업이 더욱 수월해질 수 있었을 것이다.


NAS와 오브젝트 스토리지, 클라우드 인프라 동시에 구축할 수 있는 ‘DM2C’


03 / 오브젝트 스토리지 활용

소셜 미디어, 모바일 등의 사용은 비정형 데이터의 폭발적인 증가를 가져왔다. 이들 데이터는 빅데이터 분석에 있어 소중한 데이터 자원이다. 그러나 이 데이터를 기존 방식으로 저장하는 것은 확장성뿐만 아니라 데이터 백업 관리 등의 문제를 유발한다. 이를 해결하는 방안이 바로 오브젝트 스토리지의 활용이다.

오브젝트 스토리지는 데이터를 무제한으로 저장할 뿐만 아니라, 오브젝트로 분류되는 파일에 대해 자동 백업, 무결성 보장, 보관 주기, 액세스 관리 등 자체적으로 통합적인 데이터 생명 주기 관리가 가능하다. 산업 표준인 REST API 방식을 통해 네트워크 구성이 되어 있는 환경이라면 거리와 상관없이 액세스가 가능하며, 다양한 애플리케이션에서 간편하게 데이터를 활용할 수 있다. 또한 해시 코드에 의한 데이터 무결성 체크, 파일 이중화 등을 지원해 수백 페타바이트 이상으로 확장되는 환경에서도 백업에 대해 신경 쓰지 않아도 되는 ‘백업 프리’ 환경을 제공한다.

HCP(Hitachi Content Platform)는 전형적인 오브젝트 스토리지로, 위의 기능뿐만 아니라 랜섬웨어를 방지할 수 있는 WORM 기능, 버저닝 기능이 기본으로 내장되어 있다. 수백 페타바이트로 확장이 가능하며 아마존 S3와 같은 퍼블릭 클라우드의 티어링을 통해 저장소로 확장할 수 있다.

다만 오브젝트 스토리지는 빅데이터의 실시간 분석 처리 작업에는 적합하지 않다. 최근 출시된 HCSF(Hitachi Content Software for File)는 AI와 머신러닝 같은 고속의 I/O 처리가 필요한 빅데이터 애플리케이션을 위해 고성능 분산 파일 시스템 서비스를 제공한다. 그리고 오브젝트 스토리지인 HCP를 백앤드에 배치해 핫 데이터는 고성능 NVMe 기반의 분산 파일 서비스 노드에서 처리하고, 콜드 데이터는 비용 효율적이며 대용량 서비스를 제공하는 HCP에 투명하게 저장함으로써 최적의 분석용 저장 환경을 구축할 수 있다.


고성능 분석에 적합한 솔루션 ‘HCSF’


04 / 스토리지 관리 환경의 자동화

기존 IT 환경을 클라우드로 전환하려는 근본적인 이유는 무엇일까? 클라우드의 가장 큰 장점인 민첩함은 자동화에서 나온다. 아마존을 필두로 많은 클라우드 기업은 리소스를 투입하고 회수하는 작업과 이를 모니터링하고 최적화하는 서비스를 제공해 시장을 선도하고 있다. 이런 관리상의 이 점을 가장 빠르게 취할 방법은 퍼블릭 클라우드로 전환하는 것이다.

하지만, 앞서 설명한 것처럼 퍼블릭 클라우드로 IT 환경을 마이그레이션 하는 것만이 능사는 아니다. 기존의 IT 환경을 고도화하고 클라우드에서 운영하는 것과 같은 IT 자동화를 시작해야 한다.

효성인포메이션시스템에서 제공하는 VSP 시리즈는 이런 고민을 해결할 수 있는 자체 자동화 솔루션을 제공한다. 옵스 센터(Ops Center)가 바로 그것이다.


스토리지 운영 자동화를 위한 핵심 관리 솔루션 ‘옵스 센터(Ops Center)’


옵스 센터는 데이터 관리 현대화를 위한 AI 기반의 운영이 가능한 차세대 관리 도구로, VSP 시리즈에 패키지 형식으로 제공되고 있다.

옵스 센터 애널라이저는 스토리지를 사용하고 있는 SAN 네트워크와 가상환경까지 엔드투엔드 모니터링을 기반으로 문제 발생 시 원인을 신속하게 찾아내고 해결방안을 제시한다. 또한 머신러닝 기반의 성능, 용량 트렌드 분석을 통해 시스템의 증설 시기를 예측하는 최적화 기능도 제공한다.

실제로 문제가 발생했거나 추가적인 스토리지에 대한 프로비저닝 작업을 하기 위해서는 액션이 필요하다. 이 모든 것을 간소화된 자동화 템플릿을 통해 제공해 주는 것이 옵스 센터 오토메이터이다. 오토메이터는 히타치 밴타라가 수십 년 동안 축적한 IT 운영 기반의 활용 사례를 반영한, 다양한 자동화 템플릿을 제공함으로써 자동화된 스토리지 프로비저닝 구현이 가능하다.

옵스 센터 API 컨피그레이션 매니저는 스토리지 운영관리에 대한 표준화된 REST 방식의 API를 제공함으로써 외부의 클라우드 플랫폼이 스토리지에 직접 액세스하여 볼륨 프로비저닝을 자동화할 수 있도록 한다. VMware, 오픈스택, 쿠버네티스/오픈시프트 같은 클라우드 플랫폼에 대해 플러그인 및 실행을 제공하고 있으며, 이를 통해 고성능, 고가용성이 검증된 스토리지를 이용해 안정적인 프라이빗 클라우드 환경을 구축할 수 있다.

대세인 클라우드 흐름을 따라간다는 것은 간단한 일이 아니다. 클라우드 서비스의 선두주자인 아마존처럼 IT 인프라를 구축하는 일이 처음부터 가능할 수는 없다. 현재 상당수의 기업이 예전처럼 시스템을 완전히 뜯어 고치는 빅뱅 스타일의 차세대 프로젝트를 추진하기보다는 클라우드 스타일로 점진적으로 시스템을 전환하고 있다. 이 과정에서 데이터 스토리지 전환에 대한 전략 수립은 핵심이라고 해도 과언이 아니다.

데이터 스토리지는 급격히 전환하기에는 상대적으로 리스크가 많을 수밖에 없는 IT 구성 요소이다. 검증된 방식으로 천천히 나아가되 새로운 환경에 대해 신중한 테스트와 적용을 해나간다면, 기업의 클라우드 구축 과제를 성공적으로 달성할 수 있을 것이다.