본문 바로가기

TECH ZOOM

데이터 보호, HCP가 책임진다



페타바이트 데이터를 백업하는 데는 2주 정도가, 복구에는 그 이상의 시간이 소요된다. 시간이 그리 중요하지 않다고 생각할 수도 있지만 관련 비용은 상상을 초월한다. Hitachi Data Systems(HDS)가 조사한 바에 따르면 기업의 스토리지 데이터 보호에 소요되는 비용은 기본 스토리지 비용의 약 2배, 원격 사무실의 경우는 약 3배에 달한다. 데이터 보호 비용은 백업 미디어, 백업 서버, 라이브러리, 소프트웨어 라이선스, 운영비, 관리비, 유지비 등을 모두 포함한 것이다.


데이터 보호를 위한 다양한 기술

데이터 보호에 필수적으로 요구되는 모든 요소를 제공하는 HCP(Hitachi Content Platform)는 정교한 데이터 보호 기술을 이용해 테이프 복제본 없이도 콘텐츠를 보호하는 진정한 백업 프리(Backup-free) 플랫폼이다. 다른 플랫폼과는 비교가 되지 않는, 차별화된 데이터 보호 체계가 오브젝트 스토어에 내장돼 있다. HCP는 최대 80개의 연계 노드, 80 페타바이트 용량까지 확대될 수 있으며, 다음과 같은 다양한 기술을 통해 기업의 데이터를 보호한다.



최대 4개까지 제공되는 데이터 복제본

HCP는 설정 가능한 여러 개의 로컬 오브젝트 복제본을 제공함으로써 데이터 손실에 대한 우려를 불식시킨다. 다이내믹한 DPL(Data Protection Levels)이 원본 데이터 오브젝트에 대해 최대 4개까지 복제본을 제공하므로 높은 수준의 신뢰성이 보장된다. 아주 민감하거나 중요한 데이터를 보유한 기업이라면 이러한 데이터 이중화는 없어서는 안될 핵심 요소다. 소프트웨어 미러링은 서로 다른 노드의 다양한 위치에서 각각의 오브젝트용 데이터를 저장하는 데 사용된다. 해당 노드는 보호 세트로 그룹화 되므로 오브젝트용 데이터의 모든 복제본이 단일 세트 내의 노드 전반에 걸쳐 저장된다. 이러한 수준의 보호 서비스로 필수적인 데이터 이중화가 자동 실행된다. 복제본의 유지는 오류시점이 동시에 발생하는 것을 방지해준다. 디폴트(Default)는 2개의 복제본을 제공하며, 스토리지 관리자는 복제본을 통해 DPL에 적합하도록 HCP 설정을 구성할 수 있다.



메타데이터 보호

HCP는 중요한 메타데이터를 보호하기 위해서도 이중화 장치를 사용한다. 메타데이터는 HCP에 저장된 데이터의 전반적인 가치 측면에서 매우 중요하다. 올바른 오브젝트 정책 할당과 구축을 위한 필수 요소이며, 엄청난 양의 비정형 데이터 저장을 관리한다. HCP는 데이터의 완벽한 통합 검색을 가능하게 해주는 업계 유일의 통합 메타데이터 쿼리 엔진을 제공한다. MDPL(MetaData Protection Level)은 지속적으로 유지해야 하는 수많은 HCP용 메타데이터 복제본을 명시한 전체 시스템 설정을 말한다. DPL을 통해 MDPL용 디폴트는 2개의 복제본이 된다. 메타데이터 2차 복제본은 각각의 오브젝트 데이터 복제본으로 생성, 저장되지만 관리는 독립적으로 이뤄진다. 메타데이터 원본이 소실되거나 손상이 발생하면 2차 복제본을 이용해 복원할 수 있다.



백업 프리 파일 동기화와 공유

HCP는 모바일 사용자를 위해 파일 동기화와 공유를 제공하는 HCP Anywhere용 핵심 저장소의 역할을 한다. HCP Anywhere를 통해 데이터는 방화벽 뒤에서 안전하게 보호된다. 물론 이때도 모바일 기기와 브라우저에서 승인받은 사용자는 데이터에 액세스할 수 있다. 기기 분실 또는 오류가 발생하더라도 해당 사용자가 자신의 파일을 모든 종류의 웹브라우저에서 이용할 수 있으며, 새로 구입한 기기에서도 간단히 복구된다.



백업 프리 원격 오피스

HDI(Hitachi Data Ingester)는 원격 서버 또는 가상 머신에서 운영되는 소프트웨어로 원격 사용자 또는 애플리케이션 측면에서 본다면 파일러(Filer)와 유사하다. HDI에 파일이 작성될 때 이 파일은 데이터센터의 HCP에 RESTful 인터페이스로 복제되므로 별도로 백업할 필요가 없다. HDI 서버 또는 원격 사이트가 어떤 원인으로 사용할 수 없는 상태라면 새로운 서버가 설치돼 네트워크에 연결되고, HCP Anywhere가 원격 설치돼 HDI 소프트웨어를 새롭게 구성할 수 있다. 연계가 이뤄지면 새롭게 구성된 HDI가 시스템 중단 이전에 HCP에 복제된 파일에 액세스하며, HCP에 복제된 새 파일을 생성하는 것으로 즉시 가동을 시작한다.



글로벌 분산 클라우드 서비스

REST, 아마존 S3, 오픈스택 스위프트(Openstack Swift)가 포함된 HCP 개방형 인터페이스로 재해복구 비용을 대폭 절감할 수 있으며, 글로벌 분산 클라우드 서비스로 기존의 재해복구 사이트를 대체할 수 있다. HCP는 데이터를 암호화하므로 클라우드 내 데이터의 개인정보보호 요구사항 침해 여부에 대해 걱정할 필요 없이 서로 다른 디바이스로 이동할 수 있다.



복구에 대한 새로운 접근 방법

HCP 사용자가 설정 가능한 메타데이터는 시스템이 재시동 되더라도 모든 데이터를 백업 테이프에 복구할 필요가 없다. 대신 더 빠르고 정확한 콘텐츠 액세스를 가능하게 해주며, 데이터의 효과적이고 지능적인 처리가 가능하도록 의미 있는 정보를 제공한다. HCP는 엄격한 RPO(Recovery Point Objectives), RTO(Recovery Time Objectives), SLA(Service Level Agreements)를 지원하기 위한 기술을 완벽히 보유하고 있다.



콘텐츠 입증

데이터 무결성은 명칭 또는 ID로 검색된 데이터가 같은 명칭이나 ID로 저장된 데이터와 완벽하게 동일하다는 사실을 입증하는 것을 의미한다. 수년 이상 저장된 데이터라면 콘텐츠 입증이 반드시 필요하다. 입증은 일반적으로 암호 해시 알고리즘을 사용하는 데이터를 해시하는 방식으로 진행된다. HCP는 지속적인 데이터 무결성 체크와 최우선적인 데이터 복구를 수행한다. 각각의 데이터 오브젝트는 ID 또는 해시 알고리즘이 해당 데이터를 다른 복제본과 비교하기 위해 사용하는 디지털 지문을 갖고 있다. 불일치 또는 무결성 위반 사례가 발견되면 HCP가 원본 데이터 오브젝트의 완전 복원을 위해 자동으로 오브젝트 복구를 진행한다.



오브젝트 버전 이력 보호

데이터 보호의 가장 중요한 미션은 데이터 보존 기간이 만료되기 전에 해당 데이터가 삭제되거나 의도치 않게 변경되는 것을 방지하는 것이다. 데이터 오브젝트 버전이 생성되면 이 미션의 수행과 데이터가 위·변조되지 않도록 할 수 있다. 오브젝트 시스템에 저장된 대부분의 데이터는 기본적으로 ‘WORM(Write Once, Read Many)’ 상태다. 오브젝트 고유의 식별자, 즉 디지털 지문이 이러한 데이터에 대한 불변성(Immutability)을 보장해준다. HCP는 오브젝트 수정이 가능하도록 원본에서 새로운 다른 오브젝트를 생성하는 것을 허용하며, 다른 오브젝트가 생성되면 원본 데이터는 삭제 가능한 상태가 되거나 버전 이력으로 남겨놓을 수 있다. 버전 이력 기능은 파일의 과거 버전을 손쉽게 복구하고, 최종 사용자에 의한 셀프 서비스 방식의 속성을 갖는 백업 프리 HCP에 매우 중요한 요소다. HCP는 현 시점에서 백업된 대부분의 데이터인 파일, 오브젝트 및 아카이브 데이터에 대해 백업 프리 보호를 제공한다. 이때 고성능 블록 기반 시스템은 활성 데이터에 대한 백업 및 재해복구 솔루션을 여전히 필요로한다. 그러나 이들 시스템 내 비활성 데이터는 백업에 소요되는 비용과 시간을 줄이기 위해 HCP에 보관돼야 한다. 많은 기업들이 HCP를 통해 백업과 재해복구를 수행하면서 얼마나 많은 비용을 절감하고 SLA가 향상될 수 있는지 경험해보기를 적극 추천한다.