본문 바로가기

CASE STUDY

[하나은행] 차세대 재해복구 시스템

H-Sync 방식 DR 복제로 성능/안정성/TCO 절감 한번에 OK



급변하는 금융 환경과 다양한 고객 니즈를 수용할 수 있는 인프라 구축은 은행권에게 필수적인 요소가 되고 있다. 은행권에서 일어나고 있는 차세대 금융 시스템 구축 열기는 이러한 금융 산업의 선진화, 세계화, 경제 환경 급변이라는 외부 상황을 수용하는 적극적인 움직임으로 풀이할 수 있다.



차세대 DR 시스템의 조건

하나은행은 일반적인 재해뿐 아니라 사고 또는 전산 시스템의 기능상 장애에 대비한 안전장치를 확보해 고객 자산 보호와 지속적 성장 토대를 확보하기 위해 ‘차세대 시스템 업무용 재해복구센터(이하 ‘차세대 재해복구 시스템’)’ 구축에 들어갔다. 하나은행의 경영 원칙 가운데 하나인 고객 우선, 시장 선도 은행을 지원하는 정보 시스템 인프라를 마련해 고객 만족 및 기업 가치를 극대화하는 한편, 금융감독원의 재해복구 지침에 따른 주 업무 시스템 장애 시 3시간 이내에 복구될 수 있는 체계를 마련하는 것을 목표로 차세대 재해복구 시스템을 구축했다. 전체 프로젝트 진행 기간은 7개월로, 2개월 간의 외부 컨설팅을 거쳐 지난 2008년 12월부터 2009년 5월 초까지 5개월 간에 걸쳐 구축됐다.


하나은행은 메인 프레임보다 유닉스 서버 위주로 시스템을 확장하면서 데이터가 지속적으로 늘어나는 현상이 나타나고 있다. 이런 환경 변화를 유연하게 수용하고 갈수록 늘어나는 장비를 최적화해 TCO를 절감하는 것도 차세대 재해복구 센터에서 고려할 점으로 포함됐다. 이에 대해 하나은행 시스템운영부 강석민 차장은 “기존에 재해복구 시스템을 운영하고 있었기 때문에 차세대 재해복구 시스템 구축 여부에 대한 논의는 필요 없었다. 대신 기존 환경보다 한 차원 높은 재해복구 시스템을 구축하는 데 역점을 뒀다.”라고 구축 배경을 소개했다.



은행권 ‘차세대 DR 시스템’의 이정표 제시

하나은행은 차세대 재해복구 시스템 공급 업체 선정을 놓고 다양한 측면에서 검토에 들어갔다. 제품의 기술적인 완성도, 회사 평판, 사후 대처능력, 향후 유지 보수 계획 등 다각적인 측면에서 검토한 결과, 효성인포메이션시스템(HIS)이 공급하는 Hitachi VSP 및 USP V와 H-Sync 방식으로 원격 백업이 가능한 Hitachi Universal Replicator DR 복제 솔루션을 최종 선정했다.


Hitachi Universal Replicator DR 솔루션은 H-Sync 방식의 DR 복제를 하기 때문에 메인센터 시스템의 로드를 최소화할 수 있다. 서비스 부하로 인해 DR 전송이 중단되거나 복제 방식을 변경하지 않아도 되는 장점을 가져온 것이다. 특히 Consistency Group과 Time stamp를 사용해 DR 데이터의 정합성을 보장할 수 있고, DR 회선을 최대(Max) 대역에 맞출 필요가 없기 때문에 회선 비용 절감 효과까지 기대할 수 있게 됐다.


효성인포메이션시스템(HIS)은 하나은행의 기존 ‘재해복구 센터’ 시스템도 공급한 바 있다(2000년에 구축). 실제 운영을 통해 검증받은 Hitachi 재해복구 솔루션의 신뢰성과 HIS의 치밀한 접근, 사후 지원 체제에 대한 믿음은 하나은행의 차세대 재해복구 시스템 공급사 선정에 일조했다. 무엇보다 HIS는 국민은행을 비롯해 씨티은행 등 수많은 은행권의 재해복구 시스템을 성공적으로 구축함으로써 안정성과 신뢰성을 우선하는 이 분야에서 최고의 업체로 인정받고 있다.



늘어난 데이터와 업무 부하, 회선 증설 없이 ‘거뜬’

기존 동기(Sync) 방식에서 H-Sync 방식으로 전환하는 데 있어 ‘재해 상황 시 발생할 수 있는 데이터 손실’에 대해 철저한 분석도 이뤄졌다. Hitachi Universal Replicator는 캐시가 아닌 저널 디스크에 저장하기 때문에 캐시 자원을 여유 있게 사용할 수 있다. 또한 가용한 네트워크 자원 및 성능을 최대한 사용할 수 있으므로 네트워크 대역폭의 사용을 최대화할 수 있다는 장점이 있다.


일례로 네트워크 전송 회선이 부족하게 되면 기존의 비동식 복제 솔루션의 경우 캐시 용량이 Full로 차버려 전송 중단이 발생하게 되지만 Hitachi Universal Replicator의 경우 전송회선에 여유가 생길 때까지 저널에 업데이트 데이터를 보관하다가 여유가 생기면 재전송하기 때문에 네트워크 회선 구축 비용을 절약할 수 있는 장점도 있다. 특히 복제 프로세스 자체를 운영 센터 스토리지가 아닌 백업 센터 스토리지에서 컨트롤하는 이른바, ‘Pulling 방식’의 복제 방식을 사용하기 때문에 운영 스토리지 자체를 본연의 업무에 충실할 수 있도록 성능을 보장한다.


하나은행의 기존 DR 시스템 환경에서는 서비스 I/O가 집중될 때 DR 데이터 전송까지 겹치면 서비스에 영향을 주는 경우가 발생하곤 했다. Hitachi Universal Replicator로 데이터를 전송하는 차세대 DR 시스템 구축 이후 DR 전송으로 인한 부하 발생을 거의 느낄 수 없을 정도가 됐다. 그 효과는 운영하면서 더욱 확연해졌다.



강 차장은 “차세대 DR 시스템 개통 이후 데이터 양과 업무 부하가 두 배 이상 증가하였으나, 추가적인 DR 회선의 증설 없이 기존 회선에서 수용함으로써 회선 비용 절감 효과까지 거둘 수 있게 됐다. 이는 Hitachi Universal Replicator의 DR 복제 아키텍처가 가져온 가시적이고 분명한 효과”라고 말했다. H-Sync 방식의 DR 백업은 TCO를 줄이면서도 효율성을 높이려는 하나은행의 전략과 결과적으로 일치한 것이다.


하나은행은 디스크 기반의 DR 복제 솔루션인 Hitachi Universal Replicator를 도입함으로써 시간과 인력도 크게 절감하게 됐다. DR 회선 장애 시, 저널 디스크에 변경 데이터를 저장했다가 장애가 복구되면 자동으로 DR 스토리지로 전송되기 때문에 별도의 추가 관리가 필요 없어진 것이다. 하나은행은 차세대 재해복구 시스템 구축 이후 지금까지 DR 시스템을 메인 시스템으로 가동할 일은 없었다.


2개월의 컨설팅 기간과 5개월의 구축 기간을 거쳐 개통한 하나은행 차세대 재해복구 시스템에서 눈길을 끄는 부분은 외부 컨설팅 기관에 일임하지 않고 내부 시스템 운영 조직이 적극 참여했다는 점이다. 기존 DR 시스템의 약점을 보완하고 도래할 환경을 수용할 수 있어야 차세대 DR 시스템으로서 의미가 있다고 봤기 때문이다. 기존 DR 시스템 운영 경험을 갖고 있는 내부 인력이 중심이 돼 도입할 차세대 DR 시스템을 다양한 관점에서 측정했다. 그 가운데 하나가 Hitachi Universal Replicator의 복제 옵션에 따른 주변 서비스에 대한 영향 평가였다. 강 차장은 “어떤 기능이든 장단점을 갖고 있기 때문에 고속, 중속, 저속 모드로 지정할 수 있는 Hitachi Universal Replicator의 옵션을 직접 테스트한 후 중속 모드를 최종 선택했다.”라고 말했다.



DR은 선택 아닌 필수

강 차장은 차세대 DR 시스템 구축 경험을 통해 DR 시스템 도입 시 염두에 둬야 할 점 세 가지를 들었다. 첫째, 재해 발생 시 데이터 정합성을 보장하고, 장애 시 데이터 손실률을 감내할 수 있는 수준이어야 한다. 둘째, DR 복제가 기본 서비스 I/O 성능에 영향을 주는지, 운영상 불편한 점은 없는지를 살펴야 한다. 이는 구축 후 운영 담당자들의 최대 쟁점이기도 하다. 셋째, DR 운영 비용을 어떻게 줄일 수 있는가? Hitachi Universal Replicator DR 복제 솔루션은 이 조건을 분명하게 만족하는 솔루션이다.


강 차장은 “새로 구축하는 시스템은 오픈 시스템 위주로 하고 있다”면서 “신규 시스템 구축 시에는 기본적으로 DR 시스템 구축까지 염두에 두고 있다.”라고 말했다. 지난해에 계열사인 하나투자증권과 함께 오픈한 새로운 퇴직 신탁 시스템은 DR 시스템이 동시에 구축된 경우라고 소개했다.