본문 바로가기

CASE STUDY

[넥슨코리아] 클라우드 환경 구축 위해 Hitachi VSP G1000 도입


잘나가는 온라인 게임 기업이 어느 날 갑자기 IT본부 내에 TF를 꾸렸다. IT 자원을 효율적으로 이용하고 확장일로에 있는 비즈니스를 감안한 IT 인프라를 구축하기 위해서다. 20여 년 게임 사업으로 외길을 걸어 업계에서 탄탄한 입지를 구축한 넥슨(Nexon)의 얘기다. 넥슨은 1년 여의 치밀한 준비와 철저한 테스트를 거쳐 서버와 네트워크 장비를 교체하고 효성인포메이션시스템의 스토리지를 도입해 게임 서비스의 안정화라는 성과를 일궜다. 현재는 일부 서비스에 국한된 변화지만 향후 서버 가상화에 이어 클라우드 환경까지 감안해 추진하는 프로젝트의 시작이라는 점에서 주목할 만한 일이다.



넥슨은 1994년 창립한 이후 1996년 세계 최초의 그래픽 온라인 게임 ‘바람의 나라’를 개발하며 국내 게임산업 환경에 혁신을 몰고 온 게임 기업이다. 2002년 캐주얼 게임인 ‘크레이지 아케이드 비엔비’ 런칭 이후‘ 메이플 스토리’,‘ 카트라이더’,‘ 마비노기’ 등 게임 타이틀을 꾸준히 발표해 게임 시장에서 굳건한 입지를 다져왔다. 한국 온라인 게임의 대중화를 이끌어온 넥슨의 자신감은 세계 시장에서도 빛을 발했다. 2000년대 초 일본과 미국, 유럽 등지에 법인을 설립해 글로벌 비즈니스를 전개한 이래 꾸준히 성장해 전 세계 150개 이상 국가에서 약 150종의 다양한 장르의 게임을 서비스 중이다.



게임별로 구축된 인프라를 통합하라

넥슨의 서버 가상화 기반의 인프라 구축 프로젝트가 본격 가동된 것은 지난 2014년 9월. 서버 가상화는 단일 서버를 논리적으로 구분해 복수의 서버처럼 활용하면서 네트워크, CPU, 메모리, 스토리지 등 자원을 할당해 인프라를 최대한 활용하자는 취지다.


요즘은 인터넷에 연결되어 있으면 언제든지 컴퓨팅 리소스와 스토리지 용량을 사용해 중복되는 데이터와 자원을 절감할 수 있는 클라우드 환경까지 고려하는 경우가 많다. 넥슨의 기존 게임 서비스 인프라의 특징은 게임별 특화된 시스템 환경을 구축하고 있다는 것이다.


인터넷과 모바일 환경 그리고 다양한 게임 콘텐츠 별로 차이가 나는 사용자 특성 등을 감안해 인프라를 구축했다. 서비스 질을 높이고, 방학기간이나 특별 이벤트 등의 이슈에 따라 시스템의 대응 능력을 높이기 위해서다.


게임 별로 백업과 DB 클러스터, 미러링 등 시스템을 구현해 장애 발생 시 신속한 복구가 가능하도록 하기 위한 목적도 있다. 서버 가상화에 이어 클라우드 환경까지 고려한 넥슨의 차세대 프로젝트는 이렇게 게임별로 구축된 인프라를 통합해 운영 효율을 높이면서 미래 확장성까지 높이겠다는 것이다. 




서버와 스토리지, 네트워크 등 인프라 전체에 대한 그림을 그리면서 TF가 특히 주목한 장비는 스토리지였다. 한정된 서버 자원을 최대한 효율적으로 활용하면서 서비스 안정화까지 받쳐줄 수 있는 역할은 스토리지의 몫이라는 판단 때문이다. 이에 성능과 용량 증가에 대한 비즈니스 요구에 부합하면서도 시스템 장애가 났을 경우 100% 대응할 수 있는 솔루션을 찾아야 했다.


넥슨코리아 IT 본부 게임인프라실 조주형 팀장은 “수년간 게임 서비스 운영 경험으로 스토리지 성능과 용량의 증설 시기는 언제라도 예측할 수 있는 수준에 올랐다. 문제는 서비스 장애에 완벽하게 대응하기가 어렵다는 점이다. 따라서 비즈니스 변화에 빠르게 대응할 수 있는 확장성과 성능, 가용성 그리고 효율성까지 고려한 스토리지 인프라 구축을 목표로 삼았다.”고 설명했다. 1년 여의 전체 프로젝트 기간 중 스토리지 장비 선정에만 6개월 여 시간을 투입한 이유다. 넥슨이 최종 선정한 솔루션은 효성인포메이션시스템(HIS)이 제안한 Hitachi VSP(Hitachi Virtual Storage Platform) G1000이다. 그리고 실시간 액티브-액티브(Active-Active) 이중화 솔루션인 GAD(Global Active Device)였다.



비즈니스의 연속성 보장하는 GAD의 매력에 ‘풍덩’

넥슨이 가상화 서버 통합 스토리지 시스템으로 HIS가 제안한 G1000을 선택한 이유는 명료했다. VSP G1000은 미션 크리티컬한 비즈니스에 적용할 수 있는 엔터프라이즈 스토리지다. 해외에서는 금융과 통신, 공공 분야 등 대형 사이트에 도입되어 최고의 제품으로 인정받고 있다. 무엇보다 스토리지 기반의 액티브-액티브(Active-Active)환경을 지원해 비즈니스 연속성을 확실하게 보장하는 GAD의 기능은 매력 그 자체였다.


Hitachi 하이엔드 스토리지에서 제공하는 GAD는 서로 다른 2대의 VSP 볼륨이 동시에 GAD라는 가상 스토리지 볼륨으로 복제된다. GAD를 통해 2대의 VSP G1000 스토리지가 한 대의 스토리지의 볼륨처럼 관리되기 때문에 동일한 데이터의 읽기/쓰기가 동시에 가능하다. 스토리지 간 볼륨 이동도 자유롭다. 한대의 스토리지에 장애가 발생할 경우에도 무중단 페일 오버(Fail-Over: 장애 극복 기능) 기능을 지원하기 때문에 서비스를 지속할 수 있다. 여기에 두 대의 스토리지에서 데이터가 분산되어 입출력되므로 응답시간 또한 빠르다. 벤치마크 결과 동종 업계의 유사 제품과 비교했을 때 5배가 빠른 것으로 측정됐다.


G1000은 장애 발생시 시스템 무중단 상태에서 해당 부품의 교체가 가능한 핫스왑(Hot Swap) 기능을 기본적으로 지원한다. 또한 스토리지 이외의 하드웨어를 추가하지 않는다는 점에서 어플라이언스 기반의 타사 제품과도 차별화된다. VM웨어(VMware), 하이퍼-V(Hyper-V), 시트릭스(Citrix) 등 가상화 서버가 요구하는 API를 제공한다는 점도 HIS의 솔루션을 선택하는데 한 몫 했다.


HIS 전담팀에서 제안한 신속한 장애 처리 및 제반 기술지원 시스템도 체계적이었다. 유사한 프로젝트 구축 경험을 100% 활용해 최적의 시스템 구축 방안을 제시한 것이다.



관리자 개입 없이 자동으로 서비스 장애 해결

넥슨은 6개의 주요 PC 온라인 게임 서비스 인프라를 새로 구축하면서 VSP G1000 2대를 연결해 스토리지 이중화 환경을 구축했다. 장애가 발생하더라도 서비스에 영향을 주지 않도록, GAD 솔루션을 활용해 두 대의 스토리지를 하나의 스토리지인 것처럼 구성한 것이다.


GAD 이전에는 액티브-스탠바이(Active-Standby) 개념으로 스토리지에서 장애가 발생할 경우 서비스 유지가 어려웠다. GAD솔루션을 도입함으로써 액티브-액티브(Active-Active) 구성이 가능해지면서 스토리지단에서 장애 대응이 가능하게 되어 안정적인 서비스 운영이 가능해졌다. 관리자가 개입하지 않고 스토리지가 자동으로 장애에 완벽하게 대응할 수 있는 시스템이 갖춰진 것이다. 조주형 팀장은 “3개월 여 시스템을 운영하면서 BMT에서 요구했던 사항들이 제대로 구현되고 있어 만족스럽다. 이번 프로젝트는 효율적이고 완벽한 클라우드 스토리지 인프라를 구축할 수 있는 기반을 마련했다는데 큰 의미가 있다.”고 전했다.


넥슨은 IT 인프라 자원을 보다 효율적으로 활용하는데 그치지 않고 시스템 장애 문제에 완벽하게 대비할 수 있는 환경을 마련했다. 게임을 기반으로 한 다양한 엔터테인먼트 사업을 보다 탄탄하게 받쳐주며 나아가 미래 경쟁력을 확보할 수 있는 ‘일보전진’을 이룬 것이다.




프라이빗 클라우드 스토리지 환경 위한 첫단추를 꿰다

Q. 프라이빗 클라우드 인프라에 대한 사내 반응은 어떤가요?

내부적으로 퍼블릭 클라우드를 많이 사용하고 있어서 클라우드에 대한 인식은 좋은 편이지 만 기존 인프라에 극심한 변화를 준다는 점에는 의구심이 많았습니다. 그렇기에 이번 프라이 빗 클라우드 인프라 구축 프로젝트는 6개 PC 온라인 게임에 한한 것이었지만 중요한 사업이 었습니다. 다행히 회사 설립 후 20여 년 시스템 운영 기술과 노하우, 그리고 안정화된 클라 우드 인프라 덕분에 성공적으로 끝낼 수 있었습니다.
Q. 클라우드 스토리지 환경을 구축하게 된 과정을 말씀해주세요.

2014년 9월 TF 구성 이후 게임 업계에 필요한 스토리지 인프라 환경을 파악하고 프라이빗 클라 우드 환경을 구축한 기업을 벤치마크하면서 넥슨에 적합한 그림을 그릴 수 있었습니다. 5개 업 체의 제품들을 검토한 결과 VSP G1000의 GAD(Global Active Device) 솔루션에 매료된 것이죠.
Q. 스토리지 솔루션을 도입하는데 가장 주안점을 둔 것은 무엇인가요?

스토리지 자체의 성능보다는 서비스 안정화에 더 중점을 두었습니다. 이용자들에게 중단 없 는 게임 서비스를 제공하는 일은 저희 같은 게임 회사에게 중요한 가치이기 때문입니다. 기 존의 인프라를 100% 활용할 수 있는 가상화 기능을 구현하는 것도 중요한 선택 기준이었고 요. 업계의 내로라 하는 솔루션 중에 G1000이 가장 매력적인 성능과 기능을 제공했습니다. 특히 스토리지 컨트롤러에서 완벽한 액티브-액티브(Active-Active) 기능을 제공하는 GAD는 강력했습니다. HIS의 기술력과 지원 시스템도 솔루션을 선택하는 기준이 되었지요.특히 스토 리지 컨트롤러에서 완벽한 액티브-액티브(Active-Active) 기능을 제공하는 GAD는 강력했습 니다. HIS의 기술력과 지원 시스템도 솔루션을 선택하는 기준이 되었지요.