본문 바로가기

IT TREND

소중한 기술 자산 '데이터' 제대로 관리해야 하는 이유


데이터 분석의 가치를 설명할 때 ‘커다란 단지에 가득 찬 금덩이’라는 표현이 사용되곤 하는데, 여기에는 여러 허점이 존재한다.


먼저 데이터베이스 관점에서다. 데이터는 하나의 필드이자 열이나 행이고 서로 연관성을 갖지 않는다. 수집 그 자체 이상의 의미나 가치를 보유하고 있지 않으며 어떤 맥락도 제공하지 않기 때문에, 그 자체로는 어떤 문제도 해결할 수 없다.


비정형 데이터 관점에서의 데이터는 바이트 단위의 바이너리(Binary) 정보에 불과하기 때문에 아무런 가치를 제공하지 않는다. 전체 데이터에 포함된 1비트를 알고 있다고 해서 전체 그림에 영향을 미칠 수는 없다. 정보의 흐름 속에서 발견되는 특정 시점의 데이터는 사용과 동시에 오래된 데이터가 된다.


여기서 ‘개별적인 데이터 요소들이 가지고 있는 가치는 크지 않다.’는 것을 알아둘 필요가 있다. EIM(Enterprise Information Management; 기업 정보 관리) 프로그램을 운영하고 소중한 기술 자산인 데이터를 관리하는 CDO(Chief Data Officer; 최고 데이터 책임자)를 두어야 하는 이유다.



분석의 가치




EIM, 데이터 중심적인 요소에서 비즈니스 가치 창출

기업 정보 관리(EIM)는 정보 자산의 구성 및 기술, 거버넌스를 모두 통합할 수 있는 접근법이다. 기업 정보 관리의 목적은 조직 내부의 효율성과 투명성(Transparency)을 개선하고 통찰을 확보할 수 있도록 하는 것이다. 이러한 프로그램에는 데이터의 보관, 보호, 아키텍트, 리스크 관리, 컴플라이언스, 품질 관리, 분류 등의 기능이 포함되며, 최적의 EIM은 정보에 담긴 가치와 통찰을 어떻게 끌어낼 것인지에 중점을 두고 설계되어 내부적인 효용성은 물론 성장을 위한 목표 달성을 지원해야 한다.


기업 정보 관리 프로그램은 오랫동안 방치되었던 데이터 혹은 특정 영역의 데이터에서 가치를 발견하는 것에는 적합하지 않다. 대신 정적인 패턴을 연구하거나, 변화하고 이동하는 정보 혹은 이들 간의 상관관계, 수학적이고 논리적인 모델에 대한 이론적인 응용 등에 집중해 데이터 중심적인 요소에서 비즈니스 가치를 창출해낸다. 과학에 보다 가까운 것이다. 즉 막연하게 금덩이를 찾는 것보다는 금으로 된 귀금속을 가지고 경제적인 이득을 취하는 과정으로 이해해야 한다.



데이터 큐레이션을 위한 몇 가지 준비

퍼즐 더미를 상상해 보자. 각각의 조각이 하나의 데이터 포인트이며, 이 조각들은 다양한 소스를 통해 수집된 것이라고 가정했을 때, 이 데이터의 가치를 확보하기 위해 데이터 큐레이션을 위한 몇 가지 준비 과정을 거쳐야 한다.


먼저 추출이다. 집 안의 모든 퍼즐 조각에 대해 이해해야 한다. 침대 밑, 진공 청소기 안, 반려동물의 밥그릇 안 등 곳곳에 있는 조각들, 즉 외부와 내부 혹은 정형과 비정형 등 다양한 소스의 정보를 이해하고 분류해야 한다. 다음으로는 모든 사람들을 동원해서 퍼즐 조각을 한 곳에 모아야 한다. 배치 파일과 실시간 통합 및 ETL 등 모든 소스의 데이터를 통합해야 한다. 각각의 조각에 붙은 먼지를 떼어내, 그림 뒷면에 풀을 붙이고, 끝을 다듬어 두고, 조각 숫자를 확인한다. 데이터의 매칭 및 검증, 적절한 메타데이터의 추가 등이 바로 이러한 작업이다. 이를 데이터 강화 혹은 정제 과정이라고 한다.


이러한 과정을 통해 날것의 데이터는 비로소 콘텐츠가 되며, 설명할 수 없는 필드가 설명할 수 있는 오브젝트로 재탄생하게 된다. 단순히 쌓아놓는 것이 아니라 ‘박스’ 안에 정리해두는 것이다.


여기서 ‘박스’는 콘텐츠 플랫폼으로, 이는 (기업의 경우) 모든 데이터를 보관해두는 오브젝트 스토리지와 데이터 각각의 소스로부터의 추출을 위한 데이터 모빌리티, 다양한 배치 모델 활용을 위한 클라우드 게이트웨이를 한군데로 통합한 형태가 된다. 그리고 메타데이터 태그 추가 및 상세 검색 기능을 통해 완벽하게 통합되어, 심플하며 스마트한 데이터 인텔리전스 솔루션이 완성된다.


새롭게 강화된 데이터셋(=퍼즐조각)을 컨텐츠 플랫폼(=퍼즐박스)에 보관함으로써 가치 창출을 위한 기업 정보 관리(=퍼즐 완성)를 구현할 수 있다.


콘텐츠 플랫폼의 중요성에 대한 근거는 셀 수 없이 많다. Hitachi Content Platform(HCP)은 솔루션 에코시스템을 완벽하게 통합하고 고객들이 최적의 비즈니스 가치를 확보할 수 있도록 기반을 제공한다. 데이터는 이제 전 산업군의 모든 기업들에게 생명과도 같은 존재가 되었다. 임직원에 대한 데이터, 고객 정보, 내부 커뮤니케이션, 지적 재산, 머신 데이터, 연구 자료 등 모든 종류의 데이터에 대한 제어, 가시성, 거버넌스, 협업, 접근성, 분석에 모든 역량을 집중해야 할 때이다.