본문 바로가기

IT TREND

현실이 된 빅데이터 비즈니스의 거대물결이 되다


빅데이터는 기업을 똑똑하게 만든다. 고객이 무엇을 원하는지 들여다보고 그 마음을 흔들 수 있다. 자연히 돈을 벌 수 있는 길이 따라온다. 기업들이 빅데이터에 열광하는 이유다. 고객 입장에서도 좋은 점이 적지 않다.‘ 나보다 나를 더 잘 알게 된 기업’이 제공해주는 맞춤형 서비스에 한번 맛을 들리면 헤어 나오기 쉽지 않다. 그 틈새로 ‘빅브라더’에 대한 경계심도 들어선다. 빅데이터의 명(明)과 암(暗)에 관한 논쟁이다.


빅데이터가 지구촌을 뜨겁게 달구고 있다. 기업들은 너도나도 빅데이터를 새로운 비즈니스 모델의 기반으로 만들려 하고 있다‘. 데이터가 기업 재무제표에 표시되는 것도 시간 문제’라는 말도 들린다. 흔히 빅데이터를 단어대로 데이터의 크기로 치부해 버리기도 하지만 이보다는 가치의 크기에 가깝다. 데이터를 통해 새로운 통찰이나 가치를 추출해내는 일이기 때문이다. IBM은 빅데이터의 특징을 규모(volume), 다양성(variety), 속도(velocity)에 정확성(veracity)을 보태 4V로 정의하기도 한다.



10돌 맞은 ‘하둡(Hadoop)’, 빅데이터 시대 이끌다

어찌보면 빅데이터라는 트렌드를 연 데는 하둡(Hadoop)의 기술적인 공이 컸다고 볼 수 있다. 하둡은 비정형 데이터 분산 처리 기술이다. 구글이 자사 서비스 플랫폼을 논문 형태로 공개한 후 2006년 야후(Yahoo)의 더그 커팅(Doug Cutting)이라는 개발자 주도 하에 만들어졌다. 더그 커팅은 검색엔진 ‘루씬(Lucene)’[각주:1]을 처음 개발한 사람이다. 마침 올해는 하둡이 세상에 나온지 꼭 10년째 되는 해다. 하둡이라는 이름은 더그 커팅의 어린 아들이 갖고 놀던 노란색 코끼리 인형에서 유래된 것으로 유명하다. 하둡은 기업들이 데이터를 저장, 처리, 분석하는 방식을 완전히 바꿨다. 하둡이 나오면서 이전에는 감히 엄두를 내지 못했던 대규모 데이터마저 저렴한 비용으로 분석이 가능해졌기 때문이다. 이제 데이터 분석을 비즈니스에 적용하려는 기업은 하둡을 활용한다.



아울러 하둡은 클라우데라, 맵알, 호튼웍스 같은 수많은 스타트업을 만들어 내기도 했다. 대표적인 기업인 클라우데라의 경우 하둡배포판의 70% 이상을 점유하며 시장을 이끌고 커뮤니티를 주도하고 있다. 국내에서는 그루터가 하둡 전문기업으로 이름을 알렸다. 하둡의 아버지 더그 커팅조차 하둡이 이렇게 성공할 줄 몰랐다고 말한다. 하둡은 이제 막 청년기에 접어들고 있다. 앞으로의 10년이 더 기대된다.


한편 더그 커팅은 올 4월 한국을 방문해 국내 고객들을 만날 것으로 알려졌다.



현실화'되고 있는 빅데이터 기업들


이런 배경을 알고 다음은 해외로 눈을 돌려보자. 우리 기업들보다 앞서 빅데이터라는 ‘안경’을 쓰고 고객의 마음을 훔쳐본 기업들이 눈에 들어온다. 가장 많이 알려진 사례 중 한 가지는 최근 한국에 상륙한 넷플릭스(NetFlix)다. 넷플릭스의 강점은 시청자의 시청 습관을 분석해 취향대로 영화나 드라마를 추천해주는 것이다. 전세계 190개국에서 7천만 명이 넷플릭스를 이용한다.


넷플릭스는 시청자가 좋아하는 장르와 배우, 줄거리는 물론 평일과 주말 여부와 시청 시각 등 시청 패턴을 분석해 취향에 맞는 콘텐츠를 찾아준다. 이를 위해 넷플릭스는 800명 이상의 개발자를 두고 있다. 이러한 빅데이터 분석 역량은 에미상 3관상에 빛나는 대표작인 정치 스릴러 ‘하우스 오브 카드’의 성공 배경으로 꼽힌다. 비행기 엔진 제조업체인 영국의 롤스로이스(Rolls-Royce)는 엔진 모니터링 서비스에 빅데이터 기술을 적용한 것으로 알려졌다. 자사 제품에서 얻은 데이터를 분석해 애프터 서비스의 신기원을 마련했다. 전 세계에 흩어진 4천여 개 제트엔진 성능을 꾸준히 모니터링하면서 쌓인 데이터를 기반으로 엔진의 고장을 예측하게 된 것이다. 이 엔진 모니터링 서비스는 현재 민간 항공기 엔진 부문 연 매출의 70%를 차지한다고 한다.



국내는 아직 빅데이터 금맥 제대로 못 캐내

그렇다면 국내는 어떨까. 국내의 경우‘빅데이터 금광’은 넘쳐나지만 활용 정도는 상대적으로 낮다는 평가가 나온다. 기술 수준도 선진 기술과 비교하면 3년 정도 뒤쳐져 있다. 소셜데이팅 서비스 업체 <이음소시어스>, 배달의 민족으로 유명한 <우아한 형제들>, 내비게이션앱 김기사를 운영하는 <록앤올> 정도가 빅데이터를 활용하는 국내 기업으로 손꼽힌다.


이음소시어스는 회원들의 프로필과 성향을 분석해 적절한 데이터 상대를 연결해주고, 우아한 형제들은 인구, 배달업체 수, 주문량 등을 따져 광고주에게 전략적 영업을 진행한다. 록앤올의 경우 이동경로, 차량속도 등 실시간 교통 상황을 빅데이터 분석에 반영한다. 이 정도를 제외하면 사실상 국내 기업의 빅데이터 활용 수준은 아직 걸음마 단계다. 실제로 미래창조과학부의 ‘2015년 빅데이터 시장현황 조사’에 따르면 빅데이터를 활용하는 기업(종업원 100명 이상 기업 기준)은 4.3%로 나타났다. 100곳 가운데 4곳에 불과한 셈이다. 매출 1,000억 원 이상 기업은 9.6%에 그치고 있다. 전체 기업 중 향후 도입 의사를 가진 기업은 30.2%였다.


그러나 성장세는 가파르다. 지난해 빅데이터 시장 규모는 전년보다 30.5% 성장한 2,623억원을 기록했다. 향후 성장 잠재력이 높은 것으로 예상되는 업종은 지금은 부진한 제조업이었다. 정부는 빅데이터 시장 활성화를 위해 지난해 698억 원을 투자한 바 있다. IT 시장조사기관 IDC에 따르면 세계 빅데이터 시장 역시 연평균 23% 성장해 2019년에는 486억 달러(59조 원)로 고속 성장할 전망이다.



더 알고 싶은 기업들 vs 다 보여주기 싫은 개인‘격돌’


빅데이터에 열광하는 이상으로 논쟁 또한 가열 양상을 보인다. 이는 기업이 데이터를 활용하기 쉽지 않은 환경 탓이 크다는 분석이 나온다.


개인정보보호법 등 지나친 규제가 빅데이터를 이용한 사업화에 걸림돌로 작용하고 있다는 지적이다. 국내의 경우 의료정보 등 핵심 데이터 이용은 거의 불가능한 게 현실이다. 통신, 금융 등 데이터 생산 기업들의 보수적인 성격도 한 몫을 하고 있다. 때문에 공공 데이터 개방은 빅데이터 시장의 활성화를 위해 중요한 요소로 떠오르고 있지만 아직 여러모로 부족하다. 상황이 이러다 보니 기업들이 따를 만한 성공사례가 적고 결국 빅데이터 산업이 위축되는 악순환이 반복된다. 빅데이터 활성화를 위해선 먼저 빅데이터 활용에 대한 사회적 합의선을 도출하는 것이 불가피하다.


지금 우리는 빅데이터 활용을 두고 논쟁이 한창이다. 빅데이터가 불러올 수 있는 경제적 달콤함을 보는 측은 기업들이 빅데이터를 쉽게 쓸 수 있도록 해야 한다고 주장한다. 반면 개인정보 침해를 우려하는 측은 섣부른 규제 완화를 경계한다. 개인정보의 자기결정권이라는 헌법상 기본권이 걸려 풀기가 쉽지 않다. 기업은 더 많은 것을 알고 싶어 하지만 개인은 너무 많은 것을 볼까 두려워한다. ‘딸의 임신 사실을 아버지보다 먼저 알고 유아용품 할인쿠폰을 보낸 미국 대형마트의 사례’가 시사하는 바는 결코 작지 않다.


일단 정부는 기업 편에 좀더 가까이 서 있는 듯 보인다. 빅데이터 산업을 국가 차세대 성장동력 중 하나로 삼고 진흥에 적극 나서고 있다. 이를 위해 기업들이 개인정보를 자유롭게 활용 할 수 있는 토대를 만들려 하고 있다. 방송통신위원회는 최근 대통령 업무 보고에서 누구에 대한 정보인지 확인할 수 없도록 비식별화 조치를 한 개인정보는 기업들이 정보주체의 사전 동의 없이 활용할 수 있도록 법적 근거를 만들겠다고 밝혔다. 지난 2014년 ‘빅데이터 개인정보 보호 가이드라인’을 통해 내린 비식별화 조치에 대한 유권해석에서 한 걸음 더 나아간 셈이다. 당시 방통위는 개인정보 수집을 위해선 사전동의를 거쳐야 하는 현행법과 다른 유권 해석으로 개인정보의 자기결정권을 침해한다는 비판을 받았다.


정부는 일단 빅데이터 산업 육성을 위해 ‘사전규제’에서 ‘사후규제’로 방향을 틀었다. 하지만 여전히 비식별화 조치에 대한 신뢰가 낮아 개인정보보호에 대한 우려는 당분간 가라앉지 않을 전망이다. 비식별화를 거친 개인정보라 할지라도 언제든 다른 정보와 결합해 재식별화 될 수 있다는 걱정이 줄지 않고 있기 때문이다. 빅데이터를 더는 유행으로 치부해 버리기 힘들다. 빅데이터를 이용하는 기업이 미래가 아닌 현재에 존재한다. 이제는 빅데이터 활성화를 모색하고 개인정보보호 법제의 새판을 짜기 위해 정부와 기업, 산업계 전문가들이 머리를 맞대야 할 때다. 개인정보 보호와 활용에 대한 치열한 토론이 그 첫걸음이 될 수 있을지 모른다.




  1. 1) 루씬(Lucene): 1999년 개발된 자바 언어로 이루어진 정보 검색 라이브러리로, 독립된 프로그램이 아니라 소프트웨어 라이브러리이기 때문에 사용자가 루씬 라이브 러리를 사용해 검색 서비스와 애플리케이션을 구현해야 한다. [본문으로]