본문 바로가기

IT TREND

딥러닝 • 클라우드 • 빅데이터 기술 진화로 상용화 눈 앞에


2016년 범죄가 폭주하는 도시 요하네스버그. 도시 치안을 위한 경찰로봇 스카우트 22호는 폐기처분의 위기에서 스스로 사고하고 행동하는 인공지능 로봇 ‘채피(Chappie)’로 다시 태어난다. 탄생과 동시에 갱스터의 손에 납치된 채피는 건들건들 걷는 갱스터의 걸음걸이, 거친 비속어 등 갓난아이처럼 그들의 모든 것을 학습하며 인간과 자신을 동일시하게 된다. 닐 블룸캠프 감독의 세 번째 SF영화 ‘채피’. 인간보다 더 인간적으로 묘사된 채피가 다소 비현실적으로 느껴지기도 하지만, 채피보다 낮은 단계의 스스로 학습하고 판단하는 인공지능은 이미 현실이 되고 있다.


인공지능과 사랑에 빠진 영화 ‘그녀(her)’, 인간보다 매혹적인 인공지능 로봇을 그린 ‘엑스마키나(Ex Machina)’ 그리고 채피까지. 최근 인공지능을 소재로 한 영화가 범람하고 있다. 노벨상을 수상한 물리학자 스티븐 호킹, 마이크로소프트 창업가 빌 게이츠 등이 잇따라 인공지능에 대해 우려를 표하며 화제가 돼서일까? 인간의 지적, 감성 영역에 대한 도전인 인공지능이 최근 화제다.

인공지능(Artificial intelligence)은 영국의 수학자 ‘앨런 튜링’이 고안한 생각하는 기계 ‘튜링 기계’, 튜닝 테스트로부터 시작된 컴퓨팅 공학의 한 분야다. 인공지능은 컴퓨터로 하여금 인간과 같이 사고하게 만든 체계로 인간 고유의 사고, 학습, 자연어 처리, 지각 능력 등의 지식활동을 하는 컴퓨터 시스템이나 프로그램을 말한다. 인공지능은 두 번의 붐과 정체기를 맞았다가 최근 인간의 뇌 구조를 모방한 인지 학습 기술인 딥러닝(Deep Learning), 비약적으로 향상된 컴퓨팅 파워, 데이터 분석기술에 힘입어 세 번째 전성기를 맞았다. 시장조사기관 IDC는 전 세계 인공지능 시장을 2017년 1,650억 달러 규모로 전망한다. 컨설팅 기업 맥킨지(McKensey)는 2025년 인공지능을 통한 지식노동의 자동화 효과를 연간 5조 2,000억 달러로 내다봤다.


인공지능 어디까지 왔나

인간보다 더 윤리적이고 인간다운 영화 속 인공지능 로봇 ‘채피’는 인간이 만들어낸 공상일 뿐일까? 채피 수준은 아니지만 사람의 감정을 인식하는 인공지능 로봇이 올 여름 상용화를 앞두고 있다. 소프트뱅크그룹의 감정인식 로봇 페퍼(Pepper)가 그 주인공이다. 손정의 소프트뱅크 회장은 “인간에 의해 프로그래밍됐지만 인간의 감정과 행동을 이해하고 스스로 진화하는 혁명적인 로봇”이라고 페퍼를 소개한 바 있다. 페퍼는 키 120cm, 무게 28kg의 휴머노이드 로봇으로, 사람의 언어뿐 아니라 표정, 목소리 톤으로 사람의 감정을 읽고 스스로 학습한다. 영화 속 채피처럼 가족의 구성원으로서 행동 양식을 스스로 만든다. 정교한 감정 인식과 학습을 위해 습득된 정보는 클라우드에서 보관 및 분석된다. 소프트뱅크 측의 설명에 따르면 페퍼는 베이비시터부터 가게 점원 등 사회 전반에 활용 가능하다고 한다.


<그림 1> 인공지능 로봇 ‘채피’



로봇 만이 인공지능의 활용 영역은 아니다. 자율주행 자동차, 이미지 검색, 음성인식, 영상인식 등 일상 곳곳으로 딥러닝이 파고들고 있다. 딥러닝 분야의 권위자 앤드류 응 스탠포드대학교 교수와 구글은 1만6,000개 의 프로세서와 10억 개 이상의 인공신경망(Neural network)과 심층신경망(Deep neural networks)을 이용해 유튜브상의 1,000만 개의 비디오 중 고양이가 있는 영상을 찾아냈다. ‘어려운 일은 쉽고, 쉬운 일은 어렵다’는 모라벡의 역설(Moravec’s Paradox)이 말하듯 컴퓨터에게는 사람이 하기 어려운 천문학적인 단위의 수를 계산하는 일은 쉬운 반면, 사람이 인식하고 느끼는 지각과 사고의 영역은 매우 어렵다. 유튜브상의 고양이를 찾아낸 게 그러한데, 분류를 통한 예측, 딥러닝은 이를 가능케 하고 있다.



<그림 2> 감정인식 로봇 ‘페퍼’



딥러닝은 인공지능의 한 분야이자 최근의 인공지능 혁신을 가져온 주역으로, 인간의 뇌를 모방한 인공신경망에 뿌리를 두고 있다. 딥러닝은 사람의 뇌가 사물을 인지하는 체계를 모방해 컴퓨터가 객체를 분별하도록 학습시킨다. 딥러닝은 인공신경망의 한계를 보완한 심층신경망 기반으로, 사람의 개입없이 스스로 데이터를 파악하고 학습하는 자율 학습(Unsupervised learning)으로까지 발전 추세다.

딥러닝은 머신러닝의 한 부류지만 인공신경망처럼 다중 구조다. ‘딥(Deep)’이란 뜻처럼 입력층과 출력층 사이에 ‘은닉 신경망’을 가지고 있다. 각 노드는 입력값을 계층적 구성으로 표현할 수 있다. 이때 점진적으로 모여진 하위 노드의 특징을 규합한다. 심층신경망을 통해 고수준의 특징을 찾아내 최종 의사결정을 한다. 수많은 노드가 계층적으로 연결된 만큼 딥러닝은 병렬적인 처리에 가깝다. 또 학습된 결과를 바탕으로 의사결정을 하기 때문에 데이터의 신뢰성과 양이 정확도를 좌우한다.


기계에게 학습시킬 데이터, 어디에 저장할 것인가

앤드류 응 스탠퍼드대학교 교수는 한 컨퍼런스에서 “전통적인 알고리즘은 데이터 규모가 클수록 처리 속도가 느려지는 반면, 딥러닝 알고리즘은 데이터 양이 많을수록 더 좋은 결과를 낸다”고 밝힌 바 있다. 컴퓨팅 파워 못지 않게 대량의 데이터, 즉 빅데이터를 담고 처리할 수 있는 능력이 필요한 것이다. 이에 최근 딥러닝에서 분산파일시스템인 ‘하둡 생태계’ 가 부각되고 있다.

인간의 뇌 속에는 약 1,000억 개의 신경세포가 있고, 이 신경세포는 또다시 100조 개의 시냅스로 복잡하게 연결돼 있다. 사람의 뇌에 담을 수 있는 정보의 양은 2.5페타바이트(PB)에 달한다. 인간의 뇌를 모방한, 인간의 사고와 감정을 모방하는 딥러닝과 같은 인공지능도 이러한 방대한 양의 데이터를 담고 처리할 수 있어야 한다. 영화 속 채피 수준의 인공지능이 가능하려면 데이터를 담는 데 그치지 않고 실시간 처리까지 가능해야 한다. 방대한 데이터를 비용 효율적으로 담기 위해서 도, 실시간 처리를 위해서라도 딥러닝의 스토리지는 병렬화돼야 한다. 이에 따라 최근 딥러닝에 하둡을 접목한 연구가 한창이다. 대표적인 사례는 온라인결제서비스의 대표주자 페이팔(Paypal)이다. 페이팔은 결제 사기를 막기 위한 딥러닝 연구에 하둡 2.0을 활용했다. 태생적으로 반복되는 특성을 가진 딥러닝은 맵리듀스의 패러다임과 맞지 않다. 그러나 리소스 관리에 기반한 하둡 2.0 덕에 하둡 클러스터의 대규모 데이터셋에 딥러닝 알고리즘을 적용할 수 있었다고 한다. 인메모리 기반의 하둡의 하나인 스파크(Spark)도 Machine Learning Library(MLlib)라는 라이브러리를 통해 딥러닝을 지원하고 있다.

Hitachi Data Systems(HDS)의 Hitachi HSP(Hyper Scale-Out Platform)로 구축하면 하둡 도입에 따른 리스크를 최소화하며 딥러닝에 하둡을 접목할 수 있다. 지난 4월 Hitachi connect 2015에서 소개된 HSP는 하둡에 최적화된 하이퍼 컨버지드 스케일 아웃 플랫폼으로 서버, 스토리지, 서버 가상화 기능이 하나의 어플라이언스로 통합해 비용 효율적인 컴퓨팅 성능과 용량을 동시에 제공한다. KVM(Kernel-based virtual machine) 환경 기반으로 어떤 애플리케이션도 실행할 수 있을 뿐만 아니라, 스케일 아웃도 자유롭다. 분석관련 전문지식이나 하둡/분석 전용의 분리된 인프라를 둘 필요가 없다는 점에서 구글, 야후, 페이스북과 같은 기존의 웹스케일 기업에서 구축되던 분석플랫폼과 차별화되며, 데이터분석을 통해 비즈니스 인사이트를 얻고자하는 기업에 탁월한 선택이 될 것이다. 국내에는 올해 말 출시 예정이다.

딥러닝은 우리의 일상을 ‘스마트’하게 바꾸고 있다. 구글, 네이버, 다음 등의 음성인식 서비스는 물론 검색엔진, 페이스북에 사진을 올리면 얼굴을 인식해 친구를 태그할 수 있는 기능의 뒤에도 딥러닝이 있다. 딥러닝은 GPGPU와 같은 병렬 프로세싱 기술, 클라우드 컴퓨팅 파워, 그리고 분산 스토리지 기술을 만나 기술적 혁신을 계속하고 있다. 영화 채피와 같은 인공지능 로봇이 우리의 삶에 파고드는 날은 먼 미래의 일이 아니다. 소프트뱅크의 인공지능 로봇인 페퍼가 이미 상용화되지 않았는가.