본문 바로가기

pentaho

Pentaho 딥러닝, 어디까지 가능할까! Hitachi Vantara Labs이 지난 3월 펜타호 마켓 플레이스(Pentaho Market Place)에 추가한 Plugin Machine Intelligence(이하 PMI) 플러그인을 현재 사용하고 있다면, 이번에 발표되는 업데이트에 기대를 해볼만 하다. 히타치 밴타라는 PDI(Pentaho Data Integration)용 플러그인인 기존의 PMI를 업데이트한 PMI 버전 1.4를 발표할 예정이다. PMI는 전통적인 머신러닝과 파이썬(Python) 사이킷러닝(Scikit-Learning), R, 스파크, WEKA 등 4개의 머신러닝 라이브러리의 모델 구축, 사용, 관리에 중점을 두고 있다. 굳이 ‘전통적인 머신러닝’이라는 명칭을 사용하는 이유는, 지금까지 사례로 볼 때 정형 데이터에서는 전통.. 더보기
비즈니스 성공 가도를 달리는 데이터 분석의 기술_Part 02 PART 02 빅데이터 분석 지형을 바꾸다 원스톱 플랫폼 ‘펜타호’가 남다른 까닭 SNS, 인터넷, 이메일 등 정형 데이터뿐만 아니라 비정형을 포함한 새로운 구조의 데이터를 처리하는 빅데이터 분석 플랫폼에 대한 요구 조건이 까다로워지고 있다. 단절되거나 산재되어 있는 여러 시스템에서 진행되는 작업으로는 빅데이터를 통해 효율적으로 비지니스 가치를 창출하기 어렵다는 판단에서다. 빅데이터에서 가치를 이끌어낼 수 있는, 제대로 된 빅데이터 분석 플랫폼 ‘펜타호(Pentaho)’를 알아보자. 시장조사업체 IDC에 따르면, 전 세계 데이터 규모는 2025년에 163 제타바이트(Zetabytes)에 이를 것이라고 한다. 2016년 데이터 발생량을 기준으로 10배에 달하는 예상치다. 또한 이 데이터 중 4분의 1 이상.. 더보기
비즈니스 성공 가도를 달리는 데이터 분석의 기술_Part 01 고객들은 분석 기능으로부터 많은 이점을 이끌어낼 수 있다. 리포팅, 분석, 대시보드, 시각화 툴은 사용 만족도를 높이고, 시장 경쟁력을 제공하며, 비즈니스 성장을 가속화할 수 있다. 그러나 고객이 이러한 성과를 얻게 하기 위해서는 리소스 투자, 프로젝트 시점, 리스크 관리, 사용자 니즈에 대한 세밀하고 꼼꼼한 접근 방식과 적절한 검토가 필요하다. 현재 필요한 분석 기능을 자체 개발할 것인가, 아니면 전문 벤더의 솔루션을 구매할 것인가. 각각의 장단점을 들여다 보고, 히타치 밴타라의 빅데이터 분석 플랫폼인 ‘펜타호(Pentaho)’를 살펴본다. PART 01 구매 vs 자체 개발 비즈니스 데이터 분석 위한 최선의 방법은? ‘구매 vs 자체 개발’은 소프트웨어 영역에서 아주 오래된 딜레마다. 대규모 엔지니어.. 더보기
머신러닝의 프레임을 그리다 지난 3월, 히타치 밴타라 연구소(Hitachi Vantara Labs)는 머신러닝 모델 매니지먼트(Machine Learning Model Management, 이하 MLMM)를 발표했다. 이는 머신러닝 오케스트레이션을 통해 데이터 사이언티스트가 지도 모델(Supervised Model)을 모니터링, 테스트, 재교육 및 재배포할 수 있도록 해주는 툴로, 빌트인 형태로 펜타호의 데이터 파이프라인에 활용할 수 있어 끊임없이 변화하는 환경에 대응해 모델 업데이트를 간편히 수행할 수 있다. 비즈니스 성과는 향상시키면서 리스크는 줄일 수 있게 된 것이다. 뿐만 아니라 향상된 투명성으로 알고리즘에 대한 통찰력과 신뢰도도 높일 수 있다. 머신러닝은 별도의 프로그래밍 없이 샘플을 입력하는 것만으로 모델을 구축함으로써.. 더보기
빅데이터의 바다, 인공지능을 품다 2016년 3월 구글 딥마인드(DeepMind)가 만든 알파고(AlphaGo)가 세계적인 바둑기사 이세돌을 4승1패로 이긴 이후, 우리나라뿐만 아니라 전세계적으로 인공지능(AI, Artificial Intelligence)에 대한 관심이 증폭되었다. 사실 ‘인공지능’이라는 개념은 1956년 소수의 수학자와 과학자들이 모인 다트머스 회의에서 처음으로 탄생했지만, 여러 가지 이유로 인해 관심 밖으로 밀려나 등한시되었다. 1997년 IBM의 인공지능 딥블루(Deep Blue)가 세계 체스 챔피언을 이기는 사건이 발생했고, 이후 컴퓨팅 기술의 발전, 하드웨어의 고사양화와 함께 빅데이터 시대를 맞이하면서 인공지능은 급속도로 진화하게 된다. 1990년대 중반까지 인공지능이 선험적인 경험과 지식을 활용하는 형태였다면.. 더보기
산업계를 흔들어 놓은 AI, 근거 없는 믿음 vs 현실 물리학자 스티븐 호킹은 AI(Artificial Intelligence, 인공지능)의 개발이 “최선이거나 아니면 인류에게 결코 발생해서는 안될 최악의 상황을 초래할 것” 이라고 경고했다. 하지만 필자는 ‘AI가 진정한 승자가 될 것’ 이라는 낙관적인 입장이다. 특히 금융서비스 등 실질적으로 세계 경제를 주도하는 산업 분야에서는 더더욱 그렇다. AI는 획기적인 사건이다. 전문가들은 2030년까지 AI가 15조 7천억 달러 혹은 현재의 중국과 인도의 경제 규모를 합한 것 이상으로 세계 경제에 기여할 것으로 전망한다. 맥킨지(Mcki nsey)에 따르면 거대 IT 기업들은 이미 AI 기술개발에 200~300억 달러를 투자하고 있는 것으로 나타났다. IBM의 ‘왓슨’, 구글의 ‘딥마인드’, 히타치의 ‘H’ 등이.. 더보기
HIStory | 세상의 변화 흐름 속에서 앞장 설 DATA사업팀 세계적으로 스마트시티 구축에 한창 열을 올리면서, 그 기반이 되는 Public Safety 솔루션이 주목 받고 있다. 여기에 Public Safety의 선두주자가 되고자 총력을 기울이는 한 조직이 있다. 지난 7월 1일, 새롭게 탄생한 효성인포메이션시스템(HIS) DATA사업팀이다. 구성된 지 두 달 남짓 된 팀이지만, 그동안 HIS가 걸어온 길 위에 새로운 가지를 내기 위해 9명의 팀원은 모두 기대와 희망에 가득 차 있다. 아이디어와 열정은 신입사원의 자세로, 비즈니스를 추진함에 있어서는 노련한 전문가의 자세로 다가가는 DATA사업팀의 역량은 어디에서 나오는 것일까. 스마트시티의 근간, 우리가 책임진다DATA사업팀은 명칭만 새로울 뿐 신규 조직은 아니다. 기존의 영상보안 비즈니스 인력과 펜타호 기반의 .. 더보기
Pentaho IoT Analytics 데모 영상 IoT 분석은 엣지 단에서 비즈니스 성과로 간단히 이어질 수 있습니다. Pentaho는 인사이트와 비즈니스 성과에 집중하고 있습니다. 특히 데이터의 통합부터 검증, 클렌징, 처리, 오케스트레이션을 포함해 머신러닝 모델링 및 테스트, 분석 결과물 시각화 등의 다양한 기능을 제공합니다. 더보기

What Inspires Sustainable Technology?