본문 바로가기

pentaho

펜타호, 산업별 분석 템플릿 통해 데이터 분석·활용 수준을 높이다 데이터는 과거와 비교해 상상할 수 없이 빠른 속도와 양으로 생성되고 있고, 분석 기술 역시 늘어나고 있다. 데이터 소비자들도 달라졌다. 현업에서 데이터를 사용하는 소비자의 폭이 전보다 훨씬 넓어졌고, BI 툴만 고집하지 않고 검색 엔진 또는 머신러닝(ML)을 원하기도 한다. 빅데이터 플랫폼은 과거의 CRM과 같이 시대의 흐름에 따라 유행하는 기술과는 차원이 다르다. 모든 기업이 관심을 두고 도입해야 하는 시스템으로 위상이 높아진 것이다. 데이터 분석과 관리 방식을 위한 새로운 툴과 기술이 등장했지만, 데이터 민첩성 부족은 여전히 문제다. 그리고 이 문제는 기업 혁신을 가속하는 분석과 인공지능( AI), 머신러닝 구현에 큰 걸림돌이 되고 있다. 새로운 데이터 운영 관리 솔루션이 절실히 필요한 때다. 데이터.. 더보기
빅데이터 분석 시장에 불어온 '펜타호' 바람 비즈니스 가치를 높이는 데이터 바로 알기 데이터의 중요성은 이미 오랫동안 논의되어 왔다. 이제 빅데이터의 핵심은 데이터 수집이 아닌, 수집한 데이터를 어떻게 활용할 것인지에 달려있다. 특정 비즈니스의 과제를 해결할 답을 찾는 데 데이터를 어떻게 이용할 것인지에 대해 집중할 필요가 있다. 또한 새로운 기술과 인프라를 준비하는 것과 더불어, 이를 어디에 쓰고 어떤 결과물을 만들어 낼 지에 대한 고민이 중요하다. 데이터 자체만으로는 가치가 없다는 것을 이미 모두가 잘 알고 있다. 이제는 데이터를 제대로 활용하는 것에 가치가 있다. 인공지능과 머신러닝을 통한 데이터 분석을 통해 고객의 니즈를 만족시키는 것이 중요하다. 데이터 활용성 극대화하는 펜타호 현실적인 빅데이터 전략을 찾는 이들에게 ‘데이터옵스(DataO.. 더보기
데이터 운영 시대의 해결사는 단연 펜타호! 기업들은 디지털 트랜스포메이션을 통해 데이터에서 더 많은 가치를 얻을 수 있는 방법을 모색하고 있지만, 필요한 정보를 정확히 찾아내는 것은 갈수록 어려워지고 있다. 이제는 데이터 수집, 저장, 분석에서 한 걸음 더 나아가 데이터 운영이 화두가 되고 있다. 데이터 운영의 중요성과 효성인포메이션시스템이 제안하는 데이터옵스(DataOps) 전략, 그리고 데이터옵스를 실행시킬 최적의 솔루션 펜타호에 대해 낱낱이 파헤쳐 보자. 데이터 수집과 저장, 여전히 최우선인가 빅데이터 수집, 저장, 보호는 개별 업무가 주 목적일 때 중심이 되던 영역이다. 지금도 데이터 주도2) 기업이나 머신러닝 기술을 활용 중인 기업들은 데이터 수집이나 저장을 반복적으로 강조하지만, 정작 자사에 유용한 데이터나 외부에서 가져온 데이터가 어.. 더보기
카카오게임즈, 펜타호를 통해 업무 효율성과 데이터 가치를 향상시키다! 카카오의 게임 전문 자회사 카카오게임즈는 올해 설립 3년을 맞은 글로벌 멀티플랫폼 게임 기업이다. 모바일로는 ‘카카오게임’, PC온라인에서 ‘다음게임’ 등 막강한 플랫폼을 구축, 국내외에서 플랫폼을 망라한 다양한 장르의 게임을 서비스하고 있으며 매년 가파른 성장을 이어가고 있다. 이런 성장에 따라 이를 받쳐주는 IT 시스템 변화가 필요했다. 프로젝트명 GameBI ETL(실시간 대용량 스트리밍 데이터 처리) 도입솔루션 펜타호(Pentaho) 도입효과 •스트리밍 데이터의 실시간 집계로 통계 정보 제공(시간당 1,200만~2,000만 건) •새로운 유형의 데이터 소스를 분석 시스템에 손쉽게 탑재 효율적 업무 프로세스 고민 게임 업계는 특성상 다양한 데이터 소스가 존재한다. 카카오게임즈는 저장소로 하둡(Had.. 더보기
지금은 데이터옵스(DataOps) 시대! 핵심 솔루션은? 하버드 비즈니스 리뷰(Harvard Business Review)는 “산업 간 연구 결과, 평균적으로 기업 내 정형 데이터 중 의사결정에 활발히 이용되는 데이터는 절반 이하에 불과하며, 비정형 데이터가 분석되거나 사용되는 비율은 1% 이하다. 70% 이상의 직원들이 불필요한 데이터에 액세스하고 있으며, 데이터 분석가들은 80%의 시간을 데이터 검색과 준비에 쏟고 있다. 기업의 데이터 기술은 아직 충분한 수준에 미치지 못하고 있다.”고 언급했다. 이는 2년 전인 2017년에 발간된 보고서 내용이다. 이후로 어떤 변화가 있었을까? 비즈니스를 위한 데이터 관리 프레임워크는 여전히 소수 데이터 관리는 IT가 처음 등장할 때부터 존재했으며, 많은 기술이 빅데이터 배치, 거버넌스, 베스트 프랙티스, 툴 등에 초점을.. 더보기
성큼 다가온 시계열 DB 세상, 펜타호가 접수한다! 인터넷은 수천, 수백만의 사용자가 접속하는 URL을 통해 피라미드처럼 액세스된다. 사물인터넷(IoT)이 등장함에 따라 수백 건의 기록을 인터넷으로 전송하는 수많은 ‘사물’이 존재한다. 사물인터넷을 가능하게 하는 센서 덕분에 인터넷은 단순한 정보 제공처가 아니라 정보를 취합하는 수많은 데이터 포인트로 탈바꿈하고 있다. 변화 추적에 용이한 시계열 데이터 자율주행 자동차와 같은 사물인터넷 디바이스에는 수천 GB의 데이터를 생산하는 수백 개의 센서가 달려 있다. 자율주행 자동차 1대가 하루에 수집하는 데이터는 4,000GB 이상에 달할 것으로 예측된다. 이처럼 많은 양의 데이터가 취합되는 이유는 사물인터넷 디바이스가 변화되는 상황을 수시로 확인하기 때문이다. 이러한 변화를 제대로 추적하려면 데이터 업데이트가 아.. 더보기
왜! 펜타호여야 하는가 전 세계 1,800여 사이트에서 활용하는 엔드-투-엔드 원스톱 빅데이터 플랫폼이 있다 .정형 및 비정형 데이터의 수집부터 변환, 적재, 분석, 그리고 시각화에 이르는 과정 모두를 제공하는 히타치 밴타라(Hitachi Vantara)의 펜타호(Pentaho)다. 히타치 밴타라 김경륜 이사와 효성인포메이션시스템 DATA사업팀 이진석 수석이 데이터를 활용해 더 나은 비즈니스 성과를 내고자 하는 기업들에게 펜타호가 왜 적합한 솔루션인지 설명한다. 데이터 통합 분석이 빅데이터 접근의 기본이라고 하는 이유가 있나요. 데이터 시대입니다. 데이터 경쟁력이 기업의 성패를 좌우하는 시대가 됐습니다. 문제는 관계형 데이터부터 비정형 텍스트, 센서 데이터, 머신 데이터까지 기업에서 생산되는 데이터 종류가 너무 다양하고 많다는.. 더보기
Pentaho 딥러닝, 어디까지 가능할까! Hitachi Vantara Labs이 지난 3월 펜타호 마켓 플레이스(Pentaho Market Place)에 추가한 Plugin Machine Intelligence(이하 PMI) 플러그인을 현재 사용하고 있다면, 이번에 발표되는 업데이트에 기대를 해볼만 하다. 히타치 밴타라는 PDI(Pentaho Data Integration)용 플러그인인 기존의 PMI를 업데이트한 PMI 버전 1.4를 발표할 예정이다. PMI는 전통적인 머신러닝과 파이썬(Python) 사이킷러닝(Scikit-Learning), R, 스파크, WEKA 등 4개의 머신러닝 라이브러리의 모델 구축, 사용, 관리에 중점을 두고 있다. 굳이 ‘전통적인 머신러닝’이라는 명칭을 사용하는 이유는, 지금까지 사례로 볼 때 정형 데이터에서는 전통.. 더보기
비즈니스 성공 가도를 달리는 데이터 분석의 기술_Part 02 PART 02 빅데이터 분석 지형을 바꾸다 원스톱 플랫폼 ‘펜타호’가 남다른 까닭 SNS, 인터넷, 이메일 등 정형 데이터뿐만 아니라 비정형을 포함한 새로운 구조의 데이터를 처리하는 빅데이터 분석 플랫폼에 대한 요구 조건이 까다로워지고 있다. 단절되거나 산재되어 있는 여러 시스템에서 진행되는 작업으로는 빅데이터를 통해 효율적으로 비지니스 가치를 창출하기 어렵다는 판단에서다. 빅데이터에서 가치를 이끌어낼 수 있는, 제대로 된 빅데이터 분석 플랫폼 ‘펜타호(Pentaho)’를 알아보자. 시장조사업체 IDC에 따르면, 전 세계 데이터 규모는 2025년에 163 제타바이트(Zetabytes)에 이를 것이라고 한다. 2016년 데이터 발생량을 기준으로 10배에 달하는 예상치다. 또한 이 데이터 중 4분의 1 이상.. 더보기
비즈니스 성공 가도를 달리는 데이터 분석의 기술_Part 01 고객들은 분석 기능으로부터 많은 이점을 이끌어낼 수 있다. 리포팅, 분석, 대시보드, 시각화 툴은 사용 만족도를 높이고, 시장 경쟁력을 제공하며, 비즈니스 성장을 가속화할 수 있다. 그러나 고객이 이러한 성과를 얻게 하기 위해서는 리소스 투자, 프로젝트 시점, 리스크 관리, 사용자 니즈에 대한 세밀하고 꼼꼼한 접근 방식과 적절한 검토가 필요하다. 현재 필요한 분석 기능을 자체 개발할 것인가, 아니면 전문 벤더의 솔루션을 구매할 것인가. 각각의 장단점을 들여다 보고, 히타치 밴타라의 빅데이터 분석 플랫폼인 ‘펜타호(Pentaho)’를 살펴본다. PART 01 구매 vs 자체 개발 비즈니스 데이터 분석 위한 최선의 방법은? ‘구매 vs 자체 개발’은 소프트웨어 영역에서 아주 오래된 딜레마다. 대규모 엔지니어.. 더보기