본문 바로가기

TECH ZOOM

데이터를 제대로 아는 '펜타호', 디지털 전환 속도를 높이다

급증하는 데이터, 곳곳에 산재해 있어 활용하기 어려운 데이터는 ‘성공적인 디지털 전환’의 걸림돌이다. 디지털 전환의 여정을 가속하고 싶다면, 먼저 데이터를 파악하고 이의 효율적인 운영 방안을 수립해야 한다.


데이터에서 유의미한 가치를 창출하고 비즈니스에 활용하기 위해 방법을 고민 중이라면, ‘펜타호(Pentaho)’를 주목해보자. 데이터 수집부터 정리, 학습, 분석까지 ‘데이터의 모든 것’을 지원하는 최고의 솔루션이라고 해도 과언이 아니다.

 


 

분석 프로세스에 최적화

펜타호(Pentaho)는 오픈소스 기반의 엔터프라이즈급 데이터 통합 및 분석 자동화 솔루션으로, 다양한 데이터 환경에 최적화되어 있다. 펜타호는 빅데이터 통합, 워크플로우 통합, 데이터 탐색, 데이터 시각화, 보고서 및 대시보드 등의 기능을 지원하고, 일반적인 빅데이터 솔루션과 달리 오픈소스 기반으로 비용 효율적이고 우수한 커스터마이징을 제공한다.

기업들이 별도의 솔루션을 조합하여 분석 시스템을 구축할 경우, 관리의 복잡성은 물론 비용이 상승하고 솔루션의 확대 적용 또한 어렵다. 그러나 펜타호는 수집, 변환, 적재부터 분석, 시각화까지 모든 기능을 원스톱으로 제공하기 때문에 운영의 복잡성과 관리의 어려움이 전혀 없다.

펜타호는 크게 PDI와 PBA의 두 가지 컴포넌트로 구성되어 있다. PDI(Pentaho Data Integration)는 데이터를 수집, 변형, 저장하는 기능을 지원하는 강력한 ETL 및 분석 솔루션이며, PBA(Pentaho Business Analytics)는 비즈니스 인텔리전스, 즉 사용자 관점에 맞는 리포팅, 시각화, 분석, 예측 기능을 지원하는 시각화 솔루션이다. 펜타호는 이 두 가지 컴포넌트를 통해 AI 애플리케이션을 구축한다.

 

펜타호의 주요 기능

펜타호만의 특별함

 

효율적인 분석 애플리케이션을 위한 펜타호만의 특별한 네 가지 기능은 다음과 같다.


분석 프로세스의 자동화

분석 프로세스란 데이터를 수집, 추출, 변환, 전처리하여 분석 모델에 학습시키고, 이를 통해 예측, 추론, 해석, 원인분석 등의 결과를 도출하여 시각화하는 전 과정을 말한다. 이런 프로세스를 하나의 과정이라고 볼 때, 여러 분석 프로세스가 존재하면 지속적인 운영에 어려움이 따른다. 그러나 펜타호는 자동화 기능과 편리성을 제공함으로써 이러한 어려움을 완벽하게 해결한다.


MDI 제공으로 업무 효율 증대

분석 애플리케이션이 많을 경우 확장에 특화된 기능이 필요한데, 펜타호는 이를 완벽하게 지원한다. Metadata Injection(MDI)은 공통된 업무를 모듈화하여 모든 작업공간에서 재사용할 수 있게 해주며, 다양한 형식의 입출력 정보를 메타데이터로 전달하여 작업시간을 줄임으로써 업무 효율을 증대시킨다. 수백 개의 단위 작업이 진행될 경우 작업 시간이 많이 소요되고 반복 업무도 많겠지만, 펜타호의 MDI 기능을 활용하면 개발 시간이 감소하고 편의성이 높아진다.


최적의 분석 모델 선정 및 실시간 업데이트

초기에 구축된 모델은 시간이 지날수록 정확도가 떨어질 수 있기 때문에 일정 주기마다 모델을 업데이트 해야 한다. 펜타호는 모델의 업데이트, 즉 평가와 비교 기능을 통해 최적의 모델을 선정하는 프로세스 기능을 제공한다. 모델의 성능을 지속적으로 유지하는 것은 분석 업무 활용을 위해 매우 중요하기 때문에, 모델 업데이트 로직의 사용 여부 역시 간과할 수 없는 부분이다.

초기에 잘 만든 모델이라도 성능이 떨어지게 되면 분석 모델의 가치 역시 하락하게 된다. 데이터도 시간이 지날수록 최신 트렌드나 변화를 받아들이지 않기 때문에, 모델을 지속적으로 평가하고 비교하는 방법은 반드시 필요하다.


분석 모델 업그레이드를 통한 분석 인사이트 향상

분석 모델 업데이트를 지속적인 학습이라고 본다면, 모델 업그레이드는 개별 모델의 인사이트를 통합해서 새로운 인사이트를 얻기 위해 새로운 모델을 만드는 것이다. 즉 모델 업그레이드는 학습 모델의 변형, 고도화, 성장이라고 볼 수 있다.

비전문가가 분석 모델에 업무를 적용하고 업그레이드하기 위해서는 분석 모델이 어떻게 예측하는지, 또 정확히 예측하는지 확인할 수 있어야 한다. 초기에는 전문가와 함께 모델을 생성할 수 있지만, 현업에서는 담당자가 분석 모델이 제공하는 결과에 대해 판단할 수 있어야 한다.


프라이빗 클라우드, 퍼블릭 클라우드, 온프레미스의 다양한 환경을 지원하는 펜타호

펜타호는 모델 해석을 제공함으로써 비전문가도 분석을 쉽게 사용하고 확장할 수 있다. 현업에서 분석 모델을 판단할 수 있다면 모델 업그레이드 역시 충분히 활용할 수 있고, 더 많은 비즈니스 인사이트를 창출할 수 있을 것이다.

 


더욱 스마트해진 펜타호

 

최근 업그레이드된 펜타호9.2는 ‘루마다 데이터옵스 스위트’의 강력한 엔진 역할을 하며, 기업의 데이터옵스 환경 구현을 위한 데이터 통합과 분석 등 핵심적인 기능을 제공한다. 최신 클라우드 네이티브 아키텍처를 제공하는 펜타호9.2는 아마존웹서비스(AWS), MS애저, 구글 클라우드 등 모든 주요 퍼블릭 클라우드를 지원하고, 서로 다른 컨텍스트로 구성된 데이터의 통합과 분석에 대해 고민하는 기업에 해결책을 제시해준다.

펜타호9.2는 코어 투 멀티 클라우드 파이프라인 구축을 가속하고 여러 클라우드에서 대규모로 데이터 파이프라인을 신속하게 구축·배포할 수 있다. 기업이 데이터 분석을 하고자 할 때 언제든 통합 및 이동이 가능해, 데이터 인사이트 확보를 위한 프로세스 효율을 극대화시켜준다.

또한, 데이터 통합(Integration) 실행 기능을 개선, 쿠버네티스 방식으로 배포·관리되는 마이크로서비스 활용도가 높아졌다. 따라서 고객이 어떤 환경을 선택하든 유연하게 데이터를 활용할 수 있고, 사용자 환경에 바로 연결하여 필요한 자동 확장까지도 제공한다.

펜타호는 데이터를 기반으로 혁신적인 변화를 원하는 기업들에게서 꾸준히 좋은 반응을 얻고 있다. 특히 데이터 환경이 지속적으로 변화하거나 분석 모델을 적용해야 하는 포인트가 많은 기업, 공장 최적화를 통해 원가 절감이 필요하거나 설비고장을 사전에 인지하여 사고에 대비하려는 기업 등에서 많이 활용되고 있다.

다양한 애플리케이션을 효율적으로 사용할 수 있도록 지원하는 펜타호와 함께 성공적인 디지털 전환 환경을 누려보자.


“오픈소스 및 외산 솔루션 대부분이 커스터마이징과
즉각적인 대응이 어려운 반면, 펜타호는 효성인포메이션시스템의 전문인력이
완벽하게 지원하기 때문에 어디서든 편리하게 사용할 수 있다.”