SAP 코리아(대표 형원준, www.sap.com/korea)는 아파치 하둡(Apache Hadoop)을 SAP 제품과 통합한 빅 데이터 솔루션을 발표했다. SAP HANA 플랫폼 기반 위에 SAP 사이베이스 IQ, SAP 데이터 인티그레이터(ETL), SAP 비즈니스오브젝트 BI와 결합된 빅 데이터 솔루션은 클라우데라, HP, IBM, 호튼웍스, 히타치데이터시스템즈(HDS)와의 협력을 통해 제공되며, 데이터웨어하우스(DW) 환경에서 막대한 양의 데이터를 실시간 분석하고 인사이트를 제시한다고 회사측은 소개했다.
전통적인 데이터베이스(DB)가 엔터프라이즈 데이터웨어하우스(EDW) 시장을 주도하는 가운데, 하둡은 폭증하는 데이터 - 특히 비정형 - 에 대한 비용 효과적인 처리 및 저장을 원하는 기업들에게 매력적인 대안이다. 그러나 기업들은 하둡을 자사 비즈니스 분석 환경과 통합하고 DW을 개선하는 데 어려움을 겪고 있다. SAP는 인메모리 컴퓨팅 및 컬럼 DB 기술과 하둡의 장점을 결합하는 한편, 하둡 기업들과 협력을 통해 고객들에게 정형·비정형 데이터를 아우르는 완벽한 실시간 DW 환경을 제공한다.
SAP는 고객이 하둡을 기존 비즈니스 인텔리전스(BI) 및 DW 환경에 통합할 수 있도록 다양한 방안을 제시하고 있다고 있다며, 고객은 SAP 데이터 인티그레이터를 이용해 하둡분산파일시스템(HDFS), 하이브(Hive) DB 데이터를 읽어, 하둡에서 의미 있게 요약된 연관 데이터를 SAP HANA 및 SAP 사이베이스 IQ에 적재할 수 있다고 설명했다. 따라서 BI 사용자는 기존 리포팅 및 분석 도구를 지속적으로 활용해 하둡에서 처리된 데이터를 포함한 전체 데이터에 대한 통찰력을 얻을 수 있다고 회사측은 전했다. 더 나아가 SAP 사이베이스 IQ 및 하둡 환경에서 쿼리를 연합(Federation)하거나, SAP 사이베이스 IQ MPP 환경에서 맵리듀스(MapReduce) 작업을 진행할 수 있고, SAP 비즈니스오브젝트 BI 사용자는 하이브 환경을 쿼리할 수 있으며 이를 통해 비즈니스 분석가가 직접 하둡 환경을 탐색할 수 있다고 SAP는 설명했다.
SAP 코리아 형원준 사장은 "하둡을 이용하면 비정형 위주의 대용량 데이터를 저렴하면서도 빠르게 분석할 수 있다. SAP는 하둡 프레임워크와 국내 기술진에 의해 개발된 SAP HANA 및 혁신적인 인메모리 컴퓨팅, DB, BI 기술을 결합해 고객이 고성능 EDW를 실현할 수 있도록 지원한다. 이제 SAP의 빅 데이터 오퍼링을 통해 고객은 정형·비정형 등 모든 대용량 데이터에 대한 실시간 분석과 처리가 가능하다"라고 설명했다.
생물정보학 및 게놈 분석 업체 일본 MKI사(社)는 복잡하고 반복적인 게놈 분석을 위해 하둡과 SAP HANA를 활용, 실시간 분석 DB를 구현, 하루 걸리던 분석 시간이 분 단위로 줄어들었으며, 시장조사기관 콤스코어는 하둡을 도입해 매일 발생되는 테라급 데이터를 처리하고 SAP 사이베이스 IQ 기반 EDW에 적재한 결과 수 천의 콤스코어 고객들이 셀프 서비스 도구를 활용해 결과를 분석할 수 있게 되었다고 SAP측은 전했다.
SAP는 인메모리 컴퓨팅과 하둡 기술이 결합된 빅 데이터 솔루션을 고객에게 신속히 제공하기 위해 하둡 데이터 관리 SW, 시스템, 서비스, 교육 분야 선두 주자인 클라우데라, HP, IBM, 호튼웍스, HDS와 적극 협력하고 있다.
김원영 기자 goora@noteforum.co.kr
[디지털 모바일 IT 전문 정보 - 노트포럼]
Copyrights ⓒ 노트포럼, 무단전재 및 재배포 금지