Cloud 기반의 유연한 확장성과 다양한 데이터를 신속하게 적기 분석할 수 있는 통합 빅데이터 분석 플랫폼입니다.
kt의 방대한 데이터와 활용 가능한 외부 데이터를 결합하여 수익성 제고, 신상품 개발, 악성코드 감염 원인 파악,
마케팅 방향성 수립 등 kt에서 필요한 모든 분석을 고객의 요구사항에 맞춰 수행할 수 있는 빅데이터 허브입니다.
주요 특징
유연한 확장성을 위한 클라우드 환경으로 구성
하둡 2.x 기반의 업그레이드 된 솔루션 분석 성능 강화
로컬 스토리지 기반의 분석처리 시스템 구현으로 I/O 성능 향상과 비용절감
Tez, Spark 등 Big Data 신기술 적용으로 기존 분석 시스템 대비 분석성능 7.8배 개선
사업 기간
2015/04 ~ 2015/07
01 HDFS(Hadoop Distributed File System) : Hadoop데이터가 실제 저장되는 영역
02 Spark : 메모리 기반의 고속 데이터 처리
03 RHive(R+hive) : 분석통계 함수 언어인 R을 SQL과 결합한 분석 지원 툴
04 R-Studio : 분석 결과를 그래프, 차트 등으로 시각화 지원
05 Swift(Open Stack) : 특정 시스템의 storage가 아닌 Shared Storage로 여러 솔루션/시스템에서 공유