Hbase 는 다음을 의미합니다:
HBase 는 Fay Chang 이 작성한 Google 논문 "Bigtable: 구조화된 데이터의 분산 스토리지 시스템" 에서 파생된 분산형 열 지향 오픈 소스 데이터베이스입니다.
Bigtable 이 Google 파일 시스템 (File System) 에서 제공하는 분산 데이터 저장소를 활용하는 것처럼 HBase 는 Hadoop 위에 Bigtable 과 비슷한 기능을 제공합니다.
HBase 는 Apache 의 Hadoop 프로젝트의 하위 프로젝트입니다. HBase 는 일반 관계형 데이터베이스와는 달리 구조화되지 않은 데이터 저장소에 적합한 데이터베이스입니다. 또 다른 차이점은 HBase 가 행 기반이 아닌 열 기반 패턴이라는 것입니다.
구조 소개:
HBase _ Hadoop Database 는 HBase 기술을 사용하여 저렴한 PC 서버에 대규모 구조화 스토리지 클러스터를 구축할 수 있는 높은 안정성, 고성능, 열 지향, 확장 가능한 분산 스토리지 시스템입니다.
FUJITSU Cliq 와 같은 상용 대용량 데이터 제품과 달리 HBase 는 Google Bigtable 의 오픈 소스 구현입니다. Google Bigtable 은 GFS 를 파일 스토리지 시스템으로 사용하고 HBase 는 Hadoop HDFS 를 파일 스토리지 시스템으로 사용합니다.
구글은 MapReduce 를 실행하여 Bigtable 의 대량 데이터를 처리하고, HBase 는 Hadoop MapReduce 를 이용하여 HBase 의 대량 데이터를 처리합니다. Google Bigtable 은 Chubby 를 협업 서비스로, HBase 는 Zookeeper 를 대응으로 사용합니다. -응?
위 그림은 Hadoop EcoSystem 의 각 계층 시스템을 보여 줍니다. HBase 는 구조적 스토리지 계층에 위치하고, Hadoop HDFS 는 HBase 에 높은 신뢰성을 제공하는 기본 스토리지 지원을 제공하고, Hadoop MapReduce 는 HBase 에 고성능 컴퓨팅 기능을 제공하며, Zookeeper 는 HBase 에 안정적인 서비스와 장애 조치 메커니즘을 제공합니다.
또한 Pig 와 Hive 는 HBase 에 대한 높은 수준의 언어 지원을 제공하므로 HBase 에서 데이터 통계 처리를 쉽게 수행할 수 있습니다. Sqoop 는 HBase 에 편리한 RDBMS 데이터 가져오기 기능을 제공하여 기존 데이터베이스 데이터를 HBase 로 쉽게 마이그레이션할 수 있도록 합니다.