Skip to content

官方方案

HBase 的官方文档提供了数个不同的Spark读写HBase的方法。

Basic Spark

Spark Streaming

Spark Bulk Load

SparkSQL/DataFrames

Spark on HBase

Github上可以找几个Spark on HBase 的API算法库。

Hub 说明 备注
cloudera-labs/SparkOnHBase 该模块整合到CDH的发行版中,包含大量bulk相关API
Huawei-Spark/Spark-SQL-on-HBase 通过HBase的Map/Reduce接口实现基于SQL的实时查询
Apache HBase Connector hortonworks提供spark on API
nerdammer/spark-hbase-connector

其他HBase引擎

项目名称 有应用场景 备注
HBase Ganos 基于HBase的时空序列引擎 locationtech/geomesa
阿里的云服务
OpenTSDB 基于HBase的时序数据库