官方方案¶
HBase 的官方文档提供了数个不同的Spark读写HBase的方法。
Basic Spark¶
Spark Streaming¶
Spark Bulk Load¶
SparkSQL/DataFrames¶
Spark on HBase¶
Github上可以找几个Spark on HBase 的API算法库。
| Hub | 说明 | 备注 |
|---|---|---|
| cloudera-labs/SparkOnHBase | 该模块整合到CDH的发行版中,包含大量bulk相关API | |
| Huawei-Spark/Spark-SQL-on-HBase | 通过HBase的Map/Reduce接口实现基于SQL的实时查询 | |
| Apache HBase Connector | hortonworks提供spark on API | |
| nerdammer/spark-hbase-connector |
其他HBase引擎¶
| 项目名称 | 有应用场景 | 备注 |
|---|---|---|
| HBase Ganos | 基于HBase的时空序列引擎 | locationtech/geomesa 阿里的云服务 |
| OpenTSDB | 基于HBase的时序数据库 |