在NoSQL数据库领域,统治产品无疑当属MongDB和DataStax Enterprise(一个领先的Apache Cassandra发行版)。然而本周的两条新闻头条却开始关注一个尽管很顽强,但知名度低的选手——Apache HBase,这个几乎包含在任何主流Hadoop发行版的NoSQL数据库。
Mongo的挑战
聚焦上一周,有两个事件值得关注——7岁的MongoDB任命了第三任CEO,以及主打HBase的初创公司Splice Machine新一轮融资超过300万美元。对比MongoDB和HBase,无论是独自还是联合发展,后者都没有任何超越前者的迹象。最终,即将离职的MongoDB CEO Max Schireson将其离职原因归结于需要频繁奔波于公司在Palo Alto和New York的两个总部,以及其他的一些工作需求。
MongoDB似乎诠释了快速发展的苦恼,不仅仅表现在经营管理层,也表现在技术发展层面上——从许多开发者和圈内朋友那得知,MongoDB在大规模下表现非常差,不管是集群大小还是数据摄入体积。
分歧中的发展
但不得不说,HBase的势头正在上扬,并且不存在MongoDB发展中所遇见的问题。虽然HBase没有像MongoDB及Cassandra背后那些龙头企业撑腰,但其发展已经很好了:
- HBase如今作为Hadoop的一部分存在,使用HDFS作为表格表示它可以从其他Hadoop负载中导入和导出数据,也可以单独工作。
- Apache Hive可以用于HBase数据查询,为NoSQL数据库提供SQL接口。
- MapR一直致力于提升HBase在操作应用程序方面的应用,为此该公司开发了自定义的HDFS读写版本,其发布的基于C++、兼容HBase数据库的M7 Hadoop专为可操作性工作负载设计。
- Continuuity的产品Reactor为Hadoop与HBase整合使用设计。
- Apache Knox、Hortonworks XA Secure和Zettaset Orchestrator都为HBase数据提供了安全服务。
- 微软现在提供基于云的集群服务,特别为基于Hadoop的Azure HDInsight云服务预览版本提供了HBase配置。这一基于HBase的实施应用于Azure Blob存储中。
- 上面提到过,Splice Machine已经成功为HBase发行版融资,有趣的是它还是一个关系型数据库。这在一定程度上说明了,基于HBase多功能性的横向扩展数据库基础设施并不限制必须使用NoSQL应用程序。
展望HBase未来
从Splice Machine和微软的产品来看,HBase是一个兼容了其他数据技术的NoSQL数据库。同时,人们对“Data Lake”架构日益增长的兴趣也增加了HBase成功的几率。对于HBase的持续发展,让我们拭目以待。