【初体验】 OushuDB与greenplum、impala on Hadoop对比
初次接触 OushuDB,这是我初次接触 oushuDB,所有了解都来自培训和网上资料的查询,难免有错误,请多指正。
我工作中使用过的数据库是 greenplum、impala on Hadoop,所以拿这个来简单对比一下。
OushuDB 与 HAWQ 有着深远的联系,团队基本一致。根据我粗浅的理解,HAWQ 就是 Greenplum 的计算引擎 + HDFS 存储的组合。而 Greenplum 又是基于 PostgreSQL 开发,有着很多相似性。
这两种数据库最大的不同之处就在于对分布式的实现方式,即 MPP 和 Hadoop 的不同技术路线选择。
这两者最大的区别就是整合的思路有所不同,MPP 是把一个节点视为一个整体,而 Hadoop 是把存储和计算分开管理的。
oushuDB 支持 HDFS、magma、S3 存储,显然是基于 HDFS 发展而来,magma 是其自研的存储,我了解也不是很多,就不多介绍了。
greenplum 是 MPP 路线的产物,是 PostgreSQL 的升级版。impala on Hadoop 是 Hadoop 路线的产物,使用新的计算引擎替换了 Hive+MapReduce 的老方式。
oushuDB 结合了两者的一些特性,即 Greenplum 的计算引擎 + HDFS 存储。分布式的实现方式也和 Hadoop 更加类似。
我个人认为 oushuDB 相比以上两种数据库有着这些优缺点:
优点:
- 优美的界面和 UI
- 方便的可视化操作
- 速度?(我没有进行过对比测试)
缺点:
- 商用数据库需要付费
- 不开源,社区不活跃
我认为 oushuDB 至少要有一个免费社区版供大家尝鲜使用,官网没有安装包下载也没有云试用,有再好的性能大家也无法体会。在这次培训前我从来没有听说过 oushuDB,在网上的资料也寥寥无几,团队里的项目架构师也表示对 oushuDB 没什么兴趣。
参考资料: