发布于

【初体验】 OushuDB与greenplum、impala on Hadoop对比

初次接触 OushuDB,这是我初次接触 oushuDB,所有了解都来自培训和网上资料的查询,难免有错误,请多指正。

我工作中使用过的数据库是 greenplum、impala on Hadoop,所以拿这个来简单对比一下。

OushuDB 与 HAWQ 有着深远的联系,团队基本一致。根据我粗浅的理解,HAWQ 就是 Greenplum 的计算引擎 + HDFS 存储的组合。而 Greenplum 又是基于 PostgreSQL 开发,有着很多相似性。

这两种数据库最大的不同之处就在于对分布式的实现方式,即 MPP 和 Hadoop 的不同技术路线选择。


这两者最大的区别就是整合的思路有所不同,MPP 是把一个节点视为一个整体,而 Hadoop 是把存储和计算分开管理的。

oushuDB 支持 HDFS、magma、S3 存储,显然是基于 HDFS 发展而来,magma 是其自研的存储,我了解也不是很多,就不多介绍了。

greenplum 是 MPP 路线的产物,是 PostgreSQL 的升级版。impala on Hadoop 是 Hadoop 路线的产物,使用新的计算引擎替换了 Hive+MapReduce 的老方式。

oushuDB 结合了两者的一些特性,即 Greenplum 的计算引擎 + HDFS 存储。分布式的实现方式也和 Hadoop 更加类似。

我个人认为 oushuDB 相比以上两种数据库有着这些优缺点:

优点:

  • 优美的界面和 UI
  • 方便的可视化操作
  • 速度?(我没有进行过对比测试)

缺点:

  • 商用数据库需要付费
  • 不开源,社区不活跃

我认为 oushuDB 至少要有一个免费社区版供大家尝鲜使用,官网没有安装包下载也没有云试用,有再好的性能大家也无法体会。在这次培训前我从来没有听说过 oushuDB,在网上的资料也寥寥无几,团队里的项目架构师也表示对 oushuDB 没什么兴趣。

参考资料:

  1. 我眼中的偶数数据库 OushuDB - 墨天轮 (modb.pro)
  2. MPP 与 Hadoop,两种主流大数据系统架构有啥区别?_节点_进行_资源 (sohu.com)
评论
    test