是否有类似于Hadoop顶部的Vertica类似的列存储。我不是在谈论HBase,因为它是稀疏的矩阵存储,无法获得诸如Vertica之类的东西可以达到的压缩水平?

谢谢

有帮助吗?

解决方案

你在寻找类似的东西吗 rcfile?这是一种内部使用列存储的文件类型。

其他提示

RCFILE是一个不错的开始。 RCFILE将数据存储在PAX布局中 - 柱中可能与HDFS的块大小一样大。 VLDB 2011上有一篇论文描述另一种柱状存储格式 这里 和一篇博客文章与RCFILE进行了简短的比较 这里.

我没有与Hadoop合作,但我知道Vertica一直在尝试与Hadoop集成。

http://www.vertica.com/the-analytics-platform/native-bi-etl-and-hadoop-mapreduce-integration/

看哈普 http://hadapt.com/

这是HadoopDB的商业版本 http://db.cs.yale.edu/hadoopdb/hadoopdb.html 在耶鲁大学开发。它可以使用面向列的DB(安装在计算机群集的每个节点上),而Hadoop hadoop进行耐心的执行。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top