Apache Spark上的Amplab Shark

https://stackoverflow.com//questions/22076506

23-12-2019
|

题

根据文档，

“Apache Spark是一个快速和通用的发动机，用于大规模数据处理。”

“Shark是一个用于Hadoop数据的开源分布式SQL查询引擎。”

和鲨鱼使用火花作为依赖。

我的问题是，火花只是将Hiveql解析为Spark工作，或者如果我们在分析查询中使用鲨鱼进行快速响应的情况，请做任何伟大的东西？

解决方案

是的，鲨鱼使用与hive相同的想法，但将hiveql转换为spark作业而不是mapreduce作业。请阅读这个文档，用于这两个的架构差异。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow