Tubarão de AmPlab na faísca Apache

https://stackoverflow.com//questions/22076506

hadoop
hive
apache-spark
shark-sql

23-12-2019
|

Pergunta

De acordo com a documentação,

"Apache faísca é um mecanismo rápido e geral para processamento de dados em grande escala."

"Shark é um mecanismo de consulta SQL distribuído de código aberto para dados do Hadoop."

e tubarão usa a faísca como dependência.

minha pergunta é, é a faísca apenas analisa o Hiveql em trabalhos de faísca ou faz qualquer coisa grande se usarmos o tubarão para resposta rápida em consultas analíticas?

Solução

Sim, o tubarão usa a mesma ideia que a colmeia, mas traduz o Hiveql em trabalhos de faísca em vez de MapReduce Trabalhos.Por favor, leia as páginas 13-14 de este documento para diferenças arquitetônicas entre estes dois.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow