Tubarão de AmPlab na faísca Apache
-
23-12-2019 - |
Pergunta
De acordo com a documentação,
"Apache faísca é um mecanismo rápido e geral para processamento de dados em grande escala."
"Shark é um mecanismo de consulta SQL distribuído de código aberto para dados do Hadoop."
e tubarão usa a faísca como dependência.
minha pergunta é, é a faísca apenas analisa o Hiveql em trabalhos de faísca ou faz qualquer coisa grande se usarmos o tubarão para resposta rápida em consultas analíticas?
Solução
Sim, o tubarão usa a mesma ideia que a colmeia, mas traduz o Hiveql em trabalhos de faísca em vez de MapReduce Trabalhos.Por favor, leia as páginas 13-14 de este documento para diferenças arquitetônicas entre estes dois.
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow