Pergunta

De acordo com a documentação,

"Apache faísca é um mecanismo rápido e geral para processamento de dados em grande escala."

"Shark é um mecanismo de consulta SQL distribuído de código aberto para dados do Hadoop."

e tubarão usa a faísca como dependência.

minha pergunta é, é a faísca apenas analisa o Hiveql em trabalhos de faísca ou faz qualquer coisa grande se usarmos o tubarão para resposta rápida em consultas analíticas?

Foi útil?

Solução

Sim, o tubarão usa a mesma ideia que a colmeia, mas traduz o Hiveql em trabalhos de faísca em vez de MapReduce Trabalhos.Por favor, leia as páginas 13-14 de este documento para diferenças arquitetônicas entre estes dois.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top