MapReduce ineficiente redutor
Pergunta
O que faria com apenas um único redutor em um MapReduce emprego além de todas as chaves de saída pela função de mapa a ser o mesmo?
Solução
Possíveis causas:
- O cluster ainda tem a configuração padrão de ter apenas 1 redutor (= valor-padrão).
- O código define explicitamente o valor a ser 1 redutor.
- Você está executando no modo de local (i.e.nenhum cluster em todos).
Citação de mapred-default.xml
<property>
<name>mapred.reduce.tasks</name>
<value>1</value>
<description>The default number of reduce tasks per job. Typically set to 99%
of the cluster's reduce capacity, so that if a node fails the reduces can
still be executed in a single wave.
Ignored when mapred.job.tracker is "local".
</description>
</property>
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow