Pergunta

O que faria com apenas um único redutor em um MapReduce emprego além de todas as chaves de saída pela função de mapa a ser o mesmo?

Foi útil?

Solução

Possíveis causas:

  1. O cluster ainda tem a configuração padrão de ter apenas 1 redutor (= valor-padrão).
  2. O código define explicitamente o valor a ser 1 redutor.
  3. Você está executando no modo de local (i.e.nenhum cluster em todos).

Citação de mapred-default.xml

<property>
  <name>mapred.reduce.tasks</name>
  <value>1</value>
  <description>The default number of reduce tasks per job. Typically set to 99%
  of the cluster's reduce capacity, so that if a node fails the reduces can 
  still be executed in a single wave.
  Ignored when mapred.job.tracker is "local".
  </description>
</property>
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top