Mapreduce riduttore inefficiente
Domanda
Cosa causerebbe solo un singolo riduttore in un lavoro di MapreDuce a parte tutti gli output dei tasti dalla funzione della mappa è la stessa?
Soluzione
Possibili cause:
- .
- Il tuo cluster ha ancora l'impostazione predefinita di avere solo 1 riduttore (= valore predefinito).
- Il tuo codice imposta esplicitamente il valore per essere 1 riduttore.
- Si è in esecuzione in modalità locale (cioè nessun cluster).
citazione da Mapred-default.xml
.<property> <name>mapred.reduce.tasks</name> <value>1</value> <description>The default number of reduce tasks per job. Typically set to 99% of the cluster's reduce capacity, so that if a node fails the reduces can still be executed in a single wave. Ignored when mapred.job.tracker is "local". </description> </property>
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow