Frage

Ich versuche, eine Sequenzdatei zu streamen, die von einem der Mahout -Beispiele generiert wird, um ihren Inhalt zu sehen:

    hadoop jar hadoop-streaming-0.20.2-cdh3u0.jar \
    -input /tmp/mahout-work-me/20news-bydate/bayes-test-input-output/ \
    -output /tmp/me/mm \
    -mapper "cat" \
    -reducer "wc -l" \
    -inputformat SequenceFileAsTextInputFormat

Der Job beginnt erfolgreich und stirbt schließlich mit:

11/11/30 21:08:39 INFO streaming.StreamJob:  map 0%  reduce 0%
11/11/30 21:09:17 INFO streaming.StreamJob:  map 100%  reduce 100%
java.lang.RuntimeException: java.io.IOException: WritableName can't load class: org.apache.mahout.common.StringTuple

Ich frage mich, ob etwas mit meiner Streaming-JAR-Datei nicht stimmt, wenn ich explizit auf das Mahout-Glas mit dieser Klasse verweisen muss (versuchte, Hadoop_ClassPath an den Ort von Mahout-Core-0.5-CDH3U2.jar festzulegen, aber nicht funktioniert) oder nicht) oder nicht) oder nicht) oder nicht) oder) oder nicht) oder) oder nicht). Vielleicht noch etwas anderes?

Jede Hilfe wird geschätzt. Vielen Dank.

War es hilfreich?

Lösung

Fügen Sie diese Option hinzu:

-libjars mahout-core-0.5-cdh3u2.jar
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top