Frage

Ich baue eine Hadoop (0.20.1) mapreduce Job, HBase (0.20.1), da sowohl die Datenquelle und Datensenke verwendet. Ich möchte den Job in Python schreiben, die mir verlangt hat Hadoop-0.20.1-streaming.jar zu verwenden, um Daten zu streamen zu und von meinem Python-Skripten. Dies funktioniert gut, wenn die Daten-Quelle / Senke sind HDFS-Dateien.

unterstützt Hadoop Streaming von / bis HBase für mapreduce?

War es hilfreich?

Lösung

Dies scheint zu tun, was ich will, aber es ist nicht die Hadoop Distribution Teil. Alle anderen Vorschläge oder Kommentare nach wie vor willkommen.

http://github.com/wanpark/hadoop-hbase-streaming

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top