Es kann keine Verbindung zu HDFs mit PDI-Schritt hergestellt werden
-
21-12-2019 - |
Frage
Ich habe hadoop 2.4 in einem ubuntu 14.04 vm von einem
Also, mein Hostname lautet: Ubuntu und HDFS-Port: 9000 (korrigieren Sie mich, wenn ich falsch liege).
core-site.xml:
generasacodicetagpre. Das Problem ist bei der Verbindung mit HDFs von meinem PentAho Data Integration-Tool.Angehängte Bild unten.
Bitte helfen Sie mir bitte, mit PDI mit HDFs herzustellen.Muss ich dieses Jar dafür installieren oder aktualisieren?Bitte lassen Sie mich wissen, falls Sie weitere Informationen benötigen.
Lösung
pdi 4.4 AFAIK hat keine Unterstützung für Hadoop 2.4.In jedem Fall gibt es eine Eigenschaft in einer Datei, in der Sie einstellen müssen, um eine bestimmte Hadoop-Konfiguration zu verwenden (Sie können "Hadoop-Konfiguration" sehen, die als "Shim" in den Foren usw. bezeichnet wird).In der Datei Datenintegration / Plugins / Pentaho-Big-Data-Plugin / Plugin.Properties-Datei gibt es eine Eigenschaft namens active.hadoop.configuration, es ist standardmäßig auf "Hatoop-20" festgelegt, der sich auf einen Apache hatte Hadoop 0.20 bezieht.x Distribution.Sie möchten es auf die "neueste" Distribution einstellen, die mit Pentaho geliefert oder Ihre eigene Shim baut, wie in meinem Blog-Beitrag beschrieben, der beschrieben:
http://funpdi.blogspot.COM / 2013/03 / Pentaho-Data-Integration-44-and-hadoop.html
Aufsteher Versionen (5.2+) von PDI werden Lieferantenverteilungen unterstützen, die Hatoop 2.4+ enthalten, also auf dem PDI-Marktplatz und auf Pentaho.com:)