Frage

Ich bin der Lage, meine Anwendung Upload-Dateien per FTP haben die FtpClient Java-Bibliothek.

(ich zufällig auf ein Oracle XML DB Repository zu laden.)

Alles lädt fein, wenn die XML-Datei typografische Anführungszeichen in sich hat. In diesem Fall erhalte ich die Fehlermeldung: LPX-00200: konnte nicht konvertieren von kodieren UTF-8 in UCS2

kann ich hochladen, was ich glaube, die gleiche Datei mit dem Windows-CMD-Leitung FTP-Tool sein. Ich frage mich, ob es eine Codierung einstellen, dass das Windows CMD Zeilen-Tool verwendet, dass vielleicht brauche ich in meinem Java-Code zu setzen.

Wer weiß Zeug dazu? Dank !!

War es hilfreich?

Lösung 3

In binären dieses Problem geht weg.

FTPClient.setType(FTPClient.TYPE_BINARY);

http://www.sauronsoftware.it/projects/ftp4j/manual .php # 3

Andere Tipps

Ich weiß nicht, dass die Anwendung aber man könnte versuchen -Dfile.encoding verwenden = UTF-8 auf Ihrer JVM-Befehlszeile

Nicht vertraut mit Oracle XML DB-Repositorys-können sie komprimiert Uploads akzeptieren? Zippen oder Gzipping Dateien Ressourcen sparen würden und vereiteln im Einsatz beliebige ASCII-Dateityp der automatischen Erkennung.

Wenn Ihre Datei typografische Anführungszeichen enthält, sind sie in dem höherwertigen Bit eingestellten Bereich in iso-8859-1 und windows-1252-Zeichensätzen. In UTF-8, nehmen diese Zeichen in der Regel zwei Bytes in UTF-8.

Es ist durchaus möglich, dass Sie versehentlich die XML-Datei in einem dieser Codierungen anstelle von UTF-8 codiert haben. Dass in einem Umwandlungsfehler führen würde, weil das höchstwertige Bit gesetzt wird, nur in Sequenzen von mehrer UTF-8 Oktetts erlaubt.

Wenn Sie in Windows sind, öffnen Sie die Datei in Notepad und versuchen erneut Speichern des Dokuments mit Speichern unter ... mit dem UTF-8-Codierung, und laden Sie die geänderte Datei .. Unter Unix verwenden iconv oder ein ähnliches Tool zum konvertieren von iso-8859-1 auf UTF-8 vor dem Hochladen.

Wenn das XML-Dokument explizit seine Kodierung markiert, stellen Sie sicher, dass es mit der richtigen Codierung (z UTF-8) markiert ist. In vielen XML-Parser können Sie iso-8859-1 oder windows-1252 Zeichensatz codiert XML, solange es als solche gekennzeichnet.

analysieren
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top