Problem mit Codierung UTF-8, wenn FTPing Dateien
-
22-07-2019 - |
Frage
Ich bin der Lage, meine Anwendung Upload-Dateien per FTP haben die FtpClient Java-Bibliothek.
(ich zufällig auf ein Oracle XML DB Repository zu laden.)
Alles lädt fein, wenn die XML-Datei typografische Anführungszeichen in sich hat. In diesem Fall erhalte ich die Fehlermeldung: LPX-00200: konnte nicht konvertieren von kodieren UTF-8 in UCS2
kann ich hochladen, was ich glaube, die gleiche Datei mit dem Windows-CMD-Leitung FTP-Tool sein. Ich frage mich, ob es eine Codierung einstellen, dass das Windows CMD Zeilen-Tool verwendet, dass vielleicht brauche ich in meinem Java-Code zu setzen.
Wer weiß Zeug dazu? Dank !!
Lösung 3
In binären dieses Problem geht weg.
FTPClient.setType(FTPClient.TYPE_BINARY);
Andere Tipps
Ich weiß nicht, dass die Anwendung aber man könnte versuchen -Dfile.encoding verwenden = UTF-8 auf Ihrer JVM-Befehlszeile
Nicht vertraut mit Oracle XML DB-Repositorys-können sie komprimiert Uploads akzeptieren? Zippen oder Gzipping Dateien Ressourcen sparen würden und vereiteln im Einsatz beliebige ASCII-Dateityp der automatischen Erkennung.
Wenn Ihre Datei typografische Anführungszeichen enthält, sind sie in dem höherwertigen Bit eingestellten Bereich in iso-8859-1 und windows-1252-Zeichensätzen. In UTF-8, nehmen diese Zeichen in der Regel zwei Bytes in UTF-8.
Es ist durchaus möglich, dass Sie versehentlich die XML-Datei in einem dieser Codierungen anstelle von UTF-8 codiert haben. Dass in einem Umwandlungsfehler führen würde, weil das höchstwertige Bit gesetzt wird, nur in Sequenzen von mehrer UTF-8 Oktetts erlaubt.
Wenn Sie in Windows sind, öffnen Sie die Datei in Notepad und versuchen erneut Speichern des Dokuments mit Speichern unter ... mit dem UTF-8-Codierung, und laden Sie die geänderte Datei .. Unter Unix verwenden iconv oder ein ähnliches Tool zum konvertieren von iso-8859-1 auf UTF-8 vor dem Hochladen.
Wenn das XML-Dokument explizit seine Kodierung markiert, stellen Sie sicher, dass es mit der richtigen Codierung (z UTF-8) markiert ist. In vielen XML-Parser können Sie iso-8859-1 oder windows-1252 Zeichensatz codiert XML, solange es als solche gekennzeichnet.
analysieren