JavaにUTF-8 BOMを追加する方法
-
10-10-2019 - |
質問
結果セットオブジェクトを使用してテーブルからレコードを取得し、CSVファイルを作成するJavaストアドプロシージャがあります。
BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION);
retBLOB.open(BLOB.MODE_READWRITE);
OutputStream bOut = retBLOB.setBinaryStream(0L);
ZipOutputStream zipOut = new ZipOutputStream(bOut);
PrintStream out = new PrintStream(zipOut,false,"UTF-8");
out.write('\ufeff');
out.flush();
zipOut.putNextEntry(new ZipEntry("filename.csv"));
while (rs.next()){
out.print("\"" + rs.getString(i) + "\"");
out.print(",");
}
out.flush();
zipOut.closeEntry();
zipOut.close();
retBLOB.close();
return retBLOB;
しかし、生成されたCSVファイルには、正しいドイツのキャラクターが表示されません。 Oracleデータベースには、UTF8のnls_characterset値もあります。
提案してください。
解決
UTF-8にBOMを書くには、必要です PrintStream.print()
, 、 いいえ PrintStream.write()
.
また、あなたがあなたにbomを持ちたいなら csv
ファイル、私はあなたが後にbomを印刷する必要があると思います putNextEntry()
.
他のヒント
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(...), StandardCharsets.UTF_8));
out.write('\ufeff');
out.write(...);
これにより、0xef 0xbb 0xbfをファイルに正しく書き込みます。これは、BOMのUTF-8表現です。
そうだと思います out.write('\ufeff');
実際にあるべきです out.print('\ufeff');
.
によると ジャバドック, 、 write(int)
メソッドは実際にバイトを書き込みます...文字エンコードなしで。それで out.write('\ufeff');
バイトを書きます 0xff
. 。対照的に、 print(char)
メソッドは、ストリームのエンコードを使用して1つまたはバイトとして文字をエンコードし、それらのバイトを書き込みます。
人々の場合に備えて それは 使用 PrintStream
S、少し違った方法で行う必要があります。 a Writer
単一のバイトを3バイトに変換するために魔法を行います。 PrintStream
UTF-8 BOMの3バイトすべてが個別に必要です。
// Print utf-8 BOM
PrintStream out = System.out;
out.write('\ufeef'); // emits 0xef
out.write('\ufebb'); // emits 0xbb
out.write('\ufebf'); // emits 0xbf
または、それらに直接ヘックス値を使用することもできます。
PrintStream out = System.out;
out.write(0xef); // emits 0xef
out.write(0xbb); // emits 0xbb
out.write(0xbf); // emits 0xbf
私の場合、コードで動作します。
PrintWriter out = new PrintWriter(new File(filePath), "UTF-8");
out.write(csvContent);
out.flush();
out.close();