UTF-8在Java ISO-8859-1的映射/无损改装库
-
23-09-2019 - |
题
我需要而不会失去例如所有的UTF-8特异性标点的从UTF-8执行字符的转换为ISO-8859-1在Java中。结果 理想的情况是希望这些在ISO转换为当量(例如有可能在UTF-8 5个不同单引号和希望他们全部被转换为ISO单引号字符)。
String.getBytes( “ISO-8859-1”)就不会达到目的在此情况下,因为它会失去UTF-8特异性字符。
你知道在Java中任何准备映射或库,将UTF-8特定字符映射到ISO的?
解决方案
IBM的 ICU 项目可能是你在找什么。它具有用于回退的转换的支持。
其他提示
你有没有使用一个OutputStream有一个明确的字符集ISO-8859-1的考虑?
然后只写你的Unicode字符,看看你会得到什么。
在Java开发工具包有一个工具叫native2ascii的,将做到这一点。使用:
native2ascii -encoding UTF-8 [ inputfile [ outputfile ] ]
您还可以使用-reverse选项回去的其他方式。
也可参见支持的编码的列表对于JDK 1.6 。
不隶属于 StackOverflow