题
我对UNIX hexdump工具打。我的输入文件是UTF-8编码,包含单个字符ñ
,它是十六进制UTF-8 C3 B1
。
hexdump test.txt
0000000 b1c3
0000002
咦?这说明B1 C3
- 与我期望的相反!有人能解释一下吗?
有关得到预期的输出I做:
hexdump -C test.txt
00000000 c3 b1 |..|
00000002
我想我明白编码系统..
解决方案
这是因为hexdump都默认使用16位字和您是在小端架构上运行。因此,该字节序列b1 c3
被解释为十六进制字c3b1
。所述-C
选项强制进制打印工作与字节代替文字。
其他提示
我发现两种方法来避免:
hexdump -C file
或
od -tx1 < file
我认为这是愚蠢,hexdump都决定文件通常16位字小尾数。非常混乱IMO。
不隶属于 StackOverflow