之间有什么区别的 Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, , ANSI 编码?

在什么方式是这些有用的程序员?

有帮助吗?

解决方案

下去你的清单:

  • "Unicode"不是一个编码,尽管不幸的是,很多文件没有准确地用来指无论Unicode编码,特别是系统使用的默认。在Windows和爪哇,这往往意味着UTF-16;在其他许多地方,这意味着UTF-8。当,Unicode指的是抽象的字符组本身,不以任何特定的编码。
  • UTF-16:2bytes per"代码单位"。这是当地格式的字符串中。网,并且通常在窗户和Java。值外 基本多语言面 (BMP)编码作为代理对。(这些都是比较少用,这是一个很好的工作,因为很少有开发人员得到他们的权利,我怀疑。我很怀疑,我做。)
  • UTF-8:变长编1至4的字节每码要点。ASCII值的编码作为ASCII使用1字节。
  • UTF-7:通常用于邮件编码。机会是如果你认为你需要它,你不做,你就错了。(这只是我的经验的人张贴在新闻组等-外面的邮件,这真的不是广泛使用的。)
  • UTF-32:固定的宽度编码使用4个字节每码要点。这不是很有效的,但是让生活更容易以外的BMP。我有一个.净 Utf32String 类作为一部分的我 MiscUtil 图书馆,你应该永远想要它。(它是不是已经非常彻底的测试,请注意。)
  • ASCII:单字节的编码只能使用底7位。(Unicode码0到127。) 没有口音等。
  • ANSI:有没有一个固定ANSI编码-有很多他们。通常,当人们说"ANSI"他们的意思是"默认区域/codepage对于我的系统",这是得到通过 编码。默认的, 和往往是 Windows-1252 但是可以有其他的选择。

还有更多 我Unicode页技巧的调试Unicode的问题.

其他大资源的代码是 unicode.org 其中包含更多的信息,比,你永远能够通过自己的方式工作,可能最有用的位是 代码表.

其他提示

一些阅读,让你开始对字符编码:乔尔的软件: 绝对最低每一个软件开发人员绝对,积极必须知道的关于Unicode和字符集(没有借口!)

顺便说一句 - ASP.NET无关吧。编码是通用的。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top