문제

The의 차이점은 무엇입니까? Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, 그리고 ANSI 인코딩?

프로그래머에게 어떤 방법으로 도움이됩니까?

도움이 되었습니까?

해결책

목록을 내려 가기 :

  • "유니 코드"불행히도 많은 문서화가 부적절하게 사용하여 특정 시스템을 기본적으로 인코딩하는 유니 코드를 참조하는 데 부적절하게 사용됩니다. Windows와 Java에서는 종종 UTF-16을 의미합니다. 다른 많은 곳에서는 UTF를 의미합니다. -8. 적절하게, 유니 코드는 특정 인코딩이 아니라 추상 문자 세트 자체를 나타냅니다.
  • UTF-16: "코드 단위"당 2 바이트. 이것은 .NET, 일반적으로 Windows 및 Java의 원본 형식입니다. 외부의 값 기본 다국어 평면 (BMP)는 대리 쌍으로 인코딩됩니다. (이것들은 상대적으로 거의 사용되지 않습니다. 이것은 좋은 일입니다. 개발자가 제대로 얻는 사람이 거의 없기 때문에 나는 의심 스럽다. 나는 의심의 여지가있다.)
  • UTF-8: 가변 길이 인코딩, 코드 포인트 당 1-4 바이트. ASCII 값은 1 바이트를 사용하여 ASCII로 인코딩됩니다.
  • UTF-7: 일반적으로 메일 인코딩에 사용됩니다. 당신이 필요하다고 생각하고 우편물을하고 있지 않다면, 당신은 틀 렸습니다. (이것은 뉴스 그룹 등에 게시하는 사람들에 대한 나의 경험 일뿐입니다 - 외부 우편물은 실제로 널리 사용되지 않습니다.)
  • UTF-32: 코드 포인트 당 4 바이트를 사용하여 폭을 인코딩했습니다. 이것은 그다지 효율적이지 않지만 BMP 외부의 삶을 더 쉽게 만듭니다. .NET가 있습니다 Utf32String 내 일부로 수업 오해 도서관, 당신이 그것을 원한다면. (매우 철저히 테스트되지 않았습니다.)
  • ASCII: 단일 바이트 인코딩은 하단 7 비트를 사용하여 만 인코딩합니다. (유니 코드 코드 포인트 0-127.) 악센트 등이 없습니다.
  • ANSI : 고정 된 ANSI 인코딩은 아무도 없습니다. 많은 것들이 있습니다. 일반적으로 사람들이 "ANSI"라고 말할 때, 그들은 "내 시스템의 기본 로케일/코드 페지"를 의미합니다. encoding.default, 그리고 종종 Windows-1252 그러나 다른 지역 일 수 있습니다.

더 많은 것이 있습니다 내 유니 코드 페이지 그리고 유니 코드 문제를 디버깅하기위한 팁.

코드의 다른 큰 리소스는입니다 unicode.org 당신이 당신의 길을 따라 갈 수있는 것보다 더 많은 정보를 포함하는 것 - 아마도 가장 유용한 비트는 코드 차트.

다른 팁

캐릭터 인코딩을 시작하기위한 일부 독서 : Joel on Software : 절대적 최소 모든 소프트웨어 개발자는 절대적으로, 유니 코드 및 문자 세트에 대해 긍정적으로 알아야합니다 (변명 없음!)

그건 그렇고 -ASP.NET은 그것과 아무 관련이 없습니다. 인코딩은 보편적입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top