문제

"고급 ASCII" 또는 "확장 ASCII" 문자를 참조하는 기술적으로 올바른 방법은 무엇입니까?128-255 범위뿐만 아니라 0-127 범위를 넘어서는 모든 문자를 의미합니다.

종종 발음 구별 부호, 악센트 문자라고 불리며 때로는 "국가" 문자 또는 영어가 아닌 문자라고도 하지만 이러한 이름은 부정확하거나 가능한 문자의 하위 집합만 포함합니다.

프로그래머가 즉시 인식할 수 있는 정확하고 정확한 용어는 무엇입니까?기술적인 지식이 없는 청중과 대화할 때 사용하는 가장 좋은 영어 용어는 무엇입니까?

도움이 되었습니까?

해결책

"비 ASCII 캐릭터"

다른 팁

127 이상의 ASCII 문자 코드는 정의되지 않습니다. 많은 다른 장비와 소프트웨어 공급 업체는 값 128-255에 대한 자체 캐릭터 세트를 개발했습니다. 일부는 그리기 기호를 선택하고, SONE Accent 캐릭터를 선택하고, 다른 문자를 선택합니다.

유니 코드는 대부분의 언어로 사용되는 문자를 포함하는 보편적 인 문자 코드 세트를 만들기위한 시도입니다. 여기에는 전통적인 서부 알파벳뿐만 아니라 키릴, 아랍어, 그리스, 심지어 중국어, 일본어 및 한국의 큰 캐릭터와 현대와 고대의 다른 많은 언어가 포함됩니다.

유니 코드의 여러 구현이 있습니다. UTF-8이면 가장 인기있는 것 중 하나입니다. 그 인기의 주요 이유는 ASCII와 거꾸로 호환되기 때문입니다. 캐릭터 코드 0에서 127은 ASCII 및 UTF-8에 대해 동일합니다.

즉, ASCII가 UTF-8의 서브 세트라고 말하는 것이 좋습니다. 문자 코드 128 이상은 ASCII가 아닙니다. UTF-8 (또는 기타 유니 코드) 일 수도 있고 하드웨어 또는 소프트웨어 공급 업체가 사용자 정의 구현 일 수 있습니다.

“트랜스 아스시피”,“아스마 아스시”,“울트라 아스마”등과 같은 용어를 만들 수 있습니다.

"높은 ASCII"라고 말하면, 당신은 정의에 따라 128-255 소수점입니다. ASCII 자체는 1 바이트 (실제로 7 비트) 문자 표현으로 정의됩니다. 영어 이외의 문자를 허용하기 위해 높은 비트를 사용하는 것은 나중에 발생했으며 특정 값으로 표시되는 특정 문자를 정의하는 코드 페이지를 일으켰습니다. 모든 멀티 바이트 (> 255 소수점 값)는 ASCII가 아닙니다.

ASCII 문자를 나타내지 않는 비트 시퀀스는 확실히 유니코드 문자가 아닙니다.

사용 중인 문자 인코딩에 따라 다음 중 하나일 수 있습니다.

  • 잘못된 비트 시퀀스
  • 유니코드 문자
  • ISO-8859-x 문자
  • Microsoft 1252 문자
  • 다른 문자 인코딩의 문자
  • 버그, 바이너리 데이터 등

이러한 모든 상황에 적합한 한 가지 정의는 다음과 같습니다.

  • ASCII 문자가 아님

매우 현학적으로 말하자면, "ASCII가 아닌 문자"라도 이러한 모든 상황에 정확히 맞지는 않습니다. 왜냐하면 때때로 이 범위 밖의 비트 시퀀스는 단순히 문자가 아닌 잘못된 비트 시퀀스일 수 있기 때문입니다.

"확장 ASCII"는 내가 사용하는 용어입니다. "원래 0-127 이외의 문자"를 의미합니다.

유니 코드는 확장 된 ASCII 문자 중 하나이며 상당히 큽니다.

UTF-8은 원래 ASCII와 뒤로 호환되는 유니 코드 문자를 나타내는 방법입니다.

온라인 리소스에서 찍은 단어 (그래도 멋진 웹 사이트) 쓰고 대답하는 것이 유용하고 적절하다고 생각했기 때문입니다.

처음에는 대문자와 숫자 만 포함되었지만 1967 년에는 소문자와 일부 제어 캐릭터가 추가되어 미국 ASCII로 알려진 것을 형성했습니다. 즉, 캐릭터 0 ~ 127 개.이 128 자만으로는 1967 년에 128 자만 출판되었습니다. 표준으로 영어로 작성하는 데 필요한 모든 것을 포함합니다.

1981 년에 IBM은 "Code Page 437"이라는 8 비트 ASCII 코드의 확장을 개발했으며,이 버전에서 그래픽 문자에 대한 쓸모없는 제어 문자를 대체했습니다. 또한 새로운 기호, 표지판, 그래픽 및 라틴 문자로 128자가 추가되었습니다. 스페인어와 같은 다른 언어로 텍스트를 작성하는 데 필요한 모든 구두점 표시 및 문자가 추가되었습니다. 이런 식으로 128에서 255 사이의 ASCII 문자가 추가되었습니다.

IBM에는 최초의 개인용 컴퓨터로 간주되는 "IBM-PC"로 알려진 모델 5150의 하드웨어 에서이 코드 페이지에 대한 지원이 포함되어 있습니다. 이 모델의 운영 체제 인 "MS-DOS"는이 확장 된 ASCII 코드를 사용했습니다.

비 ASCII 유니 코드 문자.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top