문제

널리 사용되는 프로그래밍 언어는 유니 코드 지원으로 설계 되었습니까?

많은 프로그래밍 언어가 이후 버전에서 나중에 고려한 유니 코드 지원을 추가했지만, 널리 사용되는 언어는 첫날부터 유니 코드 지원으로 출시 되었습니까?

도움이 되었습니까?

해결책

Java는 아마도 유니 코드 지원을받은 최초의 인기있는 언어 일 것입니다.

다른 팁

기본적으로 모든 .NET 언어는 유니 코드 언어입니다. 씨# 그리고 vb.net.

Python 3에는 많은 파손 변화가 있었고, 그중에는 전환이있었습니다. 모든 텍스트에 대한 유니 코드.

그래서 파이썬 유니 코드를위한 접지 설계는 아니지만 Python 3 였다.

나는 이것이 다른 언어로 얼마나 멀리 가는지 모르겠지만 C#에 대한 재미있는 것은 실행 시간 (그만큼 string 클래스 등) 유니 코드 인식 - 그러나 유니 코드는 소스에서 완전히 지원됩니다.

using משליט = System.Object;
using תוצאה = System.Int32;
public class שלום : משליט  {
    public תוצאה בית() {
        int אלף = 0;
        for (int λ = 0; λ < 20; λ++) אלף+=λ;
        return אלף;
    }
}

구글 프로그래밍 언어로 이동하십시오 유니 코드를 지원하고 UTF-8과 함께 작동합니다.

처음부터 프로그래밍 언어로 미래에 대한 유니 코드 지원을 설계하는 것은 실제로 어렵습니다.

Java는 이것을 언어 사양으로 설계 한 언어 중 하나입니다. 그러나 Java의 v1.0에서 유니 코드 지원 v5와 다릅니다 및 Java SDK의 V6. 이는 주로 언어가 원래 설계되었을 때 언어 사양이 제공 한 유니 코드 버전 때문입니다. Java는 모든 주요 릴리스마다 유니 코드 표준의 변경 사항을 추적하려고 시도합니다.

JLS의 초기 구현은 유니 코드 자체가 65536 자 (Java 지원 유니 코드 1.1 v1.0 및 Java V1.4 지원 유니 코드 3.0)를 지원했기 때문에 유니 코드 지원을 주장 할 수 있습니다. . 유니 코드 3.1로 변경되었습니다. 이는 진화하는 표준이며, 일반적으로 각 릴리스에서 더 많은 문자가 추가됩니다. 3.1에 나중에 추가 된 캐릭터가 호출되었습니다 보충 문자. 보충 문자에 대한 지원은 Java 5를 통해 추가되었습니다. JSR-204; Java 5 및 6 지원 유니 코드 4.0.

따라서 다른 프로그래밍 언어가 유니 코드 지원을 다르게 구현하는 경우 놀라지 마십시오.

반면에, PHP (!!)와 Ruby는 처음부터 유니 코드 지지대를 내장하지 않았습니다.

추신 : 유니 코드의 v5.1에 대한 지원은 Java 7.

Java의 문자열은 UCS 또는 UTF-8이 아닌 UTF-16이지만 Java와 .NET Languages는 지적했지만. (당시에는 현명한 아이디어처럼 보였습니다! 이제 분명히 UTF-8 또는 UCS가 더 좋을 것입니다.) 그리고 Python 3은 Python 1.X 및 2.X와 실제로 다르고 호환되지 않는 언어이므로 자격이 있습니다.

1992 년경에 Plan9 언어는 아마도이 작업을 가장 먼저 수행했을 것입니다. C의 방언. rc, Alef, mk, 산 등은 모두 유니 코드를 활성화시켰다. 그들은 ASCII가 아닌 모든 것이 식별자 캐릭터라는 매우 간단한 접근 방식을 취했습니다. 그들의보십시오 주제에 관한 1993 년의 논문. (이것은 UTF-8이 발명 된 프로젝트입니다. 즉, 특히 모든 프로그램을 통해 배관 바이너리-텍스트 없이는 매우 호환 가능한 방식으로이를 수행 할 수 있음을 의미했습니다.)

비 ASCII 식별자를 지원하는 다른 언어에는 현재 PHP가 포함됩니다.

Perl 6 처음부터 완전한 유니 코드 지원이 있습니다.
(이랑 Rakudo Perl 6 컴파일러 첫 번째 구현)

일반적인 개요

유니 코드 연산자

문자열, 정규 표현 및 문법은 모두 그래픽을 기반으로 작동하며, 조합 된 표현이없는 코드 포인트 조합에 대해서도 (이 경우 구성된 표현 인공 코드 포인트가 해당 경우에 따라 생성됩니다).

알 수없는 인코딩 "UTF8-C8"의 데이터를 처리하기위한 특수 인코딩이 존재합니다. 가능하면 UTF-8을 가정하지만 인코딩 할 수없는 시퀀스에 대한 인공 코드 포인트를 생성하여 필요한 경우 왕복을 만들 수 있습니다.

때로는 언어가 처음 설계되었을 때 언어에 포함 된 기능이 항상 최고는 아닙니다.

언어는 시간이 지남에 따라 바뀌었고 많은 사람들이 추가 기능으로 부풀어 오르면서 처음으로 포함 된 기능을 최신 상태로 유지하는 것은 아닙니다.

그래서 나는 당신이 최근에 유니 코드를 추가 한 언어를 반드시 할인해서는 안된다는 생각을 버려야합니다. 그들은 이미 성숙한 개발 도구에 유니 코드를 추가하고 처음으로 올바르게 할 수있는 기회를 얻는 이점이 있습니다.

이를 염두에두고 델파이가 귀하의 답변 중 하나로 여기에 포함되도록하고 싶습니다. Embarcadero는 Delphi 2009 버전에 유니 코드를 추가했으며 그에 대한 훌륭한 일을했습니다. 마침내 10 년 동안 사용해 왔던 델파이 4에서 업그레이드하도록 자극하는 것으로 충분했습니다.

Java는 유니 코드 문자 세트의 문자를 사용합니다.

Java 및 .NET 언어

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top