Que linguagens de programação foram desenhados com suporte a Unicode desde o início?

https://stackoverflow.com/questions/1416215

06-07-2019
|

Pergunta

Que amplamente utilizado linguagens de programação foram projetados para atuar com suporte a Unicode?

Um monte de linguagens de programação têm adicionado o suporte a Unicode, como uma reflexão tardia em versões posteriores, mas que amplamente utilizado idiomas foram lançados com suporte a Unicode a partir do primeiro dia?

Solução

O Java foi provavelmente a primeira linguagem popular para ter raiz, suporte a Unicode.

Outras dicas

Basicamente todos os .A NET languages são idiomas Unicode, tais como C# e VB.NET.

Havia muitas alterações no Python 3, entre eles o interruptor para Unicode para todo o texto.

Então, Python não era concebido de raiz, para Unicode, mas Python 3 foi.

Eu não sei até que ponto isso vai em outras línguas, mas uma coisa divertida sobre o C# é que não só é o tempo de execução (o string classe etc) ciente de unicode - mas unicode é totalmente suportado na origem:

using משליט = System.Object;
using תוצאה = System.Int32;
public class שלום : משליט  {
    public תוצאה בית() {
        int אלף = 0;
        for (int λ = 0; λ < 20; λ++) אלף+=λ;
        return אלף;
    }
}

Google Linguagem de programação Go suporta Unicode e trabalha com a codificação UTF-8.

Realmente é difícil projetar o suporte Unicode para o futuro, em uma linguagem de programação desde o início.

Java é uma das linguagens que tinha este a especificação de linguagem.No entanto, o suporte a Unicode em v1.0 de Java é diferente do v5 e v6 do Java SDK.Isto é devido, principalmente, para a versão Unicode de que a especificação da linguagem atendidos, quando a linguagem foi originalmente projetado.Java tenta acompanhar as mudanças no padrão Unicode com todas as versões mais importantes.

Início de implementações do JLS poderia reivindicar o suporte a Unicode, principalmente porque Unicode si suportado 65536 caracteres (v1).0 de Java com suporte Unicode 1.1, Java e v1.4 com suporte Unicode 3.0), que foi compatível com o de 16 bits do espaço de armazenamento ocupado pelos personagens.Isso mudou com Unicode 3.1 - é um padrão em evolução, geralmente com mais caracteres ficar acrescentadas em cada versão.Os caracteres adicionados mais tarde em 3.1 foram chamados caracteres suplementares.Suporte para caracteres suplementares foram adicionados no Java 5 através de JSR-204;Java 5 e 6 de suporte Unicode 4.0.

Portanto, não se surpreenda se de diferentes linguagens de programação implementam suporte a Unicode de forma diferente.

Por outro lado, PHP(!!) e Ruby não tem suporte a Unicode incorporadas durante a criação.

PS:Suporte para v5.1 de Unicode é para ser feita em O Java 7.

Java e .NET idiomas, como outros comentadores têm apontado, embora Java cadeias UTF-16, em vez de UCS ou UTF-8.(Na época, parecia uma ideia sensata!Agora, claramente, tanto UTF-8 ou UCS seria melhor). E Python 3 é realmente diferente, incompatível linguagem do Python 1.x e 2.x, de modo que ele se qualifica também.

O Plan9 línguas ao redor de 1992, foram provavelmente os primeiros a fazer isso:seu dialeto de C, rc, Alef, mk, ÁCIDO, e assim por diante, todos estavam habilitados para Unicode.Eles tomaram a abordagem muito simples de que tudo que não era ASCII foi um identificador de caracteres.Consulte o seu papel de 1993 sobre o assunto. (Este é o projeto onde o UTF-8 foi inventado, o que significava que eles poderiam fazer isso em uma bonita forma compatível, em especial, sem encanamento binário versus texto através de todos os seus programas.)

Outras linguagens com suporte para não-ASCII identificadores incluem atual do PHP.

Perl 6 tem total suporte a unicode a partir do zero.
(Com o Rakudo Perl 6 compilador sendo a primeira implementação)

Visão geral

Unicode operadores

Cadeias de caracteres, expressões Regulares e gramáticas todos operam com base em grafemas, mesmo para aqueles codepoint combinação para a qual não existe composto por representação (um composto de representação artificial codepoint é gerado em tempo real para esses casos).

Uma codificação especial existe para lidar com dados do desconhecido "codificação utf8-c8":isso pressupõe utf-8 quando possível, mas cria artificial codepoints para unencodable sequências, permitindo-lhes a viagem de ida e volta, se necessário.

O Python 3.x: http://docs.python.org/dev/3.0/whatsnew/3.0.html

Às vezes, um recurso que foi incluído em um idioma quando ele foi projetado não é sempre o melhor.

Línguas mudaram ao longo do tempo e muitos tornaram-se inchados e com recursos extras, embora não necessariamente, manter-se atualizado com os recursos que ele incluída pela primeira vez.

Então, eu simplesmente jogar fora a ideia de que você não deve, necessariamente, desconto de idiomas que foram recentemente adicionados Unicode.Eles têm a vantagem de agregar Unicode para um já maduro ferramenta de desenvolvimento, e ter a chance de fazer certo da primeira vez.

Com isso em mente, eu gostaria de assegurar que o Delphi está incluído aqui, como uma das suas respostas.A Embarcadero adicionado Unicode em seu Delphi versão 2009 e fez um trabalho perfeito poderoso sobre ele.Foi o suficiente para finalmente pedir-me para actualizar a partir do Delphi 4 para que eu o estava usando para 10 anos.

Java utiliza caracteres do conjunto de caracteres Unicode.

e em java .a net languages

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow