Frage

Welches weit verbreitete Programmiersprachen wurden entwickelt, Boden-up mit Unicode-Unterstützung?

Viele Programmiersprachen haben Unicode-Unterstützung als nachträglichen Einfall in späteren Versionen hinzugefügt, aber die verbreiteten Sprachen wurden mit Unicode-Unterstützung vom ersten Tag veröffentlicht?

War es hilfreich?

Lösung

Java war wahrscheinlich die erste populäre Sprache Grund auf Unicode-Unterstützung zu haben.

Andere Tipps

Im Grunde alle der .NET-Sprachen sind Unicode-Sprachen, wie zum Beispiel C # und VB.NET .

Es gibt in Python viele Bruch Veränderungen waren drei, darunter der Schalter auf Unicode für den gesamten Text .

So Python wurde nicht entwickelt Boden-up für Unicode, aber Python 3 war.

Ich weiß nicht, wie weit diese in anderen Sprachen geht, aber eine Spaßsache über C # ist, dass nicht nur der Laufzeit (die string Klasse usw.) Unicode bewusst - aber Unicode vollständig unterstützt in Quelle:

using משליט = System.Object;
using תוצאה = System.Int32;
public class שלום : משליט  {
    public תוצאה בית() {
        int אלף = 0;
        for (int λ = 0; λ < 20; λ++) אלף+=λ;
        return אלף;
    }
}

Google Programmiersprache Go unterstützt Unicode und arbeitet mit UTF-8.

Es ist wirklich schwierig, Unicode-Unterstützung für die Zukunft zu entwerfen, in einer Programmiersprache von Anfang an.

Java ist eine eine der Sprachen, die diese in die Sprachspezifikation entwickelt hatte. Allerdings Unicode-Unterstützung in Version 1.0 von Java ist anders von v5 und v6 des Java SDK. Dies ist vor allem auf die Version von Unicode, dass die Sprachspezifikation kümmerte sich um, wenn die Sprache wurde ursprünglich entworfen. Java versucht mit allen wichtigen Release Änderungen in dem Unicode-Standard zu verfolgen.

Frühe Implementierungen des JLS könnten behaupten, Unicode-Unterstützung, in erster Linie, weil Unicode selbst 65.536 Zeichen unterstützt (v1.0 von Java unterstützt Unicode 1.1 und Java v1.4 unterstützt Unicode 3.0), die mit dem 16-Bit-Speicherraum kompatibel waren genommen up von Zeichen. Das änderte sich mit Unicode 3.1 - Es ist ein neuer Standard, in der Regel mit mehr Zeichen in jeder Version hinzugefügt zu werden. Die Charaktere hinzugefügt später in 3.1 genannt wurden zusätzliche Zeichen . Unterstützung für zusätzliche Zeichen wurden in Java 5 über JSR-204 hinzugefügt; Java 5 und 6 Unterstützung Unicode 4.0.

Daher seien Sie nicht überrascht sein, wenn verschiedene Programmiersprachen Unicode implementieren Unterstützung anders.

Auf der anderen Seite, PHP (!!) und Ruby nicht Unicode-Unterstützung in sich während der Gründung gebaut hat.

PS: Unterstützung für v5.1 von Unicode ist gemacht werden in Java 7 .

Java und .NET-Sprachen, wie andere Kommentatoren haben darauf hingewiesen, obwohl Java Strings sind UTF-16 eher als UCS oder UTF-8. (Damals schien es wie eine vernünftige Idee! Jetzt eindeutig entweder UTF-8 oder UCS wäre besser.) Und Python 3 ist wirklich eine andere, inkompatible Sprache aus Python 1.x und 2.x, so qualifiziert sie auch.

Die Plan9 Sprachen etwa 1992 waren wahrscheinlich die erste, dies zu tun: ihre Dialekt C, rc, Alef, mk, ACID, und so weiter, waren alle Unicode-fähig. Sie nahmen den sehr einfachen Ansatz, dass alles, was nicht ASCII war, war eine Kennung Charakter. Sehen Sie die Papier von 1993 auf Gegenstand. (Dies ist das Projekt, in dem UTF-8 erfunden wurde, was bedeutete, dass sie dies in eine ziemlich kompatibel Weise tun könnten, insbesondere ohne Sanitär-binary-versus-Text durch all ihre Programme.)

Andere Sprachen, die Nicht-ASCII-Identifikatoren enthalten aktuellen PHP unterstützen.

Perl 6 hat die vollständige Unicode-Unterstützung von Grund auf neu.
(Mit dem Rakudo Perl 6-Compiler die erste Implementierung ist)

Allgemeine Übersicht

Unicode Operatoren

Streicher, Reguläre Ausdrücke und Grammatiken alle auf Grapheme arbeiten auf der Grundlage, auch für diejenigen Codepoint Kombination für die es keine zusammengesetzte Darstellung ist (eine zusammengesetzte Darstellung künstliche Codepunkt für jene Fälle, on the fly erzeugt wird).

Eine spezielle Codierung existiert Daten unbekannte Codierung „UTF-8-c8“ zu behandeln: die UTF-8 übernimmt dann möglich, wenn, aber schafft künstliche Codepoints für unencodable Sequenzen, so dass sie notwendig, um Roundtrip wenn

.

Manchmal ist eine Funktion, die in einer Sprache enthalten war, als es zuerst ist entworfen nicht immer die beste.

Sprachen haben sich im Laufe der Zeit verändert, und viele haben aufgebläht mit zusätzlichen Funktionen werden, während nicht unbedingt up-to-date mit den Merkmalen halten es zuerst enthalten.

Also habe ich nur die Idee werfen, die Sie nicht unbedingt Sprache diskontieren sollen, die Unicode vor kurzem hinzugefügt hat. Sie haben den Vorteil, dass Unicode das Hinzufügen zu einem bereits ausgereiften Entwicklungswerkzeug, und bekam die Chance, es richtig das erste Mal zu tun.

, die mit im Auge, ich will, um sicherzustellen, dass Delphi hier enthalten ist, als eine Ihrer Antworten. Embarcadero hinzugefügt Unicode in ihrer Delphi 2009 Version und hat eine mächtigen feine Arbeit geleistet. Es war genug, um mich endlich prompt von der Delphi aktualisieren 4, die ich seit 10 Jahren verwendet hatte.

Java verwendet Zeichen aus dem Unicode-Zeichensatz.

Java- und .NET-Sprachen

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top