Domanda

Sto scrivendo un articolo su Unicode e discutere i vantaggi di questo schema di codifica rispetto ai metodi obsoleti come ASCII.

Come parte della mia ricerca sto cercando un riferimento che ha elencato le lingue che possono essere pienamente rappresentati utilizzando solo i caratteri supportati da ASCII. Non hanno avuto molta fortuna monitoraggio giù con Google e ho pensato di toccare la conoscenza collettiva di SO per vedere se qualcuno aveva un elenco ragionevole.

Punti chiave:

  • Tutte le lingue elencate devono essere in grado di essere completamente rappresentato utilizzando il set di caratteri disponibili in ASCII.
  • So che questo non sarà completo, ma sono per lo più interessato al più comuni lingue scritte.
È stato utile?

Soluzione

Non ci sono linguaggi naturali, che io sappia che può essere pienamente rappresentati in ASCII. Anche l'inglese americano, la lingua per la quale è stato inventato ASCII, non funziona: per uno, ci sono un sacco di parole straniere che sono state integrate nella lingua inglese americano che non può essere rappresentato in ASCII, come Riprendi , ingenuo o una parola che probabilmente ogni programmatore utilizza regolarmente, schönfinkeln .

E due, ASCII manca praticamente tutti i caratteri tipografici come “virgolette”, trattini di varie lunghezze (- e -), puntini di sospensione (...), spazi sottili e larghi e così via, che sono tutti utilizzati in America inglese.

Altri suggerimenti

parole finanziamento concesso, non credo che ci sono qualsiasi di tali lingue. Anche brutti americani conoscono la differenza tra "curriculum" e "curriculum".

IIRC dalle mie lezioni di latino, i macron in latino sono aggiunte successive da parte di persone che studiano metri di poesia latina; non sarebbero stati utilizzati nella scrittura di tutti i giorni. Così hai Latina.

Presumo si intende lingue naturali e solo 7 bit ASCII?

In questo caso la lista è abbastanza piccola. Per lo più inglese.

costruiti come interlingua e Ido sono progettati per utilizzare solo caratteri ASCII. lingue ‘reale’ di uso quotidiano tendono ad utilizzare i caratteri di fuori della gamma ASCII, per lo meno per i prestiti linguistici.

Non è un linguaggio ampiamente utilizzato, ma Rotokas può essere scritta utilizzando solo caratteri ASCII. Vedere http://en.wikipedia.org/wiki/Rotokas_alphabet

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top