Question

Je ne connais pas très bien les choses de bas niveau, comme par exemple combien d'octets un personnage est. J'ai essayé de savoir si un caractère était égal à un octet, mais sans succès.

Je dois définir un délimiteur utilisé pour les connexions de socket entre un serveur et des clients. Ce délimiteur doit être aussi petit (en octets) que possible pour minimiser la bande passante.

Le délimiteur actuel est & "; # &"; Un autre délimiteur diminuerait-il ma bande passante?

Était-ce utile?

La solution

Cela dépend du codage de caractères que vous utilisez pour traduire entre les caractères et les octets (qui ne sont pas du tout la même chose):

  • En ASCII ou ISO 8859, chaque caractère est représenté par un octet
  • En UTF-32, chaque caractère est représenté par 4 octets
  • En UTF-8, chaque caractère utilise entre 1 et 4 octets
  • Dans l'ISO 2022, c'est beaucoup plus compliqué

Les caractères US-ASCII (dont # correspond à un) ne prendront qu’un octet en UTF-8, l’encodage le plus répandu qui autorise les caractères multi-octets.

Autres conseils

Cela dépend de l'encodage. Dans les jeux de caractères à un octet tels que ANSI et les divers jeux de caractères ISO8859, il s'agit d'un octet par caractère. Certains encodages tels que UTF8 ont une largeur variable où le nombre d'octets pour coder un caractère dépend du glyphe en cours de codage.

La réponse est bien sûr que cela dépend. Si vous êtes dans une env. ASCII pure, alors oui, chaque caractère prend 1 octet, mais si vous êtes dans une env. Unicode (tout Windows par exemple), la taille des caractères peut aller de 1 à 4 octets.

Si vous choisissez un caractère de l'ensemble ASCII, alors oui, votre délimiteur est aussi petit que possible.

Non, tous les caractères ont un octet, sauf si vous utilisez des caractères Unicode ou larges (pour les accents et autres symboles, par exemple).

Un caractère a une longueur de 1 octet ou 8 bits, ce qui donne 256 combinaisons possibles pour former des caractères. Les caractères sur 1 octets sont appelés caractères ASCII. Ils utilisent uniquement 7 bits (bien que 8 soient disponibles, mais vous ne pouvez pas utiliser ce 8ème bit) pour former l’alphabet standard et divers symboles utilisés lorsque les télétypes et les machines à écrire étaient encore courants.

Vous pouvez trouver un tableau ASCII et quels numéros correspondent aux caractères ici.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top