Question

Je suis en cours d'exécution d'une série de substitutions regex (à savoir les appels String.replaceAll) pour convertir tous les caractères spéciaux dans un fichier texte au format XML analysables caractères spéciaux. Par exemple:

string_out = string_out.replaceAll("&", "&");

Je l'ai touché une pierre d'achoppement remplaçant le « caractère de section » qui est, ce petit gribouillis: §

Pour commencer, je fais mon édition en vi, donc je ne peux pas coller même le caractère là-dedans, étant pas membre de ascii standard ou étendu. Je ne vois pas spécifier par code hexadécimal dans le regex travail soit, pour la même raison.

Comment voulez-vous préciser ce caractère pour un substitut regex? Ou si vous voulez juste laisser tomber et me dire qu'il ya déjà une fonction à l'écart quelque part pour faire la conversion de caractères que je fais à la main, ce qui est cool aussi.

Était-ce utile?

La solution

Unicode: §
Hex:     0xA7
html:    §
name:    section sign

Vous pouvez le trouver dans le supplément latin-1.

Autres conseils

cant vous utilisez simplement le point de code unicode?

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top