Java Unicode Regular Expression
-
04-10-2019 - |
Frage
Ich habe einen Text wie diesen.
Every person haveue280 sumue340 ambition
Ich mag ersetzen UE280, ue340 zu \ UE280, \ ue340 mit regulärem Ausdruck
Gibt es eine Lösung
Vielen Dank im Voraus
Lösung
So etwas wie das?
String s = "Every person haveue280 sumue340 ambition";
// Put a backslash in front of all all "u" followed by 4 hexadecimal digits
s = s.replaceAll("u\\p{XDigit}{4}", "\\\\$0");
was in
Every person have\ue280 sum\ue340 ambition
Nicht sicher, was Sie nach, aber vielleicht ist es so etwas wie folgt aus:
static String toUnicode(String s) {
Matcher m = Pattern.compile("u(\\p{XDigit}{4})").matcher(s);
StringBuffer buf = new StringBuffer();
while(m.find())
m.appendReplacement(buf, "" + (char) Integer.parseInt(m.group(1), 16));
m.appendTail(buf);
return buf.toString();
}
(Stand nach axtavt sehr schöner Alternative. CW zu machen.)
Andere Tipps
Bessere Version aioobe den Update:
String in = "Every person haveue280 sumue340 ambition";
Pattern p = Pattern.compile("u(\\p{XDigit}{4})");
Matcher m = p.matcher(in);
StringBuffer buf = new StringBuffer();
while(m.find())
m.appendReplacement(buf, "" + (char) Integer.parseInt(m.group(1), 16));
m.appendTail(buf);
String out = buf.toString();
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow