C # Regex Split to Java Pattern split
Domanda
Devo portare un po 'di codice C # su Java e ho qualche problema a convertire un comando di suddivisione delle stringhe.
Mentre il regex effettivo è ancora corretto, quando si divide in C # i token regex fanno parte della stringa risultante [], ma in Java i token regex vengono rimossi.
Qual è il modo più semplice per conservare i token divisi?
Ecco un esempio di codice C # che funziona nel modo in cui lo voglio:
using System;
using System.Text.RegularExpressions;
class Program
{
static void Main()
{
String[] values = Regex.Split("5+10", @"([\+\-\*\(\)\^\\/])");
foreach (String value in values)
Console.WriteLine(value);
}
}
Produces:
5
+
10
Soluzione
Non so come lo fa C #, ma per realizzarlo in Java, dovrai approssimarlo. Guarda come questo codice lo fa:
public String[] split(String text) {
if (text == null) {
text = "";
}
int last_match = 0;
LinkedList<String> splitted = new LinkedList<String>();
Matcher m = this.pattern.matcher(text);
// Iterate trough each match
while (m.find()) {
// Text since last match
splitted.add(text.substring(last_match,m.start()));
// The delimiter itself
if (this.keep_delimiters) {
splitted.add(m.group());
}
last_match = m.end();
}
// Trailing text
splitted.add(text.substring(last_match));
return splitted.toArray(new String[splitted.size()]);
}
Altri suggerimenti
Questo perché stai acquisendo il token diviso. C # prende questo come suggerimento per voler conservare il token stesso come membro dell'array risultante. Java non supporta questo.