.NET 2.0 - Tokenizzazione del testo separato da spazi
-
19-08-2019 - |
Domanda
Supponi di avere un output del genere:
Word1 Word2 Word3 Word4
Dove il numero di spazi tra le parole è arbitrario. Voglio dividerlo in una serie di parole.
Ho usato il seguente codice:
string[] tokens =
new List<String>(input.Split(' '))
.FindAll
(
delegate(string token)
{
return token != String.Empty;
}
).ToArray();
Non esattamente efficiente, ma fa bene il lavoro.
Come lo faresti?
Soluzione
Cita già string.Split (). Quello che manca è StringSplitOptions.RemoveEmptyEntries:
string[] tokens = input.Split(new char[] { ' ' },
StringSplitOptions.RemoveEmptyEntries);
Altri suggerimenti
Userei un regex per la divisione con " \ w + " per il modello.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow