Tokenizador de cuerdas en Java ofrece una salida incorrecta.Necesita ayuda (probablemente una solución fácil)
-
21-12-2019 - |
Pregunta
Mi código es básicamente para encontrar el número de palabras en una cadena (sí, realmente simple, pero no está funcionando). He intentado múltiples métodos y he intentado alterar el código varias veces. ¿Alguien puede explicar a mi por qué este código no funciona y si es posible darme un mejor / código de trabajo?
StringTokenizer stspace = new StringTokenizer(sent, " .?");
int nTokenSpace = stspace.countTokens();
String mspace[] = new String[nTokenSpace];
for(int i=0;i<nTokenSpace;i++)
{
mspace[i] = stspace.nextToken();
}
for(int i=0;i<nToken;i++)
{
String k = mspace[i];
int freq = 0;
for(int x=0;x<nTokenSpace;x++)
{
if(k==mspace[x])
{
freq++;
}
}
System.out.println(k+"\t"+freq);
}
La salida requerida para "My. Nombre. Es. ANON. Es. Anon".debe ser
My 1
Name 1
Is 2
Anon 2
But I get
My 1
Name 1
Is 1
Anon 1
Is 1
Anon 1
Tengo la sensación de que hay un error obvio aquí, pero simplemente no lo veo (necesito nuevos ojos>.>)
Solución
Su error está aquí:
if(k==mspace[x])
Necesitas usar
if (k.equals(mspace[x]))
para comparar String
s.
Si no desea los duplicados en la salida, puede agregar sus fichas a un Set
antes del bucle:
Set<String> uniqueTokens = new LinkedHashSet<String>(Arrays.asList(mspace));
for (String k : uniqueTokens) {
int freq = 0;
for (int x = 0; x < nTokenSpace; x++) {
if (k.equals(mspace[x])) {
freq++;
}
}
System.out.println(k + "\t" + freq);
}
Otros consejos
Comparación de cadenas
reemplazar
if(k==mspace[x])
{
freq++;
}
con
if(k.equals(mspace[x]))
{
freq++;
}
Tienes esta línea:
if(k==mspace[x])
Esto significa que comparas dos objetos y tienen que ser exactamente la misma referencia en la memoria, no es idéntica.Lo que estás buscando es dos objetos idénticos.Para hacer eso, tiene que comparar objetos con .equals(Object)
.
if (k.equals(mspace[x]))
Solo para agregar a las otras respuestas aquí, creo que también necesita eliminar duplicados de la lista o sus resultados serán como:
My 1
Name 1
Is 2
Anon 2
Is 2
Anon 2
Entonces, su bloque IF debe ser:
for(int i=0;i<nToken;i++)
{
String k = mspace[i];
if (k.equals(""))
continue;
int freq = 0;
for(int x=0;x<nTokenSpace;x++)
{
if(k.equals(mspace[x]) )
{
freq++;
mspace[x] = "";
}
}
System.out.println(k+"\t"+freq);
}
¿Por qué no usas clases de colección?Aquí está el código.
import java.io.*;
import java.util.*;
public class HelloWorld{
public static void main(String []args)
{
String givenstring="My. Name. Is. Anon. Is. Anon.";
String[] words=givenstring.split(" ");
ArrayList<String> arr=new ArrayList<String>();
for(int i=0;i<words.length;i++)
arr.add(words[i]);
while(arr.size()!=0)
{
String word=arr.get(0);
int frequency=Collections.frequency(arr,word);
arr.removeAll(Collections.singleton(word));
System.out.println(word+frequency);
}
}
}
Espero que ayude ..