Índice Partiendo de texto proceso en C # o Ruby
Pregunta
Teniendo en cuenta este texto:
"Los amigos son amistosos más amigables que son amables y clasifican a la clase de la clasificación de usar. Floridas flores fluyen a través de la siguiente flor de flujos"
necesito para solicitar derivada al texto para lograr los siguientes resultados:
frequency("following") = 1
frequency("flow") = 2
frequency("classification") = 1
frequency("class") = 1
frequency("flower") = 3
frequency("friend") = 4
frequency("friendly") = 4
frequency("classes") = 1
A medida que la interfaz con el motor de búsqueda de FAST. indexa contenido ayuno para proporcionar resultados relevantes a una consulta. Un aspecto de la indexación se despalillado y tenemos que utilizar C # o rubí para resolver esto.
apreciarían puntos de vista de cualquier persona en el mejor enfoque
Solución
public StemmingProcessorResults ProcessText(string text)
{
return new StemmingProcessorResults(
new []{
new StemmingProcessorResultItem("following", 1),
new StemmingProcessorResultItem("flow", 2),
new StemmingProcessorResultItem("classification", 1),
new StemmingProcessorResultItem("class", 1),
new StemmingProcessorResultItem("flower", 3),
new StemmingProcessorResultItem("friend", 4),
new StemmingProcessorResultItem("friendly", 4),
new StemmingProcessorResultItem("classes", 1)
}
);
}
Hay que ir, que debe ser perfecto para sus necesidades de copiar y pegar
Otros consejos
No se puede "Aplicar derivada" al texto para conseguir esos resultados, ya que los criterios de aceptación contenga un error. Es decir, la frecuencia ( "amigo") debe ser 5. Cada derivada algoritmo de por definición no puede producir los criterios de aceptación. Por lo tanto cualquier algoritmo que da esos valores tendrán que hacer - como por Rob Ashton. También puede utilizar una sentencia switch o una búsqueda de diccionario, lo que sea, que sólo necesita a la salida de esos números.