Pregunta

Quiero implementar una búsqueda semántica basada en Python sobre un conjunto de palabras clave (principalmente pasatiempos, últimas noticias, etc. de las que la gente podría estar interesada en hablar). Quiero saber si existen una base de datos de ontología para los mismos algoritmos/implementaciones de búsqueda de código abierto para la misma.

P.ej. Mi set = {hablar, beber, tweeting, katrina kaif, katrina cyclone, rock coleccionando, acumulando monedas}

Entonces, al buscar "acumular", podría obtener la colección de rocas y la recolección de monedas como salida.

Editar: los términos pueden tener varias palabras. Ese es "Presidente. Barack Obama de Estados Unidos" es una consulta válida.

¿Fue útil?

Solución

Es posible que desee usar "indexación aleatoria". Puede hacer exactamente lo que necesita, calcula un vector de características para cada palabra y define una métrica de similitud semántica entre dos palabras.

Todo lo que necesitas es obtener una copia de Una introducción a la indexación aleatoria y un semánticos Paquete para comenzar ...

Espero que esto ayude, si necesita más consejos, por favor comente ...

Otros consejos

Espero, pero no estoy seguro de si esto es útil para usted.

Gnowsys

  • todavía bajo un gran desarrollo
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top