Pregunta

Me gustaría encontrar la relación (no similitud) entre dos palabras usando Python. El HSO (Hirst y St-Onge, 1998), Lesk (Banerjee y Pedersen, 2003) y los algoritmos de Vector (Patwardhan, 2003) se implementan en Perl aquí Pero parece que no puedo encontrar lo mismo para Python en el NLTK lib.

Necesito usar Python, ya que forma parte de un proyecto de equipo más grande en Python. ¿Algún cabello?

¿Fue útil?

Solución

También hay una interfaz web a la que podría acceder: presumiblemente podría escribir un cliente de Python para consultar la interfaz web para obtener los valores de lesk o vector.

Puedes encontrar esas interfaces web aquí ...

http://marimba.d.umn.eduhttp://talisker.d.umn.edu

Buena suerte, Ted

Otros consejos

Usé NLTK para cargar WordNet en la base de datos del gráfico Neo4J (ver https://groups.google.com/d/topic/gremlin-users/c1oltg9xcpo/discussion ).

Y usé bombillas ( http://bulbflow.com/ ) para crear una biblioteca llamada WordGraph para interactuar con Neo4J/WordNet a través del servidor REST Rexster ( https://github.com/tinkerpop/rexster/wiki/ ).

Bulbs es una biblioteca de Python que le permite usar el lenguaje de programación de gráficos Gremlin ( https://github.com/tinkerpop/gremlin/wiki ) para consultar/traverse neo4j, y en este caso, específicamente WordNet.

Estoy en el proceso de publicar WordGraph a Github ( https://github.com/espeed/wordgraph ) - Envíame un mensaje si tienes preguntas.

Si ya tiene implementaciones de Perl, ¿por qué no simplemente escribir un envoltorio de Python que llama al código Perl? De esa manera, su proyecto Python puede hacer uso de la funcionalidad, y no tiene que reescribir los algoritmos reales. Ya hay muchas cosas en NLTK que funcionan exactamente de esta manera.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top