Question

Je voudrais trouver la connexité (non similitude) entre deux mots en utilisant Python. Les algorithmes HSO (Hirst et St-Onge, 1998), Lesk (Banerjee et Pedersen, 2003), et le vecteur (Patwardhan, 2003) sont mis en œuvre en Perl ici mais je ne peux pas semble trouver la même chose pour Python dans le NLTK lib.

Je dois utiliser Python comme il fait partie d'un projet d'équipe plus en Python. Des pistes ??

Était-ce utile?

La solution

Il y a aussi une interface Web, vous pouvez accéder -. Vous pourriez probablement écrire un client python pour interroger l'interface Web pour obtenir les valeurs de Lesk ou vecteur

Vous pouvez trouver ces interfaces web ici ...

http://marimba.d.umn.edu http://talisker.d.umn.edu

Bonne chance, Ted

Autres conseils

je NLTK à charge WordNet dans la base de données de graphe Neo4j, (voir https://groups.google.com/d/topic/gremlin-users/C1OlTG9xCpo/discussion ).

et moi Ampoules ( http://bulbflow.com/ ) pour créer une bibliothèque appelée WordGraph pour interagir avec Neo4j / WordNet via le serveur Rexster REST ( https://github.com/tinkerpop/rexster/wiki/ ).

Bulbes est une bibliothèque Python qui vous permet d'utiliser la langue Gremlin ( de programmation graphique https: // GitHub. com / tinkerpop / Gremlin / wiki ) pour la requête / traverse Neo4j, et dans ce cas, en particulier WordNet.

Je suis en train de l'affichage WordGraph à Github ( https://github.com/espeed/wordgraph) -. un message moi si vous avez des questions

Si vous avez des implémentations Perl déjà, pourquoi ne pas simplement écrire un python wrapper qui appelle le code perl? De cette façon, votre projet python peut utiliser la fonctionnalité, et vous n'avez pas de réécrire les algorithmes réels. Il y a beaucoup de choses dans NLTK déjà que le travail exactement de cette manière.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top