Question

Je l'ai essayé d'utiliser Outils OpenNLP 1.5 de SourceForge pour obtenir les nommés d'un Entités mises texte. J'ai trouvé un fichier JWNL dans le téléchargement de OpenNLP. Cela implique-t que OpenNLP à son tour, utilise WordNet pour la reconnaissance d'entités nommées. (Plus précisément, cela signifie que les fichiers Nom du modèle ont été générés avec WordNet)?

Était-ce utile?

La solution

Non, OpenNLP utilise uniquement WordNet pour la résolution co-référence, comme la corrélation "Il" à "Steve Jones" dans des phrases distinctes.

WordNet n'est pas utilisé dans la reconnaissance d'entités nommées. Les fichiers de formation d'entités nommées sont des champs annotés manuellement à partir de diverses conférences / tests, tels que CoNLL.

Source: http://opennlp.sourceforge.net/README.html

Autres conseils

Comme je sais paquet d'entropie maximale d'utilisation OpenNLP pour fournir tous leurs modèles statistiques - pos tagging, détection de la phrase, NER même tokenisation. l'intégration WordNet ne fait pas partie de OpenNLP donc je pense que ses caractéristiques ne sont pas utilisés dans les modèles de formation.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top