Est-ce OpenNLP utiliser WordNet sous le capot pour la reconnaissance d'entités nommées
-
25-10-2019 - |
Question
Je l'ai essayé d'utiliser Outils OpenNLP 1.5 de SourceForge pour obtenir les nommés d'un Entités mises texte. J'ai trouvé un fichier JWNL dans le téléchargement de OpenNLP. Cela implique-t que OpenNLP à son tour, utilise WordNet pour la reconnaissance d'entités nommées. (Plus précisément, cela signifie que les fichiers Nom du modèle ont été générés avec WordNet)?
La solution
Non, OpenNLP utilise uniquement WordNet pour la résolution co-référence, comme la corrélation "Il" à "Steve Jones" dans des phrases distinctes.
WordNet n'est pas utilisé dans la reconnaissance d'entités nommées. Les fichiers de formation d'entités nommées sont des champs annotés manuellement à partir de diverses conférences / tests, tels que CoNLL.
Autres conseils
Comme je sais paquet d'entropie maximale d'utilisation OpenNLP pour fournir tous leurs modèles statistiques - pos tagging, détection de la phrase, NER même tokenisation. l'intégration WordNet ne fait pas partie de OpenNLP donc je pense que ses caractéristiques ne sont pas utilisés dans les modèles de formation.