Pregunta

He intentado usar OpenNLP Tools 1.5 de SourceForge para obtener las empresas nombradas de un texto. Encontré un archivo JWNL en la descarga de OpenNLP. ¿Eso implica que OpenNLP a su vez está usando WordNet para el reconocimiento de entidad nombrado? (Específicamente, ¿significa que los archivos del modelo de nombre se generaron con WordNet)?

¿Fue útil?

Solución

No, OpenNLP solo usa WordNet para la resolución de co-referencia, como correlacionar "He" con "Steve Jones" en oraciones separadas.

WordNet no se usa en el reconocimiento de entidad nombrado. Los archivos de capacitación de entidades nombrados son campos anotados manualmente de varias conferencias/pruebas, como Conll.

Fuente: http://opennlp.sourceforge.net/readme.html

Otros consejos

Como sé, OpenNLP usa el paquete de entropía máxima para proporcionar todos sus modelos estadísticos: etiquetado POS, detección de oraciones, tokenización incluso incluso. La integración de WordNet no es parte de OpenNLP, por lo que creo que sus características no se usaron en modelos de entrenamiento.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top