Pregunta

Para mi aplicación GAE, necesito hacer un procesamiento de lenguaje natural para extraer el sujeto y el objeto de una oración de entrada.

Aparentemente NLTK no se puede instalar (fácilmente) en GAE, así que estoy buscando otra solución. Noté que GAE viene con Antlr3 pero al navegar por su documentación resuelve un tipo diferente de problema gramatical.

¿Alguna idea?

¿Fue útil?

Solución

Puede construir fácilmente un servidor NTLK RPC en alguna máquina y acceder a él.

Otra opción es encontrar otro servicio basado en la web que ya lo haga (como opencalais).

Otros consejos

Con respecto al problema de NLTK específicamente, mi solución probablemente sería arreglar las importaciones extrañas que está haciendo NLTK, y usarlo como estaba planeado originalmente. Cuando haya terminado, envíe un parche, por supuesto.

Dicho esto, si esto en última instancia implica tocar el almacén de datos, la respuesta es que probablemente no se pueda hacer de manera eficiente, a menos que su conjunto de datos sea pequeño o, por alguna razón, sus cosas de PNL no necesiten golpear algún tipo de índice de texto completo. Los los chicos de GAE están trabajando en ello , pero han indicado que nadie debería esperar una solución rápida a este problema en particular.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top