Extracción de información con aprendizaje de refuerzo, factible?

https://datascience.stackexchange.com/questions/10679

16-10-2019
|

Pregunta

Me preguntaba si uno podría usar el aprendizaje de refuerzo (ya que va a estar cada vez más de moda con las cosas de Google Deepmind & Alphago) para analizar y extraer información del texto.

Por ejemplo, ¿podría ser un enfoque competitivo para la predicción estructurada como

Nombrado reconocimiento de entidad (NER), es decir, la tarea de etiquetar Nueva York por "City" y New York Times por el etiquetado de parte de voz de "organización" (POS), es decir, clasificar las palabras como determinante, sustantivo, etc. Extracción de información, es decir, encontrar y etiquetar alguna información objetivo en textos, por ejemplo, el 12/03 es la fecha dada el contexto que significa 3 de diciembre y tiene la etiqueta "fecha de vencimiento" ¿Cuál sería un modelado relevante para hacer estas tareas?

Ingenuamente, pensaría en un puntero que lea el texto de principio a fin y anota cada 'letra' por una etiqueta. Tal vez aprendería que las letras vecinas en una 'palabra' comparten la misma etiqueta, etc. ¿Sería capaz de aprender dependencias a largo plazo con este enfoque?

Estoy interesado por cualquier idea o referencia relacionada con este tema.

Solución

Idealmente, desea utilizar el aprendizaje de refuerzo en situaciones en las que hay retroalimentación retrasada y transiciones estocásticas en el medio ambiente. Aunque podría aplicar RL, en su caso, puede estar mejor con una secuencia a la secuencia del marco de aprendizaje (https://papers.nips.cc/paper/5346-sequence-to-sequence-lelarning-with-neural-networks.pdf) ya que tiene acceso a toda la oración y no hay estocasticidad involucrada.

Sobre el tema de RL con extracción de información, esto podría ser de interés: mejorar la extracción de información mediante la adquisición de evidencia externa con aprendizaje de refuerzo (http://arxiv.org/abs/1603.07954)

Otros consejos

Consulte este artículo: https://paperswithcode.com/paper/a-new-concepte-deep-reinforcion-lelarning-1 con el nombre "un nuevo concepto de sistema de etiquetado general aumentado basado en el aprendizaje profundo".

Licenciado bajo: CC-BY-SA con atribución

No afiliado a datascience.stackexchange