L'extraction d'information avec l'apprentissage de renforcement, réalisable?

https://datascience.stackexchange.com/questions/10679

16-10-2019
|

Question

Je me demandais si l'on pouvait utiliser l'apprentissage par renforcement (car il va être de plus en plus à la mode avec des trucs du Google DeepMind & AlphaGo) pour analyser et des informations d'extrait de texte.

Par exemple, pourrait-il être une approche concurrentielle à la prédiction structurée comme

La reconnaissance d'entités nommées (NER), à savoir la tâche de l'étiquetage de New York par « ville », et New York Times par « organisation » Une partie du discours de marquage (POS), à savoir classificatoires mots comme déterminant, nom, etc. l'extraction de l'information, à savoir la recherche et l'étiquetage des informations cible dans les textes, par exemple 12/03 est la date compte tenu du contexte Signification 3 Décembre et a l'étiquette « date d'expiration » Quelle serait une modélisation pertinente pour effectuer ces tâches?

Je pense plutôt naïvement d'un pointeur qui a lu le texte du début à la fin et annoter chaque « lettre » par une étiquette. Peut-être qu'il apprendrait que les lettres voisines dans un « mot » partagent la même étiquette, etc. Ne serait-il capable d'apprendre les dépendances à long terme avec cette approche?

Je suis intéressé par des idées ou des références liées à ce sujet.

La solution

Vous voulez idéalement utiliser l'apprentissage par renforcement dans des situations où il est retardé des commentaires et des transitions stochastiques dans l'environnement. Bien que vous pourriez potentiellement appliquer RL, dans votre cas, vous pourriez être mieux avec une séquence de cadre d'apprentissage séquence ( https://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf ) depuis vous avez accès à l'ensemble de la phrase et il n'y a pas stochasticité impliqué.

Sur le thème de RL avec extraction d'information, cela pourrait être d'intérêt: L'amélioration de l'extraction de l'information par l'acquisition de preuves externe avec l'apprentissage par renforcement ( http://arxiv.org/abs/1603.07954 )

Autres conseils

consulter cet article: https: // paperswithcode .com / papier / a nouveau concept-de-profond renforcement apprentissage-1 avec le nom "un nouveau concept d'apprentissage profond renforcement base augmentée général système Tagging"

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange