Pregunta

He estado tratando de entender el aprendizaje de refuerzo durante bastante tiempo, pero de alguna manera no puedo visualizar cómo escribir un programa para el aprendizaje de refuerzo para resolver un problema mundial de la red. ¿Puedes sugerirme algunos libros de texto que me ayudarían a construir una concepción clara del aprendizaje de refuerzo?

¿Fue útil?

Solución

Aquí tienes algunas buenas referencias sobre el aprendizaje de refuerzo:

Clásico

Sutton RS, Barto AG. Aprendizaje de refuerzo: una introducción. Cambridge, Misa: un libro de Bradford; 1998. 322 p.

El borrador de la segunda edición está disponible de forma gratuita: http://incompleteideas.net/book/the-book-2nd.html

Russell/Norvig Capítulo 21:

Russell SJ, Norvig P, Davis E. Inteligencia artificial: un enfoque moderno. Upper Saddle River, NJ: Prentice Hall; 2010.

Más técnico

Szepesvári C. Algoritmos para el aprendizaje de refuerzo. Conferencias de síntesis sobre inteligencia artificial y aprendizaje automático. 2010; 4 (1): 1–103. http://www.ualbera.ca/~szepesva/rlbook.html

Bertsekas DP. Programación dinámica y control óptimo. 4ª edición. Belmont, Mass.: Athena Scientific; 2007. 1270 p. Capítulo 6, Vol 2 está disponible de forma gratuita: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Para desarrollos más recientes

Wiering M, van Otterlo M, editores. Aprendizaje reforzado. Berlín, Heidelberg: Springer Berlín Heidelberg; 2012 Disponible de: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Toma de decisiones bajo incertidumbre: teoría y aplicación. 1 edición. Cambridge, Massachusetts: el MIT Press; 2015. 352 p.

Aprendizaje de refuerzo de múltiples agentes

Buşoniu L, Babuška R, Schutter BD. Aprendizaje de refuerzo de múltiples agentes: una descripción general. En: Srinivasan D, Jain LC, editores. Innovaciones en sistemas y aplicaciones de múltiples agentes - 1. Springer Berlin Heidelberg; 2010 p. 183–221. Disponible de: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Aprendizaje automático de múltiples agentes: un enfoque de refuerzo. Hoboken, Nueva Jersey: Wiley; 2014.

Videos / cursos

También sugeriría el curso de David Silver en YouTube: https://www.youtube.com/playlist?list=pl5x3mdkkaajrl42i_jhe4n-p6e2ol62ofa

Otros consejos

Hay un curso en línea gratuito sobre el aprendizaje de refuerzo por Udacity. Controlar : Aprendizaje automático: aprendizaje de refuerzo

yo realmente disfruté Refuerzo Leraning: una introducción por Richard Sutton. Proporciona una vista unificadora muy agradable sobre RL, aunque no menciona los enfoques más nuevos (es de 1998).

Puedes ver mi libro - Aprendizaje de refuerzo práctico con Python Lo que explica el aprendizaje de refuerzo de los cañidos a los algoritmos de aprendizaje de refuerzo de estado de estado avanzado de última generación.

Todo el código junto con la explicación ya está disponible en mi repositorio de GitHub.https://github.com/sudharsan13296/hands-on-reinforcion-lelarning-with-python

Licenciado bajo: CC-BY-SA con atribución
scroll top