良好的实现方式的强化学习?
其他提示
的 Heaton研究 电子书是很好的说明神经网络的概念(有代码)。第4章是专门为机学习和各种培训方法对于您的网络。有一个可下载的图书馆和样本应用程序对于你来看看。
这不是特定于增强学习,但是斯坦福大学有一个很大的系列讲座 学习机在Youtube上的 和iTunes。
链接到第一个讲座,其中大约需要30分钟以潜入的内容。
粗麻布 是最近的Java库,提供了实现许多共同的强化学习算法以及一些环境和有用的工具。
这个问题是很老,但是对于任何人阅读这2018年,我强烈建议您使用OpenAI基线,如果你有兴趣在固体引用的现有RL算法。这些算法实施的一组雇员在OpenAI谁真正知道这些东西,并已广泛的微调和调试。
是公平的,你不需要这些对俄罗斯方块,但现在我怀疑家庭作业的问题可能涉及一些更复杂的环境。
我建议,以了解RL4J其是java基础。我是用这个和我很惊讶的事工作顺利,你可以了解更LSTM网络在一个强化学习算法与演员的批评算法(称为A3C)
这里就是链接:https://github.com/deeplearning4j/dl4j-examples/blob/master/rl4j-examples/
我注意到,这个问题是相当过时(10岁),收集的现代RL框架和环境可能有用。我创建了审查仓库,为此,并打算定期更新。
不隶属于 StackOverflow