学习建议

现在网络上其实遍布了可以学习深度强化学习的资源,建议大家可以选择下面的课程:

  1. Neural Networks for Machine Learning — Geoff Hinton (Coursera)

  2. Neural Nets — Andrej Karpathy’s CS231N (Stanford)

  3. Reinforcement Learning — David Silver UCL

  4. Advanced Robotics (the MDP / optimal control lectures) — Pieter Abbeel’s CS287 (Berkeley) Deep RL — John Schulman’s CS294-112 (Berkeley)

  5. Deep RL — David Silver RLDM

  6. Deep RL — John Schulman MLSS

除了课程外,也有一些书籍,比如 Richard Sutton 等人的《Reinforcement Learning: An Introduction》,还有 Pieter 推荐了 Cover 和 Thomas 的《信息论》和 Nocedal 和 Wright 写的 nonlinear optimization 书,David Barber 的 Bayesian Reasoning and Machine Learning 等等

如果你爱编程实现,那么 Ilya Sutskever 建议你从实现简单的 MNIST 分类器开始,卷积网络,重新实现 char-rnn,然后玩玩大的卷积网络。同样还可以选择一些竞赛,比如说 Kaggle 的 Knowledge 系列。不断地去寻找训练和实现的手感。在 OpenAI 中也有很多的资源帮助你快速找到感觉。

但实际上,深度学习和强化学习及深度强化学习需要有理论和实践的结合,所以理论课程和实践经历都是非常重要的。通过读书听课可以找到自己的位置,还有知识本身所处的位置以及你在整个知识地图的位置,从而不至于迷失在日新月异的环境中,慢慢地你会发现自己感兴趣的那些目的地,然后逐步地探索这些有趣的目的地,最终能够取得令自己满意的成就。而实现模型的重要性在于你可以将那些抽象的概念和理论转化为实实在在可以触及的经验,你飞动的指尖会慢慢告诉你什么是正确的节奏,哪些是让你兴奋的点。通常理论和实践之间的差异之大会超乎想象,所以只能够通过实际应用去填补这些罅隙,实现完模型后往往需要成天成天的调试你才能达到满意的效果。这个过程是非常痛苦的,但这种痛苦也是短暂的:当你最终完成了一个真正可用的模型时,那种快感无与伦比.。我想这也是很多人坚持挑战自己的缘故吧。Ilya Suskever 说道:“But each time you suffer, know that you've built a little bit of skill that will be invaluable for the future.”

results matching ""

    No results matching ""