注意,实战教程中的代码主要为了演示算法原理,完整的算法代码实现请参考Notebooks中的内容。
| 章节 | 完成状态 |
|---|---|
| PyTorch 入门 | ⬜ |
| Q learning 算法 | ☑️ |
| Sarsa 算法 | ☑️ |
| DQN 算法 | ☑️ |
| Double DQN 算法 | ☑️ |
| Dueling DQN 算法 | ☑️ |
| Noisy DQN 算法 | ☑️ |
| PER DQN 算法 | ☑️ |
| C51 算法 | ⬜ |
| Rainbow DQN 算法 | ⬜ |
| REINFORCE 算法 | ⬜ |
| A2C 算法 | ⬜ |
| DDPG 算法 | ⬜ |
| TD3 算法 | ⬜ |
| TRPO 算法 | ⬜ |