Skip to content

Latest commit

 

History

History
9 lines (8 loc) · 154 Bytes

AIKT-Reinforcement_Learning.md

File metadata and controls

9 lines (8 loc) · 154 Bytes

AIKT-Reinforcement_Learning

  • 策略迭代
  • 价值迭代
  • 蒙特卡罗算法
  • 时序差分算法
    • SARSA算法
    • Q学习
      • DQN 策略梯度