Skip to content

Latest commit

 

History

History
48 lines (30 loc) · 3.84 KB

deephack_RL.md

File metadata and controls

48 lines (30 loc) · 3.84 KB

Reinforcement Learning by DeepHackLab

dhl

Курс был построен на лекциях by David Silver

  1. Introduction to Reinforcement Learning [lecture]

  2. Markov Decision Process [lecture]

  3. Planning by Dynamic Programming [lecture]

    • Слайды
    • Задание: Имплементировать алгоритмы Policy Iteration и Value Iteration для среды FrozenLake8x8-v0 https://gym.openai.com/envs/FrozenLake8x8-v0 (пояснения к задаче здесь https://gym.openai.com/envs/FrozenLake-v0 ) . Зарегистрироваться на https://gym.openai.com под именем с префиксом deepmipt_USER . Для последующей идентификации имя USER вводится в последнем разделе Quiz’а. Решения необходимо загрузить с префиксами PI_ (Policy Iteration) и VI_ (Value Iteration). * Используя Policy Iteration и Value Iteration решить задачу Taxi-v1 https://gym.openai.com/envs/Taxi-v1
  4. Model-Free Prediction [lecture]

  5. Model-Free Control [lecture]

  6. Value Function Approximation [lecture]

  7. Policy Gradient Methods [lecture]

  8. Integrating Learning and Planning [lecture]

  9. Exploration and Exploitation [lecture]

    • Слайды
    • Задание: Доделать максимальное число домашних заданий по предыдущим лекциям.