Name		Name	Last commit message	Last commit date
parent directory ..
Seminar		Seminar
Readme.md		Readme.md
slides.pdf		slides.pdf

Readme.md

Lecture 1: Foundations of Reinforcement Learning

1. Introduction to Reinforcement Learning

Multi-armed Bandits
Contextual Bandits

2. Markov Decision Processes (MDPs)

Time-varying MDPs
Partially Observable MDPs

3. Existing of the Optimal Stationary Policy