Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2018/2019

Games and reinforcement learning

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
MI-GLR Z,ZK 4 2+2
Přednášející:
Juan Pablo Maldonado Lopez (gar.)
Cvičící:
Juan Pablo Maldonado Lopez (gar.)
Předmět zajišťuje:
katedra aplikované matematiky
Anotace:

Oblast posilovaného učení je aktuálně ve středu zájmu mnoha výzkumníků díky pokrokům v hlubokém učení, rekurentních neuronových sítí a obecné umělé intligenci. Tento předmět jsme připravili s cílem seznámit studenty s potřebnými teoretickými a praktickými základy, aby se mohli věnovat výzkumu v této oblasti.

Výuka probíhá v angličtině.

Požadavky:
Osnova přednášek:

Teorie Her

1. Sealed-bid combinatorial auctions

2. Iterative combinatorial auctions

3. Stable matching

4. Congestion games. Selfish routing and the price of anarchy

5. Potential games. Network cost-sharing games

6. Best response dynamics. No-regret dynamics.

Úvod do posilovaného učení

7. Multiarmed Bandit Algorithms.

8. Finite Markov Decision Processes

9. Dynamic Programming

10. Montecarlo methods

11. Temporal-Difference learning

12. Multi-step bootstrapping

13. Planning and learning with tabular methods

Osnova cvičení:

Teorie Her

1. Mechanism design basics. Auctions of physical goods.

2. Sponsored search auctions (online advertising).

3. Congestion games. Selfish routing and the price of anarchy

4. Traffic assignment in networks.

5. Best response dynamics. No-regret dynamics.

6. Rock, paper, scissors.

Úvod do posilovaného učení

7. Multiarmed Bandit Algorithms.

8. Markov chains and MDP's.

9. Algorithms: Q-learning, TD

10. Playing tic-tac-toe, checkers.

11. Tensorflow introduction.

12. Case studies: TD-gammon, Atari games, Go playing.

13. OpenAI Gym. Policy gradient algorithm.

Cíle studia:

Naučit studenty základy teorie her a posilovaného učení. Jak teoreticky, tak prakticky.

Studijní materiály:

Reinforcement Learning: An introduction, Sutton and Barto, 2nd edition draft, 2017.

Algorithmic Game Theory, Roughgarden, Tardos, Vazirani and Nisan, 2007.

Poznámka:
Další informace:
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 23. 3. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet5107306.html