Games and reinforcement learning

Předmět není vypsán Nerozvrhuje se

Kód	Zakončení	Kredity	Rozsah	Jazyk výuky
MI-GLR	Z,ZK	4	2P+2C	anglicky

Garant předmětu:

Přednášející:

Cvičící:

Předmět zajišťuje:

katedra aplikované matematiky

Anotace:

Oblast posilovaného učení je aktuálně ve středu zájmu mnoha výzkumníků díky pokrokům v hlubokém učení, rekurentních neuronových sítí a obecné umělé intligenci. Tento předmět jsme připravili s cílem seznámit studenty s potřebnými teoretickými a praktickými základy, aby se mohli věnovat výzkumu v této oblasti.

Výuka probíhá v angličtině.

Požadavky:

BI-ZUM - Introduction to artificial intelligence

Osnova přednášek:

Teorie Her

1. Sealed-bid combinatorial auctions

2. Iterative combinatorial auctions

3. Stable matching

4. Congestion games. Selfish routing and the price of anarchy

5. Potential games. Network cost-sharing games

6. Best response dynamics. No-regret dynamics.

Úvod do posilovaného učení

7. Multiarmed Bandit Algorithms.

8. Finite Markov Decision Processes

9. Dynamic Programming

10. Montecarlo methods

11. Temporal-Difference learning

12. Multi-step bootstrapping

13. Planning and learning with tabular methods

Osnova cvičení:

Teorie Her

1. Mechanism design basics. Auctions of physical goods.

2. Sponsored search auctions (online advertising).

3. Congestion games. Selfish routing and the price of anarchy

4. Traffic assignment in networks.

5. Best response dynamics. No-regret dynamics.

6. Rock, paper, scissors.

Úvod do posilovaného učení

7. Multiarmed Bandit Algorithms.

8. Markov chains and MDP's.

9. Algorithms: Q-learning, TD

10. Playing tic-tac-toe, checkers.

11. Tensorflow introduction.

12. Case studies: TD-gammon, Atari games, Go playing.

13. OpenAI Gym. Policy gradient algorithm.

Cíle studia:

Naučit studenty základy teorie her a posilovaného učení. Jak teoreticky, tak prakticky.

Studijní materiály:

Reinforcement Learning: An introduction, Sutton and Barto, 2nd edition draft, 2017.

Algorithmic Game Theory, Roughgarden, Tardos, Vazirani and Nisan, 2007.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-GLR/

Další informace:

https://courses.fit.cvut.cz/MI-GLR/

Pro tento předmět se rozvrh nepřipravuje

Předmět je součástí následujících studijních plánů:

Bc. obor Bezpečnost a informační technologie, 2015-2020 (volitelný předmět)
Mgr. obor Znalostní inženýrství, 2016-2017 (volitelný předmět)
Mgr. obor Počítačová bezpečnost, 2016-2019 (volitelný předmět)
Mgr. obor Počítačové systémy a sítě, 2016-2019 (volitelný předmět)
Mgr. obor Návrh a programování vestavných systémů, 2016-2019 (volitelný předmět)
Mgr. obor Webové a softwarové inženýrství, zaměření Informační systémy a management, 2016-2019 (volitelný předmět)
Mgr. obor Webové a softwarové inženýrství, zaměření Softwarové inženýrství, 2016-2019 (volitelný předmět)
Mgr. obor Webové a softwarové inženýrství, zaměření Webové inženýrství, 2016-2019 (volitelný předmět)
Mgr. program Informatika, pro fázi studia bez oboru, 2016-2019 (volitelný předmět)
Mgr. obor Systémové programování, zaměření Systémové programování, 2016-2019 (volitelný předmět)
Mgr. obor Systémové programování, zaměření Teoretická informatika, 2016-2017 (volitelný předmět)
Mgr. specializace Teoretická informatika, 2018-2019 (volitelný předmět)
Mgr. obor Znalostní inženýrství, 2018-2019 (volitelný předmět)