Games and reinforcement learning
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
MI-GLR | Z,ZK | 4 | 2P+2C | anglicky |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra aplikované matematiky
- Anotace:
-
Oblast posilovaného učení je aktuálně ve středu zájmu mnoha výzkumníků díky pokrokům v hlubokém učení, rekurentních neuronových sítí a obecné umělé intligenci. Tento předmět jsme připravili s cílem seznámit studenty s potřebnými teoretickými a praktickými základy, aby se mohli věnovat výzkumu v této oblasti.
Výuka probíhá v angličtině.
- Požadavky:
-
BI-ZUM - Introduction to artificial intelligence
- Osnova přednášek:
-
Teorie Her
1. Sealed-bid combinatorial auctions
2. Iterative combinatorial auctions
3. Stable matching
4. Congestion games. Selfish routing and the price of anarchy
5. Potential games. Network cost-sharing games
6. Best response dynamics. No-regret dynamics.
Úvod do posilovaného učení
7. Multiarmed Bandit Algorithms.
8. Finite Markov Decision Processes
9. Dynamic Programming
10. Montecarlo methods
11. Temporal-Difference learning
12. Multi-step bootstrapping
13. Planning and learning with tabular methods
- Osnova cvičení:
-
Teorie Her
1. Mechanism design basics. Auctions of physical goods.
2. Sponsored search auctions (online advertising).
3. Congestion games. Selfish routing and the price of anarchy
4. Traffic assignment in networks.
5. Best response dynamics. No-regret dynamics.
6. Rock, paper, scissors.
Úvod do posilovaného učení
7. Multiarmed Bandit Algorithms.
8. Markov chains and MDP's.
9. Algorithms: Q-learning, TD
10. Playing tic-tac-toe, checkers.
11. Tensorflow introduction.
12. Case studies: TD-gammon, Atari games, Go playing.
13. OpenAI Gym. Policy gradient algorithm.
- Cíle studia:
-
Naučit studenty základy teorie her a posilovaného učení. Jak teoreticky, tak prakticky.
- Studijní materiály:
-
Reinforcement Learning: An introduction, Sutton and Barto, 2nd edition draft, 2017.
Algorithmic Game Theory, Roughgarden, Tardos, Vazirani and Nisan, 2007.
- Poznámka:
-
Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-GLR/
- Další informace:
- https://courses.fit.cvut.cz/MI-GLR/
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů:
-
- Bc. obor Bezpečnost a informační technologie, 2015-2020 (volitelný předmět)
- Mgr. obor Znalostní inženýrství, 2016-2017 (volitelný předmět)
- Mgr. obor Počítačová bezpečnost, 2016-2019 (volitelný předmět)
- Mgr. obor Počítačové systémy a sítě, 2016-2019 (volitelný předmět)
- Mgr. obor Návrh a programování vestavných systémů, 2016-2019 (volitelný předmět)
- Mgr. obor Webové a softwarové inženýrství, zaměření Informační systémy a management, 2016-2019 (volitelný předmět)
- Mgr. obor Webové a softwarové inženýrství, zaměření Softwarové inženýrství, 2016-2019 (volitelný předmět)
- Mgr. obor Webové a softwarové inženýrství, zaměření Webové inženýrství, 2016-2019 (volitelný předmět)
- Mgr. program Informatika, pro fázi studia bez oboru, 2016-2019 (volitelný předmět)
- Mgr. obor Systémové programování, zaměření Systémové programování, 2016-2019 (volitelný předmět)
- Mgr. obor Systémové programování, zaměření Teoretická informatika, 2016-2017 (volitelný předmět)
- Mgr. specializace Teoretická informatika, 2018-2019 (volitelný předmět)
- Mgr. obor Znalostní inženýrství, 2018-2019 (volitelný předmět)