Učení robotů
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
B3B33UROB | Z,ZK | 6 | 2P+2C | česky |
- Vztahy:
- Předmět B3B33UROB nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět B3B33VIR (vztah je symetrický)
- Předmět B3B33UROB může při kontrole studijních plánů nahradit předmět B3B33VIR
- Předmět B3B33UROB nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět B3B33VIR (vztah je symetrický)
- Garant předmětu:
- Karel Zimmermann
- Přednášející:
- Karel Zimmermann
- Cvičící:
- David Čapek, Aleš Kučera, Tomáš Tichý, Patrik Vacek, Jan Vlk, Karel Zimmermann
- Předmět zajišťuje:
- katedra kybernetiky
- Anotace:
-
Předmět naučí metody hlubokého učení na známých robotických problémy, jako je sémantická segmentace nebo reaktivní řízení pohybu robota. Celkovým cílem je spíše nadčasová univerzální znalost než výčet všech známých architektur hlubokého učení. Předpokládá se, že studenti mají předchozí znalosti z matematiky (gradient, jacobian, hessian, gradient descend, Taylorův polynom) a strojového učení (minimalizace Bayesova rizika, lineární klasifikátor). Laboratoře jsou rozděleny do dvou částí, v první budou studenti řešit základní úlohy hlubokého ML od nuly (včetně reimplementace autograd backpropagation), ve druhé budou studenti stavět na existujících šablonách za účelem řešení složitých úloh včetně RL, transformátory a generativní sítě.
- Požadavky:
- Osnova přednášek:
-
Machine learning 101: model, loss, learning, issues, regression, classification
Under the hood of a linear classifier: two-class and multi-class linear classifier on RGB images
Under the hood of auto-differentiation: Computational graph of fully connected NN, Vector-Jacobian-Product (VJP) vs chainrule and multiplication of Jacobians.
The story of the cat's brain surgery: cortex + convolutional layer and its Vector-Jacobian-Product (VJP)
Where the hell does the loss come from? MAP and ML estimate, KL divergence and losses.
Why is learning prone to fail? - Structural issues: layers + issues, batch-norm, drop-out
Why is learning prone to fail? - Optimization issues: optimization vs learning, KL divergence, SGD, momentum, convergence rate, Adagrad, RMSProp, AdamOptimizer, diminishing/exploding gradient, oscillation, double descent
What can('t) we do with a deep net?: Classification (ResNet, Squeeze and Excitation Nets), Segmentation (DeepLab), Detection (Yolo, fast-RCNN), Regression (OpenPose), Spatial Transformer Nets,
Reinforcement learning: Approximated Q-learning, DQN, DDPG, Derivation of the policy gradient (REINFORCE), A2C, TRPO, PPO, Reward shaping, Inverse RL, Applications,
Memory and attention: recurrent nets, Image transformers with attention module
Generative models: GANs and diffusion models
Implicit layers: Backpropagation through unconstrained and constrained optimization problems, ODE solvers, roots, fixed points) + existing end-to-end differentiable modules cvxpy, gradSLAM, gradMPC, gradODE, pytorch3d
- Osnova cvičení:
-
Laboratoře jsou rozděleny do dvou částí, v první budou studenti řešit základní úlohy hlubokého ML od nuly (včetně reimplementace autograd backpropagation), ve druhé budou studenti stavět na existujících šablonách za účelem řešení složitých úloh včetně RL, transformátory a generativní sítě.
- Cíle studia:
- Studijní materiály:
-
Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep learning, MIT press, 2016 http://www.deeplearningbook.org
- Poznámka:
- Další informace:
- https://cw.fel.cvut.cz/wiki/courses/b3b33urob/start
- Rozvrh na zimní semestr 2024/2025:
-
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po Út St Čt Pá - Rozvrh na letní semestr 2024/2025:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Kybernetika a Robotika 2021 (povinně volitelný předmět)