Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2024/2025

Strojové učení v praxi

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
NI-MLP Z,ZK 5 2P+1C česky
Garant předmětu:
Daniel Vašata
Přednášející:
Jan Hučín
Cvičící:
Jan Hučín
Předmět zajišťuje:
katedra aplikované matematiky
Anotace:

Aplikace metod strojového učení na reálných projektech v praxi je spojena s mnoha dalšími nezbytnými úkony – počínaje porozuměním záměrů zadavatele a konče v ideálním případě technickou implementací. Předmět studenty provede všemi fázemi projektu podle standardní metodiky CRISP-DM, a to nejen teoreticky, ale i prakticky. Cílem je vyzkoušet si zpracování reálných dat a naučit se popsat celý proces od explorace po vyhodnocení výkonnosti modelu formou srozumitelného a přehledného reportu.

Požadavky:

BI-ML1/BI-ML2

Osnova přednášek:

1. Strojové učení v kontextu Data science projektů. Metodika CRISP-DM.

2. Základní technologie pro analýzu a zpracování dat.

3. Data understanding.

4. Statistická inference.

5. Aplikovaný bayesianismus.

6. Tvorba srozumitelného reportu.

7. Data preparation.

8. Praxe modelování a hodnocení modelů.

9. Interpretabilita modelů.

10. Aplikace principů SW inženýrství.

11. Využití technologií pro Big Data.

12. Limity statistických metod.

Osnova cvičení:

1. Praktické osahání vybraných technologií (pandas, scikit-learn, seaborn, mlflow, ...)

2. Základní explorace a vizualizace, formulace zjištění a doporučení pro čištění dat.

3. Praktické řešení úloh pomocí bayesovského uvažování.

4. Nástroje na tvorbu reportu (Quarto, pretty-jupyter, ...)

5. Zpracování reálných dat: transformace dat a extrakce příznaků, 6. sestavení referenčního modelu a jeho vylepšování.

Cíle studia:

Cílem předmětu je poskytnout studentům vhled do projektového přístupu k řešení reálných projektů strojového učení v praxi. Cílem je vyzkoušet si zpracování reálných dat a podle standardní metodiky CRISP-DM se naučit popsat celý proces od explorace po vyhodnocení výkonnosti modelu formou srozumitelného a přehledného reportu.

Studijní materiály:

1. Hastie, T. - Tibshirani, R. - Friedman, J. : The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer, 2011. ISBN 978-0387848570.

2. Murphy, K. P. : Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series). MIT Press, 2012. ISBN 978-0262018029.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/NI-MLP/

Další informace:
https://courses.fit.cvut.cz/NI-MLP/
Rozvrh na zimní semestr 2024/2025:
Rozvrh není připraven
Rozvrh na letní semestr 2024/2025:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 16. 6. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet7600706.html