Strojové učení v praxi
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
NI-MLP | Z,ZK | 5 | 2P+1C | česky |
- Garant předmětu:
- Daniel Vašata
- Přednášející:
- Jan Hučín
- Cvičící:
- Jan Hučín
- Předmět zajišťuje:
- katedra aplikované matematiky
- Anotace:
-
Aplikace metod strojového učení na reálných projektech v praxi je spojena s mnoha dalšími nezbytnými úkony – počínaje porozuměním záměrů zadavatele a konče v ideálním případě technickou implementací. Předmět studenty provede všemi fázemi projektu podle standardní metodiky CRISP-DM, a to nejen teoreticky, ale i prakticky. Cílem je vyzkoušet si zpracování reálných dat a naučit se popsat celý proces od explorace po vyhodnocení výkonnosti modelu formou srozumitelného a přehledného reportu.
- Požadavky:
-
BI-ML1/BI-ML2
- Osnova přednášek:
-
1. Strojové učení v kontextu Data science projektů. Metodika CRISP-DM.
2. Základní technologie pro analýzu a zpracování dat.
3. Data understanding.
4. Statistická inference.
5. Aplikovaný bayesianismus.
6. Tvorba srozumitelného reportu.
7. Data preparation.
8. Praxe modelování a hodnocení modelů.
9. Interpretabilita modelů.
10. Aplikace principů SW inženýrství.
11. Využití technologií pro Big Data.
12. Limity statistických metod.
- Osnova cvičení:
-
1. Praktické osahání vybraných technologií (pandas, scikit-learn, seaborn, mlflow, ...)
2. Základní explorace a vizualizace, formulace zjištění a doporučení pro čištění dat.
3. Praktické řešení úloh pomocí bayesovského uvažování.
4. Nástroje na tvorbu reportu (Quarto, pretty-jupyter, ...)
5. Zpracování reálných dat: transformace dat a extrakce příznaků, 6. sestavení referenčního modelu a jeho vylepšování.
- Cíle studia:
-
Cílem předmětu je poskytnout studentům vhled do projektového přístupu k řešení reálných projektů strojového učení v praxi. Cílem je vyzkoušet si zpracování reálných dat a podle standardní metodiky CRISP-DM se naučit popsat celý proces od explorace po vyhodnocení výkonnosti modelu formou srozumitelného a přehledného reportu.
- Studijní materiály:
-
1. Hastie, T. - Tibshirani, R. - Friedman, J. : The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer, 2011. ISBN 978-0387848570.
2. Murphy, K. P. : Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series). MIT Press, 2012. ISBN 978-0262018029.
- Poznámka:
-
Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/NI-MLP/
- Další informace:
- https://courses.fit.cvut.cz/NI-MLP/
- Rozvrh na zimní semestr 2024/2025:
- Rozvrh není připraven
- Rozvrh na letní semestr 2024/2025:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Mgr. specializace Teoretická informatika, 2018-2019 (volitelný předmět)
- Mgr. specializace Počítačová bezpečnost, 2020 (volitelný předmět)
- Mgr. specializace Návrh a programování vestavných systémů, 2020 (volitelný předmět)
- Mgr. specializace Počítačové systémy a sítě, 2020 (volitelný předmět)
- Mgr. specializace Manažerská informatika, 2020 (volitelný předmět)
- Mgr. specializace Softwarové inženýrství, 2020 (volitelný předmět)
- Mgr. specializace Systémové programování, verze od 2020 (volitelný předmět)
- Mgr. specializace Webové inženýrství, 2020 (volitelný předmět)
- Mgr. specializace Znalostní inženýrství, 2020 (volitelný předmět)
- Mgr. specializace Teoretická informatika, 2020 (volitelný předmět)
- Mgr. program, pro fázi studia bez specializace, ver. pro roky 2020 a vyšší (volitelný předmět)
- Study plan for Ukrainian refugees (volitelný předmět)
- Mgr. specializace Systémové programování, verze od 2023 (volitelný předmět)
- Mgr. specializace Teoretická informatika, 2023 (volitelný předmět)