Data science
Kód | Zakončení | Kredity | Rozsah |
---|---|---|---|
01DAS | KZ | 3 | 1P+2C |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra matematiky
- Anotace:
-
Praktické využití metod matematického modelování, statistiky a strojového učení s sebou nese širokou škálu úkolů od přípravy a sběru dat, návrhu vhodné metody a její rozdělení na logické dílčí celky pro její vývoj a implementaci do produkčního prostředí a v neposlední řadě na kooperaci ve skupině a řízení moderního datového projektu. Obsahem přednášek a cvičení je představení současného standardu nástrojů pro tyto úkoly, matematických modelů a postupů potřebných k řešení složitých úloh ze současné praxe oboru data science. Tyto jsou poté studenty aplikovány v rámci cvičení s důrazem na kooperaci v týmu, projektového plánování a prezentace a výsledků ostatním posluchačům kurzu.
- Požadavky:
- Osnova přednášek:
-
1.Úvod do kooperativních nástrojů a nástrojů na management datového projektu. Efektivní rozdělování práce a odpovědností v týmu.
2.Představení vývojových prostředí pro manipulaci s daty a statistické modelování, data profiling.
3.Aplikace nejpoužívanějších metod strojového učení na reálných datech (rozhodovací stromy, náhodné lesy, neuronové sítě, clustering).
4.Návrh a vyhodnocení modelu strojového učení. Rozdělení datového vzorku na trénovací a testovací, metody křížové validace, chybové metriky v kontextu úlohy.
5.Příprava dat, řešení problému neúplnosti dat, feature engineering.
6.Řízení rozsáhlé praktické úlohy od čištění dat, přes návrhy a výběry modelů, po jejich validaci a aplikaci.
7.Prezentace a obhajoba zvoleného a implementovaného řešení před ostatními posluchači.
- Osnova cvičení:
- Cíle studia:
- Studijní materiály:
-
Povinná literatura:
[1] J. VanderPlas: Python Data Science Handbook: Essential Tools for Working with Data, O'Reilly (2016).
[2] G. James, D. Witten, T. Hastie, R.Tibshiran: An Introduction to Statistical Learning, Springe, 8th edition (2017).
Doporučená literatura:
[3] T. Hastie, R.Tibshiran, J. Friedman: The Elements of Statistical Learning - Data Mining, Inference, and Prediction, Springer, 12th edition (2017).
- Poznámka:
- Další informace:
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů:
-
- Aplikované matematicko-stochastické metody (povinně volitelný předmět)
- Jaderná a částicová fyzika (volitelný předmět)