Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Data science

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah
01DAS KZ 3 1P+2C
Přednášející:
Jiří Franc (gar.)
Cvičící:
Jiří Franc (gar.)
Předmět zajišťuje:
katedra matematiky
Anotace:

Praktické využití metod matematického modelování, statistiky a strojového učení s sebou nese širokou škálu úkolů od přípravy a sběru dat, návrhu vhodné metody a její rozdělení na logické dílčí celky pro její vývoj a implementaci do produkčního prostředí a v neposlední řadě na kooperaci ve skupině a řízení moderního datového projektu. Obsahem přednášek a cvičení je představení současného standardu nástrojů pro tyto úkoly, matematických modelů a postupů potřebných k řešení složitých úloh ze současné praxe oboru data science. Tyto jsou poté studenty aplikovány v rámci cvičení s důrazem na kooperaci v týmu, projektového plánování a prezentace a výsledků ostatním posluchačům kurzu.

Požadavky:
Osnova přednášek:

1.Úvod do kooperativních nástrojů a nástrojů na management datového projektu. Efektivní rozdělování práce a odpovědností v týmu.

2.Představení vývojových prostředí pro manipulaci s daty a statistické modelování, data profiling.

3.Aplikace nejpoužívanějších metod strojového učení na reálných datech (rozhodovací stromy, náhodné lesy, neuronové sítě, clustering).

4.Návrh a vyhodnocení modelu strojového učení. Rozdělení datového vzorku na trénovací a testovací, metody křížové validace, chybové metriky v kontextu úlohy.

5.Příprava dat, řešení problému neúplnosti dat, feature engineering.

6.Řízení rozsáhlé praktické úlohy od čištění dat, přes návrhy a výběry modelů, po jejich validaci a aplikaci.

7.Prezentace a obhajoba zvoleného a implementovaného řešení před ostatními posluchači.

Osnova cvičení:
Cíle studia:
Studijní materiály:

Povinná literatura:

[1] J. VanderPlas: Python Data Science Handbook: Essential Tools for Working with Data, O'Reilly (2016).

[2] G. James, D. Witten, T. Hastie, R.Tibshiran: An Introduction to Statistical Learning, Springe, 8th edition (2017).

Doporučená literatura:

[3] T. Hastie, R.Tibshiran, J. Friedman: The Elements of Statistical Learning - Data Mining, Inference, and Prediction, Springer, 12th edition (2017).

Poznámka:
Rozvrh na zimní semestr 2019/2020:
Rozvrh není připraven
Rozvrh na letní semestr 2019/2020:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 29. 5. 2020
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet6007706.html