Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Praktický data mining

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
MI-PDM Z,ZK 5 2P+1C česky
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra aplikované matematiky
Anotace:

Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Požadavky:

Fundamentals of algebra, statistics, programming

Osnova přednášek:

1) Úvodní a přehledová přednáška

2) Rozhodovací stromy

3) Clustering (K-means, hierarchical clustering)

4) K-NN

5) Naivní Bayes

6) Lineární regrese

7) Logistická regrese

8) Redukce dimenzionality (SVD, PCA)

9) strojové zpracování přirozeného jazyka NLP

Až 4 přednášky mohou být vyplněny přednáškami lidí z praxe.

Osnova cvičení:

1) Jupyter Notebook a knihovny panda, numpy a scikit-learn

2) Vizualizace dat

3) Rozhodovací stromy v scikit-learn

4) Clusterování

5) Lineární regrese

6) PCA

Cíle studia:
Studijní materiály:

1. Larose, D. T. Discovering Knowledge in Data: An Introduction to Data Mining. Wiley-Interscience, 2004.

2. Hastie T.,Tibshirani R.,Friedman J., The Elements of Statistical Learning, Data Mining, Inference and Prediction, Springer, 2011

Poznámka:
Další informace:
https://courses.fit.cvut.cz/MI-PDM/
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 18. 10. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet5720106.html