Praktický data mining
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
MI-PDM | Z,ZK | 5 | 2P+1C | česky |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra aplikované matematiky
- Anotace:
-
Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
- Požadavky:
-
Fundamentals of algebra, statistics, programming
- Osnova přednášek:
-
1) Úvodní a přehledová přednáška
2) Rozhodovací stromy
3) Clustering (K-means, hierarchical clustering)
4) K-NN
5) Naivní Bayes
6) Lineární regrese
7) Logistická regrese
8) Redukce dimenzionality (SVD, PCA)
9) strojové zpracování přirozeného jazyka NLP
Až 4 přednášky mohou být vyplněny přednáškami lidí z praxe.
- Osnova cvičení:
-
1) Jupyter Notebook a knihovny panda, numpy a scikit-learn
2) Vizualizace dat
3) Rozhodovací stromy v scikit-learn
4) Clusterování
5) Lineární regrese
6) PCA
- Cíle studia:
- Studijní materiály:
-
1. Larose, D. T. Discovering Knowledge in Data: An Introduction to Data Mining. Wiley-Interscience, 2004.
2. Hastie T.,Tibshirani R.,Friedman J., The Elements of Statistical Learning, Data Mining, Inference and Prediction, Springer, 2011
- Poznámka:
-
Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-PDM/
- Další informace:
- https://courses.fit.cvut.cz/MI-PDM/
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů:
-
- Mgr. obor Webové a softwarové inženýrství, zaměření Informační systémy a management, 2016-2019 (povinný předmět zaměření)