Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2018/2019

Vytěžování znalostí z dat

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
BI-VZD Z,ZK 4 2+2 česky
Přednášející:
Daniel Vašata, Karel Klouda
Cvičící:
Daniel Vašata, Klára Hájková, Karel Klouda
Předmět zajišťuje:
katedra aplikované matematiky
Anotace:

Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Požadavky:
Osnova přednášek:

1. Úvod do data miningu, příprava dat, vizualizace dat.

2. Statistická analýza dat.

3. Model dat, metoda nejbližšího souseda

4. Učení, validace, testování, hodnocení kvality modelu

5. Umělé neuronové sítě v data miningu.

6. Neuronové sítě bez učitele - kompetiční učení

7. Pravděpodobnost a Bayesovská klasifikace

8. Rozhodovací stromy a pravidla.

9. Neuronové sítě s učitelem.

10. Shluková analýza.

11. Kombinování neuronových sítí a modelů obecně.

12. Data mining v prostředí Clementine.

13. Text mining, Web mining, vybrané aplikace a nové trendy.

Osnova cvičení:

1. Data, vizualizace, statistiky.

2. Statistická analýza dat.

3. Předzpracování dat, redukce dimenzionality, významnost vstupů.

4. Model, trénování, testování, validace modelu.

5. Proces vytěžování dat, klasifikace, predikce, modelování

6. Shluková analýza a SOM.

7. Zadání semestrální úlohy.

8. [3] Konzultace a práce na úloze.

9. [3] Prezentace výsledků, workshop

10. Zápočet

Cíle studia:

Cílem předmětu je poskytnout základní úvod do velmi rychle se rozvíjejícího oboru - vytěžování znalostí z dat.

Studijní materiály:

1. Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/BI-VZD/

Rozsah=prednasky+proseminare+cviceni:2p+2c

Další informace:
https://courses.fit.cvut.cz/BI-VZD/
Rozvrh na zimní semestr 2018/2019:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
St
Čt
místnost T9:107
Klouda K.
Vašata D.

14:30–16:00
(přednášková par. 1)
Dejvice
Posluchárna
místnost T9:351
Klouda K.
Vašata D.

16:15–17:45
(přednášková par. 1
paralelka 101)

Dejvice
NBFIT PC ucebna

místnost T9:350
Hájková K.
12:45–14:15
(přednášková par. 1
paralelka 103)

Dejvice
NBFIT PC ucebna
místnost T9:350
Hájková K.
14:30–16:00
(přednášková par. 1
paralelka 104)

Dejvice
NBFIT PC ucebna
Rozvrh na letní semestr 2018/2019:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 18. 2. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1126006.html