Logo ČVUT
Loading...
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2011/2012

Vytěžování znalostí z dat

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
BI-VZD Z,ZK 4 2+2 česky
Přednášející:
Pavel Kordík (gar.)
Cvičící:
Pavel Kordík (gar.)
Předmět zajišťuje:
katedra teoretické informatiky
Anotace:

Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Požadavky:
Osnova přednášek:

1. Úvod do data miningu, příprava dat, vizualizace dat.

2. Statistická analýza dat.

3. Model dat, metoda nejbližšího souseda

4. Učení, validace, testování, hodnocení kvality modelu

5. Umělé neuronové sítě v data miningu.

6. Neuronové sítě bez učitele - kompetiční učení

7. Pravděpodobnost a Bayesovská klasifikace

8. Rozhodovací stromy a pravidla.

9. Neuronové sítě s učitelem.

10. Shluková analýza.

11. Kombinování neuronových sítí a modelů obecně.

12. Data mining v prostředí Clementine.

13. Text mining, Web mining, vybrané aplikace a nové trendy.

Osnova cvičení:

1. Data, vizualizace, statistiky.

2. Statistická analýza dat.

3. Předzpracování dat, redukce dimenzionality, významnost vstupů.

4. Model, trénování, testování, validace modelu.

5. Proces vytěžování dat, klasifikace, predikce, modelování

6. Shluková analýza a SOM.

7. Zadání semestrální úlohy.

8. [3] Konzultace a práce na úloze.

9. [3] Prezentace výsledků, workshop

10. Zápočet

Cíle studia:

Cílem předmětu je poskytnout základní úvod do velmi rychle se rozvíjejícího oboru - vytěžování znalostí z dat.

Studijní materiály:

1. Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.

Poznámka:

Rozsah=prednasky+proseminare+cviceni:2p+2c

Rozvrh na zimní semestr 2011/2012:
Rozvrh není připraven
Rozvrh na letní semestr 2011/2012:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
místnost T9:349
Kordík P.
09:15–10:45
(přednášková par. 1)
Dejvice
NBFIT místnost
místnost T9:351
Kordík P.
11:00–12:30
(přednášková par. 1
paralelka 101)

Dejvice
NBFIT PC ucebna
místnost T9:351
Kordík P.
12:45–14:15
(přednášková par. 1
paralelka 102)

Dejvice
NBFIT PC ucebna
Út
St
Čt

Předmět je součástí následujících studijních plánů:
Platnost dat k 9. 7. 2012
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1126006.html