Logo ČVUT
Loading...
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2011/2012

Vytěžování znalostí z dat

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
BIK-VZD Z,ZK 4 13+4 česky
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra teoretické informatiky
Anotace:

Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Požadavky:
Osnova přednášek:

1. Úvod do data miningu, příprava dat, vizualizace dat. Statistická analýza dat.

2. Model dat, metoda nejbližšího souseda Učení, validace, testování, hodnocení kvality modelu

3. Umělé neuronové sítě v data miningu. Neuronové sítě bez učitele - kompetiční učení

4. Pravděpodobnost a Bayesovská klasifikace Rozhodovací stromy a pravidla.

5. Neuronové sítě s učitelem. Shluková analýza.

6. Kombinování neuronových sítí a modelů obecně. Data mining v prostředí Clementine.

7. Text mining, Web mining, vybrané aplikace a nové trendy.

Osnova cvičení:

1. Data, vizualizace, statistiky. Statistická analýza dat. Předzpracování dat, redukce dimenzionality, významnost vstupů. Model, trénování, testování, validace modelu. Proces vytěžování dat, klasifikace, predikce, modelování.

2. Shluková analýza a SOM. Zadání semestrální úlohy. Konzultace a práce na úloze. Prezentace výsledků, workshop Zápočet

Cíle studia:

Cílem předmětu je poskytnout základní úvod do velmi rychle se rozvíjejícího oboru - vytěžování znalostí z dat.

Studijní materiály:

Berka, P. ''Dobývání znalostí z databází''. Praha: Academia, 2003. ISBN 80-200-1062-9.

Larose, D. T. ''Discovering Knowledge in Data: An Introduction to Data Mining''. Wiley-Interscience, 2004. ISBN 0471666572.

Poznámka:

Rozsah=konzultace+seminae, Prednasejici: Ing. Pavel Kordík Ph.D.

Další informace:
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 9. 7. 2012
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1441306.html