Vytěžování znalostí z dat
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
BI-VZD | Z,ZK | 4 | 2+2 | česky |
- Přednášející:
- Pavel Kordík (gar.)
- Cvičící:
- Pavel Kordík (gar.)
- Předmět zajišťuje:
- katedra teoretické informatiky
- Anotace:
-
Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
- Požadavky:
- Osnova přednášek:
-
1. Úvod do data miningu, příprava dat, vizualizace dat.
2. Statistická analýza dat.
3. Model dat, metoda nejbližšího souseda
4. Učení, validace, testování, hodnocení kvality modelu
5. Umělé neuronové sítě v data miningu.
6. Neuronové sítě bez učitele - kompetiční učení
7. Pravděpodobnost a Bayesovská klasifikace
8. Rozhodovací stromy a pravidla.
9. Neuronové sítě s učitelem.
10. Shluková analýza.
11. Kombinování neuronových sítí a modelů obecně.
12. Data mining v prostředí Clementine.
13. Text mining, Web mining, vybrané aplikace a nové trendy.
- Osnova cvičení:
-
1. Data, vizualizace, statistiky.
2. Statistická analýza dat.
3. Předzpracování dat, redukce dimenzionality, významnost vstupů.
4. Model, trénování, testování, validace modelu.
5. Proces vytěžování dat, klasifikace, predikce, modelování
6. Shluková analýza a SOM.
7. Zadání semestrální úlohy.
8. [3] Konzultace a práce na úloze.
9. [3] Prezentace výsledků, workshop
10. Zápočet
- Cíle studia:
-
Cílem předmětu je poskytnout základní úvod do velmi rychle se rozvíjejícího oboru - vytěžování znalostí z dat.
- Studijní materiály:
-
1. Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.
- Poznámka:
-
Rozsah=prednasky+proseminare+cviceni:2p+2c
- Rozvrh na zimní semestr 2011/2012:
- Rozvrh není připraven
- Rozvrh na letní semestr 2011/2012:
-
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po Út St Čt Pá - Předmět je součástí následujících studijních plánů:
-
- Teoretická informatika - verze pro ty, kteří se zapsali v roce 2009 a 2010 (povinný předmět oboru)
- Informační systémy a management - verze pro ty, kteří se zapsali v roce 2009 a 2010 (VO)
- Informatika, plán pro fázi studia bez oboru - verze pro ty, kteří se zapsali v roce 2009 a 2010 (VO)
- Informatika, plán pro fázi studia bez oboru - verze pro ty, kteří se zapsali v roce 2011 a 2012 (VO)
- Informační systémy a management - verze pro ty, kteří se zapsali v roce 2011 a 2012 (VO)
- Teoretická informatika - verze pro ty, kteří se zapsali v roce 2011 a 2012 (povinný předmět oboru)