Strojové učení a analýza dat
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
A4M33SAD | Z,ZK | 6 | 2+2c | česky |
- Přednášející:
- Filip Železný (gar.), Jiří Kléma
- Cvičící:
- Filip Železný (gar.), Jiří Kléma, Ondřej Kuželka, Andrea Szabóová
- Předmět zajišťuje:
- katedra kybernetiky
- Anotace:
-
Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely založené např. na grafové či pravidlové reprezentaci. Zvláštní pozornost je v předmětu věnována modelování relačních dat. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují.
- Požadavky:
-
Znalosti z předmětu A4B33RPZ.
- Osnova přednášek:
-
1. Úvod do předmětu. Shluková analýza -- základní algoritmy (k-středů, hierarchické, EM).
2. Shluková analýza -- pokročilé metody (spektrální).
3. Shluková analýza -- specializované metody (konceptuální, dvojshlukování, s poloučitelem).
4. Časté množiny položek, algoritmus Apriori, asociační pravidla.
5. Časté posloupnosti, epizodální pravidla, modely posloupností.
6. Časté podstromy/podgrafy.
7. Učení z textů a webu, aplikace.
8. Výpočetní teorie učení, konceptový prostor, PAC učení
9. PAC učení logických forem, klasifikační pravidla.
10. Induktivní logické programování, nejmenší zobecnění, inverze důsledku
11. Učení z logických interpretací, relační rozhodovací stromy, relační rysy
12. Statistické relační učení: pravděpodobnostní relační modely
13. Statistické relační učení: Markovská logika
14. Shrnutí učiva, rezerva.
- Osnova cvičení:
-
1. Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ).
2. Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování.
3. Hierarchické shlukování, analýza hlavních komponent.
4. Hledání častých množin položek a asociačních pravidel.
5. Hledání častých sekvencí a podgrafů.
6. Učení z textů.
7. Test z první poloviny kurzu. Křivka učení.
8. Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace
9. Výběr a hodnocení modelu, ROC analýza
10. Práce na projektu
11. Práce na projektu
12. Induktivní logické programování: systém Aleph.
13. Statistické relační učení: systém Alchemy.
14. Udělování zápočtů, rezerva.
- Cíle studia:
-
Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.
- Studijní materiály:
-
V. Mařík et al. (eds): Umělá inteligence II, III, IV
T. Mitchell: Machine Learning, McGraw Hill, 1997
P. Langley: Elements of Machine Learning, Morgan Kaufman 1996
T. Hastie et al: The elements of Statistical Learning, Springer 2001
S. Džeroski, N. Lavrač: Relational Data Mining, Springer 2001
L. Getoor, B. Taskar (eds): Introduction to Statistical Relational
Learning, MIT Press 2007
- Poznámka:
-
Rozsah výuky v kombinované formě studia: 14p+6c
- Rozvrh na zimní semestr 2011/2012:
-
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po Út St Čt Pá - Rozvrh na letní semestr 2011/2012:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Otevřená informatika - Umělá inteligence (povinný předmět oboru)
- Otevřená informatika - Počítačové vidění a digitální obraz (povinný předmět oboru)
- Biomedicínské inženýrství a informatika - Biomedicínská informatika (povinný předmět oboru)