Logo ČVUT
Loading...
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2011/2012

Strojové učení a analýza dat

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
A4M33SAD Z,ZK 6 2+2c česky
Přednášející:
Filip Železný (gar.), Jiří Kléma
Cvičící:
Filip Železný (gar.), Jiří Kléma, Ondřej Kuželka, Andrea Szabóová
Předmět zajišťuje:
katedra kybernetiky
Anotace:

Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely založené např. na grafové či pravidlové reprezentaci. Zvláštní pozornost je v předmětu věnována modelování relačních dat. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují.

Požadavky:

Znalosti z předmětu A4B33RPZ.

URL: http://cw.felk.cvut.cz/doku.php/courses/m33sad/start

Osnova přednášek:

1. Úvod do předmětu. Shluková analýza -- základní algoritmy (k-středů, hierarchické, EM).

2. Shluková analýza -- pokročilé metody (spektrální).

3. Shluková analýza -- specializované metody (konceptuální, dvojshlukování, s poloučitelem).

4. Časté množiny položek, algoritmus Apriori, asociační pravidla.

5. Časté posloupnosti, epizodální pravidla, modely posloupností.

6. Časté podstromy/podgrafy.

7. Učení z textů a webu, aplikace.

8. Výpočetní teorie učení, konceptový prostor, PAC učení

9. PAC učení logických forem, klasifikační pravidla.

10. Induktivní logické programování, nejmenší zobecnění, inverze důsledku

11. Učení z logických interpretací, relační rozhodovací stromy, relační rysy

12. Statistické relační učení: pravděpodobnostní relační modely

13. Statistické relační učení: Markovská logika

14. Shrnutí učiva, rezerva.

Osnova cvičení:

1. Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ).

2. Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování.

3. Hierarchické shlukování, analýza hlavních komponent.

4. Hledání častých množin položek a asociačních pravidel.

5. Hledání častých sekvencí a podgrafů.

6. Učení z textů.

7. Test z první poloviny kurzu. Křivka učení.

8. Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace

9. Výběr a hodnocení modelu, ROC analýza

10. Práce na projektu

11. Práce na projektu

12. Induktivní logické programování: systém Aleph.

13. Statistické relační učení: systém Alchemy.

14. Udělování zápočtů, rezerva.

Cíle studia:

Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.

Studijní materiály:

V. Mařík et al. (eds): Umělá inteligence II, III, IV

T. Mitchell: Machine Learning, McGraw Hill, 1997

P. Langley: Elements of Machine Learning, Morgan Kaufman 1996

T. Hastie et al: The elements of Statistical Learning, Springer 2001

S. Džeroski, N. Lavrač: Relational Data Mining, Springer 2001

L. Getoor, B. Taskar (eds): Introduction to Statistical Relational

Learning, MIT Press 2007

Poznámka:

Rozsah výuky v kombinované formě studia: 14p+6c

Rozvrh na zimní semestr 2011/2012:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
místnost KN:E-128
Železný F.
Kléma J.

11:00–12:30
(přednášková par. 1)
Karlovo nám.
Cvičebna K3
místnost KN:E-132
Szabóová A.
Kuželka O.

14:30–16:00
(přednášková par. 1
paralelka 101)

Karlovo nám.
Laboratoř PC
místnost KN:E-132
Szabóová A.
Kuželka O.

16:15–17:45
(přednášková par. 1
paralelka 102)

Karlovo nám.
Laboratoř PC
St
Čt

Rozvrh na letní semestr 2011/2012:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 9. 7. 2012
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet12586004.html