Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Strojové učení a analýza dat

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
AD4M33SAD Z,ZK 6 14KP+6KC česky
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra kybernetiky
Anotace:

Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely např ve formě grafů či pravidel. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují.

Přednáší se v angličtině.

Výsledek studentské ankety předmětu je zde: http://www.fel.cvut.cz/anketa/aktualni/courses/A4M33SAD

Požadavky:

Znalosti z předmětu A4B33RPZ.

URL: http://cw.felk.cvut.cz/doku.php/courses/m33sad/start

Osnova přednášek:

1. Course introduction. Cluster analysis -- foundations (k-means, hierarchical and EM clustering).

2. Cluster analysis -- advanced methods (spectral clustering).

3. Cluster analysis -- special methods (conceptual and semi-supervised clustering, co-clustering).

4. Frequent itemset mining. the Apriori algorithm, association rules.

5. Frequent sequence mining. Episode rules. Sequence models.

6. Frequent subtrees and subgraphs.

7. Dimensionality reduction.

8. Computational learning theory - intro, PAC learning.

9. Computational learning theory (cont'd).

10. PAC-learning logic forms.

11. Learning in predicate logic.

12. Infinite Concept Spaces.

13. Empirical testing of hypotheses.

14. Wrapping up (if 14 lectures).

Osnova cvičení:

1. Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ).

2. Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování.

3. Hierarchické shlukování, analýza hlavních komponent.

4. Spektrální shlukování.

5. Hledání častých množin položek a asociačních pravidel.

6. Hledání častých sekvencí a podgrafů.

7. Test z první poloviny kurzu. Křivka učení.

8. Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace.

9. Výběr a hodnocení modelu, ROC analýza.

10. Práce na projektu.

11. Práce na projektu.

12. Induktivní logické programování: systém Aleph.

13. Statistické relační učení: systém Alchemy.

14. Udělování zápočtů, rezerva.

Cíle studia:

Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.

Studijní materiály:

T. Mitchell: Machine Learning, McGraw Hill, 1997

P. Langley: Elements of Machine Learning, Morgan Kaufman 1996

T. Hastie et al: The elements of Statistical Learning, Springer 2001

Poznámka:

Rozsah výuky v kombinované formě studia: 14p+6c

Další informace:
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 23. 9. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1241106.html