Strojové učení a analýza dat
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
A4M33SAD | Z,ZK | 6 | 2P+2C | česky |
- Vztahy:
- Předmět A4M33SAD nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět AE4M33SAD (vztah je symetrický)
- Předmět A4M33SAD může být splněn v zastoupení předmětem AE4M33SAD
- Předmět A4M33SAD nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět AE4M33SAD (vztah je symetrický)
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra počítačů
- Anotace:
-
Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely např ve formě grafů či pravidel. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují.
Přednáší se v angličtině.
Výsledek studentské ankety předmětu je zde: http://www.fel.cvut.cz/anketa/aktualni/courses/A4M33SAD
- Požadavky:
-
Znalosti z předmětu A4B33RPZ.
- Osnova přednášek:
-
1. Course introduction. Cluster analysis -- foundations (k-means, hierarchical and EM clustering).
2. Cluster analysis -- advanced methods (spectral clustering).
3. Cluster analysis -- special methods (conceptual and semi-supervised clustering, co-clustering).
4. Frequent itemset mining. the Apriori algorithm, association rules.
5. Frequent sequence mining. Episode rules. Sequence models.
6. Frequent subtrees and subgraphs.
7. Dimensionality reduction.
8. Computational learning theory - intro, PAC learning.
9. Computational learning theory (cont'd).
10. PAC-learning logic forms.
11. Learning in predicate logic.
12. Infinite Concept Spaces.
13. Empirical testing of hypotheses.
14. Wrapping up (if 14 lectures).
- Osnova cvičení:
-
1. Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ).
2. Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování.
3. Hierarchické shlukování, analýza hlavních komponent.
4. Spektrální shlukování.
5. Hledání častých množin položek a asociačních pravidel.
6. Hledání častých sekvencí a podgrafů.
7. Test z první poloviny kurzu. Křivka učení.
8. Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace.
9. Výběr a hodnocení modelu, ROC analýza.
10. Práce na projektu.
11. Práce na projektu.
12. Induktivní logické programování: systém Aleph.
13. Statistické relační učení: systém Alchemy.
14. Udělování zápočtů, rezerva.
- Cíle studia:
-
Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.
- Studijní materiály:
-
T. Mitchell: Machine Learning, McGraw Hill, 1997
P. Langley: Elements of Machine Learning, Morgan Kaufman 1996
T. Hastie et al: The elements of Statistical Learning, Springer 2001
- Poznámka:
-
Rozsah výuky v kombinované formě studia: 14p+6c
- Další informace:
- http://cw.felk.cvut.cz/doku.php/courses/a4m33sad/start
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů: