Statistical data analysis
| Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
|---|---|---|---|---|
| BE4M36SAN | Z,ZK | 6 | 2P+2C | anglicky |
- Vztahy:
- Předmět BE4M36SAN může při kontrole studijních plánů nahradit předmět B4M36SAN
- Předmět BE4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět B4M36SAN (vztah je symetrický)
- Předmět BE4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět B4M36SAN (vztah je symetrický)
- Garant předmětu:
- Jiří Kléma
- Přednášející:
- Jiří Kléma
- Cvičící:
- Alikhan Anuarbekov, Jiří Kléma, Tomáš Pevný
- Předmět zajišťuje:
- katedra počítačů
- Anotace:
-
Cílem předmětu je seznámit se se statistickými přístupy k analýze dat nad rámec tradiční výuky statistiky a
pravděpodobnosti. Kurz se soustředí na vícepříznakovou explorativní statistickou analýzu, prohloubí ale i znalosti konfirmačních přístupů. Mezi konkrétní témata patří práce s multivariátními lineárními modely, včetně zobecněných multivariátních modelů a jejich nelineárních variant. Dále se studující budou zabývat diskriminační analýzou, robustní statistikou, redukcí dimenze a návrhem a vyhodnocením empirických studií.
- Požadavky:
-
Znalost základů statistiky v rozsahu předmětu B0B01PST. Znalosti lineární klasifikace, shlukování a redukce dimenze v rozsahu B4B33RPZ.
- Osnova přednášek:
-
1. Lineární regresní modely, použití, interpretace, typy proměnných, význam p-hodnot.
2. Multivariátní regresní modely, multikolinearita, heteroskedasticita, outliery, interakce.
3. Multivariátní regresní modely, výběr proměnných, přeučení, regularizace (ridge, LASSO).
4. Nelineární regrese, polynomiální, lokální, splajny.
5. Diskriminační analýza, logistická regrese, LDA, ROC analýza.
6. Zobecněné lineární modely (GLM), link funkce.
7. Redukce dimenze, PCA a kernel PCA.
8. Redukce dimenze, MDS, Isomap, LLE.
9. Robustní statistika, odolnost vůči outlierům, M-estimátory.
10. Detekce anomálií, statistické a model-based přístupy
11. Analýza časových řad, základní pojmy, stacionarita, trend, sezonalita.
12. Analýza časových řad, spektrum, periodogram, metody AR, MA a ARIMA.
13. Návrh a vyhodnocení empirické studie, power analysis.
14. Opakování a souhrn.
- Osnova cvičení:
-
1. Statistické testování, t-test, významnost, síla testu.
2. Jednoduchá lineární regrese.
3. Regularizovaná lineární regrese.
4. Nelineární regrese.
5. Diskriminační analýza.
6. Generalizované lineární modely.
7. Průběžný test, závěrečný projekt.
8. Redukce dimenzionality.
9. Robustní statistika.
10. Detekce anomálií.
11. Návrh empirické studie, analýza síly testu.
12. Shluková analýza.
13. Analýza časových řad.
14. Závěrečný projekt týmové prezentace.
- Cíle studia:
- Studijní materiály:
-
1. James, G. et al.: An Introduction to Statistical Learning with Applications in R., Springer, 2013.
2. James, G. et al.: An Introduction to Statistical Learning with Applications in Python, 2023.
3. Hastie, T. et al.: The Elements of Statistical Learning, Springer, 2009.
- Poznámka:
- Další informace:
- https://cw.fel.cvut.cz/wiki/courses/B4M36SAN
- Rozvrh na zimní semestr 2025/2026:
-
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po Út St Čt Pá - Rozvrh na letní semestr 2025/2026:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Open Informatics - Human-Computer Interaction (povinný předmět oboru)
- Open Informatics - Cyber Security (povinný předmět oboru)
- Open Informatics - Bioinformatics (povinný předmět oboru)
- Open Informatics - Data Science (povinný předmět oboru)
- Medical Electronics and Bioinformatics - Specialization Image Processing (povinný předmět programu)
- Medical Electronics and Bioinformatics - Specialization Signal Processing (povinný předmět programu)
- Medical Electronics and Bioinformatics - Specialization Bioinformatics (povinný předmět programu)
- Medical Electronics and Bioinformatics - Specialization Medical Instrumentation (povinný předmět programu)
- Open Informatics - Cyber Security 2026 (PS)
- Open Informatics - Data Science 2026 (PS)