Statistická analýza dat
| Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
|---|---|---|---|---|
| B4M36SAN | Z,ZK | 6 | 2P+2C | česky |
- Vztahy:
- Předmět B4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět BE4M36SAN (vztah je symetrický)
- Předmět B4M36SAN může být splněn v zastoupení předmětem BE4M36SAN
- Předmět B4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět BE4M36SAN (vztah je symetrický)
- Garant předmětu:
- Jiří Kléma
- Přednášející:
- Jiří Kléma
- Cvičící:
- Alikhan Anuarbekov, Jan Blaha, Jiří Kléma, Zdeněk Míkovec, Tomáš Pevný
- Předmět zajišťuje:
- katedra počítačů
- Anotace:
-
Cílem předmětu je seznámit se se statistickými přístupy k analýze dat nad rámec tradiční výuky statistiky a
pravděpodobnosti. Kurz se soustředí na vícepříznakovou explorativní statistickou analýzu, prohloubí ale i znalosti konfirmačních přístupů. Mezi konkrétní témata patří práce s multivariátními lineárními modely, včetně zobecněných multivariátních modelů a jejich nelineárních variant. Dále se studující budou zabývat diskriminační analýzou, robustní statistikou, redukcí dimenze a návrhem a vyhodnocením empirických studií.
- Požadavky:
-
Znalost základů statistiky v rozsahu předmětu B0B01PST. Znalosti lineární klasifikace, shlukování a redukce dimenze v rozsahu B4B33RPZ.
- Osnova přednášek:
-
1. Lineární regresní modely, použití, interpretace, typy proměnných, význam p-hodnot.
2. Multivariátní regresní modely, multikolinearita, heteroskedasticita, outliery, interakce.
3. Multivariátní regresní modely, výběr proměnných, přeučení, regularizace (ridge, LASSO).
4. Nelineární regrese, polynomiální, lokální, splajny.
5. Diskriminační analýza, logistická regrese, LDA, ROC analýza.
6. Zobecněné lineární modely (GLM), link funkce.
7. Redukce dimenze, PCA a kernel PCA.
8. Redukce dimenze, MDS, Isomap, LLE.
9. Robustní statistika, odolnost vůči outlierům, M-estimátory.
10. Detekce anomálií, statistické a model-based přístupy
11. Analýza časových řad, základní pojmy, stacionarita, trend, sezonalita.
12. Analýza časových řad, spektrum, periodogram, metody AR, MA a ARIMA.
13. Návrh a vyhodnocení empirické studie, power analysis.
14. Opakování a souhrn.
- Osnova cvičení:
-
1. Statistické testování, t-test, významnost, síla testu.
2. Jednoduchá lineární regrese.
3. Regularizovaná lineární regrese.
4. Nelineární regrese.
5. Diskriminační analýza.
6. Generalizované lineární modely.
7. Průběžný test, závěrečný projekt.
8. Redukce dimenzionality.
9. Robustní statistika.
10. Detekce anomálií.
11. Návrh empirické studie, analýza síly testu.
12. Shluková analýza.
13. Analýza časových řad.
14. Závěrečný projekt týmové prezentace.
- Cíle studia:
-
Po absolvování předmětu budou studující schopni navrhnout a provést vícerozměrnou analýzu dat včetně návrhu vhodných statistických modelů a jejich srozumitelné interpretace. Bude schopen posoudit účinnost vytvořených modelů a ovládat postupy pro jejich empirické vyhodnocení, včetně validace, testování generalizace a odhadu statistické síly. Rozumí potenciálním problémům modelování, jako je přeučení, multikolinearita, nevyváženost dat či citlivost na odlehlé hodnoty. Získané dovednosti využije jak při výzkumu, tak při analýze komplexních dat v praxi.
- Studijní materiály:
-
1. James, G. et al.: An Introduction to Statistical Learning with Applications in R., Springer, 2013.
2. James, G. et al.: An Introduction to Statistical Learning with Applications in Python, 2023.
3. Hastie, T. et al.: The Elements of Statistical Learning, Springer, 2009.
- Poznámka:
- Další informace:
- https://cw.fel.cvut.cz/wiki/courses/B4M36SAN
- Rozvrh na zimní semestr 2025/2026:
-
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po Út St Čt Pá - Rozvrh na letní semestr 2025/2026:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Lékařská elektronika a bioinformatika - Specializace Bioinformatika (povinný předmět programu)
- Otevřená informatika - Interakce člověka s počítačem 2018 (povinný předmět oboru)
- Otevřená informatika - Kybernetická bezpečnost 2018 (povinný předmět oboru)
- Otevřená informatika - Bioinformatika 2018 (povinný předmět oboru)
- Otevřená informatika - Datové vědy 2018 (povinný předmět oboru)
- Lékařská elektronika a bioinformatika - Specializace Lékařská technika (povinný předmět programu)
- Lékařská elektronika a bioinformatika - Specializace Zpracování obrazu (povinný předmět programu)
- Lékařská elektronika a bioinformatika - Specializace Zpracování signálů (povinný předmět programu)
- Otevřená informatika - Kybernetická bezpečnost (PS)
- Otevřená informatika - Datové vědy (PS)