Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2025/2026

Statistická analýza dat

Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
B4M36SAN Z,ZK 6 2P+2C česky
Vztahy:
Předmět B4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět BE4M36SAN (vztah je symetrický)
Předmět B4M36SAN může být splněn v zastoupení předmětem BE4M36SAN
Předmět B4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět BE4M36SAN (vztah je symetrický)
Garant předmětu:
Jiří Kléma
Přednášející:
Jiří Kléma
Cvičící:
Alikhan Anuarbekov, Jan Blaha, Jiří Kléma, Zdeněk Míkovec, Tomáš Pevný
Předmět zajišťuje:
katedra počítačů
Anotace:

Cílem předmětu je seznámit se se statistickými přístupy k analýze dat nad rámec tradiční výuky statistiky a

pravděpodobnosti. Kurz se soustředí na vícepříznakovou explorativní statistickou analýzu, prohloubí ale i znalosti konfirmačních přístupů. Mezi konkrétní témata patří práce s multivariátními lineárními modely, včetně zobecněných multivariátních modelů a jejich nelineárních variant. Dále se studující budou zabývat diskriminační analýzou, robustní statistikou, redukcí dimenze a návrhem a vyhodnocením empirických studií.

Požadavky:

Znalost základů statistiky v rozsahu předmětu B0B01PST. Znalosti lineární klasifikace, shlukování a redukce dimenze v rozsahu B4B33RPZ.

Osnova přednášek:

1. Lineární regresní modely, použití, interpretace, typy proměnných, význam p-hodnot.

2. Multivariátní regresní modely, multikolinearita, heteroskedasticita, outliery, interakce.

3. Multivariátní regresní modely, výběr proměnných, přeučení, regularizace (ridge, LASSO).

4. Nelineární regrese, polynomiální, lokální, splajny.

5. Diskriminační analýza, logistická regrese, LDA, ROC analýza.

6. Zobecněné lineární modely (GLM), link funkce.

7. Redukce dimenze, PCA a kernel PCA.

8. Redukce dimenze, MDS, Isomap, LLE.

9. Robustní statistika, odolnost vůči outlierům, M-estimátory.

10. Detekce anomálií, statistické a model-based přístupy

11. Analýza časových řad, základní pojmy, stacionarita, trend, sezonalita.

12. Analýza časových řad, spektrum, periodogram, metody AR, MA a ARIMA.

13. Návrh a vyhodnocení empirické studie, power analysis.

14. Opakování a souhrn.

Osnova cvičení:

1. Statistické testování, t-test, významnost, síla testu.

2. Jednoduchá lineární regrese.

3. Regularizovaná lineární regrese.

4. Nelineární regrese.

5. Diskriminační analýza.

6. Generalizované lineární modely.

7. Průběžný test, závěrečný projekt.

8. Redukce dimenzionality.

9. Robustní statistika.

10. Detekce anomálií.

11. Návrh empirické studie, analýza síly testu.

12. Shluková analýza.

13. Analýza časových řad.

14. Závěrečný projekt týmové prezentace.

Cíle studia:

Po absolvování předmětu budou studující schopni navrhnout a provést vícerozměrnou analýzu dat včetně návrhu vhodných statistických modelů a jejich srozumitelné interpretace. Bude schopen posoudit účinnost vytvořených modelů a ovládat postupy pro jejich empirické vyhodnocení, včetně validace, testování generalizace a odhadu statistické síly. Rozumí potenciálním problémům modelování, jako je přeučení, multikolinearita, nevyváženost dat či citlivost na odlehlé hodnoty. Získané dovednosti využije jak při výzkumu, tak při analýze komplexních dat v praxi.

Studijní materiály:

1. James, G. et al.: An Introduction to Statistical Learning with Applications in R., Springer, 2013.

2. James, G. et al.: An Introduction to Statistical Learning with Applications in Python, 2023.

3. Hastie, T. et al.: The Elements of Statistical Learning, Springer, 2009.

Poznámka:
Další informace:
https://cw.fel.cvut.cz/wiki/courses/B4M36SAN
Rozvrh na zimní semestr 2025/2026:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
místnost KN:E-301
Kléma J.
12:45–14:15
(přednášková par. 1)
Karlovo nám.
Šrámkova posluchárna K9
místnost KN:A-424
Kléma J.
Míkovec Z.

14:30–16:00
(přednášková par. 1
paralelka 101)

Karlovo nám.
Poč. učebna A424
místnost KN:E-311
Anuarbekov A.
Pevný T.

16:15–17:45
(přednášková par. 1
paralelka 102)

Karlovo nám.
Lab K311
místnost KN:E-311
Anuarbekov A.
18:00–19:30
(přednášková par. 1
paralelka 103)

Karlovo nám.
Lab K311
Út
místnost KN:E-328
Blaha J.
14:30–16:00
(přednášková par. 1
paralelka 104)

Karlovo nám.
Bourací učebna
St
Čt

Rozvrh na letní semestr 2025/2026:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 26. 5. 2026
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet4702306.html