Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2025/2026

Statistical data analysis

Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
BE4M36SAN Z,ZK 6 2P+2C anglicky
Vztahy:
Předmět BE4M36SAN může při kontrole studijních plánů nahradit předmět B4M36SAN
Předmět BE4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět B4M36SAN (vztah je symetrický)
Předmět BE4M36SAN nesmí být zapsán, je-li v témže semestru zapsán anebo již dříve absolvován předmět B4M36SAN (vztah je symetrický)
Garant předmětu:
Jiří Kléma
Přednášející:
Jiří Kléma
Cvičící:
Alikhan Anuarbekov, Jiří Kléma, Tomáš Pevný
Předmět zajišťuje:
katedra počítačů
Anotace:

Cílem předmětu je seznámit se se statistickými přístupy k analýze dat nad rámec tradiční výuky statistiky a

pravděpodobnosti. Kurz se soustředí na vícepříznakovou explorativní statistickou analýzu, prohloubí ale i znalosti konfirmačních přístupů. Mezi konkrétní témata patří práce s multivariátními lineárními modely, včetně zobecněných multivariátních modelů a jejich nelineárních variant. Dále se studující budou zabývat diskriminační analýzou, robustní statistikou, redukcí dimenze a návrhem a vyhodnocením empirických studií.

Požadavky:

Znalost základů statistiky v rozsahu předmětu B0B01PST. Znalosti lineární klasifikace, shlukování a redukce dimenze v rozsahu B4B33RPZ.

Osnova přednášek:

1. Lineární regresní modely, použití, interpretace, typy proměnných, význam p-hodnot.

2. Multivariátní regresní modely, multikolinearita, heteroskedasticita, outliery, interakce.

3. Multivariátní regresní modely, výběr proměnných, přeučení, regularizace (ridge, LASSO).

4. Nelineární regrese, polynomiální, lokální, splajny.

5. Diskriminační analýza, logistická regrese, LDA, ROC analýza.

6. Zobecněné lineární modely (GLM), link funkce.

7. Redukce dimenze, PCA a kernel PCA.

8. Redukce dimenze, MDS, Isomap, LLE.

9. Robustní statistika, odolnost vůči outlierům, M-estimátory.

10. Detekce anomálií, statistické a model-based přístupy

11. Analýza časových řad, základní pojmy, stacionarita, trend, sezonalita.

12. Analýza časových řad, spektrum, periodogram, metody AR, MA a ARIMA.

13. Návrh a vyhodnocení empirické studie, power analysis.

14. Opakování a souhrn.

Osnova cvičení:

1. Statistické testování, t-test, významnost, síla testu.

2. Jednoduchá lineární regrese.

3. Regularizovaná lineární regrese.

4. Nelineární regrese.

5. Diskriminační analýza.

6. Generalizované lineární modely.

7. Průběžný test, závěrečný projekt.

8. Redukce dimenzionality.

9. Robustní statistika.

10. Detekce anomálií.

11. Návrh empirické studie, analýza síly testu.

12. Shluková analýza.

13. Analýza časových řad.

14. Závěrečný projekt týmové prezentace.

Cíle studia:
Studijní materiály:

1. James, G. et al.: An Introduction to Statistical Learning with Applications in R., Springer, 2013.

2. James, G. et al.: An Introduction to Statistical Learning with Applications in Python, 2023.

3. Hastie, T. et al.: The Elements of Statistical Learning, Springer, 2009.

Poznámka:
Další informace:
https://cw.fel.cvut.cz/wiki/courses/B4M36SAN
Rozvrh na zimní semestr 2025/2026:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
místnost KN:E-301
Kléma J.
12:45–14:15
(přednášková par. 1)
Karlovo nám.
Šrámkova posluchárna K9
místnost KN:E-311
Anuarbekov A.
Pevný T.

16:15–17:45
(přednášková par. 1
paralelka 102)

Karlovo nám.
Lab K311
Út
St
Čt

Rozvrh na letní semestr 2025/2026:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 2. 6. 2026
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet4878306.html