Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Statistical data analysis

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
BE4M36SAN Z,ZK 6 2P+2C
Předmět nesmí být zapsán současně s:
Statistická analýza dat (B4M36SAN)
Předmět je náhradou za:
Statistická analýza dat (B4M36SAN)
Přednášející:
Jiří Kléma (gar.)
Cvičící:
Jiří Kléma (gar.)
Předmět zajišťuje:
katedra počítačů
Anotace:

Cílem předmětu je seznámit se se statistckými přístupy k analýze dat nad rámec tradiční výuky statistiky a pravděpodobnosti. Kurz se soustředí na vícepříznakovou explorativní statistickou analýzu, prohloubí ale i znalosti konfirmačních přístupů.

Požadavky:

Znalost základů statistiky v rozsahu předmětu B0B01PST. Znalosti lineární klasifikace, shlukování a redukce dimenze v rozsahu B4B33RPZ.

Osnova přednášek:

1. Základy datové analýzy. Sumarizace dat a statistické testy.

2. Analýza variance, faktorová analýza, analýzy přežití.

3. Mnoharozměrná statistická analýza, MANOVA a MANCOVA.

4. Redukce dimenze, MDS, kernel PCA, SOM.

5. Pokročilé metody shlukování (spektrální, dvojshlukování).

6 Lineární a logistická regrese, LDA, GLM.

7. Hodnocení prediktivních modelů, ROC analýza

8. Převzorkování, permutační testy, korekce pro opakované testy

9. Detekce anomálií a robustní statistika

10. Vyhledávání informací v textu a hypertextu

11. Analýza časových řad, spektrum, periodogram, metody AR, MA a ARIMA.

12. Návrh a vyhodnocení empirické studie, power analysis.

13. Vyhledávání častých podmnožin a podsekvencí

14. Rezerva

Osnova cvičení:

1. Úvod do programování v R.

2. Knihovny R, statistické knihovny, learning package Swirl.

3. Vizualizaci dat v R.

4. Redukce dimenze - samostatná úloha.

5. Shlukování - samostatná úloha.

6. Mnoharozměrná konfirmační analýza -- samostatná úloha.

7. Diskriminační analýza -- samostatná úloha.

8. Průběžný test znalostí.

9. Mnoharozměrná lineání regrese -- samostatná úloha.

10. Mnoharozměrná nelineání regrese -- samostatná úloha.

11. Detekce anomálíí -- samostatná úloha.

12. Návrh emprické studie -- samostatná úloha.

13. Power analysis -- samostatná úloha.

14. Rezerva, zápočty.

Cíle studia:
Studijní materiály:

1. Hair, J. F., et al.: Multivariate Data Analysis: A Global Perspective. 7th ed., Prentice Hall, 2009.

2. James, G. et al.: An Introduction to Statistical Learning with Applications in R., Springer, 2013.

Poznámka:
Rozvrh na zimní semestr 2019/2020:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
místnost KN:E-301
Kléma J.
12:45–14:15
(přednášková par. 1)
Karlovo nám.
Šrámkova posluchárna K9
místnost KN:E-311
Kléma J.
16:15–17:45
(přednášková par. 1
paralelka 102)

Karlovo nám.
Lab K311
Út
St
Čt

Rozvrh na letní semestr 2019/2020:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 18. 10. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet4878306.html