Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2024/2025

Statistika pro informatiku

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
MI-SPI.1 Z,ZK 8 4P+2C česky
Garant předmětu:
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra aplikované matematiky
Anotace:

Studenti budou seznámeni se základy teorie pravděpodobnosti, matematické teorie informace a stochastických procesů a s některými metodami výpočetní statistiky. Studenti porozumí metodám statistického zpracování velkého množství dat. Získají schopnosti používat výpočetní metody a statistický software pro různé úlohy.

Požadavky:

Znalost diferenciálního a integrálního počtu, elementární znalosti z pravděpodobnosti a statistiky.

Osnova přednášek:

1. Základní pojmy teorie pravděpodobnosti: pravděpodobnostní prostor, definice, vlastnosti, sigma-spojitost, atd.

2. Základní pojmy teorie pravděpodobnosti: podmíněná pravděpodobnost, nezávislost, komentované příklady

3. Základní pojmy teorie pravděpodobnosti: náhodné veličiny, distribuční funkce, hustota, závislost, náhodný vektor, marginální a spojené rozdělení

4. Základní pojmy teorie pravděpodobnosti: podmíněné rozdělení, podmíněná střední hodnota, charakteristiky náhodných veličin, některá důležitá pravděpodobnostní rozdělení

5. Základní pojmy teorie pravděpodobnosti: Poissonův proces, simulační metody, generující funkce

6. Základní pojmy teorie pravděpodobnosti: silný zákon velkých čísel, centrální limitní věta, velké deviace, entropie

7. Markovské řetězce s diskrétním parametrem a konečným stavovým prostorem: základní pojmy, ireducibilita a periodicita stavu, absorpční pravděpodobnost, stopping time

8. Markovské řetězce s diskrétním parametrem: Příklady: zobecněná náhodná procházka, náhodná procházka na grafu, gambler's ruin, coupon collector

9. Markovské řetězce s diskrétním parametrem: Asymptotická stacionarita, jednoznačnost a existence stacionárnáho rozdělení, konvergence

10. Markovské řetězce s diskrétním parametrem: Branching procesy, birth & death procesy

11. Metody Monte Carlo: Markov Chain Monte Carlo (MCMC) - základy a příklady

12. Metody Monte Carlo: Rychlá konvergence MCMC, Propp-Wilsonův algoritmus, Sandwiching, Simulated annealing

13. Metody Monte Carlo: Monte Carlo odhady, Monte Carlo testy, redukce rozptylu

14. Stochastické procesy: definice, distribuční funkce, charakteristiky stochastických procesů

15. Stochastické procesy: charakteristiky a klasifikace stochastických procesů, příklady.

16. Základy teorie front: prvky systému hromadné obsluhy, vstupní tok požadavků, obsluha a její režim, fronta a její režim

17. Stochastické procesy: aplikace Poissonova procesu v teorii front

18. Stochastické procesy: aplikace Poissonova procesu v teorii front

19. Stochastické procesy: nehomogenní Poissonův proces, prostorový Poissonův proces, fronta M/G/infinity

20. Markovské řetězce se spojitým parametrem: jump rates, časování skoků pomocí Poissonova procesu, Kolmogorovovy Rovnice

21. Základy teorie front: Fronty M/M/m, systémy hromadné obsluhy

22. Základy teorie front: otevřené a uzavřené systémy hromadné obsluhy

23. Bootstrap metody: vlastnosti bootstrapových aproximací, korekce vychýlení odhadu bootstrapem

24. Bootstrap metody: intervaly spolehlivosti bootstrapem, permutační bootstrap

25. Bootstrap metody: bootstrapové intervaly spolehlivosti parametrů v lineární regresi

26. Odhady hustot pravděpodobnosti: histogramy, jádrové odhady, metoda maximální věrohodnosti, metoda momentů

Osnova cvičení:

1. Podmíněná pravděpodobnost, Bayesův vzorec, rozhodovací stromy, náhodná veličina, některá rozdělení pravděpodobnosti, náhodný vektor, nezávislost.

2. Shannonova entropie diskrétních a spojitých náhodných veličin. Řetězcové pravidlo.

3. Stochastické procesy, autokorelační funkce, vzájemná korelační funkce, spektrální hustota, Bernoulliho a Poissonův proces.

4. Aplikace Poissonova procesu v teorii front, fronta M/G/infinity, Markovské procesy s diskrétním časem.

5. Markovské procesy se spojitým časem, fronty M/M/m, systémy hromadné obsluhy.

6. Generování náhodných čísel, aplikace metody Monte Carlo, bootstrapové intervalové odhady, korekce vychýlení odhadu.

7. Histogram, jádrové odhady hustot pravděpodobnosti, parametrické metody odhadu hustot, směs rozdělení pravděpodobnosti.

Cíle studia:

Cílem předmětu je předat studentům základní znalosti z teorie pravděpodobnosti, teorie informace a stochastických procesů. Dále předmět přináší potřebné znalosti statistiky pro analýzu a zpracování dat. Předmět dále poskytuje znalosti metod výpočetní statistiky a seznamuje studenty s použitím statistických software.

Studijní materiály:

Antoch, J., Vorlíčková, D. ''Vybrané metody statistické analýzy dat''. Praha: Academia, 1992. ISBN 80-200-0204-9.

Prášková, Z. ''Základy náhodných procesů''. Praha: Karolinum, 1998. ISBN 80-7184-688-0.

Vajda, I. ''Teorie informace''. Praha: ČVUT, 2004. ISBN 80-01-02986-7.

Cover, T. M., Thomas, J. A. ''Elements of Information Theory (2nd Edition)''. Wiley-Interscience, 2006. ISBN 0471241954.

Gentle, J. E. ''Elements of Computational Statistics''. Springer, 2005. ISBN 0387954899.

Trivedi, K. S. ''Probability and Statistics with Reliability, Queueing, and Computer Science Applications (2nd Edition)''. Wiley-Interscience, 2001. ISBN 0471333417.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-SPI/

Další informace:
https://courses.fit.cvut.cz/MI-SPI/
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 16. 6. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet1806906.html