Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Statistická analýza a vyhodnocení technologických dat

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
XP13SAV Z,ZK 4 2P+2S česky
Přednášející:
Martin Molhanec (gar.)
Cvičící:
Martin Molhanec (gar.)
Předmět zajišťuje:
katedra elektrotechnologie
Anotace:

Studenti se seznámí na úrovni odpovídající doktorskému studiu s formáty používaných při měření a zpracování dat v průmyslu. S jejich předzpracováním (filtrování a transformace), přenosem a jejich ukládáním. Dále získají hlubší znalosti v oblasti statistická analýzy naměřených dat (testování hypotéz, DOE, regrese, korelace, spojité a nespojité distribuce). Také získají znalosti o vytváření simulačních modelů (spojitých a nespojitých). Nakonec získají znalosti o vhodné vizualizaci takto zpracovaných dat.

Požadavky:
Osnova přednášek:

1)Formáty měřených dat: csv, fixní data. Další formáty používané pro zpracování a archivaci: xml, json. Strukturovaná a nestrukturovaná data. Data na Internetu a v databázi. Textová data.

2)Nástroje na zpracování csv a dalších typů dat. Dávkové zpracování dat ve Windows a Linuxu. Vhodné skriptovací jazyky ve Windows a Linuxu. Příkazová řádka. Použití pipe a přesměrování ve Windows nebo Linuxu.

3)Manipulace s daty, vyhledávání v datech, změna dat a jejich filtrování. Jazyk SQL (základ). Xpath (základ). Správnost dat. Čištění dat.

4)Statistické zpracovaní dat. Mean, průměr, rozptyl, standardní odchylka a další charakteristické hodnoty. Populace a výběr. Korelace a kovariace. Testování hypotéz. Testy normality. Anova. Výpočet modelu.

5)Vizualizace dat a jejich interpretace. Scatter diagram, boxplot, sloupcový diagram. Histogram. Koláčový diagram. Další 2D a 3D diagramy. Zásady tvorby diagramů pro znázornění technologických dat. Popisy os. Volba barev.

6)Excel a jeho využití pro zpracování dat. Pojmenované oblasti. Array funkce a konstanty. Tabulky. Matice. Kontingenční tabulky. Grafy s ohledem na statistické výstupy. Add-Ins. VBA (zaklad).

7)Matlab pro zpracování naměřených hodnot. Zpracovaní csv dat. Statistický toolbox. Spojení s databází. Vizualizace s ohledem na statistické výstupy.

8)Mathematica pro zpracování naměřených hodnot. Zpracovaní csv dat. Statistické funkce. Spojení s databází. Vizualizace s ohledem na statistické výstupy.

9)Python. Základy Jazyka. Knihovny pro zpracování dat. Použití pro zpracování dat. Data z Internetu a přístup do databáze.

10)Python. Náročnější konstrukce. Práce s maticemi. Funkcionální přístup. Pandoc knihovna. Statistika a grafické výstupy. Knihovna Matplotlib.

11)R systém. Základy jazyka. Práce s daty. Statistika. Grafický výstup.

12)Statistické vyhodnocení dat. Regrese, korelace, optimalizace, predikce. Časové řady. Bayes.

13)Tvorba simulačního modelu. Analogová a diskrétní simulace. Modelovací systém AnyLogic.

14)Prezentace dat. Publikování dat. Open access. Autorská práva.

Osnova cvičení:
Cíle studia:
Studijní materiály:

[1] Milan Meloun, Jiří Militký.: Statistické zpracování experimentálních dat, ars magna, 1998, Praha

[2] Václav Dupač a Marie Hušková, Pravděpodobnost a matematická statistika, Karolinum, 2009

[3] M. Navara.: Pravděpodobnost a matematická statistika. Skripta FEL ČVUT, 2007

Poznámka:
Rozvrh na zimní semestr 2019/2020:
Rozvrh není připraven
Rozvrh na letní semestr 2019/2020:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 20. 1. 2020
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet5939806.html