Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024
UPOZORNĚNÍ: Jsou dostupné studijní plány pro následující akademický rok.

Základy datových analýz

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
B6B16ZDA Z,ZK 5 2P+2S+4D česky
Garant předmětu:
Martin Dobiáš
Přednášející:
Kateřina Greif, Pavel Náplava
Cvičící:
Kateřina Greif, Pavel Náplava
Předmět zajišťuje:
katedra ekonomiky, manažerství a humanitních věd
Anotace:

Předmět je zaměřený na úvod do datových analýz a vizualizace dat (informací). V první části jsou definovány klíčové pojmy a postupy, spojené s datovou analýzou. Na příkladech je demonstrováno, jakým způsobem se datová analýza provádí, jak mohou vypadat výstupy a interpretace analýz. Včetně možné manipulace a nevhodného použití. Následně je diskutována existence různých typů dat, jejich dostupnost a způsob získávání. V další části jsou prezentovány a prakticky ověřeny tři kategorie nástrojů a s nimi spojených výstupů. První dvě jsou zaměřeny na jednoduché neprogramovací (typicky MS Excel) a programovací nástroje (typicky Python a odpovídající knihovny). Pomocí těchto nástrojů a vybraných statistických metod jsou provedeny jednodušší analýzy, včetně interpretace výstupů Pro srovnání jsou prezentovány i vybrané pokročilejší metody datových analýz, jako například shlukování dat. Poslední část výuky je věnována třetí kategorii nástrojů a také způsobu analýzy, založené na vizualizaci. Přestože vizualizaci umožňují i předchozí dvě kategorie nástrojů, je cílem této části si nejen vyzkoušet, ale také uvědomit, jakým způsobem může být vizualizace pro datovou analýzu přínosná a důležitá. Pro účely vizualizace a praktickou část výuky je využit komplexní nástroj Power BI.

Požadavky:

Studenti během výuky zpracovávají průběžně menší samostatné úkoly a jeden větší semestrální projekt, v rámci kterých si ověří schopnost provést vybrané postupy analýzy dat. Všechny úkoly jsou uzavřeny prezentací dosažených výstupů. Celý předmět je zakončený zkouškou, v rámci které jsou ověřeny obecné znalosti základů datových analýz a na vybraném příkladu schopnost jejich praktické aplikace studenty.

Osnova přednášek:

1. Definice pojmů a principů datových analýz, datová analýza vs. datová věda, způsoby zpracování dat, role datové analýzy v oblasti informačních technologií, data-driven rozhodování.

2. Rozbor vybraných praktických příkladů datových analýz a jejich interpretace – správné vs. nesprávné provedení analýzy, zkreslování informací, hledání užitečných informací, specifikace požadavků na datovou analýzu.

3. Přístupy k provádění datových analýz, obecné metodiky: CRISP-DM, TDSP, specifikace projektu datové analýzy, způsoby získávání dat, datová kvalita.

4. Základní statistické nástroje a postupy, vhodné pro provádění prvotních datových analýz a hledání základních charakteristik datové množiny.

5. Pokročilejší statistické nástroje (postupy), vhodné pro hledání závislostí v datech a hodnocení významnosti vstupních parametrů.

6. Nástroje pro provádění datových analýz - programovací/neprogramovací, principy práce s těmito nástroji.

7. Datové analýzy v prostředí jazyka Python, rozšiřující knihovny pro provádění datových analýz, pokročilejší techniky datových analýz.

8. Datové analýzy v praxi – prezentace vybrané praktické případové studie, analýza prvotního zadání, způsob implementace, praktické přínosy a ukázkové výstupy

9. Pokročilé metody datových analýz, úvod do „Data Science“, big data, machine learning.

10. Vizualizace dat, úvod do vizualizace, historie, využití vizualizace pro účely datových analýz, nástroje pro vizualizace – podpora v rámci jazyka Python, kancelářské nástroje, pokročilé nástroje (Power BI).

11. Vybrané způsoby vizualizace dat - typy grafů a jejich využití pro datovou analýzu.

12. Pokročilé způsoby vizualizace dat – datové mapy, infografika a dashboardy.

13. Storytelling, prezentace výstupů datových analýz, založených na příběhu.

14. Porovnání různých způsobů a přístupů k provádění datových analýz, role nejistoty v datových analýzách, vliv nejistoty na výslednou analýzu.

Osnova cvičení:

1. Úvod do předmětu, definice pojmů a principů pro zpracování dat, existující a dostupné zdroje dat

2. Základní postupy při provádění datových analýz, ad-hoc analýzy

3. Úvod do datových analýz v prostředí MS Excel

4. Cvičení na datové analýzy v Excelu

5. Prezentace výstupů datové analýzy, provedené v Excelu

6. Úvody do datových analazých v prostředí Python, používání knihoven

7. Cvičení datových analýz v prostředí Pythonu

8. Cvičení na datové analýzy v prostředí Python

9. Prezentace datových analýz v prostředí Pythonu

10. Základy vizualizace při analýze dat

11. Seznámení se s nástrojem Power BI pro vizualizaci dat

12. Procvičování vybraných způsobů vizualizace dat v nástroji Power BI

13. Prezentace výstupů 3. domácího úkolu

14. Uzavření semestru, rezerva

Cíle studia:

Absolvováním předmětu získá absolvent úvodní znalosti jednotlivých částí cyklu zpracování dat, který odpovídá průmyslovému standardu pro data mining CRISP-DM (Cross-industry standard process for data mining). Tyto základní znalosti jsou dále rozvíjeny v návazném předmětu B6B16MPR, případně návazných magisterských oborech (Datové vědy, Počítačová grafika, Elektroenergetika, ...).

Studijní materiály:

Tamara Munzner , Visualization Analysis and Design, A K Peters/CRC Press, 2014

Hector Cuesta, Analýza dat v praxi, COMPUTER PRESS, 2015

Wes McKinney, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, O'Reilly Media, 2017

Poznámka:
Rozvrh na zimní semestr 2023/2024:
Rozvrh není připraven
Rozvrh na letní semestr 2023/2024:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
místnost T2:C2-82
Náplava P.
Greif K.

11:00–12:30
(přednášková par. 1)
Dejvice
T2:C2-82
místnost T2:B2-39d
Náplava P.
Greif K.

12:45–14:15
(přednášková par. 1
paralelka 101)

Dejvice
Cvičebna Kočí
místnost T2:B2-39d
Náplava P.
Greif K.

14:30–16:00
(přednášková par. 1
paralelka 102)

Dejvice
Cvičebna Kočí
místnost T2:C2-84
Náplava P.
Greif K.

11:00–12:30
(přednášková par. 1)
Dejvice
Ucebna
St
Čt

Předmět je součástí následujících studijních plánů:
Platnost dat k 21. 4. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet6637706.html