Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024

Data processing

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
14PD-E Z,ZK 6 2P+4C anglicky
Garant předmětu:
Michal Jeřábek
Přednášející:
Martin Šrotýř, Miroslav Vaniš
Cvičící:
Martin Šrotýř, Miroslav Vaniš
Předmět zajišťuje:
katedra aplikované informatiky v dopravě
Anotace:

Studenti se seznámí s nástroji pro zpracování a analýzu dat, na příkladech z praxe si vyzkouší nejčastější možnosti používané při zpracování dat včetně pokročilých možností při prezentaci výsledků analýz. V rámci pokročilých metod budou studenti provádět i specifickou analýzu pomocí Bayesovských sítí. Studenti budou následně samostatně provádět datovou analýzu na datech z existujících otevřených systémů.

Požadavky:

Schopnost logického myšlení, znalost základů algoritmizace a základů libovolného programovacího jazyka na úrovni odpovídající danému ročníku studia technické univerzity.

Osnova přednášek:

1. část seznamuje s nástroji na zpracování dat a je dělena do 3 bloků:

Blok 1: seznámení s R - prostředí, koncept, základy, jednoduché příklady, základní knihovny, jejich příklady a použití (nainstalování R u studentů)

Blok 2: aplikované R - aplikované příklady z praxe, knihovna s mapou, získávání dat z různých zdrojů a jejich úprava (GIS, RDBMS, CSV, apod)

Blok 3: pokročilé R - interaktivní prezentační modul (shiny), další moduly dle domluvy

2. část se zabývá konkrétním modelem pro zpracování dat, Bayesovskými sítěmi a je také dělena do 3 bloků:

Blok 1: Základy Bayesovských sítí, specializovaný software pro Bayesovské sítě, modelování, základy teorie grafů a pravděpodobnosti.

Blok 2: Příprava dat na následné využití Bayesovských sítí, vykreslení první Bayesovské sítě, algoritmy na učení sítě, parametrů, inferencí; propojení s GeNií.

Blok 3: Provádění inferencí v Bayesovských sítích.

Osnova cvičení:

1. část seznamuje s nástroji na zpracování dat a je dělena do 3 bloků:

Blok 1: seznámení s R - prostředí, koncept, základy, jednoduché příklady, základní knihovny, jejich příklady a použití (nainstalování R u studentů)

Blok 2: aplikované R - aplikované příklady z praxe, knihovna s mapou, získávání dat z různých zdrojů a jejich úprava (GIS, RDBMS, CSV, apod)

Blok 3: pokročilé R - interaktivní prezentační modul (shiny), další moduly dle domluvy

2. část se zabývá konkrétním modelem pro zpracování dat, Bayesovskými sítěmi a je také dělena do 3 bloků:

Blok 1: Základy Bayesovských sítí, specializovaný software pro Bayesovské sítě, modelování, základy teorie grafů a pravděpodobnosti.

Blok 2: Příprava dat na následné využití Bayesovských sítí, vykreslení první Bayesovské sítě, algoritmy na učení sítě, parametrů, inferencí; propojení s GeNií.

Blok 3: Provádění inferencí v Bayesovských sítích.

Cíle studia:

Cílem předmětu je primárně studenty seznámit s nástroji pro zpracování a analýzu dat, na příkladech z praxe společně vyzkoušet nejčastější možnosti používané při zpracování dat včetně pokročilých možností při prezentaci výsledků analýz.

Studijní materiály:

Jan Rauch, Milan Šimůnek: Dobývání znalostí z databází, LISp-Miner a GUHA. Praha: Oeconomica VŠE, 2014.

Petr Berka: Dobývání znalostí z databází. Praha: Academia, 2003.

Irena Holubová, Karel Minařík, David Novák, Jiří Kosek: Big Data a NoSQL databáze.

Arun K. Somani, Ganesh Chandra Deka: Big Data Analytics. CRC Press, 2017.

Poznámka:
Poznámka učitele Michal Jeřábek:

+Erasmus

Rozvrh na zimní semestr 2023/2024:
Rozvrh není připraven
Rozvrh na letní semestr 2023/2024:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
St
Čt
místnost KO:105
Šrotýř M.
08:00–09:30
(přednášková par. 126)
Konviktská 20
Počítačová učebna
místnost KO:105
Šrotýř M.
09:45–13:00
(paralelka 126)
Konviktská 20
Počítačová učebna

Předmět je součástí následujících studijních plánů:
Platnost dat k 19. 7. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet6824106.html