Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2021/2022

Aplikovaná analýza dat

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
18AAD Z 3 1P+1C česky
Přednášející:
Karel Šimánek, Jaromír Kukal (gar.), Tomáš Hubínek
Cvičící:
Karel Šimánek, Jaromír Kukal (gar.), Tomáš Hubínek
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Prakticky zaměřený předmět, který vás provede tématy Big Data, neuronových sítí, paralelních výpočtů, analýzou grafů, cloudových technologií, nasazováním a vývojem softwaru či IoT.

Požadavky:
Osnova přednášek:

1.Big Data & Data Science: Využití moderních nástrojů na akvizici, zpracování a vyhodnocení dat. Úložiště dat a jejich využití (SQL, NoSQL, objektové databáze, fulltextové databáze). Formáty pro uložení dat a jejich vhodnost.

2.Frameworky pro paralelní výpočty (MapReduce, Spark). Zpracování tokových dat. Komerční i volně dostupné nástroje, příklady použití.

3.Neuronové sítě: Využití neuronových sítí v praxi. Rekapitulace vývoje a nezbytný teoretický základ. Přehled dostupných nástrojů pro jejich optimalizaci/inferenci.

4.Využití GPU pro zrychlení a paralelizaci výpočtů. Srovnání s nástroji pro klasické strojové učení. Ukázka na zpracování obrazu, NLP či predikce časových řad.

5.Analýza grafů: Analytické výpočty nad grafy na reálných příkladech. Rekapitulace teorie grafů, základní algoritmy. Page Rank, hledání influencerů, statistiky nad hlubokými organizačními strukturami.

6.Využití frameworku Pregel a nástroje GraphX. Využití grafových databází, grafových jazyků pro efektivní dotazování (GraphQL/Cipher). Vizualizace grafů (např. v PowerBI, Neo4j apod.).

7.Zpracování dat a AI v Cloudu: Porovnání Cloud a On-premise. PaaS a IaaS. Infrastructure as a Code. Analytické nástroje v Cloudu (analytické nástroje, databáze, frameworky, rozhraní). Hands-on využití Cloudu pro řešení reálných problémů.

8.Nasazení datových a AI řešení do korporatních IT: Nasazení datových řešení do produkce. Projektové metodologie (Scrum/Agile/Waterfall). Způsob vedení projektů/týmů (DevOps/DataOps).

9.Nástroje pro podporu DevOps. Configuration Management – jak a kde udržovat kód, jakým způsobem řídit verzování, oprava a sledování defektů. Release Management – automatizované nasazení infrastruktury a kódu.

10.Internet of Things: IoT a jeho využití v praxi. Jakým způsobem postavit datové řešení založené na IoT čidlech. Poskytovatelé IoT řešení a jejich dělení.

Osnova cvičení:
Cíle studia:

Cílem předmětu je studenty seznámit s tím, jak své teoretické základy uplnit v praxi na reálné problémy a s tím, jak probíhá vývoj (datových) aplikací.

Studijní materiály:

1.Hadoop: The Definitive Guide, Autor Tom White

2.Deep Learning, Autor Ian Goodfellow, Yoshua Bengio, Aaron Courville

3.Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Autor Aurélien Géron

4.Effective DevOps: Building a Culture of Collaboration, Affinity, and Tooling at Scale, Autor: Jennifer Davis, Ryn Daniels

Poznámka:
Rozvrh na zimní semestr 2021/2022:
Rozvrh není připraven
Rozvrh na letní semestr 2021/2022:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 19. 8. 2022
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet7047906.html