Aplikovaná analýza dat
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
18AAD | Z | 3 | 1P+1C | česky |
- Garant předmětu:
- Jaromír Kukal
- Přednášející:
- Tomáš Hubínek, Jaromír Kukal, Karel Šimánek
- Cvičící:
- Tomáš Hubínek, Jaromír Kukal, Karel Šimánek
- Předmět zajišťuje:
- katedra softwarového inženýrství
- Anotace:
-
Prakticky zaměřený předmět, který vás provede tématy Big Data, neuronových sítí, paralelních výpočtů, analýzou grafů, cloudových technologií, nasazováním a vývojem softwaru či IoT.
- Požadavky:
- Osnova přednášek:
-
1.Big Data & Data Science: Využití moderních nástrojů na akvizici, zpracování a vyhodnocení dat. Úložiště dat a jejich využití (SQL, NoSQL, objektové databáze, fulltextové databáze). Formáty pro uložení dat a jejich vhodnost.
2.Frameworky pro paralelní výpočty (MapReduce, Spark). Zpracování tokových dat. Komerční i volně dostupné nástroje, příklady použití.
3.Neuronové sítě: Využití neuronových sítí v praxi. Rekapitulace vývoje a nezbytný teoretický základ. Přehled dostupných nástrojů pro jejich optimalizaci/inferenci.
4.Využití GPU pro zrychlení a paralelizaci výpočtů. Srovnání s nástroji pro klasické strojové učení. Ukázka na zpracování obrazu, NLP či predikce časových řad.
5.Analýza grafů: Analytické výpočty nad grafy na reálných příkladech. Rekapitulace teorie grafů, základní algoritmy. Page Rank, hledání influencerů, statistiky nad hlubokými organizačními strukturami.
6.Využití frameworku Pregel a nástroje GraphX. Využití grafových databází, grafových jazyků pro efektivní dotazování (GraphQL/Cipher). Vizualizace grafů (např. v PowerBI, Neo4j apod.).
7.Zpracování dat a AI v Cloudu: Porovnání Cloud a On-premise. PaaS a IaaS. Infrastructure as a Code. Analytické nástroje v Cloudu (analytické nástroje, databáze, frameworky, rozhraní). Hands-on využití Cloudu pro řešení reálných problémů.
8.Nasazení datových a AI řešení do korporatních IT: Nasazení datových řešení do produkce. Projektové metodologie (Scrum/Agile/Waterfall). Způsob vedení projektů/týmů (DevOps/DataOps).
9.Nástroje pro podporu DevOps. Configuration Management – jak a kde udržovat kód, jakým způsobem řídit verzování, oprava a sledování defektů. Release Management – automatizované nasazení infrastruktury a kódu.
10.Internet of Things: IoT a jeho využití v praxi. Jakým způsobem postavit datové řešení založené na IoT čidlech. Poskytovatelé IoT řešení a jejich dělení.
- Osnova cvičení:
- Cíle studia:
-
Cílem předmětu je studenty seznámit s tím, jak své teoretické základy uplnit v praxi na reálné problémy a s tím, jak probíhá vývoj (datových) aplikací.
- Studijní materiály:
-
1.Hadoop: The Definitive Guide, Autor Tom White
2.Deep Learning, Autor Ian Goodfellow, Yoshua Bengio, Aaron Courville
3.Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Autor Aurélien Géron
4.Effective DevOps: Building a Culture of Collaboration, Affinity, and Tooling at Scale, Autor: Jennifer Davis, Ryn Daniels
- Poznámka:
- Rozvrh na zimní semestr 2024/2025:
- Rozvrh není připraven
- Rozvrh na letní semestr 2024/2025:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Aplikované matematicko-stochastické metody (volitelný předmět)
- Aplikace informatiky v přírodních vědách (volitelný předmět)