Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024
UPOZORNĚNÍ: Jsou dostupné studijní plány pro následující akademický rok.

DB technologie pro Big Data

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah
BI-BIG KZ 4 2P+2C
Garant předmětu:
Monika Borkovcová
Přednášející:
Monika Borkovcová, Josef Gattermayer
Cvičící:
Monika Borkovcová, Jan Matoušek
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Studenti se seznámí s oborem zpracování velkých dat. Velká data jsou taková data, které již klasické relační databáze nejsou schopné zpracovat, přitom jejich realtime zpracováním vznikne informace, která má rozhodující cenu např. v konkurenčním boji.

Předmět je zaměřen velice prakticky, studenti si osvojí nejpoužívanější průmyslové technologie - Apache Big Data Stack, neboli Apache Cassandra, Apache Hadoop, Apache Solr a další. Teoretický základ z přednášek seznámí studenty s algoritmy používanými v Apache Big Data Stacku.

Prakticky orientovaná cvičení naučí studenty vyvinout nad ním vlastní aplikace.

Požadavky:

Základní znalost relačních databází, práce s příkazovou řádkou.

Osnova přednášek:

1. Úvod do předmětu, co jsou to Big Data

2. NoSQL, Apache Cassandra, úvod a clusterování

3. Hadoop a MapReduce

4. Cassandra Data Model (new and legacy)

5. Cassandra Data Modeling

6. Apache Hive a Pig & Solr

7. Case study 1

8. Cassandra CQL

9. Cassandra JDBC a Thrift client

10. Case study 2

11. Optimalizace výkonu

12. Case study 3

13. Rezerva

Osnova cvičení:

1. Seznámení s prostředím laboratoře

2. Úvod do práce s Cassandra Clusterem

3. Hadoop MapReduce

4. Cassandra UseCase 1 - 1. část

5. Cassandra UseCase 1 - 2. část

6. Cassandra UseCase 2 - 1. část (Využití Hive / Pig)

7. Cassandra UseCase 2 - 1. část

8. Cassandra UseCase 3 - 1. část (Využíti Solr)

9. Cassandra UseCase 3 - 2. část

10. Cassandra UseCase 4 - 1. část (Komplexní řešení)

11. Cassandra UseCase 4 - 2. část

12. Odevzdání semestrální práce, zápočet

13. Rezerva

Cíle studia:
Studijní materiály:

Zikopoulos, Paul, and Chris Eaton. Understanding big data: Analytics for enterprise class hadoop and streaming data. McGraw-Hill Osborne Media, 2011.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/BI-BIG/

Další informace:
https://courses.fit.cvut.cz/BI-BIG/
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 27. 3. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet3094006.html