Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2022/2023
UPOZORNĚNÍ: Jsou dostupné studijní plány pro následující akademický rok.

DB technologie pro Big Data

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah
BI-BIG KZ 4 2P+2C
Garant předmětu:
Monika Borkovcová
Přednášející:
Monika Borkovcová, Josef Gattermayer
Cvičící:
Monika Borkovcová, Jan Matoušek
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Studenti se seznámí s oborem zpracování velkých dat. Velká data jsou taková data, které již klasické relační databáze nejsou schopné zpracovat, přitom jejich realtime zpracováním vznikne informace, která má rozhodující cenu např. v konkurenčním boji.

Předmět je zaměřen velice prakticky, studenti si osvojí nejpoužívanější průmyslové technologie - Apache Big Data Stack, neboli Apache Cassandra, Apache Hadoop, Apache Solr a další. Teoretický základ z přednášek seznámí studenty s algoritmy používanými v Apache Big Data Stacku.

Prakticky orientovaná cvičení naučí studenty vyvinout nad ním vlastní aplikace.

Požadavky:

Základní znalost relačních databází, práce s příkazovou řádkou.

Osnova přednášek:

1. Úvod do předmětu, co jsou to Big Data

2. NoSQL, Apache Cassandra, úvod a clusterování

3. Hadoop a MapReduce

4. Cassandra Data Model (new and legacy)

5. Cassandra Data Modeling

6. Apache Hive a Pig & Solr

7. Case study 1

8. Cassandra CQL

9. Cassandra JDBC a Thrift client

10. Case study 2

11. Optimalizace výkonu

12. Case study 3

13. Rezerva

Osnova cvičení:

1. Seznámení s prostředím laboratoře

2. Úvod do práce s Cassandra Clusterem

3. Hadoop MapReduce

4. Cassandra UseCase 1 - 1. část

5. Cassandra UseCase 1 - 2. část

6. Cassandra UseCase 2 - 1. část (Využití Hive / Pig)

7. Cassandra UseCase 2 - 1. část

8. Cassandra UseCase 3 - 1. část (Využíti Solr)

9. Cassandra UseCase 3 - 2. část

10. Cassandra UseCase 4 - 1. část (Komplexní řešení)

11. Cassandra UseCase 4 - 2. část

12. Odevzdání semestrální práce, zápočet

13. Rezerva

Cíle studia:
Studijní materiály:

Zikopoulos, Paul, and Chris Eaton. Understanding big data: Analytics for enterprise class hadoop and streaming data. McGraw-Hill Osborne Media, 2011.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/BI-BIG/

Další informace:
https://courses.fit.cvut.cz/BI-BIG/
Rozvrh na zimní semestr 2022/2023:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
St
Čt
místnost TH:A-s135
Borkovcová M.
09:15–10:45
(přednášková par. 1)
Thákurova 7 (FSv-budova A)
As135
místnost T9:345
Borkovcová M.
Matoušek J.

11:00–12:30
(přednášková par. 1
paralelka 101)

Dejvice
NBFIT BOU ucebna
místnost T9:345
Borkovcová M.
Matoušek J.

12:45–14:15
(přednášková par. 1
paralelka 102)

Dejvice
NBFIT BOU ucebna
místnost T9:345
Borkovcová M.
Matoušek J.

14:30–16:00
(přednášková par. 1
paralelka 103)

Dejvice
NBFIT BOU ucebna
místnost T9:345
Borkovcová M.
Matoušek J.

16:15–17:45
(přednášková par. 1
paralelka 104)

Dejvice
NBFIT BOU ucebna

Rozvrh na letní semestr 2022/2023:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 27. 3. 2023
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet3094006.html