Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024
UPOZORNĚNÍ: Jsou dostupné studijní plány pro následující akademický rok.

DB Technologies for Big Data

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
BIE-BIG.21 KZ 5 2P+2C anglicky
Garant předmětu:
Josef Gattermayer
Přednášející:
Josef Gattermayer
Cvičící:
Josef Gattermayer
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Students will be introduced into the field of Big Data processing where nonrelational (NoSQL) database engines are typically used today. The course is focused practically so that after finishing the course students were able to choose suitable tools (mostly open source) and techniques,design and implement a simplest reproducible method of data processing (data collection, transformation/aggregation, presentation). Students get acquainted with various architectures for processing and storing big data. A theoretical foundation and presentation of individual technologies will be supplemented with specific case studies.

Požadavky:

Basic knowledge of relational databases, working with the command line.

Osnova přednášek:

1. Introduction to the Big Data processing, the definition of the Big Data concept, CAP theorem.

2. Case study.

3. [2] Column-oriented database engines (Cassandra).

5. Document-oriented database engines (MongoDB).

6. [2] Platforms for Big Data processing based on maintaining data in a file system (Hadoop).

8. [2] Platforms for Big Data processing based on maintaining data in main memory (Spark).

10. Indexing of unstructured and semistructured data (ElasticSearch, Solr).

11. Tools for data visualization and presentation (Kibana).

12. [2] Case studies.

Osnova cvičení:

1. Introduction to the laboratory environment

2. Introduction to working with Cassandra Cluster

3. Hadoop MapReduce

4. Cassandra UseCase 1 - Part 1

5. Cassandra UseCase 1 - Part 2

6. Cassandra UseCase 2 - Part 1 (Hive / Pig Use)

7. Cassandra UseCase 2 - Part 1

8. Cassandra UseCase 3 - Part 1 (Use Solr)

9. Cassandra UseCase 3 - Part 2

10. Cassandra UseCase 4 - Part 1 (Complex solution)

11. Cassandra UseCase 4 - Part 2

12. Submission of semester work, credit

13. Reserve

Cíle studia:
Studijní materiály:

1. Zikopoulos P., Eaton Ch. : Understanding big data: Analytics for enterprise class Hadoop and streaming data. McGraw-Hill Osborne Media, 2011. ISBN 978-0071790536.

2. Hewitt E. : Cassandra: The Definitive Guide. O'Reilly Media, 2010. ISBN 978-1449390419.

3. Meier A., Kaufmann M. : SQL & NoSQL Databases. Springer, 2019. ISBN 978-3-658-24549-8.

4. Bradshaw S., Brazil E., Chodorow Ch. : MongoDB: The Definitive Guide: Powerful and Scalable Data Storage. O'Reilly Media, 2019. ISBN 9781491954461.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/BI-BIG/

Další informace:
https://courses.fit.cvut.cz/BI-BIG/
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 18. 4. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet6672506.html