Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2020/2021

Big data

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
F7PMIBD Z,ZK 4 2P+2C česky
Přednášející:
Lenka Lhotská (gar.)
Cvičící:
Lenka Lhotská (gar.), Bohuslav Dvorský, Ondřej Klempíř
Předmět zajišťuje:
katedra přírodovědných oborů
Anotace:

Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data). Předmět se zaměří na metody extrakce, analýzy a výběr infrastruktury pro zpracování perzistentních dat, ale i dat, která jsou průběžně vytvářena a stále se mění (stream), např. data ze sociálních sítí. V rámci předmětu bude prezentováno užití tradičních metod umělé inteligence a strojového učení pro problematiku analýzy rozsáhlých dat.

Požadavky:

Forma ověření studijních výsledků: Podmínky zápočtu jsou absolvování čtyř testů se ziskem alespoň 50 % bodů. Testy prověří praktické znalosti při analýze a rozpoznávání vícerozměrných dat. Zkouška má písemnou část, která se skládá z převážně teoretických otázek s následním ústním dozkoušení v rozsahu odpřednášené a odcvičené látky.

Požadavky na studenty: Povinná účast na cvičeních (max. 2 absence).

Osnova přednášek:

Osnova přednášek:

1.Základní pojmy a vlastnosti dat v oblasti velkých dat.

2.Technologie pro uchovávání velkých dat, NoSQL databáze

3.Datové modely, výběrová kritéria

4.Struktura a standardizace dat

5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)

6.Metody strojového učení, vhodné pro analýzu velkých dat

7.Vybrané metody strojového učení I

8.Vybrané metody strojového učení II

9.Metody pro analýzu kontinuálních dat

10.Hledání souvislostí ve volně propojených datech

11.Případové studie I

12.Případové studie II

13.Případové studie III

14.Závěrečné shrnutí

Osnova cvičení:

Cvičení probíhají v počítačové učebně, studenti mohou rovněž používat vlastní počítače.

1.Základní pojmy a vlastnosti dat v oblasti velkých dat.

2.Technologie pro uchovávání velkých dat, NoSQL databáze

3.Datové modely, výběrová kritéria

4.Struktura a standardizace dat

5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)

6.Metody strojového učení, vhodné pro analýzu velkých dat

7.Vybrané metody strojového učení I

8.Vybrané metody strojového učení II

9.Metody pro analýzu kontinuálních dat

10.Hledání souvislostí ve volně propojených datech

11.Případové studie I

12.Případové studie II

13.Případové studie III

14.Závěrečné shrnutí

Cíle studia:

Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data).

Studijní materiály:

Povinná literatura:

[1] HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. Praha: Grada, 2015. Profesionál. ISBN 978-80-247-5466-6.

Doporučená literatura:

[2] INMON, William H. Data architecture: a primer for the data scientist. Waltham, MA: Elsevier, 2014. ISBN 9780128020449.

Poznámka:
Rozvrh na zimní semestr 2020/2021:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
St
místnost CIIRC
Lhotská L.
09:00–10:50
(přednášková par. 1)
Dejvice
CIIRC
Čt
místnost KL:B-730
Dvorský B.
12:00–13:50
(přednášková par. 1
paralelka 1)

Kladno FBMI
Počítačová učebna

Rozvrh na letní semestr 2020/2021:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 25. 11. 2020
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet5588406.html