Big data
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
F7PMIBD | Z,ZK | 4 | 2P+2C | česky |
- Garant předmětu:
- Lenka Lhotská
- Přednášející:
- Lenka Lhotská
- Cvičící:
- Bohuslav Dvorský, Lenka Lhotská
- Předmět zajišťuje:
- katedra biomedicínské informatiky
- Anotace:
-
Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data). Předmět se zaměří na metody extrakce, analýzy a výběr infrastruktury pro zpracování perzistentních dat, ale i dat, která jsou průběžně vytvářena a stále se mění (stream), např. data ze sociálních sítí. V rámci předmětu bude prezentováno užití tradičních metod umělé inteligence a strojového učení pro problematiku analýzy rozsáhlých dat.
- Požadavky:
-
Forma ověření studijních výsledků: Podmínky zápočtu jsou absolvování čtyř testů se ziskem alespoň 50 % bodů. Testy prověří praktické znalosti při analýze a rozpoznávání vícerozměrných dat. Zkouška má písemnou část, která se skládá z převážně teoretických otázek s následním ústním dozkoušení v rozsahu odpřednášené a odcvičené látky.
Požadavky na studenty: Povinná účast na cvičeních (max. 2 absence).
- Osnova přednášek:
-
Osnova přednášek:
1.Základní pojmy a vlastnosti dat v oblasti velkých dat.
2.Technologie pro uchovávání velkých dat, NoSQL databáze
3.Datové modely, výběrová kritéria
4.Struktura a standardizace dat
5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)
6.Metody strojového učení, vhodné pro analýzu velkých dat
7.Vybrané metody strojového učení I
8.Vybrané metody strojového učení II
9.Metody pro analýzu kontinuálních dat
10.Hledání souvislostí ve volně propojených datech
11.Případové studie I
12.Případové studie II
13.Případové studie III
14.Závěrečné shrnutí
- Osnova cvičení:
-
Cvičení probíhají v počítačové učebně, studenti mohou rovněž používat vlastní počítače.
1.Základní pojmy a vlastnosti dat v oblasti velkých dat.
2.Technologie pro uchovávání velkých dat, NoSQL databáze
3.Datové modely, výběrová kritéria
4.Struktura a standardizace dat
5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)
6.Metody strojového učení, vhodné pro analýzu velkých dat
7.Vybrané metody strojového učení I
8.Vybrané metody strojového učení II
9.Metody pro analýzu kontinuálních dat
10.Hledání souvislostí ve volně propojených datech
11.Případové studie I
12.Případové studie II
13.Případové studie III
14.Závěrečné shrnutí
- Cíle studia:
-
Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data).
- Studijní materiály:
-
Povinná literatura:
[1] HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. Praha: Grada, 2015. Profesionál. ISBN 978-80-247-5466-6.
Doporučená literatura:
[2] INMON, William H. Data architecture: a primer for the data scientist. Waltham, MA: Elsevier, 2014. ISBN 9780128020449.
- Poznámka:
- Rozvrh na zimní semestr 2024/2025:
-
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po Út St Čt Pá - Rozvrh na letní semestr 2024/2025:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Navazující magisterská studijní specializace Asistivní technologie (povinný předmět)
- Navazující magisterská studijní specializace Softwarové technologie (povinný předmět)
- Navazující magisterská studijní specializace Nanotechnologie (povinný předmět)