Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2018/2019

Dolování dat z webu

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
MI-DDW.16 Z,ZK 5 2P+1C česky
Přednášející:
Jaroslav Kuchař (gar.), Milan Dojčinovski (gar.)
Cvičící:
Jaroslav Kuchař (gar.), Milan Dojčinovski (gar.)
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Studenti se v předmětu seznámí s metodami a technologiemi pro získávání dat z webu, jejich zpracování a praktické využití v reálných aplikacích. Získají přehled a znalosti z oblastí analýzy webového obsahu, analýzy chování uživatelů, sociálního webu a doporučovacích systémů.

Požadavky:

Znalost architektury webu (HTTP, HTML, URI), znalosti programování (např. Java, JavaScript), teorie grafů a znalosti základních algoritmů.

Osnova přednášek:

1. Motivace a úvod do předmětu

2. Metody přístupu k datům a jejich získávání

3. Indexace a vyhledávání dokumentů

4. Dolování z textových dat

5. Využití dolování z textových dat

6. Analýza sociálních sítí

7. PageRank a HITS

8. Dolování dat ze sociálního webu

9. Webová analytika

10. (2) Dolování proudu dat

11. (2) Doporučovací systémy

Osnova cvičení:

1. Základní metody pro získávání dat a jejich zpracování

2. Předzpracování textu, aplikace metod text miningu

3. Prezentace projektů, konzultace

4. Analýza dat generovaných uživateli

5. Základní metody doporučovacích systémů

6. Prezentace projektů a zápočet

Cíle studia:

Vybavit studenty přehledem o technologiích dolování z webu a schopností některé z nich aplikovat v praxi.

Studijní materiály:

1. Liu, B. „Web Data Mining“, Springer-Verlag Berlin Heidelberg, 2011. ISBN 978-3-642-19459-7.

2. Easley, D., Kleinberg, J. „Networks, Crowds, and Markets: Reasoning About a Highly Connected World“, Cambridge University Press, 2010. ISBN 978-0521195331.

3. Ricci, F., Rokach, L., Shapira, B., B. Kantor, P. „Recommender Systems Handbook“, Springer, 2010. ISBN 978-0387858197.

4. Kaushik, A. „Web Analytics 2.0: The Art of Online Accountability and Science of Customer Centricity“, Sybex, 2009. ISBN 978-0470529393.

5. Marmanis, H., Babenko, D. „Algorithms of the Intelligent Web“, Manning Publications, 2009. ISBN 978-1933988665.

6. A. Russel, M. „Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More“, O'Reilly Media, 2013. ISBN 978-1449367619.

7. Chakrabarti, S. „Mining the Web: Discovering Knowledge from Hypertext Data“, Morgan Kaufmann, 2002. ISBN 1558607544.

Poznámka:

Rozsah: 2p+1c

Rozvrh na zimní semestr 2018/2019:
Rozvrh není připraven
Rozvrh na letní semestr 2018/2019:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
místnost T9:303
Kuchař J.
11:00–12:30
LICHÝ TÝDEN

(přednášková par. 1
paralelka 101)

Dejvice
NBFIT PC ucebna
místnost T9:303
Kuchař J.
12:45–14:15
LICHÝ TÝDEN

(přednášková par. 1
paralelka 102)

Dejvice
NBFIT PC ucebna
místnost TH:A-s135
Kuchař J.
16:15–17:45
(přednášková par. 1)
Thákurova 7 (FSv-budova A)
As135
Út
St
Čt

Předmět je součástí následujících studijních plánů:
Platnost dat k 22. 7. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet4651506.html