Dolování dat z webu
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
MI-DDW.16 | Z,ZK | 5 | 2P+1C | česky |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra softwarového inženýrství
- Anotace:
-
Studenti se v předmětu seznámí s metodami a technologiemi pro získávání dat z webu, jejich zpracování a praktické využití v reálných aplikacích. Získají přehled a znalosti z oblastí analýzy webového obsahu, analýzy chování uživatelů, sociálního webu a doporučovacích systémů.
- Požadavky:
-
Znalost architektury webu (HTTP, HTML, URI), znalosti programování (např. Java, JavaScript), teorie grafů a znalosti základních algoritmů.
- Osnova přednášek:
-
1. Motivace a úvod do předmětu
2. Metody přístupu k datům a jejich získávání
3. Indexace a vyhledávání dokumentů
4. Dolování z textových dat
5. Využití dolování z textových dat
6. Analýza sociálních sítí
7. PageRank a HITS
8. Dolování dat ze sociálního webu
9. Webová analytika
10. (2) Dolování proudu dat
11. (2) Doporučovací systémy
- Osnova cvičení:
-
1. Základní metody pro získávání dat a jejich zpracování
2. Předzpracování textu, aplikace metod text miningu
3. Prezentace projektů, konzultace
4. Analýza dat generovaných uživateli
5. Základní metody doporučovacích systémů
6. Prezentace projektů a zápočet
- Cíle studia:
-
Vybavit studenty přehledem o technologiích dolování z webu a schopností některé z nich aplikovat v praxi.
- Studijní materiály:
-
1. Liu, B. „Web Data Mining“, Springer-Verlag Berlin Heidelberg, 2011. ISBN 978-3-642-19459-7.
2. Easley, D., Kleinberg, J. „Networks, Crowds, and Markets: Reasoning About a Highly Connected World“, Cambridge University Press, 2010. ISBN 978-0521195331.
3. Ricci, F., Rokach, L., Shapira, B., B. Kantor, P. „Recommender Systems Handbook“, Springer, 2010. ISBN 978-0387858197.
4. Kaushik, A. „Web Analytics 2.0: The Art of Online Accountability and Science of Customer Centricity“, Sybex, 2009. ISBN 978-0470529393.
5. Marmanis, H., Babenko, D. „Algorithms of the Intelligent Web“, Manning Publications, 2009. ISBN 978-1933988665.
6. A. Russel, M. „Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More“, O'Reilly Media, 2013. ISBN 978-1449367619.
7. Chakrabarti, S. „Mining the Web: Discovering Knowledge from Hypertext Data“, Morgan Kaufmann, 2002. ISBN 1558607544.
- Poznámka:
-
Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-DDW/
- Další informace:
- https://courses.fit.cvut.cz/MI-DDW/
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů:
-
- Mgr. obor Znalostní inženýrství, 2016-2017 (povinný předmět oboru)
- Mgr. obor Počítačová bezpečnost, 2016-2019 (volitelný předmět)
- Mgr. obor Počítačové systémy a sítě, 2016-2019 (volitelný předmět)
- Mgr. obor Návrh a programování vestavných systémů, 2016-2019 (volitelný předmět)
- Mgr. obor Webové a softwarové inženýrství, zaměření Informační systémy a management, 2016-2019 (volitelný předmět)
- Mgr. obor Webové a softwarové inženýrství, zaměření Softwarové inženýrství, 2016-2019 (volitelný předmět)
- Mgr. obor Webové a softwarové inženýrství, zaměření Webové inženýrství, 2016-2019 (povinný předmět zaměření)
- Mgr. program Informatika, pro fázi studia bez oboru, 2016-2019 (VO)
- Mgr. obor Systémové programování, zaměření Systémové programování, 2016-2019 (volitelný předmět)
- Mgr. obor Systémové programování, zaměření Teoretická informatika, 2016-2017 (volitelný předmět)
- Mgr. specializace Teoretická informatika, 2018-2019 (volitelný předmět)
- Mgr. obor Znalostní inženýrství, 2018-2019 (povinný předmět oboru)