Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024

Web Data Mining

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
NIE-DDW Z,ZK 5 2P+1C anglicky
Garant předmětu:
Milan Dojčinovski
Přednášející:
Milan Dojčinovski
Cvičící:
Milan Dojčinovski
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Students will learn latest methods and technologies for web data acquisition, analysis and utilization of the discovered knowledge. Students will gain an overview of Web mining techniques for Web crawling, Web structure analysis, Web usage analysis, Web content mining and information extraction. Students will also gain an overview of most recent developments in the field of social web and recommendation systems.

Požadavky:

Basic knowledge in Web architecture (HTTP, HTML, URI), programming skills (e.g. Java, JavaScript), graph theory and basic algorithms.

Osnova přednášek:

1. Key web data mining principles.

2. Web content mining approaches (formats, restrictions, ethical aspects).

3. Web content mining tools.

4. Accessing and extracting specific web content (deep web).

5. Main text mining concepts.

6. Practical applications of text mining.

7. Social network structure and content analysis (2).

8. Web graph, web structure mining.

9. Web usage mining: data collecting.

10. Web usage mining: data analysis, web analytics.

11. Recommender systems and personalization.

12. Data stream mining: algorithms and applications.

Osnova cvičení:

1. Basics of data acquisition and processing

2. Text preprocessing, text mining applications

3. Acquisition and analysis of graph-based data

4. User data analysis

5. Basics of recommendation systems

6. Project presentation and assessment

Cíle studia:

Provide students with an overview of web mining technologies and qualify them to use some of them in practice.

Studijní materiály:

1. Liu, B. „Web Data Mining“, Springer-Verlag Berlin Heidelberg, 2011. ISBN 978-3-642-19459-7.

2. Charu C. Aggarwal. „Machine Learning for Text“, Springer, 2018. ISBN 9783319735313.

3. Easley, D., Kleinberg, J. „Networks, Crowds, and Markets: Reasoning About a Highly Connected World“, Cambridge

4. A. Russel, M. „Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More (3rd Edition)“, O'Reilly Media, 2019. ISBN 978-1491985045.

5. Charu C. Aggarwal. „Recommender Systems: The Textbook“, Springer, 2016. ISBN 9783319296579.

Poznámka:

Information about the course is available at https://courses.fit.cvut.cz/NIE-DDW/

Další informace:
https://courses.fit.cvut.cz/NIE-DDW/
Rozvrh na zimní semestr 2023/2024:
Rozvrh není připraven
Rozvrh na letní semestr 2023/2024:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
místnost TH:A-1242
Dojčinovski M.
11:00–12:30
(přednášková par. 1)
Thákurova 7 (budova FSv)
místnost TH:A-1142
Dojčinovski M.
14:30–16:00
SUDÝ TÝDEN

(přednášková par. 1
paralelka 101)

Thákurova 7 (budova FSv)
Apple lab
St
Čt

Předmět je součástí následujících studijních plánů:
Platnost dat k 23. 4. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet6699506.html