Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024

Searching Web and Multimedia Databases

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
BIE-VWM Z,ZK 5 2P+1C anglicky
Garant předmětu:
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Students gain basic knowledge concerning retrieval techniques on the web, where the web environment is viewed as a large distributed and heterogenous data repository. In particular, the students will understand the techniques for retrieving text and hypertext documents (the web pages). Moreover, they will be aware of similarity retrieval methods focused on heterogenous multimedia databases (unstructured data collections, respectively).

Požadavky:

Basic knowledge and skills in algorithmics, programming, data structures and database technologies.

Osnova přednášek:

1. Web space, search engines, web retrieval modalities.

2. Boolean model of information retrieval.

3. Vector model of information retrieval.

4. Link analysis and PageRank.

5. Web page ranking and search engine optimization.

6. Semantic web and Linked data.

7. Deep web and social context.

8. Introduction to the similarity search in multimedia databases.

9. Similarity queries.

10. Indexing metric similarity for efficient multimedia retrieval.

11. Approximate similarity retrieval.

12. Advanced similarity search models.

Osnova cvičení:

1. Project topic presentation.

2. Group consultations.

3. Group consultations.

4. Individual consultations.

5. Individual consultations.

6. Project presentation.

7. Project presentation.

Cíle studia:

This module is recommended for students that are interested in deeper understanding of web search engines. In particular, text, hypertext, and multimedia retrieval techniques are explored. The retrieval techniques are described in three layers: theoretical (model), algorithmical, and application. Then, in experimental projects, the students can implement the methods and employ them in various web applications.

Studijní materiály:

course slides +

1) Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval: The Concepts and Technology behind Search, 2011, Addison-Wesley Professional, ISBN-10: 0321416910

2) Amy N. Langville, Carl D. Meyer. Google's PageRank and Beyond: The Science of Search Engine Rankings, 2012, Princeton University Press, ISBN-10: 0691152667

3) Kristopher B. Jones. Search Engine Optimization: Your Visual Blueprint for Effective Internet Marketing, 2013, Visual, ISBN-10: 1118551745

4) Pavel Zezula, Giuseppe Amato, Vlastislav Dohnal, Michal Batko. Similarity Search: The Metric Space Approach, 2005, Springer, ISBN-10: 0387291466

5) Charu C. Aggarwal. Data Mining: The Textbook. 2015, Springer, ISBN-10: 9783319141411

Poznámka:

Information about the course and courseware are available at https://courses.fit.cvut.cz/BI-VWM/

Další informace:
https://courses.fit.cvut.cz/BI-VWM/
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 19. 4. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet1449106.html