Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2024/2025

Vyhledávání na webu a v multimediálních databázích

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
BI-VWM.21 Z,ZK 5 2P+1C česky
Garant předmětu:
Tomáš Skopal
Přednášející:
Tomáš Skopal
Cvičící:
Jiří Novák, Tomáš Skopal
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Studenti získají základní přehled o technikách vyhledávání v prostředí Webu, na který je nahlíženo jako na rozsáhlé distribuované a heterogenní dokumentové úložiště. Konkrétně studenti získají znalosti o technikách vyhledávání textových a hypertextových dokumentů (samotných webových stránek) a o extrakci vlastností z webových stránek. Detailněji se seznámí s technikami podobnostního vyhledávání v heterogenních multimediálních databázích (obecně v kolekcích nestrukturovaných dat). Zároveň se tak naučí technikám pro programování webových vyhledávačů pro uvedené typy dat (dokumenty).

Požadavky:

Základní znalosti algoritmizace, programování a datové struktury, základy databázových systémů.

Osnova přednášek:

1. Webový prostor, vyhledávače a modality vyhledávání na webu.

2. Boolský model získávání informací.

3. Vektorový model získávání informací.

4. Analýza odkazů na webu a PageRank.

5. [2] Řazení webových stránek a jejich optimalizace pro vyhledávače (SEO).

7. Sémantický web a Linked Data.

8. Personalizované vyhledávání a sociální kontext.

9. Web data mining.

10. Úvod do podobnostního vyhledávání v multimediálních databázích.

11. Indexování metrické podobnosti pro rychlé vyhledávání v multimediálních databázích.

12. Aproximativní podobnostní vyhledávání.

13. Podobnostní dotazy a multimodální vyhledávání.

Osnova cvičení:

1. Prezentace témat zápočtových projektů.

2. Skupinové konzultace.

3. Skupinové konzultace.

4. Individuální konzultace.

5. Individuální konzultace.

6. Prezentace projektů.

7. Prezentace projektů.

Cíle studia:

Předmět je určen studentům, kteří se zajímají o hlubší principy vyhledávání na webu, konkrétně o principy vyhledávačů textových, webových a multimediálních dokumentů. Vyhledávací techniky budou diskutovány na třech úrovních: teoretická (modelová), algoritmická, a aplikační. V rámci experimentálních projektů pak studenti budou moci dílčí techniky implementovat a použít pro reálná nasazení ve svých webových aplikacích.

Studijní materiály:

1. Baeza-Yates R., Ribeiro-Neto B. : Modern Information Retrieval: The Concepts and Technology behind Search. Addison-Wesley Professional, 2011. ISBN 978-0321416919.

2. Langville A. N., Meyer C. D. : Google’s PageRank and Beyond: The Science of Search Engine Rankings. Princeton University Press, 2012. ISBN 978-0691152660.

3. Kristopher B. J. : Search Engine Optimization: Your Visual Blueprint for Effective Internet Marketing. Visual, 2013. ISBN 978-1118551745.

4. Zezula P., Amato G., Dohnal V., Batko M. : Similarity Search: The Metric Space Approach. Springer, 2005. ISBN 978-0387291468.

5. Aggarwal C. C. : Data Mining: The Textbook. Springer, 2015. ISBN 978-3319141411.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://moodle-vyuka.cvut.cz/course/search.php?search=BI-VWM

Další informace:
https://moodle-vyuka.cvut.cz/course/search.php?search=BI-VWM
Rozvrh na zimní semestr 2024/2025:
Rozvrh není připraven
Rozvrh na letní semestr 2024/2025:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 2. 12. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet6702406.html