Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2022/2023

Vyhledávání na webu a v multimediálních databázích

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
BI-VWM Z,ZK 5 2P+1C česky
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Studenti získají základní přehled o technikách vyhledávání v prostředí Webu, na který je nahlíženo jako na rozsáhlé distribuované a heterogenní dokumentové úložiště. Konkrétně studenti získají znalosti o technikách vyhledávání textových a hypertextových dokumentů (samotných webových stránek) a o extrakci vlastností z webových stránek. Detailněji se seznámí s technikami podobnostního vyhledávání v heterogenních multimediálních databázích (obecně v kolekcích nestrukturovaných dat). Zároveň se tak naučí technikám pro programování webových vyhledávačů pro uvedené typy dat (dokumenty).

Požadavky:

Základní znalosti algoritmizace, programování a datové struktury, základy databázových systémů.

Osnova přednášek:

1. Webový prostor, vyhledávače a modality vyhledávání na webu.

2. Boolský model získávání informací.

3. Vektorový model získávání informací.

4. Analýza odkazů na webu a PageRank.

5. [2] Řazení webových stránek a jejich optimalizace pro vyhledávače (SEO).

7. Sémantický web a Linked Data.

8. Personalizované vyhledávání a sociální kontext.

9. Web data mining.

10. Úvod do podobnostního vyhledávání v multimediálních databázích.

11. Indexování metrické podobnosti pro rychlé vyhledávání v multimediálních databázích.

12. Aproximativní podobnostní vyhledávání.

13. Podobnostní dotazy a multimodální vyhledávání.

Osnova cvičení:

1. Prezentace témat zápočtových projektů.

2. Skupinové konzultace.

3. Skupinové konzultace.

4. Individuální konzultace.

5. Individuální konzultace.

6. Prezentace projektů.

7. Prezentace projektů.

Cíle studia:

Předmět je určen studentům, kteří se zajímají o hlubší principy vyhledávání na webu, konkrétně o principy vyhledávačů textových, webových a multimediálních dokumentů. Vyhledávací techniky budou diskutovány na třech úrovních: teoretická (modelová), algoritmická, a aplikační. V rámci experimentálních projektů pak studenti budou moci dílčí techniky implementovat a použít pro reálná nasazení ve svých webových aplikacích.

Studijní materiály:

slajdy ke kurzu +

1) Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval: The Concepts and Technology behind Search, 2011, Addison-Wesley Professional, ISBN-10: 0321416910

2) Amy N. Langville, Carl D. Meyer. Google's PageRank and Beyond: The Science of Search Engine Rankings, 2012, Princeton University Press, ISBN-10: 0691152667

3) Kristopher B. Jones. Search Engine Optimization: Your Visual Blueprint for Effective Internet Marketing, 2013, Visual, ISBN-10: 1118551745

4) Pavel Zezula, Giuseppe Amato, Vlastislav Dohnal, Michal Batko. Similarity Search: The Metric Space Approach, 2005, Springer, ISBN-10: 0387291466

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://moodle-vyuka.cvut.cz/course/search.php?search=BI-VWM

Další informace:
https://moodle-vyuka.cvut.cz/course/search.php?search=BI-VWM
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 8. 12. 2022
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet1123906.html