Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Vyhledávání na webu a v multimed. DB

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
BIK-VWM Z,ZK 5 13KP+2KC česky
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Studenti získají základní přehled o technikách vyhledávání v prostředí webu, na které je nahlíženo jako na rozsáhlá distribuovaná a heterogenní datová úložiště. Konkrétně studenti získají znalosti o technikách vyhledávání textových a hypertextových dokumentů (samotných webových stránek), dále se detailněji seznámí s technikami podobnostního vyhledávání v heterogenních multimediálních databázích (obecně v kolekcích nestrukturovaných dat). Zároveň se tak naučí technikám pro programování webových vyhledávačů pro uvedené typy dat.

Požadavky:

Základní znalosti algoritmizace, programování a datové struktury, základy databázových systémů.

Osnova přednášek:

1. Webový prostor, vyhledávače a modality vyhledávání na webu.

2. Boolský model v information retrieval.

3. Vektorový model v information retrieval.

4. Analýza odkazů na webu a PageRank.

5. Řazení webových stránek a jejich optimalizace pro vyhledávače (SEO).

6. Sémantický web a Linked data.

7. Prohledávání skrytého webu a sociální kontext.

8. Úvod do podobnostního vyhledávání v multimediálních databázích.

9. Podobnostní dotazy.

10. Indexování metrické podobnosti pro rychlé vyhledávání v multimediálních databázích.

11. Aproximativní podobnostní vyhledávání.

12. Pokročilé modely podobnostního vyhledávání.

Osnova cvičení:

1. Prezentace témat zápočtových projektů.

2. Skupinové konzultace.

3. Skupinové konzultace.

4. Individuální konzultace.

5. Individuální konzultace.

6. Prezentace projektů.

7. Prezentace projektů.

Cíle studia:

Předmět je určen studentům, kteří se zajímají o hlubší principy vyhledávání na webu, konkrétně o principy vyhledávačů textových, webových a multimediálních dokumentů. Vyhledávací techniky budou diskutovány na třech úrovních: teoretická (modelová), algoritmická, a aplikační. V rámci experimentálních projektů pak studenti budou moci dílčí techniky implementovat a použít pro reálná nasazení ve svých webových aplikacích.

Studijní materiály:

course slides +

1) Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval: The Concepts and Technology behind Search, 2011, Addison-Wesley Professional, ISBN-10: 0321416910

2) Amy N. Langville, Carl D. Meyer. Google's PageRank and Beyond: The Science of Search Engine Rankings, 2012, Princeton University Press, ISBN-10: 0691152667

3) Kristopher B. Jones. Search Engine Optimization: Your Visual Blueprint for Effective Internet Marketing, 2013, Visual, ISBN-10: 1118551745

4) Pavel Zezula, Giuseppe Amato, Vlastislav Dohnal, Michal Batko. Similarity Search: The Metric Space Approach, 2005, Springer, ISBN-10: 0387291466

Poznámka:

Rozsah=konzultace+seminae

Další informace:
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 15. 10. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1441906.html