Logo ČVUT
Loading...
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2011/2012

Vyhledávání na webu a v multimed. DB

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
BIK-VWM Z,ZK 5 13+2 česky
Přednášející:
Jiří Novák
Cvičící:
Jiří Novák
Předmět zajišťuje:
katedra softwarového inženýrství
Anotace:

Studenti získají základní přehled o technikách vyhledávání v prostředí webu, na které je nahlíženo jako na rozsáhlá distribuovaná a heterogenní datová úložiště. Konkrétně studenti získají znalosti o technikách vyhledávání textových a hypertextových dokumentů (samotných webových stránek), dále se detailněji seznámí s technikami podobnostního vyhledávání v heterogenních multimediálních databázích (obecně v kolekcích nestrukturovaných dat). Zároveň se tak naučí technikám pro programování webových vyhledávačů pro uvedené typy dat.

Požadavky:

Základní znalosti algoritmizace, programování a datové struktury, základy databázových systémů.

Osnova přednášek:

1. Úvod. Infrastruktura webu, distribuce dat na webu, typy dokumentů na webu, modality vyhledávání na webu.

2. Vyhledávání textu - Booleovské modely. Implementace.

3. Vyhledávání textu - Vektorové modely. Implementace.

4. Topologická analýza a rankování webových stránek.

5. Optimalizace webových stránek pro vyhledávače.

6. Sémantický web.

7. Úvod do podobnostního vyhledávání v multimediálních databázích.

8. Podobnostní dotazy, agregační operátory.

9. Indexování metrické podobnosti pro rychlé vyhledávání v multimediálních databázích.

10. Aproximativní podobnostní vyhledávání.

11. Pokročilé podobnostní vyhledávací modely.

Osnova cvičení:

1. Prezentace témat zápočtových projektů.

2. Skupinové konzultace.

3. Skupinové konzultace.

4. Individuální konzultace.

5. Individuální konzultace.

6. Prezentace projektů.

7. Prezentace projektů.

Cíle studia:

Předmět je určen studentům, kteří se zajímají o hlubší principy vyhledávání na webu, konkrétně o principy vyhledávačů textových, webových a multimediálních dokumentů. Vyhledávací techniky budou diskutovány na třech úrovních: teoretická (modelová), algoritmická, a aplikační. V rámci experimentálních projektů pak studenti budou moci dílčí techniky implementovat a použít pro reálná nasazení ve svých webových aplikacích.

Studijní materiály:

Berry, M., Browne, M., ''Understanding Search Engines: Mathematical Modeling and Text Retrieval''. SIAM, 2005, ISBN 0898715814.

Langville, A., Meyer, C., ''Google's PageRank and Beyond: The Science of Search Engine Rankings''. Princeton University Press, 2006, ISBN 0691122024.

Jones, K., ''Search Engine Optimization: Your visual blueprint for effective Internet marketing''. Visual, 2008, ISBN 0470224487.

Uchyigit, G., Ma, M., ''Personalization Techniques And Recommender Systems''. World Scientific Publishing Company, 2008, ISBN 9812797017.

Castelli, V., Bergman, L., ''Image Databases: Search and Retrieval of Digital Imagery''. Wiley-Interscience, 2002, ISBN 0471321168.

Deb, S., ''Multimedia Systems and Content-Based Image Retrieval''. Information Science Publishing, 2003, ISBN 1591401569.

Zezula, P., Amato, G., Dohnal, V., Batko, M. ''Similarity Search - The Metric Space Approach''. Springer, New York, 2005, ISBN 0387291466.

Poznámka:

Rozsah=konzultace+seminae, Prednasejici: doc. RNDr. Tomáš Skopal Ph.D.

Rozvrh na zimní semestr 2011/2012:
Rozvrh není připraven
Rozvrh na letní semestr 2011/2012:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 9. 7. 2012
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1441906.html