Vyhledávání na webu a v multimed. DB
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
BIK-VWM | Z,ZK | 5 | 13+2 | česky |
- Přednášející:
- Jiří Novák
- Cvičící:
- Jiří Novák
- Předmět zajišťuje:
- katedra softwarového inženýrství
- Anotace:
-
Studenti získají základní přehled o technikách vyhledávání v prostředí webu, na které je nahlíženo jako na rozsáhlá distribuovaná a heterogenní datová úložiště. Konkrétně studenti získají znalosti o technikách vyhledávání textových a hypertextových dokumentů (samotných webových stránek), dále se detailněji seznámí s technikami podobnostního vyhledávání v heterogenních multimediálních databázích (obecně v kolekcích nestrukturovaných dat). Zároveň se tak naučí technikám pro programování webových vyhledávačů pro uvedené typy dat.
- Požadavky:
-
Základní znalosti algoritmizace, programování a datové struktury, základy databázových systémů.
- Osnova přednášek:
-
1. Úvod. Infrastruktura webu, distribuce dat na webu, typy dokumentů na webu, modality vyhledávání na webu.
2. Vyhledávání textu - Booleovské modely. Implementace.
3. Vyhledávání textu - Vektorové modely. Implementace.
4. Topologická analýza a rankování webových stránek.
5. Optimalizace webových stránek pro vyhledávače.
6. Sémantický web.
7. Úvod do podobnostního vyhledávání v multimediálních databázích.
8. Podobnostní dotazy, agregační operátory.
9. Indexování metrické podobnosti pro rychlé vyhledávání v multimediálních databázích.
10. Aproximativní podobnostní vyhledávání.
11. Pokročilé podobnostní vyhledávací modely.
- Osnova cvičení:
-
1. Prezentace témat zápočtových projektů.
2. Skupinové konzultace.
3. Skupinové konzultace.
4. Individuální konzultace.
5. Individuální konzultace.
6. Prezentace projektů.
7. Prezentace projektů.
- Cíle studia:
-
Předmět je určen studentům, kteří se zajímají o hlubší principy vyhledávání na webu, konkrétně o principy vyhledávačů textových, webových a multimediálních dokumentů. Vyhledávací techniky budou diskutovány na třech úrovních: teoretická (modelová), algoritmická, a aplikační. V rámci experimentálních projektů pak studenti budou moci dílčí techniky implementovat a použít pro reálná nasazení ve svých webových aplikacích.
- Studijní materiály:
-
Berry, M., Browne, M., ''Understanding Search Engines: Mathematical Modeling and Text Retrieval''. SIAM, 2005, ISBN 0898715814.
Langville, A., Meyer, C., ''Google's PageRank and Beyond: The Science of Search Engine Rankings''. Princeton University Press, 2006, ISBN 0691122024.
Jones, K., ''Search Engine Optimization: Your visual blueprint for effective Internet marketing''. Visual, 2008, ISBN 0470224487.
Uchyigit, G., Ma, M., ''Personalization Techniques And Recommender Systems''. World Scientific Publishing Company, 2008, ISBN 9812797017.
Castelli, V., Bergman, L., ''Image Databases: Search and Retrieval of Digital Imagery''. Wiley-Interscience, 2002, ISBN 0471321168.
Deb, S., ''Multimedia Systems and Content-Based Image Retrieval''. Information Science Publishing, 2003, ISBN 1591401569.
Zezula, P., Amato, G., Dohnal, V., Batko, M. ''Similarity Search - The Metric Space Approach''. Springer, New York, 2005, ISBN 0387291466.
- Poznámka:
-
Rozsah=konzultace+seminae, Prednasejici: doc. RNDr. Tomáš Skopal Ph.D.
- Rozvrh na zimní semestr 2011/2012:
- Rozvrh není připraven
- Rozvrh na letní semestr 2011/2012:
- Rozvrh není připraven
- Předmět je součástí následujících studijních plánů:
-
- Web a multimedia, kombinovaná forma studia (povinný předmět oboru)