Vyhledávání na webu a v multimediálních databázích
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
BI-VWM | Z,ZK | 5 | 2P+1C | česky |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra softwarového inženýrství
- Anotace:
-
Studenti získají základní přehled o technikách vyhledávání v prostředí Webu, na který je nahlíženo jako na rozsáhlé distribuované a heterogenní dokumentové úložiště. Konkrétně studenti získají znalosti o technikách vyhledávání textových a hypertextových dokumentů (samotných webových stránek) a o extrakci vlastností z webových stránek. Detailněji se seznámí s technikami podobnostního vyhledávání v heterogenních multimediálních databázích (obecně v kolekcích nestrukturovaných dat). Zároveň se tak naučí technikám pro programování webových vyhledávačů pro uvedené typy dat (dokumenty).
- Požadavky:
-
Základní znalosti algoritmizace, programování a datové struktury, základy databázových systémů.
- Osnova přednášek:
-
1. Webový prostor, vyhledávače a modality vyhledávání na webu.
2. Boolský model získávání informací.
3. Vektorový model získávání informací.
4. Analýza odkazů na webu a PageRank.
5. [2] Řazení webových stránek a jejich optimalizace pro vyhledávače (SEO).
7. Sémantický web a Linked Data.
8. Personalizované vyhledávání a sociální kontext.
9. Web data mining.
10. Úvod do podobnostního vyhledávání v multimediálních databázích.
11. Indexování metrické podobnosti pro rychlé vyhledávání v multimediálních databázích.
12. Aproximativní podobnostní vyhledávání.
13. Podobnostní dotazy a multimodální vyhledávání.
- Osnova cvičení:
-
1. Prezentace témat zápočtových projektů.
2. Skupinové konzultace.
3. Skupinové konzultace.
4. Individuální konzultace.
5. Individuální konzultace.
6. Prezentace projektů.
7. Prezentace projektů.
- Cíle studia:
-
Předmět je určen studentům, kteří se zajímají o hlubší principy vyhledávání na webu, konkrétně o principy vyhledávačů textových, webových a multimediálních dokumentů. Vyhledávací techniky budou diskutovány na třech úrovních: teoretická (modelová), algoritmická, a aplikační. V rámci experimentálních projektů pak studenti budou moci dílčí techniky implementovat a použít pro reálná nasazení ve svých webových aplikacích.
- Studijní materiály:
-
slajdy ke kurzu +
1) Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval: The Concepts and Technology behind Search, 2011, Addison-Wesley Professional, ISBN-10: 0321416910
2) Amy N. Langville, Carl D. Meyer. Google's PageRank and Beyond: The Science of Search Engine Rankings, 2012, Princeton University Press, ISBN-10: 0691152667
3) Kristopher B. Jones. Search Engine Optimization: Your Visual Blueprint for Effective Internet Marketing, 2013, Visual, ISBN-10: 1118551745
4) Pavel Zezula, Giuseppe Amato, Vlastislav Dohnal, Michal Batko. Similarity Search: The Metric Space Approach, 2005, Springer, ISBN-10: 0387291466
- Poznámka:
-
Informace o předmětu a výukové materiály naleznete na https://moodle-vyuka.cvut.cz/course/search.php?search=BI-VWM
- Další informace:
- https://moodle-vyuka.cvut.cz/course/search.php?search=BI-VWM
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů:
-
- Bc. program Informatika, pro fázi studia bez oboru, 2015-2020 (VO)
- Bc. obor Bezpečnost a informační technologie, 2015-2020 (volitelný předmět)
- Bc. obor Teoretická informatika, 2015-2020 (volitelný předmět)
- Bc. obor Počítačové inženýrství, 2015-2020 (volitelný předmět)
- Bc. obor Informační systémy a management, 2015-2020 (volitelný předmět)
- Bc. obor Webové a softwarové inženýrství, zaměření Softwarové inženýrství, 2015-2020 (volitelný předmět)
- Bc. obor Webové a softwarové inženýrství, zaměření Webové inženýrství, 2015-2020 (povinný předmět zaměření)
- Bc. obor Webové a softwarové inženýrství, zaměření Počítačová grafika, 2015-2020 (volitelný předmět)
- Bc. obor Znalostní inženýrství, 2018-2020 (povinný předmět oboru)