Efektivní vyhledávání v textech
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
MI-EVY.16 | Z,ZK | 5 | 2P+1C | česky |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra teoretické informatiky
- Anotace:
-
Studenti získají znalosti efektivních algoritmů vyhledávání v textových informacích. Naučí se pracovat s tzv. zhuštěnými datovými strukturami, které vynikají jak rychlostí přístupu tak úsporou místa v paměti. Získané znalosti budou schopni uplatnit při návrhu aplikací zabývajících se vyhledáváním v textu.
- Požadavky:
- Osnova přednášek:
-
1. Úvod, základní definice, border array.
2. Úplné indexování textu: Suffix array.
3. Úplné indexování textu: Suffix tree, konstrukce LCP.
4. Úplné indexování textu: factor, suffix automata, on-line konstrukce.
5. Algoritmy přesného vyhledávání.
6. FFT ve vyhledávání.
7. Succinct data structure: metody rank & select.
8. Succinct data structure: wavelet tree.
9. FM-Index.
10. Reprezentace slovníku, kontrola pravopisu.
11. Přibližné vyhledávání.
12. Vyhledávání v bioinformatice a v muzikologii.
13. Vyhledávání v bioinformatice a v muzikologii.
- Osnova cvičení:
-
1. Základní pojmy.
2. Úplné indexování textu
3. Algoritmy přesného vyhledávání.
4. FFT ve vyhledávání
5. Succinct data structure
6. FM-Index, přibližné vyhledávání.
- Cíle studia:
-
Vyhledávání je klíčovým úkolem v mnoha aplikacích. Jeho význam roste s rostoucím objemem získaných informací. Efektivní algoritmy a datové struktury pro vyhledávání jsou tak zásadní pro práci s informacemi, ale také v dalších oblastech, jako je počítačová bezpečnost (např. detekce vniknutí do systému, hledání virů). Tento předmět dá studentům dobrý přehled o takových algoritmech a datových strukturách.
- Studijní materiály:
-
W. F. Smyth: ''Computing Patterns in Strings'', Pearson Addison Wesley (UK), 2003, 423 pp. ISBN-10: 0201398397
M. Crochemore, W. Rytter: ''Jewels of Stringology''. World Scientific Publishing Company, 2003. ISBN-10: 9810248970.
G. Navarro, M. Raffinot: ''Flexible Pattern Matching in Strings''. Cambridge University Press, 2008. ISBN-10: 0521039932.
M. Crochemore, C. Hancart, T. Lecroq: ''Algorithms on Strings''. Cambridge University Press, 2007. ISBN-10: 0521848997
- Poznámka:
-
Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/MI-EVY/
- Další informace:
- https://courses.fit.cvut.cz/MI-EVY/
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů:
-
- Mgr. obor Systémové programování, zaměření Systémové programování, 2016-2019 (povinný předmět zaměření)
- Mgr. specializace Teoretická informatika, 2018-2019 (PS)