Textové informační systémy
Kód | Zakončení | Kredity | Rozsah |
---|---|---|---|
XD36TIS | Z,ZK | 5 | 14+4s |
- Předmět je náhradou za:
- Textové informační systémy (D36TIS)
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra počítačů
- Anotace:
-
Textové informační systémy obsahují textové dokumenty, které obvykle nejsou strukturované a jsou v přirozeném jazyce. Hlavní problémy, které tyto systémy řeší spočívají ve vyhledávání dokumentů podle jejich obsahu, komprese textu a kontrola správnosti textu. Těmto problémům je věnována hlavní pozornost v přednáškách i cvičení.
- Požadavky:
- Osnova přednášek:
-
1. Základní pojmy a klasifikace informačních systémů
2. Vyhledávání v textu, modely vyhledávacích algoritmů
3. Simulace nedeterministických konečných automatů, dynamické programování a bitový paralelismus
4. Vyhledávací stroje, KMP a AC algoritmy
5. Protisměrné vyhledávání, BM a CW algoritmy
6. Dvoucestné automaty se skokem
7. Faktorové automaty
8. Indexové metody, analýza textu, tezaurus
9. Signaturové metody
10. Komprese dat, základní pojmy, modelování a kódování
11. Statistické metody komprese dat
12. Slovníkové metody komprese dat
13. Syntaktické metody komprese dat
14. Kontrola správnosti textu
- Osnova cvičení:
-
1. Konečné automaty - opakování
2. Konečné automaty pro vyhledávání řetězců v textu
3. Konečné automaty pro vyhledávání posloupností v textu
4. Simulace konečných automatů, dynamické programování
5. Simulace konečných automatů, bitový paralelismus
6. Boyer-Mooreův algoritmus a jeho varianty
7. Dvoucestné automaty se skokem
8. Faktorové automaty
9. Textový systém s indexováním
10. Tvorba Indexu
11. Signaturové metody
12. Komprese dat - statistické metody
13. Komprese dat - slovníkové metody
14. Modely pro kompresi dat
- Cíle studia:
- Studijní materiály:
-
1. Melichar, B.: Textové informační systémy. Praha, Vydavatelství ČVUT 1997.
- Poznámka:
- Další informace:
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů: