Textové informační systémy
Kód | Zakončení | Kredity | Rozsah |
---|---|---|---|
36TIS | Z,ZK | 4 | 2+2s |
- Předmět je náhradou za:
- Textové informační systémy (X36TIS)
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra počítačů
- Anotace:
-
Textové informační systémy obsahují textové dokumenty, které obvykle nejsou strukturované a jsou v přirozeném jazyce. Hlavní problémy, které tyto systémy řeší spočívají ve vyhledávání dokumentů podle jejich obsahu, komprese textu a kontrola správnosti textu. Těmto problémům je věnována hlavní pozornost v přednáškách i cvičení.
- Požadavky:
- Osnova přednášek:
-
1. Základní pojmy a klasifikace informačních systémů
2. Vyhledávání v textu, modely vyhledávacích algoritmů
3. Simulace nedeterministických konečných automatů, dynamické programování a bitový paralelismus
4. Vyhledávací stroje, KMP a AC algoritmy
5. Protisměrné vyhledávání, BM a CW algoritmy
6. Dvoucestné automaty se skokem
7. Faktorové automaty
8. Indexové metody, analýza textu, tezaurus
9. Signaturové metody
10. Komprese dat, základní pojmy, modelování a kódování
11. Statistické metody komprese dat
12. Slovníkové metody komprese dat
13. Syntaktické metody komprese dat
14. Kontrola správnosti textu
- Osnova cvičení:
-
1. LaTeX, základní pojmy
2. LaTeX, matematická sazba
3. LaTeX, grafika
4. Konečné automaty pro vyhledávání řetězců v textu
5. Konečné automaty pro vyhledávání posloupností v textu
6. Simulace konečných automatů, dynamické programování
7. Simulace konečných automatů, bitový paralelismus
8. Boyer-Mooreův algoritmus a jeho varianty
9. Dvoucestné automaty se skokem
10. Textový systém s indexováním
11. Komprese dat statistické metody
12. Komprese dat slovníkové metody
13. Modely dat pro kompresi dat
- Cíle studia:
- Studijní materiály:
-
[1] Melichar, B.: Textové informační systémy. Skripta ČVUT, Praha 1996
- Poznámka:
-
Rozsah výuky v kombinované formě studia: 14+4
Typ cvičení: s
- Další informace:
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů: