Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2018/2019

Počítače a přirozený jazyk 1

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
01POPJ1 Z 2 0+2 česky
Přednášející:
Cvičící:
Daniel Zeman (gar.)
Předmět zajišťuje:
katedra matematiky
Anotace:

Základní kurz počítačového zpracování a porozumění přirozenému jazyku. Budou probrány metody automatické morfologické a syntaktické analýzy včetně moderních statistických metod zjednoznačnění výsledku. Dvojúrovňová morfologie, značkování a jazykové modely, Viterbiho algoritmus, gramatiky, chart parsing, pravděpodobnostní gramatiky.

Požadavky:
Osnova přednášek:

1. Úvod, přehled aplikací.

2. Programovací jazyk Perl.

3. Korpusy, první aplikace.

4. Lingvistická terminologie, roviny zpracování přirozeného jazyka.

5. Vyhodnocení úspěšnosti.

6. Slovníky a morfologické značky.

7. Dvojúrovňová morfologie, morfonologie. 8. Morfologie a bezkontextové gramatiky.

9. Morfologie a unifikační gramatiky.

10. Značkování (zjednoznačnění výsledků morfologické analýzy).

11. Kontrola pravopisu.

12. Složková syntaxe.

13. Závislostní syntaxe.

Osnova cvičení:
Cíle studia:

Znalosti:

Základní metody zpracování textu v přirozeném jazyce od tokenizace po úroveň syntaktické analýzy.

Schopnosti:

Implementovat některé z nich v jazyce Perl. Pracovat s anotovanými korpusy a existujícími volně dostupnými nástroji, jako jsou taggery a parsery.

Studijní materiály:

Povinná literatura:

[1] James Allen: Natural Language Understanding. The Benjamin/Cummings Publishing Company, Inc.; Redwood City, California,1994. ISBN 0-8053-0334-0.

Doporučená literatura:

[2] Larry Wall, Tom Christiansen, Randal Schwartz: Programming Perl. O'Reilly, 1996. ISBN 1-56592-149-6. http://www.perl.com/

[3] Adolf Erhart: Základy jazykovědy. Státní pedagogické nakladatelství; Praha, 1990

[4] Richard Sproat: Morphology and Computation. Massachusetts Institute of Technology; Cambridge, Massachusetts, 1992. ISBN 0-262-19314-0.

[5] Jan Hajič: Unification Morphology Grammar (doktorandská práce). Univerzita Karlova, Praha, 1994

[6] Stuart Shieber: An Introduction to Unification-based Approaches to Grammar. CSLI Lecture Notes No. 4, Stanford, California, 1986

[7] Sandra Kübler, Ryan McDonald, Joakim Nivre: Dependency Parsing. Morgan and Claypool Publishers; 2009. ISBN 978-1-59829596-2.

[8] Christopher D. Manning, Hinrich Schütze: Foundations of Statistical Natural Language Processing. The MIT Press, Cambridge, Massachusetts, 1999. ISBN 0-26213-360-1.

Studijní pomůcky:

Počítačová učebna s přístupem na internet a k linuxovým strojům, programovací jazyk Perl 5.8 nebo vyšší, dataprojektor.

Poznámka:
Další informace:
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 23. 5. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet23046905.html