Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024

Fonetika řeči a pokročilé hlasové technologie

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
XP31FON ZK 4 2P+4D česky
Garant předmětu:
Petr Pollák
Přednášející:
Petr Pollák
Cvičící:
Petr Pollák
Předmět zajišťuje:
katedra teorie obvodů
Anotace:

Předmět rozšiřuje základní přehled o aktuálním poznání v oblasti hlasových technologií. V rámci předmětu se studenti seznámí podrobně s teorií vzniku a vnímání řeči s interdisciplinárním přesahem do fonetiky, fonologie a lingvistiky, jejichž hlubší znalost je nezbytná pro vývoj i poznání pokročilých přístupů v hlasových technologiích. Studenti se také seznámí s vybranými pokročilými moderními metodami rozpoznávání a syntézy řeči, případně i kódování a zvýrazňování. Ve srovnání s magisterským předmětem „Zpracování řeči“ (B2M31ZRE) je obsah tohoto předmětu zaměřen především na hlubší poznání moderních a pokročilých algoritmů na bázi GMM, HMM, WFST, JFA, i-vektorů, a zejména pak systémům s neuronovými sítěmi (ANN, DNN, CNN, RNN, LSTM, apod.), které jsou v současných moderních systémech s hlasovým vstupem či výstupem využívány. Velký důraz bude kladen na samostatnou práci v rámci individuálních projektů, ve kterých se budou studenti detailněji zabývat vybranými aktuálně publikovanými nejnovějšími metodami.

Požadavky:
Osnova přednášek:
Osnova cvičení:
Cíle studia:
Studijní materiály:

[1] RABINER, L., R. W. SCHAFER. Theory nad Applications Digital Speech Processing. Upper Saddle River: Pearson, 2010. 1056 pp. ISBN 978-0136034285.

[2] HUANG, X., A. ACERO a H. W. HON. Spoken language processing: a guide to theory, algorithm, and system development. Upper Saddle River, NJ: Prentice Hall PTR, 2001. 1008 pp. ISBN 978-0130226167.

[3] JELINEK, F. Statistical methods for speech recognition (Language, Speech, and Communication). Cambridge, Mass.: MIT Press, 1998. 305 pp. ISBN 978-0262100663.

[4] YU, D. a L. DENG. Automatic Speech Recognition. A Deep Learning Approach. London: Springer-Verlag London, 2015. 321 pp. DOI 10.1007/978-1-4471-5779-3. ISBN 978-1-4471-5778-6.

[5] JURAFSKY, D. a J. H. MARTIN. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River, N.J.: Pearson Prentice Hall, 2009. 1032 pp. ISBN 978-0131873216.

[6] UHLÍŘ, J., P. SOVKA, P. Pollák, V. HANŽL a R. ČMEJLA. Technologie hlasových komunikací. Praha: Nakladatelství ČVUT, 2007. 276 pp. ISBN 978-80-01-03888-8.

[7] PSUTKA, J., L. MÜLLER, J. MATOUŠEK a V. RADOVÁ. Mluvíme s počítačem česky. Praha: Academia, 2006. 748 pp. ISBN 978-80-200-1309-5.

[8] SKARNITZL, R., J. VOLÍN a P. ŠTURM. Zvuková báze řečové komunikace - Fonetický a fonologický popis řeči. Praha: Univerzita Karlova v Praze, nakladatelství Karolinum, 2016. ISBN 9788024632728.

Poznámka:
Rozvrh na zimní semestr 2023/2024:
Rozvrh není připraven
Rozvrh na letní semestr 2023/2024:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
St
Čt
místnost T2:C4-362
Pollák P.
16:15–17:45
(přednášková par. 1)
Dejvice
Laborator K362

Předmět je součástí následujících studijních plánů:
Platnost dat k 19. 4. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet5923506.html