Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Fonetické signály a jejich kódování

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
XP31FSK ZK 4 2P+2S česky
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra teorie obvodů
Anotace:

Předmět uvádí do problematiky zpracování řečových signálů. V rámci předmětu se studenti seznámí od základních až po pokročilé moderní algoritmy analýzy, syntézy, kódování či zvýrazňování řeči. Další část je zaměřena na rozpoznávání řeči, kde se studenti seznámí s moderními pokročilými přístupy v úlohách jako rozpoznávání s malým a velkým slovníkem či rozpoznáváním řečníka. Významná pozornost je věnována použití různých klasifikačních technik na bázi GMM, DTW, HMM, ANN/DNN, WFST, JFA, i-vektorů, apod.

Výsledek studentské ankety předmětu je zde: http://www.fel.cvut.cz/anketa/aktualni/courses/XP31FSK

Požadavky:

Vstupními požadavky jsou znalosti z oblasti číslicového zpracování signálů.

Osnova přednášek:

1. Model vzniku a vnímání řeči, fonetický popis řeči.

2. Spektrální charakteristiky řeči (DFT, LPC, banky filtrů).

3. Kepstrální reprezentace řeč a možné aplikace.

4. Detekce řečové aktivity a potlačování šumu v řeči.

5. Syntéza řeči

6. Kódování řeči

7. Základní a speciální metody extrakce řečových příznaků (PCA, LDA).

8. Používané klasifikátory pro různé úlohy (GMM, HMM, VQ)

9. Moderní metody verifikace a identifikace mluvčího (UBM-GMM, JFA, i-vectory).

10. Rozpoznávání řeči na bázi DTW a HMM

11. Rozpoznávání spojité řeči, jazykové modelování, využití WFST

12. Adaptační techniky v rozpoznávání řeči.

13. Moderní systémy na bázi ANN/DNN, metody hlubokého učení.

14. Rezerva.

Osnova cvičení:

Program cvičení je organizovaný formou společných konzultací zapsaných studentů. Důraz je kladen na samostatnou práci studentů v průběhu semestru a samostatné zpracování zvoleného tématu. Řešení individuálních projektů jsou na společných konzultacích průběžně podrobně diskutovány.

Cíle studia:
Studijní materiály:

[1] Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia Praha, 1995

[2] Deller, J.R. - Hansen, J.H.L. - Proakis, J.G.: Discrete-time processing of speech signals, New York: IEEE Press 2000, 908 s., ISBN 0-7803-5386-2

[3] http://www.ee.ic.ac.uk/hp/staff/dmb/courses/speech/speech.htm

Poznámka:
Další informace:
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 6. 8. 2020
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet11845104.html