Fonetické signály a jejich kódování
Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
XP31FSK | ZK | 4 | 2P+2S | česky |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra teorie obvodů
- Anotace:
-
Předmět uvádí do problematiky zpracování řečových signálů. V rámci předmětu se studenti seznámí od základních až po pokročilé moderní algoritmy analýzy, syntézy, kódování či zvýrazňování řeči. Další část je zaměřena na rozpoznávání řeči, kde se studenti seznámí s moderními pokročilými přístupy v úlohách jako rozpoznávání s malým a velkým slovníkem či rozpoznáváním řečníka. Významná pozornost je věnována použití různých klasifikačních technik na bázi GMM, DTW, HMM, ANN/DNN, WFST, JFA, i-vektorů, apod.
Výsledek studentské ankety předmětu je zde: http://www.fel.cvut.cz/anketa/aktualni/courses/XP31FSK
- Požadavky:
-
Vstupními požadavky jsou znalosti z oblasti číslicového zpracování signálů.
- Osnova přednášek:
-
1. Model vzniku a vnímání řeči, fonetický popis řeči.
2. Spektrální charakteristiky řeči (DFT, LPC, banky filtrů).
3. Kepstrální reprezentace řeč a možné aplikace.
4. Detekce řečové aktivity a potlačování šumu v řeči.
5. Syntéza řeči
6. Kódování řeči
7. Základní a speciální metody extrakce řečových příznaků (PCA, LDA).
8. Používané klasifikátory pro různé úlohy (GMM, HMM, VQ)
9. Moderní metody verifikace a identifikace mluvčího (UBM-GMM, JFA, i-vectory).
10. Rozpoznávání řeči na bázi DTW a HMM
11. Rozpoznávání spojité řeči, jazykové modelování, využití WFST
12. Adaptační techniky v rozpoznávání řeči.
13. Moderní systémy na bázi ANN/DNN, metody hlubokého učení.
14. Rezerva.
- Osnova cvičení:
-
Program cvičení je organizovaný formou společných konzultací zapsaných studentů. Důraz je kladen na samostatnou práci studentů v průběhu semestru a samostatné zpracování zvoleného tématu. Řešení individuálních projektů jsou na společných konzultacích průběžně podrobně diskutovány.
- Cíle studia:
- Studijní materiály:
-
[1] Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia Praha, 1995
[2] Deller, J.R. - Hansen, J.H.L. - Proakis, J.G.: Discrete-time processing of speech signals, New York: IEEE Press 2000, 908 s., ISBN 0-7803-5386-2
[3] http://www.ee.ic.ac.uk/hp/staff/dmb/courses/speech/speech.htm
- Poznámka:
- Další informace:
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů:
-
- Doktorské studium, prezenční forma (povinně volitelný předmět)
- Doktorské studium, kombinovaná forma (povinně volitelný předmět)
- Doktorské studium, strukturované prezenční (povinně volitelný předmět)
- Doktorské studium, strukturované kombinované (povinně volitelný předmět)