Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Bioinformatika

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
B4M36BIN Z,ZK 5 2P+2C česky
Předmět nesmí být zapsán současně s:
Bioinformatika (BAM36BIN)
Bioinformatics (BE4M36BIN)
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra počítačů
Anotace:

Cílem předmětu je vysvětlit principy algoritmů používaných pro zpracování biologických dat na molekulární úrovni, konkrétně algoritmů používaných pro sekvenování genomů, srovnávání biologických sekvencí (zejm. genů), jejich pravděpodobnostní a gramatické modelování, pro hledání souvislostí mezi primární a vyššími strukturami proteinů, jejich funkcemi a interakcemi, pro analýzu dat vysoce paralelních měření (zejm. genové exprese) a pro systémově-biologické modelování procesů jako je metabolismus a regulace genové exprese.

Požadavky:
Osnova přednášek:

1. Úvod do předmětu, ukázkové problémy bioinformatiky.

2. Algoritmy pro sekvenování, optimální skládání fragmentů.

3. Srovnávání a zarovnávání párů biologických sekvencí, využití dynamického programování.

4. Algoritmus BLAST jako heuristická metoda zarovnávání sekvencí, zarovnávání většího počtu sekvencí.

5. Modelovaní sekvencí markovskými řetězci, homogenita a řád modelu.

6. Skryté markovské modely pro modelování rodin bílkovin a vyhledávání genů.

7. Modely vývoje sekvencí, fylogenetické stromy, využití hierarchického shlukování.

8. Modely vývoje sekvencí nad rámec hierarchického shlukování (neighbor joining, parsimony, pravděpodobnostní).

9. Modelování primární a vyšších struktur proteinů, souvislost struktur na různých úrovních, proteinové databáze.

10. Modelování asociací mezi strukturou a funkcemi proteinu. Predikce interakcí s jinými proteiny, s DNA a s dalšími molekulami.

11. Analýza dat z vysoce paralelních měrení, celogenomové studie. Shlukování, detekce významných faktorů, prediktivní modelování.

12. Apriorní znalost pro analýzu dat exprese. Využití genových ontologií, anotací a slabě strukturované textové informace.

13. Modelování transkripčních a metabolických drah. Struktura a dynamika, reprezentační standardy.

14. Rezerva.

Osnova cvičení:

1. Úvod do předmětu. Přehled semestrálních prací. Biologický základ. Zadání samostatné práce: WEB SEARCH.

2. Zarovnávání sekvencí DNA. Zadání samostatné práce: SEQUENCE ALIGNMENT.

3. Algoritmus BLAST. Odevzdání samostatné práce: WEB SEARCH., Konzultace samostatné práce: SEQUENCE ALIGNMENT.

4. Fylogenetické stromy. Odevzdání samostatné práce: SEQUENCE ALIGNMENT.

5. Markovské modely. Skryté markovské modely.

6. Markovské modely. Skryté markovské modely (pokračování).

7. Markovské modely. Skryté markovské modely (dokončení). Zadání samostatné práce: GENE FINDING.

8. Sestavování sekvencí DNA.

9. Genová exprese. Konzultace samostatné práce: GENE FINDING. Zadání samostatné práce: GENE EXPRESSION.

10. Genová exprese (dokončení). Konzultace samostatné práce: GENE EXPRESSION.

11. Motivační příklady. Odevzdání samostatné práce: GENE FINDING

12. Cvičení odpadá.

13. Zajímavosti v bioinformatice (Gene networks, optogenetics...). Odevzdání samostatné práce: GENE EXPRESSION.

14. Zápočty

Cíle studia:
Studijní materiály:

1. Durbin et al.: Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. Cambridge University Press, 1998.

2. Baxevanis, A.D., Ouellette, B.F. (eds): Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley. 2002.

3. Bourne, P.E., Weissig, H.: Structural Bioinformatics. Wiley, 2003.

Poznámka:

B4M36BIN mapuje na stejný předmět jako kód A6M33BIN.

Další informace:
http://cw.felk.cvut.cz/doku.php/courses/a6m33bin/start
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 20. 9. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet4702506.html