Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2019/2020

Bioinformatika

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
A6M33BIN Z,ZK 5 2P+2C česky
Přednášející:
Cvičící:
Předmět zajišťuje:
katedra počítačů
Anotace:

Cílem předmětu je vysvětlit principy algoritmů používaných pro zpracování biologických dat na molekulární úrovni, konkrétně algoritmů používaných pro sekvenování genomů, srovnávání biologických sekvencí (zejm. genů), jejich pravděpodobnostní a gramatické modelování, pro hledání souvislostí mezi primární a vyššími strukturami proteinů, jejich funkcemi a interakcemi, pro analýzu dat vysoce paralelních měření (zejm. genové exprese) a pro systémově-biologické modelování procesů jako je metabolismus a regulace genové exprese. Kurs obsahuje i výklad potřebných pasáží molekulární biologie a základních technologií pro měření dat, jež mají být vykládanými algoritmy zpracovávány.

Výsledek studentské ankety předmětu je zde: http://www.fel.cvut.cz/anketa/aktualni/courses/A6M33BIN

Požadavky:

Znalosti těchto oblastí: algoritmy a datové struktury, třídy složitosti algoritmů, NP úplnost, principy relačních databází a dotazování, základy teorie grafů, automatů a gramatik, základy pravděpodobnosti a statistiky, principy statistických testů.

Osnova přednášek:

1. Úvod, principy organizace a fungování živé hmoty, evoluce života.

2. Tok genetické informace v živých systémech. Centrální dogma, DNA, RNA, protein, replikace, transkripce, translace,reparace. Dědičnost.

3. Algoritmy pro sekvenování, optimální skládání fragmentů.

4. Srovnávání a zarovnávání biologických sekvencí, algoritmus BLAST, nukleotidové databáze.

5. Zarovnávání vícera sekvencí, využití dynamického programování, heuristické metody.

6. Modelovaní sekvencí, Markovské modely, Viterbiho algoritmus, gramatické modelování.

7. Modely vývoje sekvencí, fylogenetické stromy, využití hierarchického shlukování.

8. Modelování primární a vyšších struktur proteinů, souvislost struktur na různých úrovních, proteinové databáze.

9. Modelování asociací mezi strukturou a funkcemi proteinu. Predikce interakcí s jinými proteiny, s DNA a s dalšími molekulami.

10. Exprese genů ve zdraví a nemoci, molekulární podstata dědičných a nádorových onemocnění.

11. Analýza dat z vysoce paralelních měrení, celogenomové studie. Shlukování, detekce významných faktorů, prediktivní modelování.

12. Apriorní znalost pro analýzu dat exprese. Využití genových ontologií, anotací a slabě strukturované textové informace.

13. Modelování transkripčních a metabolických drah. Struktura a dynamika, reprezentační standardy.

14. Rezerva.

Osnova cvičení:

1. Úvod do předmětu. Přehled semestrálních prací. Biologický základ. Zadání samostatné práce: WEB SEARCH.

2. Zarovnávání sekvencí DNA. Zadání samostatné práce: SEQUENCE ALIGNMENT.

3. Algoritmus BLAST. Odevzdání samostatné práce: WEB SEARCH., Konzultace samostatné práce: SEQUENCE ALIGNMENT.

4. Fylogenetické stromy. Odevzdání samostatné práce: SEQUENCE ALIGNMENT.

5. Markovské modely. Skryté markovské modely.

6. Markovské modely. Skryté markovské modely (pokračování).

7. Markovské modely. Skryté markovské modely (dokončení). Zadání samostatné práce: GENE FINDING.

8. Sestavování sekvencí DNA.

9. Genová exprese. Konzultace samostatné práce: GENE FINDING. Zadání samostatné práce: GENE EXPRESSION.

10. Genová exprese (dokončení). Konzultace samostatné práce: GENE EXPRESSION.

11. Motivační příklady. Odevzdání samostatné práce: GENE FINDING

12. Cvičení odpadá.

13. Zajímavosti v bioinformatice (Gene networks, optogenetics...)., Odevzdání samostatné práce: GENE EXPRESSION.

14. Zápočty

Cíle studia:

Cílem předmětu je vysvětlit principy algoritmů používaných pro zpracování biologických dat na molekulární úrovni, konkrétně algoritmů používaných pro sekvenování genomů, srovnávání biologických sekvencí (zejm. genů), jejich pravděpodobnostní a gramatické modelování, pro hledání souvislostí mezi primární a vyššími strukturami proteinů, jejich funkcemi a interakcemi, pro analýzu dat vysoce paralelních měření (zejm. genové exprese) a pro systémově-biologické modelování procesů jako je metabolismus a regulace genové exprese. Kurs obsahuje i výklad potřebných pasáží molekulární biologie a základních technologií pro měření dat, jež mají být vykládanými algoritmy zpracovávány.

Studijní materiály:

[1] Durbin et al.: Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, 1998.

[2] Hunter, L. (2004) Life and Its Molecules: A Brief Introduction. AI Magazine 25(1):9-22.

[3] Lesk, AM. (2002). Introduction to Bioinformatics, Oxford Univ Press.

[4] Baxevanis, AD., Ouellette, BFF. (eds) Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley.

[5] Cvrčková, F. (2006). Úvod do praktické bioinformatiky. Praha, Academia.

Poznámka:
Další informace:
http://cw.felk.cvut.cz/doku.php/courses/a6m33bin/start
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 11. 8. 2020
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1706506.html