Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2018/2019

Mathematics for data science

Předmět není vypsán Nerozvrhuje se
Kód Zakončení Kredity Rozsah Jazyk výuky
MIE-MZI Z,ZK 4 2+1
Přednášející:
Štěpán Starosta (gar.)
Cvičící:
Štěpán Starosta (gar.)
Předmět zajišťuje:
katedra aplikované matematiky
Anotace:

In this course, the students are introduced to the domains of mathematics necessary for understanding the standard methods and algorithms used in data science. The studied topics include mainly: linear algebra (matrix factorisations, eigenvalues, diagonalization), continuous optimisation (optimisation with constraints, duality principle, gradient methods) and selected notions from probability theory and statistics.

Požadavky:

Knowledge of basic notions of linear algebra and matrix theory, basics of probability theory, course MIE-MPI: Mathematics for informatics.

Osnova přednášek:

1) Mathematical formulation of regression and classification problem.

2) Geometrical view of linear regression model and least squares method (LS).

3) Computing the LS estimate (QR decomposition of a matrix).

4) Hypothesis tests for linear model, model validation.

5) Variable subset selection: ridge regression, best-subset selection, etc.

7) Singular value decomposition and its connection with ridge regression.

8) [2] Principal component analysis and dimensionality reduction.

10) Linear regression and classification.

11) Logistic regression.

12) Local regression and smoothing methods (splines, kernels).

13) [2] Support vector machines.

Osnova cvičení:

1) Least squares method.

2) Matrix factorisation and matrix eigenvalues.

3) Usage of linear regression and related methods.

4) Principal component analysis.

5) Logistic regression.

6) Support vector machines.

Cíle studia:
Studijní materiály:

1. Christopher Bishop, Pattern Recognition and Machine Learning, Springer-Verlag New York (2006), ISBN 978-0-387-31073-2

2. Trevor Hastie, Robert Tibshirani, Jerome Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer (2011), ISBN 978-0387848570.

Poznámka:
Další informace:
Pro tento předmět se rozvrh nepřipravuje
Předmět je součástí následujících studijních plánů:
Platnost dat k 16. 2. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet5171306.html