Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2018/2019

Data Mining

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah Jazyk výuky
BIE-VZD Z,ZK 4 2P+2C
Přednášející:
Kamil Dedecius, Juan Pablo Maldonado Lopez
Cvičící:
Kamil Dedecius, Juan Pablo Maldonado Lopez
Předmět zajišťuje:
katedra aplikované matematiky
Anotace:

Students are introduced to the basic methods of discovering knowledge in data. In particular, they learn the basic techniques of data preprocessing, multidimensional data visualization, statistical techniques of data transformation, and fundamental principles of knowledge discovery methods. Students will be aware of the relationships between model bias and variance and will know the fundamentals of assessing model quality. Data mining software is extensively used in the module. Students will be able to apply basic data mining tools to common problems (classification, regression, clustering).

Požadavky:

-

Osnova přednášek:

1. Introduction to data mining, data preparation, data visualization.

2. Statistical analysis of data.

3. Cluster analysis.

4. Data model, nearest neighbour classifier.

5. Training, validation and testing, model's quality evaluation.

6. Artificial neural networks in data mining.

7. Unsupervised neural networks - competitive learning.

8. Probability and Bayesian classification.

9. Decision trees and rules.

10. Neural networks with supervised learning.

11. Combining neural networks and models in general.

12. Data mining in the Clementine environment.

13. Text mining, Web mining, selected applications, new trends.

Osnova cvičení:

1. Data, visualization, statistics.

2. Statistical analysis of data.

3. Data preprocessing, dimension reduction, relevance of inputs.

4. Model, learning, testing, model validation.

5. Data mining process, classification, prediction, modeling.

6. Cluster analysis, SOM.

7. Project assignment.

8. [3] Consultations, working on projects.

9. [3] Presentations of results, workshop.

Cíle studia:

The module aims to introduce students to a rapidly developing field - knowledge discovery in data.

Studijní materiály:

1. Larose, D. T. ''Discovering Knowledge in Data: An Introduction to Data Mining''. Wiley-Interscience, 2004. ISBN 0471666572.

Poznámka:

Informace o předmětu a výukové materiály naleznete na https://courses.fit.cvut.cz/BIE-VZD/

Rozsah=prednasky+proseminare+cviceni2p+2c

Další informace:
https://courses.fit.cvut.cz/BIE-VZD/
Rozvrh na zimní semestr 2018/2019:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
Út
St
místnost T9:343
Maldonado Lopez J.
09:15–10:45
(přednášková par. 1)
Dejvice
NBFIT učebna
Čt
místnost T9:348
Maldonado Lopez J.
11:00–12:30
(přednášková par. 1
paralelka 101)

Dejvice
NBFIT PC ucebna

Rozvrh na letní semestr 2018/2019:
06:00–08:0008:00–10:0010:00–12:0012:00–14:0014:00–16:0016:00–18:0018:00–20:0020:00–22:0022:00–24:00
Po
místnost T9:301
Dedecius K.
14:30–16:00
(přednášková par. 1)
Dejvice
NBFIT učebna
místnost T9:303
Dedecius K.
16:15–17:45
(přednášková par. 1
paralelka 101)

Dejvice
NBFIT PC ucebna
Út
St
Čt

Předmět je součástí následujících studijních plánů:
Platnost dat k 15. 7. 2019
Aktualizace výše uvedených informací naleznete na adrese http://bilakniha.cvut.cz/cs/predmet1449206.html