Logo ČVUT
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
STUDIJNÍ PLÁNY
2023/2024

Pokročilé zpracování dat v jaderné a subjaderné fyzice

Přihlášení do KOSu pro zápis předmětu Zobrazit rozvrh
Kód Zakončení Kredity Rozsah
D02STAT ZK
Garant předmětu:
Miroslav Myška
Přednášející:
Petr Chaloupka, Miroslav Myška
Cvičící:
Petr Chaloupka
Předmět zajišťuje:
katedra fyziky
Anotace:

Student získá teoretické a praktické zkušenosti s používáním pokročilých technik statistické analýzy dat, které se v současné době využívají při zpracování dat na experimentech fyziky vysokých energií. Mezi tyto patří kupříkladu unfolding, metody založené Kálmánově filtru a metody strojového učení jako jsou rozhodovací stromy a neuronové sítě. Budou probrány teoretické základy regrese a klasifikace. Student získá praktické znalosti metod souvisejících s předběžným zpracováním dat (data pre-processing), trénováním algoritmů strojového učení (supervised machine learning), validace spolehlivosti (bias) a přetrénování (overtraining). Cílem cvičení je analyzovat reálná experimentální data z databáze open HEPData a v praxi porovnat klasifikátory získané různými metodami.

Požadavky:
Osnova přednášek:

1. Teorie statistická regrese a inference

2. Statistické dekonvoluční metody

3. Optimalizace a Kálmánův filtr

4. Neparametrické metody regrese a klasifikace

4.1. Rozhodovací stromy

4.2. Neurální sítě

Osnova cvičení:
Cíle studia:

Student získá teoretické a praktické zkušenosti s používáním pokročilých technik statistické analýzy dat, které se v současné době využívají při zpracování dat na experimentech fyziky vysokých energií. Mezi tyto patří kupříkladu unfolding, metody založené Kálmánově filtru a metody strojového učení jako jsou rozhodovací stromy a neuronové sítě. Budou probrány teoretické základy regrese a klasifikace. Student získá praktické znalosti metod souvisejících s předběžným zpracováním dat (data pre-processing), trénováním algoritmů strojového učení (supervised machine learning), validace spolehlivosti (bias) a přetrénování (overtraining). Cílem cvičení je analyzovat reálná experimentální data z databáze open HEPData a v praxi porovnat klasifikátory získané různými metodami.

Studijní materiály:

Povinná literatura

[1] Bohm, Zech, Introduction to Statistics and Data Analysis for Physicist, DESY online library

[2] I. Goodfellow, Y. Bengio, and A. Courville: Deep Learning, MIT Press, 2016

[3] B. Ristic, S. Arulampalam, N. Gordon: Beyond the Kalman Filter: Particle Filters for Tracking Applications,

Artech House, 2004

Doporučená literatura

[4]A. Geron: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and

Techniques to Build Intelligent Systems, O’Reilly Media, 2019

[5] B. Hachman: A Living Review of Machine Learning for Particle Physics, github: HEPML-LivingReview

Poznámka:
Rozvrh na zimní semestr 2023/2024:
Rozvrh není připraven
Rozvrh na letní semestr 2023/2024:
Rozvrh není připraven
Předmět je součástí následujících studijních plánů:
Platnost dat k 13. 7. 2024
Aktualizace výše uvedených informací naleznete na adrese https://bilakniha.cvut.cz/cs/predmet7705106.html