Pokročilé zpracování dat v jaderné a subjaderné fyzice
Kód | Zakončení | Kredity | Rozsah |
---|---|---|---|
D02STAT | ZK |
- Garant předmětu:
- Přednášející:
- Cvičící:
- Předmět zajišťuje:
- katedra fyziky
- Anotace:
-
Student získá teoretické a praktické zkušenosti s používáním pokročilých technik statistické analýzy dat, které se v současné době využívají při zpracování dat na experimentech fyziky vysokých energií. Mezi tyto patří kupříkladu unfolding, metody založené Kálmánově filtru a metody strojového učení jako jsou rozhodovací stromy a neuronové sítě. Budou probrány teoretické základy regrese a klasifikace. Student získá praktické znalosti metod souvisejících s předběžným zpracováním dat (data pre-processing), trénováním algoritmů strojového učení (supervised machine learning), validace spolehlivosti (bias) a přetrénování (overtraining). Cílem cvičení je analyzovat reálná experimentální data z databáze open HEPData a v praxi porovnat klasifikátory získané různými metodami.
- Požadavky:
- Osnova přednášek:
-
1. Teorie statistická regrese a inference
2. Statistické dekonvoluční metody
3. Optimalizace a Kálmánův filtr
4. Neparametrické metody regrese a klasifikace
4.1. Rozhodovací stromy
4.2. Neurální sítě
- Osnova cvičení:
- Cíle studia:
-
Student získá teoretické a praktické zkušenosti s používáním pokročilých technik statistické analýzy dat, které se v současné době využívají při zpracování dat na experimentech fyziky vysokých energií. Mezi tyto patří kupříkladu unfolding, metody založené Kálmánově filtru a metody strojového učení jako jsou rozhodovací stromy a neuronové sítě. Budou probrány teoretické základy regrese a klasifikace. Student získá praktické znalosti metod souvisejících s předběžným zpracováním dat (data pre-processing), trénováním algoritmů strojového učení (supervised machine learning), validace spolehlivosti (bias) a přetrénování (overtraining). Cílem cvičení je analyzovat reálná experimentální data z databáze open HEPData a v praxi porovnat klasifikátory získané různými metodami.
- Studijní materiály:
-
Povinná literatura
[1] Bohm, Zech, Introduction to Statistics and Data Analysis for Physicist, DESY online library
[2] I. Goodfellow, Y. Bengio, and A. Courville: Deep Learning, MIT Press, 2016
[3] B. Ristic, S. Arulampalam, N. Gordon: Beyond the Kalman Filter: Particle Filters for Tracking Applications,
Artech House, 2004
Doporučená literatura
[4]A. Geron: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and
Techniques to Build Intelligent Systems, O’Reilly Media, 2019
[5] B. Hachman: A Living Review of Machine Learning for Particle Physics, github: HEPML-LivingReview
- Poznámka:
- Další informace:
- Pro tento předmět se rozvrh nepřipravuje
- Předmět je součástí následujících studijních plánů: