O předmětu

Machnine learning se jako vědní disciplína pohybuje na pomezí statistiky, informatiky a matematiky. V ekonomických aplikacích jsou machinelearningové algoritmy nejčastěji využívány k nalezení relevantních informací v datech a následně k předpovídání či ekonomickému rozhodování. Uplatnění však tyto algoritmy nalézají také v oblasti kauzální inference. Cílem tohoto kurzu je seznámit studenty s hlavními machinelearingovými koncepty a technikami, které jsou používány napříč jednotlivými algoritmy. Důraz je kladen zejména na pochopení a osvojení si společných prvků těchto algoritmů a jejich praktické využití v ekonomickém modelování či analýze dat. Záměrem kurzu je obsáhnout celý proces analýzy dat v machine learningových aplikacích – od přípravy dat po volbu, výstavbu a validaci ekonomického modelu.

Co se naučíš

Po úspěšném absolvování kurzu budou studenti chápat hlavní principy, pojmy a postupy používané v oblasti machine learningu a budou je schopni aplikovat při řešení reálných úloh. Studenti se postupně seznámí se všemi kroky, které ekonomické modelování pomocí machinelearningových metod zahrnuje – od přípravy dat, jejich transformace a explorační analýzy až po volbu, výstavu a validaci vybraných modelů. Získané dovednosti mohou studenti použít nejen v praxi, ale také jako nutný základ pro studium náročnějších metod, případně jako vhodný doplněk k tradičním statistickým postupům. Studenti budou rovněž umět využívat machinelearninové metody v oblasti kauzální inference, a to zejména v případech, kdy tradiční statistické postupy mohou poskytovat neuspokojivé výsledky.

Obsah předmětu

Terminologie, cíle a východiska machine learningu, přehled a třídění machine learningových algoritmů (metod), specifika machine learningových algoritmů v ekonomických úlohách Příprava a transformace proměnných (feature engineering), explorační analýza dat a machine learningové nástroje vícerozměrné vizualizace Bias variance trade off, přístupy k regularizaci úloh Metody regularizace v lineárním regresním modelu (hřebenová regrese, LASSO, Elastic net) Vztah mezi regularizací a uplatněním apriorních informací v Bayesovské statistice – využití v ekonomickém modelování Metody výběru a validace modelu, křížová validace Techniky pro kombinaci modelů úvod do Ensemble learning methods (stacked regressions, boosting, bagging), srovnání s metodami průměrování modelů (model averaging) Klasifikační metody – specifika, ztrátové funkce, popis úspěšnosti a přesnosti modelu, Logistická regrese a Naive Bayes Classifier Kauzální inference (využití metody LASSO a dalších machinelearningových algoritmů v kauzální inferenci) Bližší popis vybraných algoritmů/metod – (zejména Gaussian Process Regression,…)

Literatura

Základní:

✏️ Upravit wiki obsah

Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace

Heslo si vyžádej od správce wiki.