O předmětu

Předmět je zaměřen na využití jazyka Python pro analýzu dat, včetně využití technik strojového učení a dobývání znalostí z databází. Součástí kurzu je představení i dalších navazujících jazyků a technologií jako R, Scala a Spark/Hadoop.

Co se naučíš

Po úspěšném absolvování budou studenti schopni analyzovat data pomocí nejčastěji používaných balíčků jazyka Python, včetně balíčků pro strojové učení.

Obsah předmětu

  • Úvod do jazyka Python - Přehled vybraných systémů pro strojové učení (scikit-learn) - Předzpracování dat v jazyce Python (Pandas) - Vizualizace a explorace dat - Tvorba modelů strojového učení, ladění hyperparametrů - Evaluace a interpretace modelů, vysvětlitelné strojové učení - Další programovací jazyky a prostředí pro data science (např. Scala, Spark, Hadoop) - Případová studie s reálnými daty, přednášky hostů (dle dostupnosti)

Literatura

Základní:

Jak uspět v předmětu

Doporučená příprava:

  • Pravidelná příprava během semestru místo drcení na zkoušku
  • Přednáškové slidy a materiály dostupné přes Moodle VŠE (dl.vse.cz)
  • Stará zkouška / typové otázky — zeptej se cvičícího nebo hledej na InSIS
  • Studijní skupiny a sdílení poznámek s kolegy z ročníku
Na co si dát pozor:
  • Přečti si sylabus — co je povinná vs. doporučená literatura
  • Podmínky zápočtu (zápočtové testy, projekty, docházka)
  • Termíny zkoušek zapisovat včas — kapacita bývá omezená

Doporučené zdroje

  • Sylabus na InSIS — osnova, literatura, garant
  • Moodle VŠE — prezentace a studijní materiály od vyučujících
  • Knihovna VŠE — přístup k e-knihám a databázím (EBSCO, ProQuest...)
  • SIS VŠE — výsledky zkoušek, zkušební termíny, docházka

✏️ Upravit wiki obsah

Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace

Heslo si vyžádej od správce wiki.