O předmětu

Předmět je zaměřen na cloudové platformy využitelné v úloze dolování z dat. Předmět pokrývá celý cyklus procesu dolování – od přípravy dat v různých formátech (tabulky, text, multimédia), přes modelování, až po nasazení modelů ve formě webových služeb a integraci s programovacími jazyky zaměřenými na data science.

Co se naučíš

Po úspěšném absolvování budou studenti schopni využít nejčastější platformy pro dolování dat pro provedení úloh dolování dat (např. příprava dat, regrese, shlukování, predikce). Absolventi budou vybaveni znalostmi pro práci s různými typy vstupních dat. V případě vstupu ve formě přirozeného jazyka budou např. schopni provést detekci entit a tokenizaci. Předmět bude reflektovat aktuální trendy, jako vysvětlitelné (symbolické) modely.

Obsah předmětu

  • Úvod do služeb založených na cloudu - Přehled vybraných algoritmů pro strojové učení a optimalizaci - Během kurzu se studenti seznámí s přibližně třemi cloudovými platformami, budou pokryty následující oblasti: - Předzpracování tabulkových dat (čištění, nerovnoměrně rozdělená data, dummy proměnné) - Předzpracování textových data (identifikace entit, lematizace, stemování) - Velké datasety (sub sampling) - Modelovací algoritmy, manuální a automatická optimalizace parametrů - Evaluace a srovnání modelů - Pokročilé a nová témata (plně automatická workflow, optimalizace) - Nasazení modelů (web services, MOJOs, executable models) - Integrace mezi cloudovými službami a vybranými programovacími jazyky (Python, R), frameworky (např. Scikit-learn) a vývojovými prostředími (jako např. R studio). - Zvaná přednáška nebo přednášky

Literatura

Základní:

Jak uspět v předmětu

Doporučená příprava:

  • Pravidelná příprava během semestru místo drcení na zkoušku
  • Přednáškové slidy a materiály dostupné přes Moodle VŠE (dl.vse.cz)
  • Stará zkouška / typové otázky — zeptej se cvičícího nebo hledej na InSIS
  • Studijní skupiny a sdílení poznámek s kolegy z ročníku
Na co si dát pozor:
  • Přečti si sylabus — co je povinná vs. doporučená literatura
  • Podmínky zápočtu (zápočtové testy, projekty, docházka)
  • Termíny zkoušek zapisovat včas — kapacita bývá omezená

Doporučené zdroje

  • Sylabus na InSIS — osnova, literatura, garant
  • Moodle VŠE — prezentace a studijní materiály od vyučujících
  • Knihovna VŠE — přístup k e-knihám a databázím (EBSCO, ProQuest...)
  • SIS VŠE — výsledky zkoušek, zkušební termíny, docházka

✏️ Upravit wiki obsah

Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace

Heslo si vyžádej od správce wiki.