Předmět je zaměřen na cloudové platformy využitelné v úloze dolování z dat. Předmět pokrývá celý cyklus procesu dolování – od přípravy dat v různých formátech (tabulky, text, multimédia), přes modelování, až po nasazení modelů ve formě webových služeb a integraci s programovacími jazyky zaměřenými n
Předmět je zaměřen na cloudové platformy využitelné v úloze dolování z dat. Předmět pokrývá celý cyklus procesu dolování – od přípravy dat v různých formátech (tabulky, text, multimédia), přes modelování, až po nasazení modelů ve formě webových služeb a integraci s programovacími jazyky zaměřenými na data science.
Po úspěšném absolvování budou studenti schopni využít nejčastější cloudové platformy pro dolování dat k realizaci širokého spektra úloh dolování dat (např. příprava dat, regrese, shlukování, predikce). Absolventi budou vybaveni znalostmi pro práci s různými typy vstupních dat. V případě vstupu ve formě přirozeného jazyka budou např. schopni provést detekci entit a tokenizaci. Předmět bude reflektovat aktuální trendy, jako jsou např. vysvětlitelné (symbolické) modely.
• Úvod do služeb založených na cloudu. Seznámení s vybranými cloudovými platformami. • Přehled vybraných algoritmů pro strojové učení a optimalizaci. • Předzpracování tabulkových dat (čištění, nerovnoměrně rozdělená data, dummy proměnné). • Předzpracování textových dat (identifikace entit, lematizace, stemování). • Velké datasety (subsampling). • Modelovací algoritmy, manuální a automatická optimalizace parametrů. • Evaluace a srovnání modelů. • Pokročilá a nová témata (plně automatická workflow, optimalizace). • Možnost zvané přednášky nebo přednášek.
Základní:
Doporučená příprava:
Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace