O předmětu

Cílem předmětu je (i) pomoci studentům porozumět nejčastějším případům užití textové analytiky, jejich přínosům a výzvám, kterým se v řešení těchto případů v současnosti čelí; (ii) poskytnout přehled o nejpoužívanějších balíčcích a knihovnách pro zpracování přirozeného jazyka, které jsou vhodné do produkčního prostředí; (iii) pomoci studentům navrhnout a implementovat jejich vlastní řešení vybraných případů užití textové analytiky, které je vhodné do produkčního prostředí.

Co se naučíš

Po úspěšném absolvování budou studenti schopni: diskutovat přínosy a omezení jednotlivých případů užití textové analytiky, navrhnout a implementovat řešení na bázi zpracování přirozeného jazyka vhodné pro nasazení do produkčního prostředí; diskutovat výhody a nevýhody nejpoužívanějších balíčků a knihoven pro zpracování přirozeného jazyka; diskutovat vhodnost metod zpracování přirozeného jazyka pro vybrané případy užití textové analytiky.

Obsah předmětu

• Knihovny a balíčky na zpracování přirozeného jazyku pro Python, R a Javu. • Architektura aplikací pro zpracování přirozeného jazyka, NLP pipeline. • Jazykové modely, předtrénované modely, trénování modelu. • Klasifikace textu, analýza témat. • Sumarizace textu, zodpovídání otázek. • Analýza sentimentu, opinion mining.

Jak uspět v předmětu

Doporučená příprava:

  • Pravidelná příprava během semestru místo drcení na zkoušku
  • Přednáškové slidy a materiály dostupné přes Moodle VŠE (dl.vse.cz)
  • Stará zkouška / typové otázky — zeptej se cvičícího nebo hledej na InSIS
  • Studijní skupiny a sdílení poznámek
Na co si dát pozor:
  • Přečti si sylabus — co je povinná vs. doporučená literatura
  • Podmínky zápočtu (zápočtové testy, projekty, docházka)
  • Termíny zkoušek zapisovat včas — kapacita bývá omezená

Doporučené zdroje

✏️ Upravit wiki obsah

Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace

Heslo si vyžádej od správce wiki.