Cílem předmětu je (i) pomoci studentům porozumět nejčastějším případům užití textové analytiky, jejich přínosům a výzvám, kterým se v řešení těchto případů v současnosti čelí; (ii) poskytnout přehled o nejpoužívanějších balíčcích a knihovnách pro zpracování přirozeného jazyka, které jsou vhodné do p
Cílem předmětu je (i) pomoci studentům porozumět nejčastějším případům užití textové analytiky, jejich přínosům a výzvám, kterým se v řešení těchto případů v současnosti čelí; (ii) poskytnout přehled o nejpoužívanějších balíčcích a knihovnách pro zpracování přirozeného jazyka, které jsou vhodné do produkčního prostředí; (iii) pomoci studentům navrhnout a implementovat jejich vlastní řešení vybraných případů užití textové analytiky, které je vhodné do produkčního prostředí.
Po úspěšném absolvování budou studenti schopni: diskutovat přínosy a omezení jednotlivých případů užití textové analytiky, navrhnout a implementovat řešení na bázi zpracování přirozeného jazyka vhodné pro nasazení do produkčního prostředí; diskutovat výhody a nevýhody nejpoužívanějších balíčků a knihoven pro zpracování přirozeného jazyka; diskutovat vhodnost metod zpracování přirozeného jazyka pro vybrané případy užití textové analytiky.
• Knihovny a balíčky na zpracování přirozeného jazyku pro Python, R a Javu. • Architektura aplikací pro zpracování přirozeného jazyka, NLP pipeline. • Jazykové modely, předtrénované modely, trénování modelu. • Klasifikace textu, analýza témat. • Sumarizace textu, zodpovídání otázek. • Analýza sentimentu, opinion mining.
Doporučená příprava:
Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace