O předmětu

Cílem je objasnění předmětu, teorií, metod a praktických nástrojů zpracování odborných informací, vytváření a zpřístupňování automatizovaných informačních fondů a poskytování informačních služeb. Zvláštní pozornost se věnuje vybraným algoritmům zpracování textových informací v automatizovaných informačních systémech (indexování, shlukování ap.).

Co se naučíš

Po úspěšném absolvování budou studenti schopni identifikovat hlavní problémy zpracování textových informací v automatizovaném informačním systému a posoudit možnosti jejich řešení.

Obsah předmětu

Přednášky: - data, informace a informační proces, bariéry v informačním procesu a další charakteristiky „informačního věku“ - identifikační a obsahová analýza dokumentů; selekční jazyky - automatické indexování textů, invertovaný soubor, modely vyhledávání - základní lingvistické problémy automatického indexování textů a jejich algoritmická řešení (problém významnosti selekčních znaků, jejich morfologických variant, synonymie a podobných sémantických vztahů mezi nimi, homonymie) - n-gramové metody zpracování textů - metody redukce dimenzionality vektorové reprezentace textů - vybrané algoritmy klasifikace a shlukování textů - shrnutí problematiky aplikace, tvorby a údržby tezauru v rámci automatizovaného informačního systému (v návaznosti na předchozí metody) - automatizovaná sumarizace (jako rozšíření úlohy automatického indexování) Cvičení: - experimentální posouzení vhodnosti různých slov v textu k indexování, vyhodnocení jejich množství a morfologické variability, odhad důsledků pozorování pro větší objem textů - demonstrace praktických nástrojů použitelných v rámci indexování i jiného zpracování textových dokumentů (včetně samostatné práce studentů s některými z nich) - 2 průběžné testy

Literatura

Základní:

Jak uspět v předmětu

Doporučená příprava:

  • Pravidelná příprava během semestru místo drcení na zkoušku
  • Přednáškové slidy a materiály dostupné přes Moodle VŠE (dl.vse.cz)
  • Stará zkouška / typové otázky — zeptej se cvičícího nebo hledej na InSIS
  • Studijní skupiny a sdílení poznámek s kolegy z ročníku
Na co si dát pozor:
  • Přečti si sylabus — co je povinná vs. doporučená literatura
  • Podmínky zápočtu (zápočtové testy, projekty, docházka)
  • Termíny zkoušek zapisovat včas — kapacita bývá omezená

Doporučené zdroje

  • Sylabus na InSIS — osnova, literatura, garant
  • Moodle VŠE — prezentace a studijní materiály od vyučujících
  • Knihovna VŠE — přístup k e-knihám a databázím (EBSCO, ProQuest...)
  • SIS VŠE — výsledky zkoušek, zkušební termíny, docházka

✏️ Upravit wiki obsah

Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace

Heslo si vyžádej od správce wiki.