O předmětu

Statistika je věda o sběru, analýze a interpretaci dat. Je povinná pro studenty ekonomie, informatiky i managementu. Statistické metody se používají ve výzkumu, byznys analytice i data science.

Popisná statistika

Míry polohy:

  • Průměr (aritmetický): x̄ = (Σxᵢ) / n
  • Medián: střední hodnota seřazeného souboru
- Lichý n: x̃ = x_{(n+1)/2} - Sudý n: x̃ = (x_{n/2} + x_{n/2+1}) / 2
  • Modus: nejčastěji se vyskytující hodnota
  • Kvantily: Q1 (25%), Q2 = medián (50%), Q3 (75%)
Míry variability:
  • Rozptyl: s² = Σ(xᵢ - x̄)² / (n-1)
  • Směrodatná odchylka: s = √s²
  • Variační koeficient: CV = s / x̄ × 100 %
  • Interkvartilové rozpětí: IQR = Q3 - Q1
  • Rozpětí: R = x_max - x_min
Míry šikmosti a špičatosti:
  • Šikmost > 0: pravostranná asymetrie (dlouhý pravý chvost)
  • Šikmost < 0: levostranná asymetrie
  • Špičatost (kurtóza) > 3: leptokurtická (špičatá), < 3: platykurtická (plochá)

Pravděpodobnost

Základní pravidla:

  • P(A) ∈ [0, 1]
  • P(Ω) = 1 (jistý jev)
  • P(∅) = 0 (nemožný jev)
  • P(Aᶜ) = 1 - P(A)
  • P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
Podmíněná pravděpodobnost:
P(A|B) = P(A ∩ B) / P(B)

Bayesova věta:

P(A|B) = P(B|A) · P(A) / P(B)

Nezávislé jevy: P(A ∩ B) = P(A) · P(B)

Náhodné veličiny

Diskrétní NV:

  • Pravděpodobnostní funkce: P(X = xᵢ) = pᵢ
  • E(X) = Σ xᵢ · pᵢ (střední hodnota)
  • D(X) = E(X²) - [E(X)]² (rozptyl)
Binomické rozdělení B(n, p):
P(X = k) = C(n,k) · pᵏ · (1-p)^(n-k)
E(X) = n·p, D(X) = n·p·(1-p)
Použití: počet úspěchů v n nezávislých pokusech s pravděpodobností p.

Poissonovo rozdělení P(λ):

P(X = k) = e^(-λ) · λᵏ / k!
E(X) = D(X) = λ
Použití: počet událostí v čase/prostoru (příchody, nehody).

Spojitá NV:

  • f(x) = hustota pravděpodobnosti
  • P(a ≤ X ≤ b) = ∫_a^b f(x) dx
Normální rozdělení N(μ, σ²):
  • Symetrické, zvonová křivka
  • 68-95-99.7 pravidlo: 1σ/2σ/3σ od průměru
  • Standardizace: Z = (X - μ) / σ ~ N(0, 1)

Testování hypotéz

Postup:

  1. Formuluj H₀ (nulová hypotéza) a H₁ (alternativní)
  2. Zvol hladinu významnosti α (obvykle 0.05)
  3. Vypočítej testovou statistiku
  4. Urči kritickou hodnotu nebo p-hodnotu
  5. Rozhodni: zamítni H₀ nebo nezamítni H₀
Chyby:
  • Chyba I. druhu (α): zamítáme H₀, přestože platí
  • Chyba II. druhu (β): nezamítáme H₀, přestože neplatí
  • Síla testu = 1 - β
Z-test pro průměr (σ² známé):
z = (x̄ - μ₀) / (σ/√n)

t-test pro průměr (σ² neznámé):

t = (x̄ - μ₀) / (s/√n)   ~ t_{n-1}

Dvouvýběrový t-test:

t = (x̄₁ - x̄₂) / √(s_p² · (1/n₁ + 1/n₂))

Chi-kvadrát test nezávislosti:

  • Kontingenční tabulka, testuje závislost dvou kategoriálních proměnných
  • χ² = Σ (O - E)² / E

Regresní analýza

Jednoduchá lineární regrese:

y = β₀ + β₁x + ε

MNČ (metoda nejmenších čtverců):

β₁ = Σ(xᵢ-x̄)(yᵢ-ȳ) / Σ(xᵢ-x̄)²  =  Cov(x,y) / Var(x)
β₀ = ȳ - β₁·x̄

Koeficient determinace:

R² = 1 - SSE/SST = vysvětlená variabilita / celková variabilita
R² ∈ [0, 1], čím vyšší, tím lepší fit

Pearsonův korelační koeficient:

r = Cov(x,y) / (s_x · s_y) ∈ [-1, 1]
  • r = 1: dokonalá přímá lineární závislost
  • r = -1: dokonalá nepřímá lineární závislost
  • r = 0: nelineární nebo žádná závislost

Tipy pro zkoušku

  • Medián je robustnější vůči odlehlým hodnotám než průměr
  • p-hodnota < α → zamítáme H₀ (výsledek je statisticky významný)
  • Korelace ≠ kauzalita!
  • Normální rozdělení: skoro všechny ekonomické jevy po logaritmování
  • Interval spolehlivosti: x̄ ± t_{α/2} · s/√n

Doporučené zdroje

✏️ Upravit wiki obsah

Používej Markdown: ## Nadpis, **tučně**, `kód`, - odrážky, > citace

Heslo si vyžádej od správce wiki.