O předmětu
Statistika je věda o sběru, analýze a interpretaci dat. Je povinná pro studenty ekonomie, informatiky i managementu. Statistické metody se používají ve výzkumu, byznys analytice i data science.
Popisná statistika
Míry polohy:
- Průměr (aritmetický): x̄ = (Σxᵢ) / n
- Medián: střední hodnota seřazeného souboru
- Lichý n: x̃ = x_{(n+1)/2} - Sudý n: x̃ = (x_{n/2} + x_{n/2+1}) / 2
- Modus: nejčastěji se vyskytující hodnota
- Kvantily: Q1 (25%), Q2 = medián (50%), Q3 (75%)
Míry variability: - Rozptyl: s² = Σ(xᵢ - x̄)² / (n-1)
- Směrodatná odchylka: s = √s²
- Variační koeficient: CV = s / x̄ × 100 %
- Interkvartilové rozpětí: IQR = Q3 - Q1
- Rozpětí: R = x_max - x_min
Míry šikmosti a špičatosti: - Šikmost > 0: pravostranná asymetrie (dlouhý pravý chvost)
- Šikmost < 0: levostranná asymetrie
- Špičatost (kurtóza) > 3: leptokurtická (špičatá), < 3: platykurtická (plochá)
Pravděpodobnost
Základní pravidla:
- P(A) ∈ [0, 1]
- P(Ω) = 1 (jistý jev)
- P(∅) = 0 (nemožný jev)
- P(Aᶜ) = 1 - P(A)
- P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
Podmíněná pravděpodobnost: P(A|B) = P(A ∩ B) / P(B)
Bayesova věta:
P(A|B) = P(B|A) · P(A) / P(B)
Nezávislé jevy: P(A ∩ B) = P(A) · P(B)
Náhodné veličiny
Diskrétní NV:
- Pravděpodobnostní funkce: P(X = xᵢ) = pᵢ
- E(X) = Σ xᵢ · pᵢ (střední hodnota)
- D(X) = E(X²) - [E(X)]² (rozptyl)
Binomické rozdělení B(n, p): P(X = k) = C(n,k) · pᵏ · (1-p)^(n-k)
E(X) = n·p, D(X) = n·p·(1-p)
Použití: počet úspěchů v n nezávislých pokusech s pravděpodobností p.
Poissonovo rozdělení P(λ):
P(X = k) = e^(-λ) · λᵏ / k!
E(X) = D(X) = λ
Použití: počet událostí v čase/prostoru (příchody, nehody).
Spojitá NV:
- f(x) = hustota pravděpodobnosti
- P(a ≤ X ≤ b) = ∫_a^b f(x) dx
Normální rozdělení N(μ, σ²): - Symetrické, zvonová křivka
- 68-95-99.7 pravidlo: 1σ/2σ/3σ od průměru
- Standardizace: Z = (X - μ) / σ ~ N(0, 1)
Testování hypotéz
Postup:
- Formuluj H₀ (nulová hypotéza) a H₁ (alternativní)
- Zvol hladinu významnosti α (obvykle 0.05)
- Vypočítej testovou statistiku
- Urči kritickou hodnotu nebo p-hodnotu
- Rozhodni: zamítni H₀ nebo nezamítni H₀
Chyby: - Chyba I. druhu (α): zamítáme H₀, přestože platí
- Chyba II. druhu (β): nezamítáme H₀, přestože neplatí
- Síla testu = 1 - β
Z-test pro průměr (σ² známé): z = (x̄ - μ₀) / (σ/√n)
t-test pro průměr (σ² neznámé):
t = (x̄ - μ₀) / (s/√n) ~ t_{n-1}
Dvouvýběrový t-test:
t = (x̄₁ - x̄₂) / √(s_p² · (1/n₁ + 1/n₂))
Chi-kvadrát test nezávislosti:
- Kontingenční tabulka, testuje závislost dvou kategoriálních proměnných
- χ² = Σ (O - E)² / E
Regresní analýza
Jednoduchá lineární regrese:
y = β₀ + β₁x + ε
MNČ (metoda nejmenších čtverců):
β₁ = Σ(xᵢ-x̄)(yᵢ-ȳ) / Σ(xᵢ-x̄)² = Cov(x,y) / Var(x)
β₀ = ȳ - β₁·x̄
Koeficient determinace:
R² = 1 - SSE/SST = vysvětlená variabilita / celková variabilita
R² ∈ [0, 1], čím vyšší, tím lepší fit
Pearsonův korelační koeficient:
r = Cov(x,y) / (s_x · s_y) ∈ [-1, 1]
- r = 1: dokonalá přímá lineární závislost
- r = -1: dokonalá nepřímá lineární závislost
- r = 0: nelineární nebo žádná závislost
Tipy pro zkoušku
- Medián je robustnější vůči odlehlým hodnotám než průměr
- p-hodnota < α → zamítáme H₀ (výsledek je statisticky významný)
- Korelace ≠ kauzalita!
- Normální rozdělení: skoro všechny ekonomické jevy po logaritmování
- Interval spolehlivosti: x̄ ± t_{α/2} · s/√n
Doporučené zdroje