3MA481 - Statistika

O předmětu

Statistika je věda o sběru, analýze a interpretaci dat. Je povinná pro studenty ekonomie, informatiky i managementu. Statistické metody se používají ve výzkumu, byznys analytice i data science.

Popisná statistika

Míry polohy:

Průměr (aritmetický): x̄ = (Σxᵢ) / n
Medián: střední hodnota seřazeného souboru

- Lichý n: x̃ = x_{(n+1)/2} - Sudý n: x̃ = (x_{n/2} + x_{n/2+1}) / 2

Modus: nejčastěji se vyskytující hodnota
Kvantily: Q1 (25%), Q2 = medián (50%), Q3 (75%)

Míry variability:

Rozptyl: s² = Σ(xᵢ - x̄)² / (n-1)
Směrodatná odchylka: s = √s²
Variační koeficient: CV = s / x̄ × 100 %
Interkvartilové rozpětí: IQR = Q3 - Q1
Rozpětí: R = x_max - x_min

Míry šikmosti a špičatosti:

Šikmost > 0: pravostranná asymetrie (dlouhý pravý chvost)
Šikmost < 0: levostranná asymetrie
Špičatost (kurtóza) > 3: leptokurtická (špičatá), < 3: platykurtická (plochá)

Pravděpodobnost

Základní pravidla:

P(A) ∈ [0, 1]
P(Ω) = 1 (jistý jev)
P(∅) = 0 (nemožný jev)
P(Aᶜ) = 1 - P(A)
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)

Podmíněná pravděpodobnost:

P(A|B) = P(A ∩ B) / P(B)

Bayesova věta:

P(A|B) = P(B|A) · P(A) / P(B)

Nezávislé jevy: P(A ∩ B) = P(A) · P(B)

Náhodné veličiny

Diskrétní NV:

Pravděpodobnostní funkce: P(X = xᵢ) = pᵢ
E(X) = Σ xᵢ · pᵢ (střední hodnota)
D(X) = E(X²) - [E(X)]² (rozptyl)

Binomické rozdělení B(n, p):

P(X = k) = C(n,k) · pᵏ · (1-p)^(n-k)
E(X) = n·p, D(X) = n·p·(1-p)

Použití: počet úspěchů v n nezávislých pokusech s pravděpodobností p.

Poissonovo rozdělení P(λ):

P(X = k) = e^(-λ) · λᵏ / k!
E(X) = D(X) = λ

Použití: počet událostí v čase/prostoru (příchody, nehody).

Spojitá NV:

f(x) = hustota pravděpodobnosti
P(a ≤ X ≤ b) = ∫_a^b f(x) dx

Normální rozdělení N(μ, σ²):

Symetrické, zvonová křivka
68-95-99.7 pravidlo: 1σ/2σ/3σ od průměru
Standardizace: Z = (X - μ) / σ ~ N(0, 1)

Testování hypotéz

Postup:

Formuluj H₀ (nulová hypotéza) a H₁ (alternativní)
Zvol hladinu významnosti α (obvykle 0.05)
Vypočítej testovou statistiku
Urči kritickou hodnotu nebo p-hodnotu
Rozhodni: zamítni H₀ nebo nezamítni H₀

Chyby:

Chyba I. druhu (α): zamítáme H₀, přestože platí
Chyba II. druhu (β): nezamítáme H₀, přestože neplatí
Síla testu = 1 - β

Z-test pro průměr (σ² známé):

z = (x̄ - μ₀) / (σ/√n)

t-test pro průměr (σ² neznámé):

t = (x̄ - μ₀) / (s/√n)   ~ t_{n-1}

Dvouvýběrový t-test:

t = (x̄₁ - x̄₂) / √(s_p² · (1/n₁ + 1/n₂))

Chi-kvadrát test nezávislosti:

Kontingenční tabulka, testuje závislost dvou kategoriálních proměnných
χ² = Σ (O - E)² / E

Regresní analýza

Jednoduchá lineární regrese:

y = β₀ + β₁x + ε

MNČ (metoda nejmenších čtverců):

β₁ = Σ(xᵢ-x̄)(yᵢ-ȳ) / Σ(xᵢ-x̄)²  =  Cov(x,y) / Var(x)
β₀ = ȳ - β₁·x̄

Koeficient determinace:

R² = 1 - SSE/SST = vysvětlená variabilita / celková variabilita
R² ∈ [0, 1], čím vyšší, tím lepší fit

Pearsonův korelační koeficient:

r = Cov(x,y) / (s_x · s_y) ∈ [-1, 1]

r = 1: dokonalá přímá lineární závislost
r = -1: dokonalá nepřímá lineární závislost
r = 0: nelineární nebo žádná závislost

Tipy pro zkoušku

Medián je robustnější vůči odlehlým hodnotám než průměr
p-hodnota < α → zamítáme H₀ (výsledek je statisticky významný)
Korelace ≠ kauzalita!
Normální rozdělení: skoro všechny ekonomické jevy po logaritmování
Interval spolehlivosti: x̄ ± t_{α/2} · s/√n

Doporučené zdroje

Hindls, Hronová, Seger: Statistika pro ekonomy
StatSoft Textbook — zdarma online
Khan Academy Statistics
R nebo Python (pandas, scipy) — pro výpočty

3MA481 - Statistika

O předmětu

Popisná statistika

Pravděpodobnost

Náhodné veličiny

Testování hypotéz

Regresní analýza

Tipy pro zkoušku

Doporučené zdroje

✏️ Upravit wiki obsah

👨‍🏫 Učitelé

📋 Základní info

🔗 Odkazy