\section{Náhodné veličiny} V této kapitole se budeme věnovat náhodným veličinám, což bude formalizovat (a zobecňovat) jakýsi intuitivní chápání toho, že nějaká proměnná nabývá různých hodnot s určitými pravděpodobnostmi. Začneme ústřední definicí celé statistiky -- náhodnou veličinou. \begin{definition} Nechť $(\Omega, \mathcal{A})$ je měřitelný prostor. \textit{Náhodná veličina} je měřitelné zobrazení, které přiřazuje každému výsledku $\omega$ reálné číslo $X(\omega)$. Jinými slovy, $\{\omega \in \Omega: X(\omega) \leq x\} \in \mathcal{A} \forall x\in\mathbb{R}$. \end{definition} \hfill \textit{konec 2. přednášky (18.2.2025)} \begin{convention} Zavedeme značení $[X \in B] = \{\omega: X(\omega) \in B\}, [X \leq a] = \{\omega, X(\omega) \leq a\}$. Platí tedy $[X \in B], [X \leq a] \in \mathcal{A}$ pro všechna $B \in \mathcal{B}, a \in \mathbb{R}$. Jde o náhodné jevy a jsou tedy dobře definované jejich pravděpodobnosti $P[X \in B], P[X \leq a]$. \end{convention} \begin{example} Házíme mincí desetkrát. Nechť $X(\omega)$ je počet orlů v posloupnosti $\omega$. Jestliže $\omega = OOPOOPOOPP$ (kde $O$ je orel a $P$ je panna), platí $X(\omega) = 6$. \end{example} V předchozí kapitole jsme mluvili o pravděpodobnostním rozdělení, je na čase tento pojem formálně zadefinovat. \begin{definition} \textit{Rozdělením náhodné veličiny} $X: (\Omega, \mathcal{A}) \rightarrow (\mathbb{R}, \mathcal{B}(\mathbb{R}))$ nazýváme indukovanou pravděpodobnostní míru $P_X$ na $(\mathbb{R},\mathcal{B}(\mathbb{R}))$ definovanou jako $$ P_X(B) := P[\{\omega\in\Omega: X(\omega)\in B\}],B\in \mathcal{B}(\mathbb{R}).$$ \end{definition} Máme tedy jakýsi obraz míry $P$ v zobrazení $P_X$ čímž se $(\Omega, \mathcal{A}, P)$ zobrazí na pravděpodobnostní prostor $(\mathbb{R},\mathcal{B}(\mathbb{R}),P_X)$. V opačném směru můžeme použít takzvané kanonické vnoření do prostoru $(\mathbb{R}, \mathcal{B}, P_X)$, kde naší zvolenou měřitelnou funkcí bude identita, tedy není potřeba se bát, že by příslušný prostor nemusel existovat. Následující věta říká, že nezáleží ve kterém z těchto dvou prostorů integrujeme libovolnou funkci. \begin{theorem}[O přenosu integrace] Buď $g$ měřitelná funkce na měřitelném prostoru $(\mathbb{M}, \mathcal{M})$ a $X: (\Omega, \mathcal{A}, P) \rightarrow (\mathbb{M}, \mathcal{M})$. Nechť $P_X$ je míra na $\mathcal{M}$ indukovaná zobrazením $X$, tedy $P_X(M) = P[X^{-1}(M)]$ pro $M \in \mathcal{M}$. Potom, je-li aspoň jedna strana definována, platí $$\int_\Omega g[X(\omega)] dP(\omega) = \int_\mathbb{M} g(x) dP_X(x).$$ \end{theorem} \begin{proof} Důkaz této věty je poměrně technický, hlavní ideou je ``klasický" postup z teorie míry postupným důkazem nejdříve pro charakteristickou funkci, poté pro jednoduchou měřitelnou (nabývající jen konečně mnoha hodnot), pak pro nezápornou měřitelnou a na závěr pro obecnou měřitelnou funkci. Nechť $g = \chi_B, B \in \mathcal{M}$. Tedy $g(X(\omega)) = 1$ pro $X(\omega) \in B$ (a všude jinde nulová), tedy pro $\omega \in X^{-1}(B)$. Potom máme $$ \int_\Omega g(X(\omega) dP(\omega) = \int_{X^{-1}(B)} dP(\omega) = P[X^{-1}(B)]. $$ Pro pravou stranu máme $$ \int_\mathbb{M} g(x) dP_X(x) = \int_B dP_X(x) = P_X(B) = P[X^{-1}(B)].$$ Dále nechť $g$ je jednoduchá měřitelná, tedy $g(\cdot) = \sum_{k = 1}^{n} c_k \chi_{B_k}(\cdot)$ pro $n \in \mathbb{N}$, $c_k \in \mathbb{R}$ a $B_k \in \mathcal{M}$ pro všechna $k$. Z linearity integrálu plyne (vytkneme sumu) $ \int_\Omega g(X(\omega) dP(\omega) = \int_{X^{-1}(B)} dP(\omega) = P[X^{-1}(B)]$. Je-li $g$ nezáporná měřitelná, potom existuje posloupnost $g_n$ jednoduchých měřitelných funkcí takových, že $g_n \nearrow g$. Potom dle Léviho věty o monotonní konvergenci máme $$\int_\Omega g[X(\omega)] dP(\omega) = \lim_{n\rightarrow\infty} \int_\Omega g_n[X(\omega)] dP(\omega) $$ $$ = \lim_{n\rightarrow\infty} \int_\mathbb{M} g_n(x) dP_X(x) = \int_\mathbb{M} g(x) dP_X(x),$$ kde třetí rovnost plyne z již dokázané části pro jednoduché měřitelné funkce. Nakonec, pro $g$ měřitelnou existuje rozklad $g = g^+ - g^-$ takový, že $g^+, g^-$ jsou nezáporné měřitelné, tedy požadované tvrzení plyne z části pro nezáporné měřitelné funkce. \end{proof} Na závěr poznamenejme, že se nám budou obzvlášť hodit volby $(\mathbb{M}, \mathcal{M}) = (\mathbb{R}^n, \mathcal{B}(\mathbb{R}^n))$ pro $n \geq 1$. Připomeňme si, že jsou-li $\mu, \nu$ dvě $\sigma$-konečné míry na $(\mathbb{R}, \mathcal{B}(\mathbb{R}))$ a je-li $\nu << \mu$ (tedy $\mu(B) = 0$ implikuje $\nu(B) = 0$), potom z Radonovy-Nikodymovy věty plyne existence nezáporné měřitelné funkce $f$ takové, že $\nu(B) = \int_\mathbb{R} fd\mu$ pro všechna $B \in \mathcal{B}$. Této funkci $f$ říkáme Radonova-Nikodymova derivace a píšeme $f = \frac{d\nu}{d\mu}$. Taková funkce $f$ je navíc určena jednoznačně až na množinu $\mu$-míry $0$. Využijeme těchto poznatků tak, že zvolíme vhodnou referenční míru na $\mathbb{R}$ a rozdělení $P_X$ pak bude popsáno právě zavedenou Radonovou-Nikodymovou derivací. Vhodné referenční míry jsou např. \begin{itemize} \item Lebesgueova míra $\lambda$, \item Čítací míra na spočetné podmnožině $\mathbb{R}$, platí $\mu_S(B) = |B \cap S|$ kde $S$ je nejvýše spočetná podmnožina $\mathbb{R}$. \end{itemize} \begin{definition} Buď $X$ náhodná veličina a $P_X$ její rozdělení. Nechť $P_X$ je absolutně spojité vůči $\mu$, kde $\mu$ je $\sigma$-konečná míra na $\mathbb{R}$. Pak funkci $f_X$ splňující $P_X(B) = \int_B f_X d\mu$ pro všechny $B \in \mathbb{B}$ nazveme \textit{hustotou} rozdělení náhodné veličiny $X$ vůči míře $\mu$. \end{definition} Je třeba si dát pozor na to, aby zvolená referenční míra opravdu byla absolutně spojitá, například při hodu kostkou má výsledek $1$ nenulovou pravděpodobnost, ale $\lambda(\{1\}) = 0$. \begin{theorem} Buď $X$ náhodná veličina a $P_X$ její rozdělení. Je-li $f_X$ hustota (rozdělení) vůči $\sigma$-konečné míře $\mu$, pak $$P[X\in B] = \int_B f_X d\mu.$$ \end{theorem} \begin{proof} Jde o přímý důsledek Radonovy-Nikodymovy věty a vztahu mezi $P_X$ a $P$. \end{proof} Další funkcí, která plně charakterizuje rozdělení náhodné veličiny je tzv. distribuční funkce. \begin{definition} Buď $X$ náhodná veličina na $(\Omega, \mathcal{A}, P)$ a $P_X$ její rozdělení. \textit{Distribuční funkce} $F_x$ náhodné veličiny $X$ je definována vztahem $$F_X(a) := P((-\infty, a]) = P[X \leq a].$$ \end{definition} Uvedeme si několik užitečných vlastností distribučních funkcí: \begin{corollary}[Základní vlastnosti distribučních funkcí]\hfill \begin{enumerate}[(i)] \item Distribuční funkce jednoznačně určuje rozdělení (jinými slovy, $F_X = F_Y$ implikuje $P_X = P_Y$). \item Různé náhodné veličiny mohou mít stejné distribuční funkce, tedy stejné rozdělení. \end{enumerate} \end{corollary} \hfill \textit{konec 3. přednášky (24.2.2025)} \begin{example} Hodíme dvěma kostkami, označme $Y$ počet sudých čísel na těchto dvou kostkách. Potom $Y \in \{ 0, 1, 2 \}$. Z definice $F_Y(a) = P[Y \leq a]$, tedy $$ F_Y(a) = \begin{cases} 0, a < 0,\\ \frac{1}{4}, 0 \leq a < 1,\\ \frac{3}{4}, 1 \leq a < 2,\\ 1, a \geq 2. \end{cases} $$ Dále, z toho, že $P_Y({0}) = \frac{1}{4} > 0$, plyne, že míra $P_Y$ není absolutně spojitá vůči Lebesgueově míře $\lambda$, tedy musíme uvažovat čítací míru $\mu_\mathbb{Z}$ na množině celých čísel. Potom hustota $f_Y$ má následující tvar: $$ f_Y(a) = \begin{cases} \frac{1}{4}, a = 0,\\ \frac{1}{2}, a = 1,\\ \frac{1}{4}, a = 2,\\ 0, \text{jinak}. \end{cases} $$ \end{example} Vidíme, že hustota odpovídá skokům distribuční funkce v daném bodě. V následující větě uvedeme charakterizaci distribučních funkcí. \begin{theorem}[Charakterizace distribučních funkcí] Buď $X$ náhodná veličina a $F_X$ její distribuční funkce. Pak \begin{enumerate}[(i)] \item $F_X$ je neklesající; \item $\lim_{a\rightarrow -\infty} F_X(a) = 0$, $\lim_{a\rightarrow +\infty} F_X(a) = 1$; \item $F_X$ je zprava spojitá. \end{enumerate} Navíc, každá funkce $F$ splňující body (i)-(iii) z této věty je distribuční funkcí nějaké náhodné veličiny. \end{theorem} \begin{proof} Dokážeme pouze implikaci o vlastnostech distribuční funkce, opačná implikace (existuje rozdělení) vyžaduje pokročilý matematický aparát z analýzy a teorie míry, který prozatím postrádáme. \begin{enumerate}[(i)] \item $F_X(a)= P[X \leq a]$. Bez újmy na obecnosti nechť $b > a$. Potom $F_X(b) = P[X \leq b] = P([X \leq a] \cup [a < X \leq b]) = P[X \leq a] + P[a < X \leq b]$ z aditivity míry, druhý sčítanec je nezáporný, tedy dostáváme požadované tvrzení. \item Platí $\lim_{a\rightarrow -\infty} = \lim_{n\rightarrow\infty} F_X(-n) = \lim_{n\rightarrow\infty} P[X \in (-\infty, -n]] =: $\\$\lim_{n\rightarrow\infty} P[X \in A_n] = 0$. Poslední rovnost platí ze spojitosti míry (Věta \ref{thm-continuity}), neboť platí $A_n \searrow \emptyset$. Obdobně se ukáže tvrzení pro $a \rightarrow + \infty$ (cvičení). \item Stačí uvažovat posloupnost $a_n = a + \frac{1}{n}$ pro $n \in \mathbb{N}$. Požadované tvrzení opět plyne z věty o spojitosti míry. \end{enumerate} \end{proof} Pro každou funkci $F$ splňující vlastnosti z předchozí věty existuje míra $\mu_F$ na $(\mathbb{R}, \mathcal{B})$ určená vztahem $\mu_F((-\infty, a]) = F(a)$ pro všechna $a$. Tato míra je konečná a platí $\mu_F((a, b]) = F(b) - F(a)$. \begin{definition}[Rozklad pravděpodobnostního rozdělení] Každou pravděpodobnostní míru $P_X$ můžeme rozdělit na tři složky $P_X = P_{X_{as}} + P_{X_{ds}} + P_{X_{sg}}$, kde $P_{X_{as}}$ je absolutně spojitá vůči Lebesgueově míře $\lambda$, $P_{X_{ds}}$ (diskrétní spojitá) je absolutně spojitá vůči čítací míře $\mu$ na nějaké spočetné podmnožině $\mathbb{R}$ a nakonec $P_{X_{sg}}$ (singulární) není absolutně spojitá vůči $\lambda$ ani ji nelze napsat jako spočetnou kombinaci Diracových měr $\delta_x$. \end{definition} Příkladem singulární distribuční funkce je například integrál takzvaného Cantorova diskontinua. Obecně taková rozdělení nemají ``hezké" vlastnosti, proto s nimi již nebudeme pracovat. \begin{definition} Náhodnou veličinu $X$ nazveme \textit{diskrétní}, jestliže existují $\emptyset \neq I \subset \mathbb{N}$, $\{x_i\}_{i \in I}$ a $\{p_i \in (0,1]\}_{i \in I}$ takové že $P[X \in B] = \sum_{i, x_i \in B} p_i$ pro všechny borelovské $B$. \end{definition} Platí $P[X = x_i] = p_i$ a $\sum_{i \in I} p_i = 1$. Rozdělením takové veličiny je funkce $P_X = \sum_{i \in I} p_i \delta_{x_i}$, kde $\delta_u$ je Diracova míra v bodě $u$. Toto rozdělení je absolutně spojité vůči čítací míře na $S = \{x_i\}_{i \in I} \subset \mathbb{R}$. Potom funkce $f_X(u) := \begin{cases} p_i, u = x_i,\\ 0, \text{jinak} \end{cases}$ je hustotou (občas také pravděpodobnostní funkcí) zkoumaného rozdělení. \begin{definition} Náhodná veličina $X$ se nazývá \textit{(absolutně) spojitá}, pokud její rozdělení $P_X$ je absolutně spojité vůči Lebesgueově míře $\lambda$. \end{definition} Pro spojitou náhodnou veličinu $X$ vždy existuje hustota $f_X$ (nezáporná a jednoznačná až na množinu $\lambda$-míry $0$) splňující $P[X\in B] = \int_B f_X(t) dt$ a speciálně $F_X(a) = \int_{-\infty}^a f_X(t) dt$ pro všechna $a \in \mathbb{R}$. Taková $F_X$ má derivaci ve skoro všech bodech a platí $F'_X(a) = f_X(a)$ pro s.v. $a$. Analogicky pro diskrétní náhodnou veličinu $Y$ je hustota funkcí, která nabývá v bodě $a$ hodnoty distribuční funkce v daném bodě. Ne každá veličina, se kterou se běžně setkáme je ryze spojitá nebo ryze diskrétní. Příkladem veličiny, která má obě složky nenulové, je například úhrn denních srážek, s nenulovou pravděpodobností nenaprší vůbec, ale když už začne pršet, úhrn srážek je spojitá náhodná veličina. \begin{lemma} Nechť $F_X$ je distribuční funkce náhodné veličiny $X$. Pak pro $a < b$ platí \begin{enumerate}[(i)] \item $P[a < X \leq b] = P[X \in (a, b]) = F_X(b) - F_X(a)$, \item $P[X > a] = 1 - F_X(a)$, \item $P[X = a] = F_X(a) - F_X(a^-)$, kde $F_X(a^-)$ je limita zleva $\lim_{h\rightarrow 0^+} F_X(a - h)$ a odtud $P[a \leq X \leq b] = F_X(b) - F_X(a^-)$. \item pro spojitou náhodnou veličinu platí $P[a\leq X \leq b] = P[a \leq X < b] = P[a < X \leq b] = P[a < X < b] = F_X(b) - F_X(a)$. \end{enumerate} \end{lemma} \begin{proof} Důkaz je jednoduchý, plyne z příslušných definic. Uvedeme např. důkaz pro bod (iii). $P[X = a] = \lim_{h\rightarrow 0^+} P[a - h < X \leq a] = F_X(a) - \lim_{h\rightarrow 0^+} F_X(a - h)$. \end{proof} \hfill \textit{konec 4. přednášky (25.2.2025)} Dalším užitečným pojmem je funkce inverzní k distribuční funkci, které běžně říkáme kvantil. \begin{definition} Nechť $X$ je náhodná veličina s distribuční funkcí $F$. \textit{Inverzní distribuční funkce} neboli \textit{kvantilová funkce} je definována jako $$ F^{-1} (q) = \inf \left\{ x: F(x) > q \right\}$$ pro $q \in (0, 1)$. Hodnoty $ F^{-1}$ ve speciálních bodech mají své vlastní názvy: \begin{itemize} \item $F^{-1}(\frac{1}{4})$ je \textit{první kvartil}, \item $F^{-1}(\frac{1}{2})$ je \textit{medián}, \item $F^{-1}(\frac{3}{4})$ je \textit{třetí kvartil}. \end{itemize} \end{definition} Je-li $F$ ryze rostoucí a spojitá, je $F^{-1}(q)$ to jediné $x \in \mathbb{R}$ takové, že $F(x) = q$, jinými slovy, $F$ je bijekce z $\mathbb{R}$ do $(0, 1)$. Takto definovaná kvantilová funkce je neklesající a zprava spojitá. Dále z $F^{-1}$ můžeme jednoznačně určit $F$, tedy také charakterizuje rozdělení $P_X$. Nakonec, o dvou náhodný veličinách $X$ a $Y$ říkáme, že jsou stejně rozdělené, zapisujeme $X \overset{d}{=} Y$, právě tehdy, když $F_X(x) = F_Y(x)$ pro všechna $x$. To však neznamená, že $X = Y$. Ukážeme si několik užitečných příkladů rozdělení (diskrétních a později i spojitých). Tato rozdělení se používají v praxi při modelování jednoduchých systémů, ale u komplikovanějších modelů se s těmito rozděleními bohužel nevystačíme. \subsection{Diskrétní náhodné veličiny} \begin{definition}[Bodové rozdělení] Náhodná veličina $X$ má \textit{bodové rozdělení} v bodě $a$ právě tehdy, když $P[X = x] = \chi_{\{x = a\}}, x \in \mathbb{R}$. Zapisujeme $X \sim \delta_a$. Potom platí $F_X(x) = \chi_{\{x \geq a\}}$. \end{definition} \begin{definition}[Diskrétní rovnoměrné rozdělení] Náhodná veličina $X$ má \textit{diskrétní rovnoměrné rozdělení} na $\{1,\dots,k\}$ právě tehdy, když $$f_X(x) = \begin{cases}1/k, x = 1,\dots,k;\\0,\text{jinak.}\end{cases}$$ \end{definition} \begin{definition}[Bernoulliho rozdělení] Náhodná veličina $X$ má \textit{Bernoulliho rozdělení} s parametrem $p \in (0, 1)$ právě tehdy, když $f_X(x) = p^x(1 - p)^{1 - x}$ pro $x \in {0, 1}$. Zapisujeme $X \sim Alt(p)$ nebo $X \sim Be(p)$. Tímto rozdělením modelujeme jevy, u kterých jsou pouze dva možné výsledky (úspěch/neúspěch, hod mincí). \end{definition} \begin{definition}[Binomické rozdělení] Náhodná veličina $X$ má \textit{binomické rozdělení} s parametry $n \in \mathbb{N}$ a $p \in (0, 1)$ právě tehdy, když $$f_X(x) = \binom{n}{x}p^x(1- p)^{n - x} \chi_{\{x \in \{0,\dots,n\}\}}.$$ Zapisujeme $X \sim Bi(n, p)$. Používáme toto v případě sčítaně nezávislých\footnote{Přesná definice nezávislých veličin bude uvedena později.} veličin s Bernoulliho rozdělením (počet úspěchů mezi $n$ pokusy). \end{definition} \begin{definition}[Geometrické rozdělení] Náhodná veličina $X$ má \textit{geometrické rozdělení} s parametrem $p \in (0, 1)$ (zapisujeme $X \sim Geo(p)$) právě tehdy, když $$ f_X(x) = p(1 - p)^x $$ pro $x \in \mathbb{N}_0$. Taková náhodná veličina vyjadřuje počet neúspěchů před prvním úspěchem v posloupnosti nezávislých pokusů. \end{definition} \begin{definition}[Negativně binomické rozdělení] Náhodná veličina $X$ má \textit{negativně binomické rozdělení} s parametry $n \in \mathbb{N}$ a $p \in (0, 1)$ (píšeme $X \sim NB(n, p)$), jestliže platí $$ f_X(x) = \binom{n + x - 1}{n - 1} p^n(1 - p)^x $$ pro $x \in \mathbb{N}_0$. Rozdělení vyjadřuje počet neúspěchů před $n$-tým úspěchem v posloupnosti nezávislých pokusů. Specifický případ $NB(1, p) = Geo(p)$. \end{definition} \begin{definition}[Poissonovo rozdělení] Náhodná veličina $X$ má \textit{Poissonovo rozdělení} s parametrem $\lambda > 0$ (zapisujeme $X \sim Po(\lambda)$) právě tehdy, když $$f_X(x) = e^{-\lambda} \frac{\lambda^x}{x!}$$ pro $x \in \mathbb{N}_0$. Jestliže $X \sim Po(\lambda_X)$ a $Y \sim Po(\lambda_Y)$ jsou nezávislé, potom $X + Y \sim Po(\lambda_X + \lambda_Y)$. Jestliže $n \rightarrow \infty$ a $np \rightarrow \lambda < \infty$, potom $Bi(n, p)$ konverguje k $Po(\lambda)$. \end{definition} \subsection{Absolutně spojité náhodné veličiny} \begin{definition}[Spojité rovnoměrné rozdělení] Náhodná veličina $X$ má \textit{rovnoměrné rozdělení} na intervalu $[a, b]$ právě tehdy, když $f_X(x) = (b - a)^{-1} \chi_{\{x \in [a, b]\}}$. Zapisujeme $X \sim U(a, b)$ (uniform) nebo $X \sim R(a, b)$ (rovnoměrné). \end{definition} \begin{definition}[Normální rozdělení] Náhodná veličina $X$ má \textit{normální (Gaussovo) rozdělení} s parametry $\mu \in \mathbb{R}$ a $\sigma^2 > 0$ (zapisujeme $X \sim N(\mu, \sigma^2)$) právě tehdy, když $$f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left\{ - \frac{(x - \mu)^2}{2\sigma^2}\right\}$$ pro $x \in \mathbb{R}$. \end{definition} Toto rozdělení je enormně důležité, uvedeme si proto několik jeho vlastností. Nejprve, máme-li $X \sim N(\mu, \sigma^2)$, potom $Z := (X - \mu)/\sigma \sim N(0, 1)$. Tomuto rozdělení říkáme \textit{standardní normální rozdělení}. Dále, máme-li dvě nezávislé normálně rozdělené veličiny $X \sim N(\mu_X, \sigma_X^2), Y \sim N(\mu_Y, \sigma_Y^2)$, potom $X + Y \sim N(\mu_X + \mu_Y, \sigma_X^2 + \sigma_Y^2)$. Distribuční funkce $N(0, 1)$ nejde vyjádřit analyticky, máme jen $\Phi(x) := \int_{-\infty}^x \phi(t) dt$, kde $\phi(x) := \frac{1}{\sqrt{2\pi}} \exp{-x^2/2}$ je hustota standardního normálního rozdělení. Její hodnoty proto vyhledáváme v tabulkách, případně počítáme numericky. \begin{example} Předpokládejme, ze $X \sim N(3, 5)$. Spočteme $P[X \geq 1]$. Dále spočtěte $q = F_X^{-1}(0.2)$. \end{example} \begin{proof} Počítáme přímo $$P[X \geq 1] = 1 - P[X \leq 1] = 1 - P[Z \leq \frac{1 - 3}{\sqrt{5}}] \approx 1 - \Phi(-0.8944) = 0.81.$$ Dále z tabulek víme, že $\Phi(-0.8416) = 0.2$, potom $$ 0.2 = P[X \leq q] = P[Z \leq \frac{q - \mu}{\sigma}] = \Phi[\frac{q - \mu}{\sigma}],$$ proto $-0.8416 = \frac{q - \mu}{\sigma} = \frac{q - 3}{\sqrt{5}}$ a tedy $q = 3 - 0.8416 \sqrt{5} \approx 1.1181$. \end{proof} \begin{definition}[Exponenciální rozdělení] Náhodná veličina $X$ má \textit{exponenciální rozdělení} s parametrem $\lambda > 0$ (zapisujeme $X \sim Exp(\lambda)$) právě tehdy, když $$f_X(x) = \lambda e^{-\lambda x} \chi_{\{x > 0\}}.$$ \end{definition} \begin{definition}[Gamma rozdělení] Náhodná veličina $X$ má \textit{Gamma rozdělení} s parametry $a, p > 0$ právě tehdy, když $$ f_X(x) = \frac{a^p}{\Gamma(p)} x^{p - 1} e^{-ax} \chi_{\{x > 0\}},$$ kde $\Gamma(p) = \int_0^\infty t^{p - 1} e^{-t} dt$ je gamma funkce (spojité rozšíření faktoriálu). Zapisujeme $X \sim Gamma(a, p)$ nebo $X \sim \Gamma(a, p)$. Exponenciální rozdělení $Exp(a)$ je speciálním případem Gamma rozdělení s parametrem $p = 1$. Opět máme součtový vzorec pro nezávislé veličiny $X \sim \Gamma(a, p_X), Y \sim \Gamma(a, p_Y)$, platí totiž $X + Y \sim \Gamma(a, p_X + p_Y)$. \end{definition} \begin{definition}[Beta rozdělení] Náhodná veličina $X$ má \textit{Beta rozdělení} s parametry $\alpha, \beta > 0$ právě tehdy, když $$ f_X(x) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)} x^{\alpha - 1} (1 - x)^{\beta - 1} \chi_{\{x \in (0, 1)\}}. $$ Zapisujeme $X \sim Beta(\alpha, \beta)$ nebo $X \sim B(\alpha, \beta)$. Všimněme si, že na rozdíl od předchozích rozdělení jde o rozdělení na kompaktu. \end{definition} \hfill \textit{konec 5. přednášky (3.3.2025)} \begin{definition}[$\chi^2$-rozdělení] Náhodná veličina $X$ má $\chi^2$-rozdělení s $p$ stupni volnosti (zapisujeme $X \sim \chi_p^2$) právě tehdy, když $$ f_X(x) = \frac{1}{\Gamma(p/2) 2^{(p/2)}} x^{p/2 - 1} e^{-x/2} \chi_{\{x > 0\}}.$$ Máme-li soubor nezávislých náhodných veličin $X_1,\dots,X_p \sim N(0, 1)$, potom součet jejich druhých mocnin odpovídá $\chi^2$-rozdělení, $\sum_{i=1}^p X_i^2 \sim \chi_p^2$. \end{definition} \begin{definition}[Studentovo $t$-rozdělení] Náhodná veličina $X$ má Studentovo $t$-rozdělení s $\nu$ stupni volnosti (zapisujeme $X \sim t_\nu$) právě tehdy, když $$ f_X(x) = \frac{\Gamma((\nu + 1)/2)}{\Gamma(\nu/2)\sqrt{\pi\nu}} \frac{1}{(1+x^2/\nu)^{(\nu+1)/2}}. $$ \end{definition} \begin{definition}[Cauchyho rozdělení] Cauchyovo rozdělení je speciální případ $t$-rozdělení, když $\nu = 1$. Potom platí $$ f_X(x) = \frac{1}{\pi (1 + x^2)}.$$ K zajímavým vlastnostem Cauchyova rozdělení patří například to, že nemá střední hodnotu (bude upřesněno později). \end{definition} Přejdeme dále k vícerozměrným náhodným veličinám, jedním z jejich využití je například možnost formální definice pojmu nezávislosti několika náhodných veličin. \begin{definition} Nechť $(\Omega, \mathcal{A})$ je měřitelný prostor. \textit{Náhodný vektor} je měřitelné zobrazení, které každému výsledku $\omega$ přiřadí reálný $d$-rozměrný vektor $\vec{X}(\omega)$. To znamená, že $$ \vec{X} : \Omega \rightarrow \mathbb{R}^d \land \{\omega \in \Omega: \vec{X}(\omega) \leq \vec{x}\} \in \mathcal{A} \forall \vec{x} \in \mathbb{R}^d. $$ \end{definition} \begin{definition} \textit{Rozdělením náhodného vektoru} $\vec{X}: (\Omega, \mathcal{A}) \rightarrow (\mathbb{R}^d, \mathcal{B}(\mathbb{R}^d))$ nazveme indukovanou pravděpodobnostní míru $P_{\vec{X}}$ na $(\mathbb{R}^d, \mathcal{B}(\mathbb{R}^d))$ definovanou jako $$ P_{\vec{X}}(B) := P[\{\omega \in \Omega: \vec{X}(\omega) \in B\}] $$ pro všechny $B \in \mathcal{B}(\mathbb{R}^d)$. \end{definition} Již na první pohled je zřejmá analogie s jednorozměrnými náhodnými veličinami v tom, že $P_{\vec{X}}$ je obraz míry $P$ v zobrazení $\vec{X}$, kde se původní pravděpodobnostní prostor zobrazí na $(\mathbb{R}^d, \mathcal{B}(\mathbb{R}^d), P_{\vec{X}})$. Platí, že pokud máme náhodný vektor $\vec{X} = [X_1, \dots, X_d]^T$, potom $X_i$ je náhodná veličina pro všechna $i \in \{1, \dots, d\}$ (důsledek definice, avšak platí i opačná implikace). \begin{definition} Nechť $(\Omega, \mathcal{A}, P)$ je pravděpodobnostní prostor. \textit{Sdružená distribuční funkce} náhodného vektoru $\vec{X}$ je funkce $F_{\vec{X}}: \mathbb{R}^d \rightarrow [0,1]$ definovaná jako $$ F_{\vec{X}}(\vec{x}) = P(\vec{X} \leq \vec{x}) = P(\bigcup_{l=1}^d \{X_l \leq x_l\}) $$ pro všechna $\vec{x} = [x_1,\dots,x_d]^T \in \mathbb{R}^d$. \end{definition} Analogicky s náhodnými veličinami si zformulujeme tvrzení o základních vlastnostech sdružených distribučních funkcí. \begin{theorem}[Vlastnosti sdružené distribuční funkce] Pokud je $F$ sdružená distribuční funkce $d$-rozměrného náhodného vektoru $\vec{X}$, pak platí \begin{enumerate}[(i)] \item $F$ je po složkách neklesající a zprava spojitá; \item $\lim_{x_l \rightarrow -\infty} F(\vec{x}) = 0$ pro každé $l = 1\dots d$; \item $\lim_{x_l \rightarrow +\infty \forall l} F(\vec{x}) = 1$. \end{enumerate} \end{theorem} \begin{proof} Nejdříve dokážeme vlastnost (i). Fixujme $x_1,\dots,x_{l-1},x_{l+1},\dots,x_d \in \mathbb{R}$ a definujeme funkci $G(x) := F_{\vec{X}}(x_1,\dots,x_{l-1},x,x_{l+1},\dots,x_d)$. Z monotonie pravděpodobnosti je $G$ neklesající a nezáporná. Jelikož je $G$ neklesající, nutně existuje limita $\lim_{y\rightarrow x^+} G(y) \geq G(x)$. Dokážeme, že dochází k rovnosti (čímž dokážeme spojitost zprava). Z Heineovy věty plyne, že $\lim_{y\rightarrow x^+} G(y) = \lim G(x + \frac{1}{n})$. Označme $B_n := (-\infty, x_1] \times \cdots \times (-\infty, x_{l-1}] \times (-\infty, x + \frac{1}{n}) \times (-\infty, x_{l+1}] \times \cdot \times (-\infty, x_n]$. Potom máme, že $B_n \searrow B := (-\infty, x_1] \times \cdots \times (-\infty, x_{l-1}] \times (-\infty, x]) \times (-\infty, x_{l+1}] \times \cdot \times (-\infty, x_n]$. Dále s využitím věty o spojitosti míry (Věta \ref{thm-continuity}) můžeme psát $$\lim_{y\rightarrow x^+} G(y) = \lim_{n\rightarrow \infty} G(x + \frac{1}{n}) = \lim_{n\rightarrow \infty} P_{\vec{X}}(B_n) = P_{\vec{X}}\left(\bigcap_{n=1}^\infty B_n\right) = P_{\vec{X}}(B) = G(x),$$ čímž je ukončen důkaz vlastnosti (i). K důkazu vlastnosti (ii) opět mějme pevná $x_1,\dots,x_{l-1},x_{l+1},\dots,x_d \in \mathbb{R}$. Opět uvažujme funkci $G$ z předchozí části důkazu, která je neklesající a nezáporná. Proto musí existovat její limita $\lim_{\vec{x} \rightarrow -\infty} = \lim_{n \rightarrow \infty} G(-n)$ (opět plyne z Heineovy věty). Definujme $C_n := (-\infty, x_1] \times \cdots \times (-\infty, x_{l-1}] \times (-\infty, -n]) \times (-\infty, x_{l+1}] \times \cdot \times (-\infty, x_n]$, potom platí že $C_n \searrow \emptyset$. Podobným argumentem jako posledně máme $$\lim_{x_l \rightarrow -\infty} F(\vec{x}) = \lim_{x\rightarrow -\infty} G(x) = \lim_{n\rightarrow \infty} G(-n) = \lim_{n\rightarrow \infty} P_{\vec{X}} \left(\bigcap_{n=1}^\infty C_n\right) = P_{\vec{X}}(\emptyset) = 0,$$ čímž jsme dokázali vlastnost (ii). Nakonec si uvědomíme, že podmínka z vlastnosti (iii) je ekvivalentní tomu, že $\lim_{n\rightarrow\infty} \min\{x_l\} = \infty$. Z již několikrát použité věty o spojitosti pravděpodobnosti máme, že $1 \geq F_{\vec{X}}(\vec{x}) \geq F_{\vec{X}} (\min\{x_l\} [1,\dots,1]^T )$. Stačí tedy dokázat, že poslední uvedená limita je rovna $\infty$. Položme $H(x) := F_{\vec{X}}(x[1,\dots,1]^T)$. Z monotonie pravděpodobnosti máme, že funkce $H$ je neklesající. Dále $0 \leq H(x) \leq 1$, tedy existuje $\lim_{x\rightarrow\infty} H(x) = \lim_{n\rightarrow\infty} H(n)$ (jako limita posloupnosti). Položme $D_n := (-\infty, n]^d$. Opět z věty o spojitosti míry můžeme psát $$\lim_{x_l \rightarrow +\infty \forall l} F(\vec{x}) = \lim_{n\rightarrow \infty} H(n) = \lim_{n\rightarrow \infty} P_{\vec{X}}(D_n) = P_{\vec{X}} (\mathbb{R}^d) = 1,$$ čímž jsme získali požadovanou rovnost. \end{proof} \begin{theorem}[Marginální distribuční funkce] Pokud je $F_{\vec{X}}$ sdružená distribuční funkce náhodného vektoru $\vec{X} = [X_1,\dots,X_d]^T$, pak $$ \lim_{x_d \rightarrow +\infty} F_{\vec{X}}(x_1,\dots,x_d) = F(x_1,\dots,x_{d-1}), \forall \vec{x}=[x_1,\dots,x_d]^T \in \mathbb{R}^d,$$ kde $F$ je distribuční funkce náhodného podvektoru $[X_1,\dots,X_{d-1}]^T$. \end{theorem} \begin{proof} Nechť je dána libovolná posloupnost $\{z_n\}_{n=1}^\infty$ taková, že $\lim z_n = \infty$. Dále označme $B:=\bigcap_{l=1}^{d-1} \{X_l \leq x_l\}$, $B_n := B \cup \{X_d \leq z_n\}$ a $D_n := \left(\bigcup_{m=n}^\infty B_m^C \right)^C$. Platí $D_n \subseteq B_n \subseteq B = \bigcup_{m=1}^\infty B_m$ a $D_n \nearrow B$. Ze spojitosti míry (Věta \ref{thm-continuity}) máme, že $\lim_{n\rightarrow\infty} P(D_n) = P(B)$ a z monotonie míry máme, že $P(D_n) \leq P(B_n) \leq P(B)$. Potom (viz věta o dvou strážnících) máme $\lim_{n\rightarrow \infty} P(B_n) = P(B)$. Nakonec z Heineovy věty máme, že $\lim_{x_d \rightarrow \infty} P(B \cap \{X_d \leq x_d\}) = P(B)$. \end{proof} Výše zmíněný limitní přechod můžeme opakovat vícekrát a ``marginalizovat" až na jednorozměrný případ. Navíc, složky můžeme permutovat, tedy v kombinaci s touto větou můžeme ``vyřadit" libovolnou složku. \begin{definition}[Marginální rozdělení] Nechť $J \subseteq \{1,\dots d\}$ a $|J|=m$. Potom \textit{náhodný podvektor} definujeme jako $\vec{Y} \equiv \{X_l\}_{l\in J} : (\Omega, \mathcal{A}) \rightarrow (\mathbb{R}^m, \mathcal{B}(\mathbb{R}^m))$ a \textit{marginálním rozdělením} rozumíme indukovanou pravděpodobnostní míru $P_{\vec{Y}}$ na prostoru $(\mathbb{R}^m, \mathcal{B}(\mathbb{R}^m))$. \end{definition} Ve speciálním případě $J = \{1,\dots,m\}$ pak máme $P_{\vec{Y}}(B) = P_{\vec{X}}(B \times \mathbb{R}^{d - m})$. Pro $|J| = 1$ celkem snadno vidíme, že se jedná o náhodnou veličinu. V následujících definicích definujeme spojité a diskrétní náhodné vektory podobně tomu, jak jsme to udělali u náhodných veličin. \begin{definition} Náhodný vektor $\vec{X} = [X_1, \dots, X_d]^T$ nazveme \textit{diskrétní}, jestliže existují nejvýše spočetná množina $I \subseteq \mathbb{N}$ a posloupnosti $\{\vec{x}_i\}_{i\in I}$ prvků $\mathbb{R}^d$ a $\{p_i\}_{i\in I}$ prvků intervalu $(0, 1]$ takové, že platí $$ P_{\vec{X}} = \sum_{i \in I}p_i \delta_{\vec{x}_i} \text{ a } \sum_{i \in I} p_i = 1, $$ kde $\delta_{\vec{u}}$ značí Diracovu míru v $\vec{u} \in \mathbb{R}^d$. \end{definition} \begin{definition} Náhodný vektor $\vec{X} = [X_1, \dots, X_d]^T$ nazveme \textit{(absolutně) spojitý}, jestliže $P_{\vec{X}}$ je absolutně spojitá vůči $d$-rozměrné Lebesgueově míře $\lambda^d$. \end{definition} V případě diskrétního náhodného vektoru pak můžeme explicitně uvést sdruženou distribuční funkci $F_{\vec{X}}(\vec{x}) = \sum_{i \in I} p_i \chi_{[\vec{x}_i, \infty)} (\vec{x}) = \sum_{i \in I}^{\vec{x}_i \leq \vec{x}} p_i$, kde relaci $\leq$ uvažujeme po složkách (musí platit pro všechny složky zároveň). Pro spojité náhodné vektory si uvědomíme, že sdružená distribuční funkce má derivaci $\frac{\partial^d}{\partial x_1\dots \partial x_d} F_{\vec{X}}$ s.v. vzhledem k $\lambda^d$ a platí následující vztah pro sdruženou hustotu $$ f_{\vec{X}} (\vec{x}) = \frac{\partial^d}{\partial x_1 \dots \partial x_d} F_{\vec{X}}.$$ Tento vztah platí $\lambda^d$-skoro všude a navíc v námi zkoumaných příkladech je $F_{\vec{X}}$ dostatečně hladká, tedy nezáleží na pořadí derivací. Potom také můžeme z hustoty spočítat distribuční funkci pomocí vztahu $$ F_{\vec{X}} (\vec{x})= \int_{-\infty}^{x_1} \dots \int_{-\infty}^{x_d} f_{\vec{X}}(t_1, \dots, t_d) dt_d \dots dt_1,$$ pro všechna $\vec{x} = [x_1, \dots, x_d]^T \in \mathbb{R}^d$. Díky Fubiniově větě opět nezáleží na pořadí integrálů. \hfill \textit{konec 6. přednášky (4.3.2025)}