512 lines
40 KiB
TeX
512 lines
40 KiB
TeX
\section{Náhodné veličiny}
|
|
|
|
V této kapitole se budeme věnovat náhodným veličinám, což bude formalizovat (a zobecňovat) jakýsi intuitivní chápání toho, že nějaká proměnná nabývá různých hodnot s určitými pravděpodobnostmi. Začneme ústřední definicí celé statistiky -- náhodnou veličinou.
|
|
|
|
\begin{definition}
|
|
Nechť $(\Omega, \mathcal{A})$ je měřitelný prostor. \textit{Náhodná veličina} je měřitelné zobrazení, které přiřazuje každému výsledku $\omega$ reálné číslo $X(\omega)$.
|
|
Jinými slovy, $\{\omega \in \Omega: X(\omega) \leq x\} \in \mathcal{A} \forall x\in\mathbb{R}$.
|
|
\end{definition}
|
|
|
|
\hfill \textit{konec 2. přednášky (18.2.2025)}
|
|
|
|
\begin{convention}
|
|
Zavedeme značení $[X \in B] = \{\omega: X(\omega) \in B\}, [X \leq a] = \{\omega, X(\omega) \leq a\}$. Platí tedy $[X \in B], [X \leq a] \in \mathcal{A}$ pro všechna $B \in \mathcal{B}, a \in \mathbb{R}$. Jde o náhodné jevy a jsou tedy dobře definované jejich pravděpodobnosti $P[X \in B], P[X \leq a]$.
|
|
\end{convention}
|
|
|
|
\begin{example}
|
|
Házíme mincí desetkrát. Nechť $X(\omega)$ je počet orlů v posloupnosti $\omega$. Jestliže $\omega = OOPOOPOOPP$ (kde $O$ je orel a $P$ je panna), platí $X(\omega) = 6$.
|
|
\end{example}
|
|
|
|
V předchozí kapitole jsme mluvili o pravděpodobnostním rozdělení, je na čase tento pojem formálně zadefinovat.
|
|
|
|
\begin{definition}
|
|
\textit{Rozdělením náhodné veličiny} $X: (\Omega, \mathcal{A}) \rightarrow (\mathbb{R}, \mathcal{B}(\mathbb{R}))$ nazýváme indukovanou pravděpodobnostní míru $P_X$ na $(\mathbb{R},\mathcal{B}(\mathbb{R}))$ definovanou jako
|
|
$$ P_X(B) := P[\{\omega\in\Omega: X(\omega)\in B\}],B\in \mathcal{B}(\mathbb{R}).$$
|
|
\end{definition}
|
|
|
|
Máme tedy jakýsi obraz míry $P$ v zobrazení $P_X$ čímž se $(\Omega, \mathcal{A}, P)$ zobrazí na pravděpodobnostní prostor $(\mathbb{R},\mathcal{B}(\mathbb{R}),P_X)$. V opačném směru můžeme použít takzvané kanonické vnoření do prostoru $(\mathbb{R}, \mathcal{B}, P_X)$, kde naší zvolenou měřitelnou funkcí bude identita, tedy není potřeba se bát, že by příslušný prostor nemusel existovat. Následující věta říká, že nezáleží ve kterém z těchto dvou prostorů integrujeme libovolnou funkci.
|
|
|
|
\begin{theorem}[O přenosu integrace]
|
|
Buď $g$ měřitelná funkce na měřitelném prostoru $(\mathbb{M}, \mathcal{M})$ a $X: (\Omega, \mathcal{A}, P) \rightarrow (\mathbb{M}, \mathcal{M})$.
|
|
Nechť $P_X$ je míra na $\mathcal{M}$ indukovaná zobrazením $X$, tedy $P_X(M) = P[X^{-1}(M)]$ pro $M \in \mathcal{M}$. Potom, je-li aspoň jedna strana definována, platí
|
|
$$\int_\Omega g[X(\omega)] dP(\omega) = \int_\mathbb{M} g(x) dP_X(x).$$
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Důkaz této věty je poměrně technický, hlavní ideou je ``klasický" postup z teorie míry postupným důkazem nejdříve pro charakteristickou funkci, poté pro jednoduchou měřitelnou (nabývající jen konečně mnoha hodnot), pak pro nezápornou měřitelnou a na závěr pro obecnou měřitelnou funkci.
|
|
|
|
Nechť $g = \chi_B, B \in \mathcal{M}$. Tedy $g(X(\omega)) = 1$ pro $X(\omega) \in B$ (a všude jinde nulová), tedy pro $\omega \in X^{-1}(B)$. Potom máme
|
|
$$ \int_\Omega g(X(\omega) dP(\omega) = \int_{X^{-1}(B)} dP(\omega) = P[X^{-1}(B)]. $$
|
|
Pro pravou stranu máme
|
|
$$ \int_\mathbb{M} g(x) dP_X(x) = \int_B dP_X(x) = P_X(B) = P[X^{-1}(B)].$$
|
|
|
|
Dále nechť $g$ je jednoduchá měřitelná, tedy $g(\cdot) = \sum_{k = 1}^{n} c_k \chi_{B_k}(\cdot)$ pro $n \in \mathbb{N}$, $c_k \in \mathbb{R}$ a $B_k \in \mathcal{M}$ pro všechna $k$.
|
|
Z linearity integrálu plyne (vytkneme sumu) $ \int_\Omega g(X(\omega) dP(\omega) = \int_{X^{-1}(B)} dP(\omega) = P[X^{-1}(B)]$.
|
|
|
|
Je-li $g$ nezáporná měřitelná, potom existuje posloupnost $g_n$ jednoduchých měřitelných funkcí takových, že $g_n \nearrow g$. Potom dle Léviho věty o monotonní konvergenci máme
|
|
$$\int_\Omega g[X(\omega)] dP(\omega) = \lim_{n\rightarrow\infty} \int_\Omega g_n[X(\omega)] dP(\omega) $$
|
|
$$ = \lim_{n\rightarrow\infty} \int_\mathbb{M} g_n(x) dP_X(x) = \int_\mathbb{M} g(x) dP_X(x),$$
|
|
kde třetí rovnost plyne z již dokázané části pro jednoduché měřitelné funkce.
|
|
|
|
Nakonec, pro $g$ měřitelnou existuje rozklad $g = g^+ - g^-$ takový, že $g^+, g^-$ jsou nezáporné měřitelné, tedy požadované tvrzení plyne z části pro nezáporné měřitelné funkce.
|
|
\end{proof}
|
|
|
|
Na závěr poznamenejme, že se nám budou obzvlášť hodit volby $(\mathbb{M}, \mathcal{M}) = (\mathbb{R}^n, \mathcal{B}(\mathbb{R}^n))$ pro $n \geq 1$.
|
|
|
|
Připomeňme si, že jsou-li $\mu, \nu$ dvě $\sigma$-konečné míry na $(\mathbb{R}, \mathcal{B}(\mathbb{R}))$ a je-li $\nu << \mu$ (tedy $\mu(B) = 0$ implikuje $\nu(B) = 0$), potom z Radonovy-Nikodymovy věty plyne existence nezáporné měřitelné funkce $f$ takové, že $\nu(B) = \int_\mathbb{R} fd\mu$ pro všechna $B \in \mathcal{B}$. Této funkci $f$ říkáme Radonova-Nikodymova derivace a píšeme $f = \frac{d\nu}{d\mu}$. Taková funkce $f$ je navíc určena jednoznačně až na množinu $\mu$-míry $0$.
|
|
|
|
Využijeme těchto poznatků tak, že zvolíme vhodnou referenční míru na $\mathbb{R}$ a rozdělení $P_X$ pak bude popsáno právě zavedenou Radonovou-Nikodymovou derivací. Vhodné referenční míry jsou např.
|
|
\begin{itemize}
|
|
\item Lebesgueova míra $\lambda$,
|
|
\item Čítací míra na spočetné podmnožině $\mathbb{R}$, platí $\mu_S(B) = |B \cap S|$ kde $S$ je nejvýše spočetná podmnožina $\mathbb{R}$.
|
|
\end{itemize}
|
|
|
|
\begin{definition}
|
|
Buď $X$ náhodná veličina a $P_X$ její rozdělení. Nechť $P_X$ je absolutně spojité vůči $\mu$, kde $\mu$ je $\sigma$-konečná míra na $\mathbb{R}$. Pak funkci $f_X$ splňující $P_X(B) = \int_B f_X d\mu$ pro všechny $B \in \mathbb{B}$ nazveme \textit{hustotou} rozdělení náhodné veličiny $X$ vůči míře $\mu$.
|
|
\end{definition}
|
|
|
|
Je třeba si dát pozor na to, aby zvolená referenční míra opravdu byla absolutně spojitá, například při hodu kostkou má výsledek $1$ nenulovou pravděpodobnost, ale $\lambda(\{1\}) = 0$.
|
|
|
|
\begin{theorem}
|
|
Buď $X$ náhodná veličina a $P_X$ její rozdělení. Je-li $f_X$ hustota (rozdělení) vůči $\sigma$-konečné míře $\mu$, pak
|
|
$$P[X\in B] = \int_B f_X d\mu.$$
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Jde o přímý důsledek Radonovy-Nikodymovy věty a vztahu mezi $P_X$ a $P$.
|
|
\end{proof}
|
|
|
|
Další funkcí, která plně charakterizuje rozdělení náhodné veličiny je tzv. distribuční funkce.
|
|
|
|
\begin{definition}
|
|
Buď $X$ náhodná veličina na $(\Omega, \mathcal{A}, P)$ a $P_X$ její rozdělení. \textit{Distribuční funkce} $F_x$ náhodné veličiny $X$ je definována vztahem $$F_X(a) := P((-\infty, a]) = P[X \leq a].$$
|
|
\end{definition}
|
|
|
|
Uvedeme si několik užitečných vlastností distribučních funkcí:
|
|
|
|
\begin{corollary}[Základní vlastnosti distribučních funkcí]\hfill
|
|
\begin{enumerate}[(i)]
|
|
\item Distribuční funkce jednoznačně určuje rozdělení (jinými slovy, $F_X = F_Y$ implikuje $P_X = P_Y$).
|
|
\item Různé náhodné veličiny mohou mít stejné distribuční funkce, tedy stejné rozdělení.
|
|
\end{enumerate}
|
|
\end{corollary}
|
|
|
|
\hfill \textit{konec 3. přednášky (24.2.2025)}
|
|
|
|
\begin{example}
|
|
Hodíme dvěma kostkami, označme $Y$ počet sudých čísel na těchto dvou kostkách. Potom $Y \in \{ 0, 1, 2 \}$. Z definice $F_Y(a) = P[Y \leq a]$, tedy
|
|
$$
|
|
F_Y(a) = \begin{cases}
|
|
0, a < 0,\\
|
|
\frac{1}{4}, 0 \leq a < 1,\\
|
|
\frac{3}{4}, 1 \leq a < 2,\\
|
|
1, a \geq 2.
|
|
\end{cases}
|
|
$$
|
|
|
|
Dále, z toho, že $P_Y({0}) = \frac{1}{4} > 0$, plyne, že míra $P_Y$ není absolutně spojitá vůči Lebesgueově míře $\lambda$, tedy musíme uvažovat čítací míru $\mu_\mathbb{Z}$ na množině celých čísel. Potom hustota $f_Y$ má následující tvar:
|
|
$$
|
|
f_Y(a) = \begin{cases}
|
|
\frac{1}{4}, a = 0,\\
|
|
\frac{1}{2}, a = 1,\\
|
|
\frac{1}{4}, a = 2,\\
|
|
0, \text{jinak}.
|
|
\end{cases}
|
|
$$
|
|
\end{example}
|
|
|
|
Vidíme, že hustota odpovídá skokům distribuční funkce v daném bodě. V následující větě uvedeme charakterizaci distribučních funkcí.
|
|
|
|
\begin{theorem}[Charakterizace distribučních funkcí]
|
|
Buď $X$ náhodná veličina a $F_X$ její distribuční funkce. Pak
|
|
\begin{enumerate}[(i)]
|
|
\item $F_X$ je neklesající;
|
|
\item $\lim_{a\rightarrow -\infty} F_X(a) = 0$, $\lim_{a\rightarrow +\infty} F_X(a) = 1$;
|
|
\item $F_X$ je zprava spojitá.
|
|
\end{enumerate}
|
|
|
|
Navíc, každá funkce $F$ splňující body (i)-(iii) z této věty je distribuční funkcí nějaké náhodné veličiny.
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Dokážeme pouze implikaci o vlastnostech distribuční funkce, opačná implikace (existuje rozdělení) vyžaduje pokročilý matematický aparát z analýzy a teorie míry, který prozatím postrádáme.
|
|
|
|
\begin{enumerate}[(i)]
|
|
\item $F_X(a)= P[X \leq a]$. Bez újmy na obecnosti nechť $b > a$. Potom $F_X(b) = P[X \leq b] = P([X \leq a] \cup [a < X \leq b]) = P[X \leq a] + P[a < X \leq b]$ z aditivity míry, druhý sčítanec je nezáporný, tedy dostáváme požadované tvrzení.
|
|
\item Platí $\lim_{a\rightarrow -\infty} = \lim_{n\rightarrow\infty} F_X(-n) = \lim_{n\rightarrow\infty} P[X \in (-\infty, -n]] =: $\\$\lim_{n\rightarrow\infty} P[X \in A_n] = 0$. Poslední rovnost platí ze spojitosti míry (Věta \ref{thm-continuity}), neboť platí $A_n \searrow \emptyset$. Obdobně se ukáže tvrzení pro $a \rightarrow + \infty$ (cvičení).
|
|
\item Stačí uvažovat posloupnost $a_n = a + \frac{1}{n}$ pro $n \in \mathbb{N}$. Požadované tvrzení opět plyne z věty o spojitosti míry.
|
|
\end{enumerate}
|
|
\end{proof}
|
|
|
|
Pro každou funkci $F$ splňující vlastnosti z předchozí věty existuje míra $\mu_F$ na $(\mathbb{R}, \mathcal{B})$ určená vztahem $\mu_F((-\infty, a]) = F(a)$ pro všechna $a$. Tato míra je konečná a platí $\mu_F((a, b]) = F(b) - F(a)$.
|
|
|
|
\begin{definition}[Rozklad pravděpodobnostního rozdělení]
|
|
Každou pravděpodobnostní míru $P_X$ můžeme rozdělit na tři složky $P_X = P_{X_{as}} + P_{X_{ds}} + P_{X_{sg}}$, kde $P_{X_{as}}$ je absolutně spojitá vůči Lebesgueově míře $\lambda$, $P_{X_{ds}}$ (diskrétní spojitá) je absolutně spojitá vůči čítací míře $\mu$ na nějaké spočetné podmnožině $\mathbb{R}$ a nakonec $P_{X_{sg}}$ (singulární) není absolutně spojitá vůči $\lambda$ ani ji nelze napsat jako spočetnou kombinaci Diracových měr $\delta_x$.
|
|
\end{definition}
|
|
|
|
Příkladem singulární distribuční funkce je například integrál takzvaného Cantorova diskontinua. Obecně taková rozdělení nemají ``hezké" vlastnosti, proto s nimi již nebudeme pracovat.
|
|
|
|
\begin{definition}
|
|
Náhodnou veličinu $X$ nazveme \textit{diskrétní}, jestliže existují $\emptyset \neq I \subset \mathbb{N}$, $\{x_i\}_{i \in I}$ a $\{p_i \in (0,1]\}_{i \in I}$ takové že $P[X \in B] = \sum_{i, x_i \in B} p_i$ pro všechny borelovské $B$.
|
|
\end{definition}
|
|
|
|
Platí $P[X = x_i] = p_i$ a $\sum_{i \in I} p_i = 1$. Rozdělením takové veličiny je funkce $P_X = \sum_{i \in I} p_i \delta_{x_i}$, kde $\delta_u$ je Diracova míra v bodě $u$. Toto rozdělení je absolutně spojité vůči čítací míře na $S = \{x_i\}_{i \in I} \subset \mathbb{R}$. Potom funkce
|
|
$f_X(u) := \begin{cases}
|
|
p_i, u = x_i,\\
|
|
0, \text{jinak}
|
|
\end{cases}$ je hustotou (občas také pravděpodobnostní funkcí) zkoumaného rozdělení.
|
|
|
|
\begin{definition}
|
|
Náhodná veličina $X$ se nazývá \textit{(absolutně) spojitá}, pokud její rozdělení $P_X$ je absolutně spojité vůči Lebesgueově míře $\lambda$.
|
|
\end{definition}
|
|
|
|
Pro spojitou náhodnou veličinu $X$ vždy existuje hustota $f_X$ (nezáporná a jednoznačná až na množinu $\lambda$-míry $0$) splňující $P[X\in B] = \int_B f_X(t) dt$ a speciálně $F_X(a) = \int_{-\infty}^a f_X(t) dt$ pro všechna $a \in \mathbb{R}$. Taková $F_X$ má derivaci ve skoro všech bodech a platí $F'_X(a) = f_X(a)$ pro s.v. $a$. Analogicky pro diskrétní náhodnou veličinu $Y$ je hustota funkcí, která nabývá v bodě $a$ hodnoty distribuční funkce v daném bodě.
|
|
|
|
Ne každá veličina, se kterou se běžně setkáme je ryze spojitá nebo ryze diskrétní. Příkladem veličiny, která má obě složky nenulové, je například úhrn denních srážek, s nenulovou pravděpodobností nenaprší vůbec, ale když už začne pršet, úhrn srážek je spojitá náhodná veličina.
|
|
|
|
\begin{lemma}
|
|
Nechť $F_X$ je distribuční funkce náhodné veličiny $X$. Pak pro $a < b$ platí
|
|
\begin{enumerate}[(i)]
|
|
\item $P[a < X \leq b] = P[X \in (a, b]) = F_X(b) - F_X(a)$,
|
|
\item $P[X > a] = 1 - F_X(a)$,
|
|
\item $P[X = a] = F_X(a) - F_X(a^-)$, kde $F_X(a^-)$ je limita zleva $\lim_{h\rightarrow 0^+} F_X(a - h)$ a odtud $P[a \leq X \leq b] = F_X(b) - F_X(a^-)$.
|
|
\item pro spojitou náhodnou veličinu platí $P[a\leq X \leq b] = P[a \leq X < b] = P[a < X \leq b] = P[a < X < b] = F_X(b) - F_X(a)$.
|
|
\end{enumerate}
|
|
\end{lemma}
|
|
|
|
\begin{proof}
|
|
Důkaz je jednoduchý, plyne z příslušných definic. Uvedeme např. důkaz pro bod (iii).
|
|
|
|
$P[X = a] = \lim_{h\rightarrow 0^+} P[a - h < X \leq a] = F_X(a) - \lim_{h\rightarrow 0^+} F_X(a - h)$.
|
|
\end{proof}
|
|
|
|
\hfill \textit{konec 4. přednášky (25.2.2025)}
|
|
|
|
Dalším užitečným pojmem je funkce inverzní k distribuční funkci, které běžně říkáme kvantil.
|
|
|
|
\begin{definition}
|
|
Nechť $X$ je náhodná veličina s distribuční funkcí $F$. \textit{Inverzní distribuční funkce} neboli \textit{kvantilová funkce} je definována jako
|
|
$$ F^{-1} (q) = \inf \left\{ x: F(x) > q \right\}$$
|
|
pro $q \in (0, 1)$.
|
|
Hodnoty $ F^{-1}$ ve speciálních bodech mají své vlastní názvy:
|
|
\begin{itemize}
|
|
\item $F^{-1}(\frac{1}{4})$ je \textit{první kvartil},
|
|
\item $F^{-1}(\frac{1}{2})$ je \textit{medián},
|
|
\item $F^{-1}(\frac{3}{4})$ je \textit{třetí kvartil}.
|
|
\end{itemize}
|
|
\end{definition}
|
|
|
|
Je-li $F$ ryze rostoucí a spojitá, je $F^{-1}(q)$ to jediné $x \in \mathbb{R}$ takové, že $F(x) = q$, jinými slovy, $F$ je bijekce z $\mathbb{R}$ do $(0, 1)$. Takto definovaná kvantilová funkce je neklesající a zprava spojitá. Dále z $F^{-1}$ můžeme jednoznačně určit $F$, tedy také charakterizuje rozdělení $P_X$. Nakonec, o dvou náhodný veličinách $X$ a $Y$ říkáme, že jsou stejně rozdělené, zapisujeme $X \overset{d}{=} Y$, právě tehdy, když $F_X(x) = F_Y(x)$ pro všechna $x$. To však neznamená, že $X = Y$.
|
|
|
|
Ukážeme si několik užitečných příkladů rozdělení (diskrétních a později i spojitých). Tato rozdělení se používají v praxi při modelování jednoduchých systémů, ale u komplikovanějších modelů se s těmito rozděleními bohužel nevystačíme.
|
|
|
|
\subsection{Diskrétní náhodné veličiny}
|
|
|
|
\begin{definition}[Bodové rozdělení]
|
|
Náhodná veličina $X$ má \textit{bodové rozdělení} v bodě $a$ právě tehdy, když $P[X = x] = \chi_{\{x = a\}}, x \in \mathbb{R}$. Zapisujeme $X \sim \delta_a$. Potom platí $F_X(x) = \chi_{\{x \geq a\}}$.
|
|
\end{definition}
|
|
|
|
\begin{definition}[Diskrétní rovnoměrné rozdělení]
|
|
Náhodná veličina $X$ má \textit{diskrétní rovnoměrné rozdělení} na $\{1,\dots,k\}$ právě tehdy, když
|
|
$$f_X(x) = \begin{cases}1/k, x = 1,\dots,k;\\0,\text{jinak.}\end{cases}$$
|
|
\end{definition}
|
|
|
|
\begin{definition}[Bernoulliho rozdělení]
|
|
Náhodná veličina $X$ má \textit{Bernoulliho rozdělení} s parametrem $p \in (0, 1)$ právě tehdy, když $f_X(x) = p^x(1 - p)^{1 - x}$ pro $x \in {0, 1}$. Zapisujeme $X \sim Alt(p)$ nebo $X \sim Be(p)$. Tímto rozdělením modelujeme jevy, u kterých jsou pouze dva možné výsledky (úspěch/neúspěch, hod mincí).
|
|
\end{definition}
|
|
|
|
\begin{definition}[Binomické rozdělení]
|
|
Náhodná veličina $X$ má \textit{binomické rozdělení} s parametry $n \in \mathbb{N}$ a $p \in (0, 1)$ právě tehdy, když
|
|
$$f_X(x) = \binom{n}{x}p^x(1- p)^{n - x} \chi_{\{x \in \{0,\dots,n\}\}}.$$
|
|
Zapisujeme $X \sim Bi(n, p)$. Používáme toto v případě sčítaně nezávislých\footnote{Přesná definice nezávislých veličin bude uvedena později.} veličin s Bernoulliho rozdělením (počet úspěchů mezi $n$ pokusy).
|
|
\end{definition}
|
|
|
|
\begin{definition}[Geometrické rozdělení]
|
|
Náhodná veličina $X$ má \textit{geometrické rozdělení} s parametrem $p \in (0, 1)$ (zapisujeme $X \sim Geo(p)$) právě tehdy, když
|
|
$$ f_X(x) = p(1 - p)^x $$
|
|
pro $x \in \mathbb{N}_0$. Taková náhodná veličina vyjadřuje počet neúspěchů před prvním úspěchem v posloupnosti nezávislých pokusů.
|
|
\end{definition}
|
|
|
|
\begin{definition}[Negativně binomické rozdělení]
|
|
Náhodná veličina $X$ má \textit{negativně binomické rozdělení} s parametry $n \in \mathbb{N}$ a $p \in (0, 1)$ (píšeme $X \sim NB(n, p)$), jestliže platí
|
|
$$ f_X(x) = \binom{n + x - 1}{n - 1} p^n(1 - p)^x $$
|
|
pro $x \in \mathbb{N}_0$. Rozdělení vyjadřuje počet neúspěchů před $n$-tým úspěchem v posloupnosti nezávislých pokusů. Specifický případ $NB(1, p) = Geo(p)$.
|
|
\end{definition}
|
|
|
|
\begin{definition}[Poissonovo rozdělení]
|
|
Náhodná veličina $X$ má \textit{Poissonovo rozdělení} s parametrem $\lambda > 0$ (zapisujeme $X \sim Po(\lambda)$) právě tehdy, když
|
|
$$f_X(x) = e^{-\lambda} \frac{\lambda^x}{x!}$$
|
|
pro $x \in \mathbb{N}_0$. Jestliže $X \sim Po(\lambda_X)$ a $Y \sim Po(\lambda_Y)$ jsou nezávislé, potom $X + Y \sim Po(\lambda_X + \lambda_Y)$. Jestliže $n \rightarrow \infty$ a $np \rightarrow \lambda < \infty$, potom $Bi(n, p)$ konverguje k $Po(\lambda)$.
|
|
\end{definition}
|
|
|
|
\subsection{Absolutně spojité náhodné veličiny}
|
|
|
|
\begin{definition}[Spojité rovnoměrné rozdělení]
|
|
Náhodná veličina $X$ má \textit{rovnoměrné rozdělení} na intervalu $[a, b]$ právě tehdy, když $f_X(x) = (b - a)^{-1} \chi_{\{x \in [a, b]\}}$. Zapisujeme $X \sim U(a, b)$ (uniform) nebo $X \sim R(a, b)$ (rovnoměrné).
|
|
\end{definition}
|
|
|
|
\begin{definition}[Normální rozdělení]
|
|
Náhodná veličina $X$ má \textit{normální (Gaussovo) rozdělení} s parametry $\mu \in \mathbb{R}$ a $\sigma^2 > 0$ (zapisujeme $X \sim N(\mu, \sigma^2)$) právě tehdy, když
|
|
$$f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left\{ - \frac{(x - \mu)^2}{2\sigma^2}\right\}$$
|
|
pro $x \in \mathbb{R}$.
|
|
\end{definition}
|
|
|
|
Toto rozdělení je enormně důležité, uvedeme si proto několik jeho vlastností. Nejprve, máme-li $X \sim N(\mu, \sigma^2)$, potom $Z := (X - \mu)/\sigma \sim N(0, 1)$. Tomuto rozdělení říkáme \textit{standardní normální rozdělení}. Dále, máme-li dvě nezávislé normálně rozdělené veličiny $X \sim N(\mu_X, \sigma_X^2), Y \sim N(\mu_Y, \sigma_Y^2)$, potom $X + Y \sim N(\mu_X + \mu_Y, \sigma_X^2 + \sigma_Y^2)$.
|
|
|
|
Distribuční funkce $N(0, 1)$ nejde vyjádřit analyticky, máme jen $\Phi(x) := \int_{-\infty}^x \phi(t) dt$, kde $\phi(x) := \frac{1}{\sqrt{2\pi}} \exp{-x^2/2}$ je hustota standardního normálního rozdělení. Její hodnoty proto vyhledáváme v tabulkách, případně počítáme numericky.
|
|
|
|
\begin{example}
|
|
Předpokládejme, ze $X \sim N(3, 5)$. Spočteme $P[X \geq 1]$. Dále spočtěte $q = F_X^{-1}(0.2)$.
|
|
\end{example}
|
|
|
|
\begin{proof}
|
|
Počítáme přímo
|
|
$$P[X \geq 1] = 1 - P[X \leq 1] = 1 - P[Z \leq \frac{1 - 3}{\sqrt{5}}] \approx 1 - \Phi(-0.8944) = 0.81.$$
|
|
|
|
Dále z tabulek víme, že $\Phi(-0.8416) = 0.2$, potom
|
|
$$ 0.2 = P[X \leq q] = P[Z \leq \frac{q - \mu}{\sigma}] = \Phi[\frac{q - \mu}{\sigma}],$$
|
|
proto $-0.8416 = \frac{q - \mu}{\sigma} = \frac{q - 3}{\sqrt{5}}$ a tedy $q = 3 - 0.8416 \sqrt{5} \approx 1.1181$.
|
|
\end{proof}
|
|
|
|
\begin{definition}[Exponenciální rozdělení]
|
|
Náhodná veličina $X$ má \textit{exponenciální rozdělení} s parametrem $\lambda > 0$ (zapisujeme $X \sim Exp(\lambda)$) právě tehdy, když $$f_X(x) = \lambda e^{-\lambda x} \chi_{\{x > 0\}}.$$
|
|
\end{definition}
|
|
|
|
\begin{definition}[Gamma rozdělení]
|
|
Náhodná veličina $X$ má \textit{Gamma rozdělení} s parametry $a, p > 0$ právě tehdy, když
|
|
$$ f_X(x) = \frac{a^p}{\Gamma(p)} x^{p - 1} e^{-ax} \chi_{\{x > 0\}},$$
|
|
kde $\Gamma(p) = \int_0^\infty t^{p - 1} e^{-t} dt$ je gamma funkce (spojité rozšíření faktoriálu). Zapisujeme $X \sim Gamma(a, p)$ nebo $X \sim \Gamma(a, p)$. Exponenciální rozdělení $Exp(a)$ je speciálním případem Gamma rozdělení s parametrem $p = 1$.
|
|
|
|
Opět máme součtový vzorec pro nezávislé veličiny $X \sim \Gamma(a, p_X), Y \sim \Gamma(a, p_Y)$, platí totiž $X + Y \sim \Gamma(a, p_X + p_Y)$.
|
|
\end{definition}
|
|
|
|
\begin{definition}[Beta rozdělení]
|
|
Náhodná veličina $X$ má \textit{Beta rozdělení} s parametry $\alpha, \beta > 0$ právě tehdy, když
|
|
$$ f_X(x) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)} x^{\alpha - 1} (1 - x)^{\beta - 1} \chi_{\{x \in (0, 1)\}}. $$
|
|
Zapisujeme $X \sim Beta(\alpha, \beta)$ nebo $X \sim B(\alpha, \beta)$. Všimněme si, že na rozdíl od předchozích rozdělení jde o rozdělení na kompaktu.
|
|
\end{definition}
|
|
|
|
\hfill \textit{konec 5. přednášky (3.3.2025)}
|
|
|
|
\begin{definition}[$\chi^2$-rozdělení]
|
|
Náhodná veličina $X$ má $\chi^2$-rozdělení s $p$ stupni volnosti (zapisujeme $X \sim \chi_p^2$) právě tehdy, když
|
|
$$ f_X(x) = \frac{1}{\Gamma(p/2) 2^{(p/2)}} x^{p/2 - 1} e^{-x/2} \chi_{\{x > 0\}}.$$
|
|
Máme-li soubor nezávislých náhodných veličin $X_1,\dots,X_p \sim N(0, 1)$, potom součet jejich druhých mocnin odpovídá $\chi^2$-rozdělení, $\sum_{i=1}^p X_i^2 \sim \chi_p^2$.
|
|
\end{definition}
|
|
|
|
\begin{definition}[Studentovo $t$-rozdělení]
|
|
Náhodná veličina $X$ má Studentovo $t$-rozdělení s $\nu$ stupni volnosti (zapisujeme $X \sim t_\nu$) právě tehdy, když
|
|
$$ f_X(x) = \frac{\Gamma((\nu + 1)/2)}{\Gamma(\nu/2)\sqrt{\pi\nu}} \frac{1}{(1+x^2/\nu)^{(\nu+1)/2}}. $$
|
|
\end{definition}
|
|
|
|
\begin{definition}[Cauchyho rozdělení]
|
|
Cauchyovo rozdělení je speciální případ $t$-rozdělení, když $\nu = 1$. Potom platí
|
|
$$ f_X(x) = \frac{1}{\pi (1 + x^2)}.$$
|
|
K zajímavým vlastnostem Cauchyova rozdělení patří například to, že nemá střední hodnotu (bude upřesněno později).
|
|
\end{definition}
|
|
|
|
Přejdeme dále k vícerozměrným náhodným veličinám, jedním z jejich využití je například možnost formální definice pojmu nezávislosti několika náhodných veličin.
|
|
|
|
\begin{definition}
|
|
Nechť $(\Omega, \mathcal{A})$ je měřitelný prostor. \textit{Náhodný vektor} je měřitelné zobrazení, které každému výsledku $\omega$ přiřadí reálný $d$-rozměrný vektor $\vec{X}(\omega)$. To znamená, že
|
|
$$ \vec{X} : \Omega \rightarrow \mathbb{R}^d \land \{\omega \in \Omega: \vec{X}(\omega) \leq \vec{x}\} \in \mathcal{A} \forall \vec{x} \in \mathbb{R}^d. $$
|
|
\end{definition}
|
|
|
|
\begin{definition}
|
|
\textit{Rozdělením náhodného vektoru} $\vec{X}: (\Omega, \mathcal{A}) \rightarrow (\mathbb{R}^d, \mathcal{B}(\mathbb{R}^d))$ nazveme indukovanou pravděpodobnostní míru $P_{\vec{X}}$ na $(\mathbb{R}^d, \mathcal{B}(\mathbb{R}^d))$ definovanou jako
|
|
$$ P_{\vec{X}}(B) := P[\{\omega \in \Omega: \vec{X}(\omega) \in B\}] $$
|
|
pro všechny $B \in \mathcal{B}(\mathbb{R}^d)$.
|
|
\end{definition}
|
|
|
|
Již na první pohled je zřejmá analogie s jednorozměrnými náhodnými veličinami v tom, že $P_{\vec{X}}$ je obraz míry $P$ v zobrazení $\vec{X}$, kde se původní pravděpodobnostní prostor zobrazí na $(\mathbb{R}^d, \mathcal{B}(\mathbb{R}^d), P_{\vec{X}})$.
|
|
Platí, že pokud máme náhodný vektor $\vec{X} = [X_1, \dots, X_d]^T$, potom $X_i$ je náhodná veličina pro všechna $i \in \{1, \dots, d\}$ (důsledek definice, avšak platí i opačná implikace).
|
|
|
|
\begin{definition}
|
|
Nechť $(\Omega, \mathcal{A}, P)$ je pravděpodobnostní prostor. \textit{Sdružená distribuční funkce} náhodného vektoru $\vec{X}$ je funkce $F_{\vec{X}}: \mathbb{R}^d \rightarrow [0,1]$ definovaná jako
|
|
$$ F_{\vec{X}}(\vec{x}) = P(\vec{X} \leq \vec{x}) = P(\bigcup_{l=1}^d \{X_l \leq x_l\}) $$
|
|
pro všechna $\vec{x} = [x_1,\dots,x_d]^T \in \mathbb{R}^d$.
|
|
\end{definition}
|
|
|
|
Analogicky s náhodnými veličinami si zformulujeme tvrzení o základních vlastnostech sdružených distribučních funkcí.
|
|
|
|
\begin{theorem}[Vlastnosti sdružené distribuční funkce]
|
|
Pokud je $F$ sdružená distribuční funkce $d$-rozměrného náhodného vektoru $\vec{X}$, pak platí
|
|
\begin{enumerate}[(i)]
|
|
\item $F$ je po složkách neklesající a zprava spojitá;
|
|
\item $\lim_{x_l \rightarrow -\infty} F(\vec{x}) = 0$ pro každé $l = 1\dots d$;
|
|
\item $\lim_{x_l \rightarrow +\infty \forall l} F(\vec{x}) = 1$.
|
|
\end{enumerate}
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Nejdříve dokážeme vlastnost (i). Fixujme $x_1,\dots,x_{l-1},x_{l+1},\dots,x_d \in \mathbb{R}$ a definujeme funkci $G(x) := F_{\vec{X}}(x_1,\dots,x_{l-1},x,x_{l+1},\dots,x_d)$. Z monotonie pravděpodobnosti je $G$ neklesající a nezáporná.
|
|
Jelikož je $G$ neklesající, nutně existuje limita $\lim_{y\rightarrow x^+} G(y) \geq G(x)$. Dokážeme, že dochází k rovnosti (čímž dokážeme spojitost zprava).
|
|
|
|
Z Heineovy věty plyne, že $\lim_{y\rightarrow x^+} G(y) = \lim G(x + \frac{1}{n})$. Označme $B_n := (-\infty, x_1] \times \cdots \times (-\infty, x_{l-1}] \times (-\infty, x + \frac{1}{n}) \times (-\infty, x_{l+1}] \times \cdot \times (-\infty, x_n]$. Potom máme, že $B_n \searrow B := (-\infty, x_1] \times \cdots \times (-\infty, x_{l-1}] \times (-\infty, x]) \times (-\infty, x_{l+1}] \times \cdot \times (-\infty, x_n]$.
|
|
|
|
Dále s využitím věty o spojitosti míry (Věta \ref{thm-continuity}) můžeme psát
|
|
$$\lim_{y\rightarrow x^+} G(y) = \lim_{n\rightarrow \infty} G(x + \frac{1}{n}) = \lim_{n\rightarrow \infty} P_{\vec{X}}(B_n) = P_{\vec{X}}\left(\bigcap_{n=1}^\infty B_n\right) = P_{\vec{X}}(B) = G(x),$$
|
|
čímž je ukončen důkaz vlastnosti (i).
|
|
|
|
K důkazu vlastnosti (ii) opět mějme pevná $x_1,\dots,x_{l-1},x_{l+1},\dots,x_d \in \mathbb{R}$. Opět uvažujme funkci $G$ z předchozí části důkazu, která je neklesající a nezáporná. Proto musí existovat její limita $\lim_{\vec{x} \rightarrow -\infty} = \lim_{n \rightarrow \infty} G(-n)$ (opět plyne z Heineovy věty). Definujme $C_n := (-\infty, x_1] \times \cdots \times (-\infty, x_{l-1}] \times (-\infty, -n]) \times (-\infty, x_{l+1}] \times \cdot \times (-\infty, x_n]$, potom platí že $C_n \searrow \emptyset$. Podobným argumentem jako posledně máme
|
|
$$\lim_{x_l \rightarrow -\infty} F(\vec{x}) = \lim_{x\rightarrow -\infty} G(x) = \lim_{n\rightarrow \infty} G(-n) = \lim_{n\rightarrow \infty} P_{\vec{X}} \left(\bigcap_{n=1}^\infty C_n\right) = P_{\vec{X}}(\emptyset) = 0,$$
|
|
čímž jsme dokázali vlastnost (ii).
|
|
|
|
Nakonec si uvědomíme, že podmínka z vlastnosti (iii) je ekvivalentní tomu, že $\lim_{n\rightarrow\infty} \min\{x_l\} = \infty$. Z již několikrát použité věty o spojitosti pravděpodobnosti máme, že $1 \geq F_{\vec{X}}(\vec{x}) \geq F_{\vec{X}} (\min\{x_l\} [1,\dots,1]^T )$. Stačí tedy dokázat, že poslední uvedená limita je rovna $\infty$.
|
|
|
|
Položme $H(x) := F_{\vec{X}}(x[1,\dots,1]^T)$. Z monotonie pravděpodobnosti máme, že funkce $H$ je neklesající. Dále $0 \leq H(x) \leq 1$, tedy existuje $\lim_{x\rightarrow\infty} H(x) = \lim_{n\rightarrow\infty} H(n)$ (jako limita posloupnosti). Položme $D_n := (-\infty, n]^d$. Opět z věty o spojitosti míry můžeme psát
|
|
$$\lim_{x_l \rightarrow +\infty \forall l} F(\vec{x}) = \lim_{n\rightarrow \infty} H(n) = \lim_{n\rightarrow \infty} P_{\vec{X}}(D_n) = P_{\vec{X}} (\mathbb{R}^d) = 1,$$
|
|
čímž jsme získali požadovanou rovnost.
|
|
\end{proof}
|
|
|
|
\begin{theorem}[Marginální distribuční funkce]
|
|
\label{thm-marginalization}
|
|
Pokud je $F_{\vec{X}}$ sdružená distribuční funkce náhodného vektoru $\vec{X} = [X_1,\dots,X_d]^T$, pak
|
|
$$ \lim_{x_d \rightarrow +\infty} F_{\vec{X}}(x_1,\dots,x_d) = F(x_1,\dots,x_{d-1}), \forall \vec{x}=[x_1,\dots,x_d]^T \in \mathbb{R}^d,$$
|
|
kde $F$ je distribuční funkce náhodného podvektoru $[X_1,\dots,X_{d-1}]^T$.
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Nechť je dána libovolná posloupnost $\{z_n\}_{n=1}^\infty$ taková, že $\lim z_n = \infty$. Dále označme $B:=\bigcap_{l=1}^{d-1} \{X_l \leq x_l\}$, $B_n := B \cup \{X_d \leq z_n\}$ a $D_n := \left(\bigcup_{m=n}^\infty B_m^C \right)^C$. Platí $D_n \subseteq B_n \subseteq B = \bigcup_{m=1}^\infty B_m$ a $D_n \nearrow B$. Ze spojitosti míry (Věta \ref{thm-continuity}) máme, že $\lim_{n\rightarrow\infty} P(D_n) = P(B)$ a z monotonie míry máme, že $P(D_n) \leq P(B_n) \leq P(B)$. Potom (viz věta o dvou strážnících) máme $\lim_{n\rightarrow \infty} P(B_n) = P(B)$. Nakonec z Heineovy věty máme, že $\lim_{x_d \rightarrow \infty} P(B \cap \{X_d \leq x_d\}) = P(B)$.
|
|
\end{proof}
|
|
|
|
Výše zmíněný limitní přechod můžeme opakovat vícekrát a ``marginalizovat" až na jednorozměrný případ. Navíc, složky můžeme permutovat, tedy v kombinaci s touto větou můžeme ``vyřadit" libovolnou složku.
|
|
|
|
\begin{definition}[Marginální rozdělení]
|
|
Nechť $J \subseteq \{1,\dots d\}$ a $|J|=m$. Potom \textit{náhodný podvektor} definujeme jako $\vec{Y} \equiv \{X_l\}_{l\in J} : (\Omega, \mathcal{A}) \rightarrow (\mathbb{R}^m, \mathcal{B}(\mathbb{R}^m))$ a \textit{marginálním rozdělením} rozumíme indukovanou pravděpodobnostní míru $P_{\vec{Y}}$ na prostoru $(\mathbb{R}^m, \mathcal{B}(\mathbb{R}^m))$.
|
|
\end{definition}
|
|
|
|
Ve speciálním případě $J = \{1,\dots,m\}$ pak máme $P_{\vec{Y}}(B) = P_{\vec{X}}(B \times \mathbb{R}^{d - m})$. Pro $|J| = 1$ celkem snadno vidíme, že se jedná o náhodnou veličinu.
|
|
|
|
V následujících definicích definujeme spojité a diskrétní náhodné vektory podobně tomu, jak jsme to udělali u náhodných veličin.
|
|
|
|
\begin{definition}
|
|
Náhodný vektor $\vec{X} = [X_1, \dots, X_d]^T$ nazveme \textit{diskrétní}, jestliže existují nejvýše spočetná množina $I \subseteq \mathbb{N}$ a posloupnosti $\{\vec{x}_i\}_{i\in I}$ prvků $\mathbb{R}^d$ a $\{p_i\}_{i\in I}$ prvků intervalu $(0, 1]$ takové, že platí
|
|
$$ P_{\vec{X}} = \sum_{i \in I}p_i \delta_{\vec{x}_i} \text{ a } \sum_{i \in I} p_i = 1, $$
|
|
kde $\delta_{\vec{u}}$ značí Diracovu míru v $\vec{u} \in \mathbb{R}^d$.
|
|
\end{definition}
|
|
|
|
\begin{definition}
|
|
Náhodný vektor $\vec{X} = [X_1, \dots, X_d]^T$ nazveme \textit{(absolutně) spojitý}, jestliže $P_{\vec{X}}$ je absolutně spojitá vůči $d$-rozměrné Lebesgueově míře $\lambda^d$.
|
|
\end{definition}
|
|
|
|
V případě diskrétního náhodného vektoru pak můžeme explicitně uvést sdruženou distribuční funkci $F_{\vec{X}}(\vec{x}) = \sum_{i \in I} p_i \chi_{[\vec{x}_i, \infty)} (\vec{x}) = \sum_{i \in I}^{\vec{x}_i \leq \vec{x}} p_i$, kde relaci $\leq$ uvažujeme po složkách (musí platit pro všechny složky zároveň).
|
|
|
|
Pro spojité náhodné vektory si uvědomíme, že sdružená distribuční funkce má derivaci $\frac{\partial^d}{\partial x_1\dots \partial x_d} F_{\vec{X}}$ s.v. vzhledem k $\lambda^d$ a platí následující vztah pro sdruženou hustotu
|
|
$$ f_{\vec{X}} (\vec{x}) = \frac{\partial^d}{\partial x_1 \dots \partial x_d} F_{\vec{X}}.$$
|
|
Tento vztah platí $\lambda^d$-skoro všude a navíc v námi zkoumaných příkladech je $F_{\vec{X}}$ dostatečně hladká, tedy nezáleží na pořadí derivací. Potom také můžeme z hustoty spočítat distribuční funkci pomocí vztahu
|
|
$$ F_{\vec{X}} (\vec{x})= \int_{-\infty}^{x_1} \dots \int_{-\infty}^{x_d} f_{\vec{X}}(t_1, \dots, t_d) dt_d \dots dt_1,$$
|
|
pro všechna $\vec{x} = [x_1, \dots, x_d]^T \in \mathbb{R}^d$. Díky Fubiniově větě opět nezáleží na pořadí integrálů.
|
|
|
|
\hfill \textit{konec 6. přednášky (4.3.2025)}
|
|
|
|
\begin{theorem}[Hustota vzhledem k součinové referenční míře]
|
|
\label{thm-density-product}
|
|
Nechť $P_{\vec{X}}$ je rozdělení náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ a nechť existují $\sigma$-konečné míry $\mu_l, l\in\{1,\dots,d\}$ na $\mathbb{R}$ takové, že pro jejich součin platí $P_{\vec{X}} \ll \mu_1 \otimes \cdots \otimes \mu_d$. Potom $P_{X_l} \ll \mu_l$ pro všechny složky $l \in \{1, \dots, d\}$. Dále pak existují nezáporné měřitelné funkce (hustoty) $f_{\vec{X}} : \mathbb{R}^d \rightarrow [0, \infty)$ a $f_{X_l}: \mathbb{R} \rightarrow [0, \infty)$ pro $l \in \{1, \dots, d\}$ takové, že
|
|
$$ P_{\vec{X}} (\times_{l=1}^d (-\infty, x_l]) = F_{\vec{X}}(\vec{x}) = \int_{\times_{l=1}^d (-\infty, x_l]} f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d) $$
|
|
pro všechna $\vec{x} = [x_1, \dots, x_d]^T$. Pro borelovskou množinu $B\in \mathcal{B}(\mathbb{R}^d)$ navíc platí
|
|
$$ P_{\vec{X}} (B) = \int_B f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d). $$
|
|
Potom také $F_{X_l} (x_l) = \int_{-\infty}^{x_l} f_{X_l} (t) d\mu_l$ pro všechna $x_l \in \mathbb{R}$ a všechny složky $l \in \{1, \dots, d\}$, kde
|
|
$$f_{X_l}(t) = \int_{\mathbb{R}^{d-1}} f_{\vec{X}} (t_1,\dots, t_d) d(\mu_1\otimes\dots\otimes\mu_{l-1}\otimes\mu_{l+1}\otimes\dots\otimes\mu_d) $$
|
|
platí $\mu_l$-skoro všude.
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Existence hustot plyne přímo z Radonovy-Nikodymovy věty. Zbytek plyne z Fubiniho věty (předpoklady splněny díky Radonově-Nikodymově větě a faktu, že pravděpodobnostní prostor je vždy normalizovaný).
|
|
\end{proof}
|
|
|
|
Poznamenejme, že předpoklad existence příslušných měr je automaticky splněn v případě diskrétních nebo absolutně spojitých náhodných vektorů.
|
|
|
|
\begin{example}
|
|
Mějme absolutně spojitý náhodný vektor $[X, Y]^T$. Potom existuje jeho sdružená distribuční funkce $F_{[X, Y]^T}(x, y)$. Chceme-li dostat jednorozměrnou distribuční funkci $F_X(x)$, s použitím Věty \ref{thm-marginalization} dostáváme $F_X(x) = \lim_{y \rightarrow \infty} F_{[X, Y]^T} (x, y)$. Potom jeho hustotu dostaneme, zderivováním $f_X(x) = F'_X(x)$. Navíc z předchozí věty (Věta \ref{thm-density-product}) máme, že existuje sdružená hustota $f_{[X, Y]^T}(x, y) = \pdv*{F_{[X, Y]^T}}{x, y}(x, y)$. Pro získání jednorozměrné hustoty $f_X$ pak už jen stačí zintegrovat podle $y$ přes celou reálnou osu.
|
|
\end{example}
|
|
|
|
Nechť $\vec{X}$ je diskrétní náhodný vektor a $\nu$ čítací míra na $\{\vec{x}_i\}_{i \in I} \subset \mathbb{R}^d$, pak hustotu tohoto vektoru vzhledem k čítací míře $\nu$ nazýváme \textit{pravděpodobnostní funkcí} diskrétního mnohorozměrného rozdělení $\vec{X}$.
|
|
|
|
\begin{example}
|
|
Uvažujme dvojrozměrný náhodný vektor $[X, Y]^T$. Pro přehlednost uvedeme i řádkové/sloupcové součty (jde o marginální hustoty).
|
|
\begin{center}
|
|
\begin{tabular}{c|cc|c}
|
|
& $Y = 0$ & $Y = 1$ & \\
|
|
\hline
|
|
$X = 0$ & $1/9$ & $2/9$ & $1/3$ \\
|
|
$X = 1$ & $2/9$ & $4/9$ & $2/3$ \\
|
|
\hline
|
|
& $1/3$ & $2/3$ & $1$
|
|
\end{tabular}
|
|
\end{center}
|
|
|
|
Potom přímým výpočtem můžeme získat například $f_{[X, Y]^T} (1, 1) = P(X = 1, Y = 1) = 4/9$.
|
|
\end{example}
|
|
|
|
\begin{example}
|
|
Nechť dvourozměrný náhodný vektor $[X, Y]^T$ je rovnoměrně rozdělen na jednotkovém čtverci. Pak z Věty \ref{thm-density-product} okamžitě vychází $f_{[X, Y]^T} (x, y) = \chi_{\{(x, y) \in [0, 1]^2\}}$. Určíme $P[X < 1/2, Y < 1/2]$. Tato událost $B := \{X < 1/2, Y < 1/2\}$ odpovídá podmnožině jednotkového čtverce, tedy zintegrováním přes tuto podmnožinu nepočítáme nic jiného než plošný obsah této množiny. Z Fubiniovy věty tedy dostáváme $P(B) = 1/4$.
|
|
\end{example}
|
|
|
|
Uvedeme užitečný důsledek předchozí věty pouze v případě dvourozměrných vektorů, snadno se však dají rozšířit i pro případ vícerozměrných vektorů.
|
|
|
|
\begin{corollary}[Marginální rozdělení pro dvourozměrné náhodné vektory]
|
|
Pokud diskrétní náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální pravděpodobnostní funkce pro $X$ je
|
|
$$ f_X(x) = P[X = x] = \sum_y P(X = x, Y = y) = \sum_y f_{[X, Y]^T} (x, y). $$
|
|
|
|
Pokud spojitý náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální hustota pro $X$ je
|
|
$$ f_X(x) = \int f_{[X, Y]^T} (x, y) dy. $$
|
|
\end{corollary}
|
|
|
|
Věnujme opět pozornost pojmu nezávislosti náhodných veličin. Všimněme si, že platí následující vlastnost
|
|
$$ \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} F_{\vec{X}} (\vec{x}) = \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} P[X_1 \leq x_1, \dots, X_d \leq x_d] =$$
|
|
$$ P[X_l \leq x_l] =: F_{X_l}(x_l). $$
|
|
|
|
\begin{definition}
|
|
Náhodné veličiny $X_1, \dots, X_d$ jsou \textit{nezávislé}, pokud $F_{\vec{X}} (\vec{x}) = \prod_{l = 1}^d F_{X_l} (x_l)$ pro každý vektor $\vec{x} = [x_1 \dots, x_d]^T \in \mathbb{R}^d$.
|
|
\end{definition}
|
|
|
|
Analogicky s předchozí definicí definujeme nezávislost náhodných vektorů.
|
|
|
|
\begin{definition}
|
|
Náhodné vektory $\vec{X}_1, \dots, \vec{X}_d$ jsou \textit{nezávislé}, pokud
|
|
$$ F_{\vec{X}} (\vec{x}) = \prod_{l=1}^d F_{\vec{X}_l} (\vec{x}_l) $$
|
|
pro každý ``nad-vektor" $\vec{x} = [\vec{x}_1^T, \dots, \vec{x}_d^T]^T \in \mathbb{R}^{\sum_{l=1}^d d_l}$ kde $\vec{X} = [\vec{X}_1^T,\dots, X_d^T]^T$ a $\vec{X}_l$ jsou $d_l$-rozměrné náhodné vektory pro všechna $l \in \{1, \dots d\}$.
|
|
\end{definition}
|
|
|
|
Dalším důležitým pojmem je takzvaný nosič náhodné veličiny. Rozumíme tím v zásadě množinu, kde náhodná veličina ``žije". Uvedeme zde definici pro diskrétní a spojité náhodné veličiny. Tyto pojmy se budou hodit pro vymezení prostoru, přes který poté budeme integrovat.
|
|
|
|
\begin{definition}
|
|
\textit{Nosičem} diskrétní náhodné veličiny $X$ nazýváme následující množinu $S(X) = \{x \in \mathbb{R}: P[X = x] > 0\}$. \textit{Nosičem} spojité náhodné veličiny $Y$ rozumíme množinu $S(Y) = \{y \in \mathbb{R}: f_Y(y) > 0\}$. Obdobně definujeme i nosič náhodného vektoru (cvičení).
|
|
\end{definition}
|
|
|
|
\begin{theorem}[Ekvivalentní charakterizace nezávislosti]
|
|
Nechť sdružená pravděpodobnostní funkce diskrétního náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x}) = P[\vec{X} = \vec{x}]$. Pak platí, že náhodné veličiny $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když
|
|
$$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d P[X_l = x_l]$$
|
|
pro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$.
|
|
|
|
Nechť sdružená pravděpodobnostní funkce spojitého náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x})$. Pak platí, že $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když
|
|
$$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d f_{X_l}(x_l) $$
|
|
pro $\lambda^d$-skoro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$.
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Dokážeme oba případy (spojitý a diskrétní) najednou tak, že budeme uvažovat příslušnou referenční součinovou míru.
|
|
|
|
Nejdříve dokážeme implikaci $\Rightarrow$. Uvažujme vektor $\vec{x} = [x_1,\dots,x_d]^T$. Potom z definice nezávislosti a linearity integrálu dostáváme
|
|
$$ F_{\vec{X}}(\vec{x}) = \prod_{l=1}^d F_{X_l}(x_l) = \prod_{l=1}^d \int_{-\infty}^{x_l} f_{x_l} (t_l) d\mu_l = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1,$$
|
|
kde druhá rovnost plyne z věty o hustotě vzhledem k součinové referenční míře (Věta \ref{thm-density-product}) s mírou $\lambda^d$, případně sčítací mírou $\nu$ na $\mathbb{R}^d$. Dále díky Fubiniově větě můžeme pokračovat v úpravách
|
|
$$ \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1 = \int_{(-\infty, \vec{x}]} \prod_{l=1}^d f_{x_l} (t_l) d(\mu_1 \otimes \cdots \otimes \mu_d).$$
|
|
Pak už ale nutně musí platit $f_{\vec{X}}(t_1, \dots, t_d) = \prod_{l=1}^d f_{x_l} (t_l)$.
|
|
|
|
Implikace $\Leftarrow$ se dokáže obráceným postupem (cvičení).
|
|
\end{proof}
|
|
|
|
\begin{corollary}
|
|
Předpokládejme, že $S([X, Y]^T) = S(X) \times S(Y)$. Pokud pro sdruženou pravděpodobnostní funkci diskrétního náhodného vektoru $[X, Y]^T$ platí $P[X = x, Y = y] = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé.
|
|
|
|
Obdobně, pokud pro sdruženou pravděpodobnostní funkci spojitého náhodného vektoru $[X, Y]^T$ platí $f_{[X, Y]^T}(x, y) = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro $\lambda^2$-skoro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé.
|
|
|
|
Poznámka: $g$ a $h$ nutně nemusí být hustoty nebo pravděpodobnostní funkce, ale normovaná funkce $\tilde{g} := \frac{g}{\int g}$ již ano.
|
|
\end{corollary}
|
|
|
|
\begin{proof}
|
|
Definujme $\tilde{g}$ a $\tilde{h}$ jako v poznámce. Potom musí existovat verze $\tilde{g}, \tilde{h} \geq 0$ měřitelná. Zbytek dostaneme z předchozí věty.
|
|
\end{proof}
|
|
|
|
\hfill \textit{konec 7. přednášky (10.3.2025)}
|