prednaska 10.3.2025

This commit is contained in:
Petr Velička 2025-03-10 11:33:39 +01:00
parent f354a99a94
commit 1d7b4f3e5b
Signed by: petrvel
GPG key ID: E8F909AFE649174F
3 changed files with 113 additions and 0 deletions

View file

@ -360,6 +360,7 @@ Analogicky s náhodnými veličinami si zformulujeme tvrzení o základních vla
\end{proof}
\begin{theorem}[Marginální distribuční funkce]
\label{thm-marginalization}
Pokud je $F_{\vec{X}}$ sdružená distribuční funkce náhodného vektoru $\vec{X} = [X_1,\dots,X_d]^T$, pak
$$ \lim_{x_d \rightarrow +\infty} F_{\vec{X}}(x_1,\dots,x_d) = F(x_1,\dots,x_{d-1}), \forall \vec{x}=[x_1,\dots,x_d]^T \in \mathbb{R}^d,$$
kde $F$ je distribuční funkce náhodného podvektoru $[X_1,\dots,X_{d-1}]^T$.
@ -398,3 +399,114 @@ $$ F_{\vec{X}} (\vec{x})= \int_{-\infty}^{x_1} \dots \int_{-\infty}^{x_d} f_{\ve
pro všechna $\vec{x} = [x_1, \dots, x_d]^T \in \mathbb{R}^d$. Díky Fubiniově větě opět nezáleží na pořadí integrálů.
\hfill \textit{konec 6. přednášky (4.3.2025)}
\begin{theorem}[Hustota vzhledem k součinové referenční míře]
\label{thm-density-product}
Nechť $P_{\vec{X}}$ je rozdělení náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ a nechť existují $\sigma$-konečné míry $\mu_l, l\in\{1,\dots,d\}$ na $\mathbb{R}$ takové, že pro jejich součin platí $P_{\vec{X}} \ll \mu_1 \otimes \cdots \otimes \mu_d$. Potom $P_{X_l} \ll \mu_l$ pro všechny složky $l \in \{1, \dots, d\}$. Dále pak existují nezáporné měřitelné funkce (hustoty) $f_{\vec{X}} : \mathbb{R}^d \rightarrow [0, \infty)$ a $f_{X_l}: \mathbb{R} \rightarrow [0, \infty)$ pro $l \in \{1, \dots, d\}$ takové, že
$$ P_{\vec{X}} (\times_{l=1}^d (-\infty, x_l]) = F_{\vec{X}}(\vec{x}) = \int_{\times_{l=1}^d (-\infty, x_l]} f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d) $$
pro všechna $\vec{x} = [x_1, \dots, x_d]^T$. Pro borelovskou množinu $B\in \mathcal{B}(\mathbb{R}^d)$ navíc platí
$$ P_{\vec{X}} (B) = \int_B f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d). $$
Potom také $F_{X_l} (x_l) = \int_{-\infty}^{x_l} f_{X_l} (t) d\mu_l$ pro všechna $x_l \in \mathbb{R}$ a všechny složky $l \in \{1, \dots, d\}$, kde
$$f_{X_l}(t) = \int_{\mathbb{R}^{d-1}} f_{\vec{X}} (t_1,\dots, t_d) d(\mu_1\otimes\dots\otimes\mu_{l-1}\otimes\mu_{l+1}\otimes\dots\otimes\mu_d) $$
platí $\mu_l$-skoro všude.
\end{theorem}
\begin{proof}
Existence hustot plyne přímo z Radonovy-Nikodymovy věty. Zbytek plyne z Fubiniho věty (předpoklady splněny díky Radonově-Nikodymově větě a faktu, že pravděpodobnostní prostor je vždy normalizovaný).
\end{proof}
Poznamenejme, že předpoklad existence příslušných měr je automaticky splněn v případě diskrétních nebo absolutně spojitých náhodných vektorů.
\begin{example}
Mějme absolutně spojitý náhodný vektor $[X, Y]^T$. Potom existuje jeho sdružená distribuční funkce $F_{[X, Y]^T}(x, y)$. Chceme-li dostat jednorozměrnou distribuční funkci $F_X(x)$, s použitím Věty \ref{thm-marginalization} dostáváme $F_X(x) = \lim_{y \rightarrow \infty} F_{[X, Y]^T} (x, y)$. Potom jeho hustotu dostaneme, zderivováním $f_X(x) = F'_X(x)$. Navíc z předchozí věty (Věta \ref{thm-density-product}) máme, že existuje sdružená hustota $f_{[X, Y]^T}(x, y) = \pdv*{F_{[X, Y]^T}}{x, y}(x, y)$. Pro získání jednorozměrné hustoty $f_X$ pak už jen stačí zintegrovat podle $y$ přes celou reálnou osu.
\end{example}
Nechť $\vec{X}$ je diskrétní náhodný vektor a $\nu$ čítací míra na $\{\vec{x}_i\}_{i \in I} \subset \mathbb{R}^d$, pak hustotu tohoto vektoru vzhledem k čítací míře $\nu$ nazýváme \textit{pravděpodobnostní funkcí} diskrétního mnohorozměrného rozdělení $\vec{X}$.
\begin{example}
Uvažujme dvojrozměrný náhodný vektor $[X, Y]^T$. Pro přehlednost uvedeme i řádkové/sloupcové součty (jde o marginální hustoty).
\begin{center}
\begin{tabular}{c|cc|c}
& $Y = 0$ & $Y = 1$ & \\
\hline
$X = 0$ & $1/9$ & $2/9$ & $1/3$ \\
$X = 1$ & $2/9$ & $4/9$ & $2/3$ \\
\hline
& $1/3$ & $2/3$ & $1$
\end{tabular}
\end{center}
Potom přímým výpočtem můžeme získat například $f_{[X, Y]^T} (1, 1) = P(X = 1, Y = 1) = 4/9$.
\end{example}
\begin{example}
Nechť dvourozměrný náhodný vektor $[X, Y]^T$ je rovnoměrně rozdělen na jednotkovém čtverci. Pak z Věty \ref{thm-density-product} okamžitě vychází $f_{[X, Y]^T} (x, y) = \chi_{\{(x, y) \in [0, 1]^2\}}$. Určíme $P[X < 1/2, Y < 1/2]$. Tato událost $B := \{X < 1/2, Y < 1/2\}$ odpovídá podmnožině jednotkového čtverce, tedy zintegrováním přes tuto podmnožinu nepočítáme nic jiného než plošný obsah této množiny. Z Fubiniovy věty tedy dostáváme $P(B) = 1/4$.
\end{example}
Uvedeme užitečný důsledek předchozí věty pouze v případě dvourozměrných vektorů, snadno se však dají rozšířit i pro případ vícerozměrných vektorů.
\begin{corollary}[Marginální rozdělení pro dvourozměrné náhodné vektory]
Pokud diskrétní náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální pravděpodobnostní funkce pro $X$ je
$$ f_X(x) = P[X = x] = \sum_y P(X = x, Y = y) = \sum_y f_{[X, Y]^T} (x, y). $$
Pokud spojitý náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální hustota pro $X$ je
$$ f_X(x) = \int f_{[X, Y]^T} (x, y) dy. $$
\end{corollary}
Věnujme opět pozornost pojmu nezávislosti náhodných veličin. Všimněme si, že platí následující vlastnost
$$ \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} F_{\vec{X}} (\vec{x}) = \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} P[X_1 \leq x_1, \dots, X_d \leq x_d] =$$
$$ P[X_l \leq x_l] =: F_{X_l}(x_l). $$
\begin{definition}
Náhodné veličiny $X_1, \dots, X_d$ jsou \textit{nezávislé}, pokud $F_{\vec{X}} (\vec{x}) = \prod_{l = 1}^d F_{X_l} (x_l)$ pro každý vektor $\vec{x} = [x_1 \dots, x_d]^T \in \mathbb{R}^d$.
\end{definition}
Analogicky s předchozí definicí definujeme nezávislost náhodných vektorů.
\begin{definition}
Náhodné vektory $\vec{X}_1, \dots, \vec{X}_d$ jsou \textit{nezávislé}, pokud
$$ F_{\vec{X}} (\vec{x}) = \prod_{l=1}^d F_{\vec{X}_l} (\vec{x}_l) $$
pro každý ``nad-vektor" $\vec{x} = [\vec{x}_1^T, \dots, \vec{x}_d^T]^T \in \mathbb{R}^{\sum_{l=1}^d d_l}$ kde $\vec{X} = [\vec{X}_1^T,\dots, X_d^T]^T$ a $\vec{X}_l$ jsou $d_l$-rozměrné náhodné vektory pro všechna $l \in \{1, \dots d\}$.
\end{definition}
Dalším důležitým pojmem je takzvaný nosič náhodné veličiny. Rozumíme tím v zásadě množinu, kde náhodná veličina ``žije". Uvedeme zde definici pro diskrétní a spojité náhodné veličiny. Tyto pojmy se budou hodit pro vymezení prostoru, přes který poté budeme integrovat.
\begin{definition}
\textit{Nosičem} diskrétní náhodné veličiny $X$ nazýváme následující množinu $S(X) = \{x \in \mathbb{R}: P[X = x] > 0\}$. \textit{Nosičem} spojité náhodné veličiny $Y$ rozumíme množinu $S(Y) = \{y \in \mathbb{R}: f_Y(y) > 0\}$. Obdobně definujeme i nosič náhodného vektoru (cvičení).
\end{definition}
\begin{theorem}[Ekvivalentní charakterizace nezávislosti]
Nechť sdružená pravděpodobnostní funkce diskrétního náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x}) = P[\vec{X} = \vec{x}]$. Pak platí, že náhodné veličiny $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když
$$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d P[X_l = x_l]$$
pro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$.
Nechť sdružená pravděpodobnostní funkce spojitého náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x})$. Pak platí, že $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když
$$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d f_{X_l}(x_l) $$
pro $\lambda^d$-skoro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$.
\end{theorem}
\begin{proof}
Dokážeme oba případy (spojitý a diskrétní) najednou tak, že budeme uvažovat příslušnou referenční součinovou míru.
Nejdříve dokážeme implikaci $\Rightarrow$. Uvažujme vektor $\vec{x} = [x_1,\dots,x_d]^T$. Potom z definice nezávislosti a linearity integrálu dostáváme
$$ F_{\vec{X}}(\vec{x}) = \prod_{l=1}^d F_{X_l}(x_l) = \prod_{l=1}^d \int_{-\infty}^{x_l} f_{x_l} (t_l) d\mu_l = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1,$$
kde druhá rovnost plyne z věty o hustotě vzhledem k součinové referenční míře (Věta \ref{thm-density-product}) s mírou $\lambda^d$, případně sčítací mírou $\nu$ na $\mathbb{R}^d$. Dále díky Fubiniově větě můžeme pokračovat v úpravách
$$ \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1 = \int_{(-\infty, \vec{x}]} \prod_{l=1}^d f_{x_l} (t_l) d(\mu_1 \otimes \cdots \otimes \mu_d).$$
Pak už ale nutně musí platit $f_{\vec{X}}(t_1, \dots, t_d) = \prod_{l=1}^d f_{x_l} (t_l)$.
Implikace $\Leftarrow$ se dokáže obráceným postupem (cvičení).
\end{proof}
\begin{corollary}
Předpokládejme, že $S([X, Y]^T) = S(X) \times S(Y)$. Pokud pro sdruženou pravděpodobnostní funkci diskrétního náhodného vektoru $[X, Y]^T$ platí $P[X = x, Y = y] = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé.
Obdobně, pokud pro sdruženou pravděpodobnostní funkci spojitého náhodného vektoru $[X, Y]^T$ platí $f_{[X, Y]^T}(x, y) = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro $\lambda^2$-skoro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé.
Poznámka: $g$ a $h$ nutně nemusí být hustoty nebo pravděpodobnostní funkce, ale normovaná funkce $\tilde{g} := \frac{g}{\int g}$ již ano.
\end{corollary}
\begin{proof}
Definujme $\tilde{g}$ a $\tilde{h}$ jako v poznámce. Potom musí existovat verze $\tilde{g}, \tilde{h} \geq 0$ měřitelná. Zbytek dostaneme z předchozí věty.
\end{proof}
\hfill \textit{konec 7. přednášky (10.3.2025)}