prednaska 10.3.2025

2025-03-10 11:33:39 +01:00 · 2025-03-10 11:33:39 +01:00 · 1d7b4f3e5b
commit 1d7b4f3e5b
parent f354a99a94
3 changed files with 113 additions and 0 deletions
--- a/nahodne-veliciny.tex
+++ b/nahodne-veliciny.tex
@ -360,6 +360,7 @@ Analogicky s náhodnými veličinami si zformulujeme tvrzení o základních vla
 \end{proof}

 \begin{theorem}[Marginální distribuční funkce]
+	\label{thm-marginalization}
 	Pokud je $F_{\vec{X}}$ sdružená distribuční funkce náhodného vektoru $\vec{X} = [X_1,\dots,X_d]^T$, pak
 	$$ \lim_{x_d \rightarrow +\infty} F_{\vec{X}}(x_1,\dots,x_d) = F(x_1,\dots,x_{d-1}), \forall \vec{x}=[x_1,\dots,x_d]^T \in \mathbb{R}^d,$$
 	kde $F$ je distribuční funkce náhodného podvektoru $[X_1,\dots,X_{d-1}]^T$.
@ -398,3 +399,114 @@ $$ F_{\vec{X}} (\vec{x})= \int_{-\infty}^{x_1} \dots \int_{-\infty}^{x_d} f_{\ve
 pro všechna $\vec{x} = [x_1, \dots, x_d]^T \in \mathbb{R}^d$. Díky Fubiniově větě opět nezáleží na pořadí integrálů.

 \hfill \textit{konec 6. přednášky (4.3.2025)}
+
+\begin{theorem}[Hustota vzhledem k součinové referenční míře]
+	\label{thm-density-product}
+	Nechť $P_{\vec{X}}$ je rozdělení náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ a nechť existují $\sigma$-konečné míry $\mu_l, l\in\{1,\dots,d\}$ na $\mathbb{R}$ takové, že pro jejich součin platí $P_{\vec{X}} \ll \mu_1 \otimes \cdots \otimes \mu_d$. Potom $P_{X_l} \ll \mu_l$ pro všechny složky $l \in \{1, \dots, d\}$. Dále pak existují nezáporné měřitelné funkce (hustoty) $f_{\vec{X}} : \mathbb{R}^d \rightarrow [0, \infty)$ a $f_{X_l}: \mathbb{R} \rightarrow [0, \infty)$ pro $l \in \{1, \dots, d\}$ takové, že
+	$$ P_{\vec{X}} (\times_{l=1}^d (-\infty, x_l]) = F_{\vec{X}}(\vec{x}) = \int_{\times_{l=1}^d (-\infty, x_l]} f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d) $$
+	pro všechna $\vec{x} = [x_1, \dots, x_d]^T$. Pro borelovskou množinu $B\in \mathcal{B}(\mathbb{R}^d)$ navíc platí
+	$$ P_{\vec{X}} (B) = \int_B f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d). $$
+	Potom také $F_{X_l} (x_l) = \int_{-\infty}^{x_l} f_{X_l} (t) d\mu_l$ pro všechna $x_l \in \mathbb{R}$ a všechny složky $l \in \{1, \dots, d\}$, kde
+	$$f_{X_l}(t) = \int_{\mathbb{R}^{d-1}} f_{\vec{X}} (t_1,\dots, t_d) d(\mu_1\otimes\dots\otimes\mu_{l-1}\otimes\mu_{l+1}\otimes\dots\otimes\mu_d) $$
+	platí $\mu_l$-skoro všude.
+\end{theorem}
+
+\begin{proof}
+	Existence hustot plyne přímo z Radonovy-Nikodymovy věty. Zbytek plyne z Fubiniho věty (předpoklady splněny díky Radonově-Nikodymově větě a faktu, že pravděpodobnostní prostor je vždy normalizovaný).
+\end{proof}
+
+Poznamenejme, že předpoklad existence příslušných měr je automaticky splněn v případě diskrétních nebo absolutně spojitých náhodných vektorů.
+
+\begin{example}
+	Mějme absolutně spojitý náhodný vektor $[X, Y]^T$. Potom existuje jeho sdružená distribuční funkce $F_{[X, Y]^T}(x, y)$. Chceme-li dostat jednorozměrnou distribuční funkci $F_X(x)$, s použitím Věty \ref{thm-marginalization} dostáváme $F_X(x) = \lim_{y \rightarrow \infty} F_{[X, Y]^T} (x, y)$. Potom jeho hustotu dostaneme, zderivováním $f_X(x) = F'_X(x)$. Navíc z předchozí věty (Věta \ref{thm-density-product}) máme, že existuje sdružená hustota $f_{[X, Y]^T}(x, y) = \pdv*{F_{[X, Y]^T}}{x, y}(x, y)$. Pro získání jednorozměrné hustoty $f_X$ pak už jen stačí zintegrovat podle $y$ přes celou reálnou osu.
+\end{example}
+
+Nechť $\vec{X}$ je diskrétní náhodný vektor a $\nu$ čítací míra na $\{\vec{x}_i\}_{i \in I} \subset \mathbb{R}^d$, pak hustotu tohoto vektoru vzhledem k čítací míře $\nu$ nazýváme \textit{pravděpodobnostní funkcí} diskrétního mnohorozměrného rozdělení $\vec{X}$.
+
+\begin{example}
+	Uvažujme dvojrozměrný náhodný vektor $[X, Y]^T$. Pro přehlednost uvedeme i řádkové/sloupcové součty (jde o marginální hustoty).
+	\begin{center}
+		\begin{tabular}{c|cc|c}
+			& $Y = 0$ & $Y = 1$ & \\
+			\hline
+			$X = 0$ & $1/9$ & $2/9$ & $1/3$ \\
+			$X = 1$ & $2/9$ & $4/9$ & $2/3$ \\
+			\hline
+			& $1/3$ & $2/3$ & $1$
+		\end{tabular}
+	\end{center}
+
+	Potom přímým výpočtem můžeme získat například $f_{[X, Y]^T} (1, 1) = P(X = 1, Y = 1) = 4/9$.
+\end{example}
+
+\begin{example}
+	Nechť dvourozměrný náhodný vektor $[X, Y]^T$ je rovnoměrně rozdělen na jednotkovém čtverci. Pak z Věty \ref{thm-density-product} okamžitě vychází $f_{[X, Y]^T} (x, y) = \chi_{\{(x, y) \in [0, 1]^2\}}$. Určíme $P[X < 1/2, Y < 1/2]$. Tato událost $B := \{X < 1/2, Y < 1/2\}$ odpovídá podmnožině jednotkového čtverce, tedy zintegrováním přes tuto podmnožinu nepočítáme nic jiného než plošný obsah této množiny. Z Fubiniovy věty tedy dostáváme $P(B) = 1/4$.
+\end{example}
+
+Uvedeme užitečný důsledek předchozí věty pouze v případě dvourozměrných vektorů, snadno se však dají rozšířit i pro případ vícerozměrných vektorů.
+
+\begin{corollary}[Marginální rozdělení pro dvourozměrné náhodné vektory]
+	Pokud diskrétní náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální pravděpodobnostní funkce pro $X$ je
+	$$ f_X(x) = P[X = x] = \sum_y P(X = x, Y = y) = \sum_y f_{[X, Y]^T} (x, y). $$
+
+	Pokud spojitý náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální hustota pro $X$ je
+	$$ f_X(x) = \int f_{[X, Y]^T} (x, y) dy. $$
+\end{corollary}
+
+Věnujme opět pozornost pojmu nezávislosti náhodných veličin. Všimněme si, že platí následující vlastnost
+$$ \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} F_{\vec{X}} (\vec{x}) = \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} P[X_1 \leq x_1, \dots, X_d \leq x_d] =$$
+$$ P[X_l \leq x_l] =: F_{X_l}(x_l). $$
+
+\begin{definition}
+	Náhodné veličiny $X_1, \dots, X_d$ jsou \textit{nezávislé}, pokud $F_{\vec{X}} (\vec{x}) = \prod_{l = 1}^d F_{X_l} (x_l)$ pro každý vektor $\vec{x} = [x_1 \dots, x_d]^T \in \mathbb{R}^d$.
+\end{definition}
+
+Analogicky s předchozí definicí definujeme nezávislost náhodných vektorů.
+
+\begin{definition}
+	Náhodné vektory $\vec{X}_1, \dots, \vec{X}_d$ jsou \textit{nezávislé}, pokud
+	$$ F_{\vec{X}} (\vec{x}) = \prod_{l=1}^d F_{\vec{X}_l} (\vec{x}_l) $$
+	pro každý ``nad-vektor" $\vec{x} = [\vec{x}_1^T, \dots, \vec{x}_d^T]^T \in \mathbb{R}^{\sum_{l=1}^d d_l}$ kde $\vec{X} = [\vec{X}_1^T,\dots, X_d^T]^T$ a $\vec{X}_l$ jsou $d_l$-rozměrné náhodné vektory pro všechna $l \in \{1, \dots d\}$.
+\end{definition}
+
+Dalším důležitým pojmem je takzvaný nosič náhodné veličiny. Rozumíme tím v zásadě množinu, kde náhodná veličina ``žije". Uvedeme zde definici pro diskrétní a spojité náhodné veličiny. Tyto pojmy se budou hodit pro vymezení prostoru, přes který poté budeme integrovat.
+
+\begin{definition}
+	\textit{Nosičem} diskrétní náhodné veličiny $X$ nazýváme následující množinu $S(X) = \{x \in \mathbb{R}: P[X = x] > 0\}$. \textit{Nosičem} spojité náhodné veličiny $Y$ rozumíme množinu $S(Y) = \{y \in \mathbb{R}: f_Y(y) > 0\}$. Obdobně definujeme i nosič náhodného vektoru (cvičení).
+\end{definition}
+
+\begin{theorem}[Ekvivalentní charakterizace nezávislosti]
+	Nechť sdružená pravděpodobnostní funkce diskrétního náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x}) = P[\vec{X} = \vec{x}]$. Pak platí, že náhodné veličiny $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když
+	$$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d P[X_l = x_l]$$
+	pro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$.
+
+	Nechť sdružená pravděpodobnostní funkce spojitého náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x})$. Pak platí, že $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když
+	$$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d f_{X_l}(x_l) $$
+	pro $\lambda^d$-skoro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$.
+\end{theorem}
+
+\begin{proof}
+	Dokážeme oba případy (spojitý a diskrétní) najednou tak, že budeme uvažovat příslušnou referenční součinovou míru.
+
+	Nejdříve dokážeme implikaci $\Rightarrow$. Uvažujme vektor $\vec{x} = [x_1,\dots,x_d]^T$. Potom z definice nezávislosti a linearity integrálu dostáváme
+	$$ F_{\vec{X}}(\vec{x}) = \prod_{l=1}^d F_{X_l}(x_l) = \prod_{l=1}^d \int_{-\infty}^{x_l} f_{x_l} (t_l) d\mu_l = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1,$$
+	kde druhá rovnost plyne z věty o hustotě vzhledem k součinové referenční míře (Věta \ref{thm-density-product}) s mírou $\lambda^d$, případně sčítací mírou $\nu$ na $\mathbb{R}^d$. Dále díky Fubiniově větě můžeme pokračovat v úpravách
+	$$ \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1 = \int_{(-\infty, \vec{x}]} \prod_{l=1}^d f_{x_l} (t_l) d(\mu_1 \otimes \cdots \otimes \mu_d).$$
+	Pak už ale nutně musí platit $f_{\vec{X}}(t_1, \dots, t_d) = \prod_{l=1}^d f_{x_l} (t_l)$.
+
+	Implikace $\Leftarrow$ se dokáže obráceným postupem (cvičení).
+\end{proof}
+
+\begin{corollary}
+	Předpokládejme, že $S([X, Y]^T) = S(X) \times S(Y)$. Pokud pro sdruženou pravděpodobnostní funkci diskrétního náhodného vektoru $[X, Y]^T$ platí $P[X = x, Y = y] = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé.
+
+	Obdobně, pokud pro sdruženou pravděpodobnostní funkci spojitého náhodného vektoru $[X, Y]^T$ platí $f_{[X, Y]^T}(x, y) = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro $\lambda^2$-skoro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé.
+
+	Poznámka: $g$ a $h$ nutně nemusí být hustoty nebo pravděpodobnostní funkce, ale normovaná funkce $\tilde{g} := \frac{g}{\int g}$ již ano.
+\end{corollary}
+
+\begin{proof}
+	Definujme $\tilde{g}$ a $\tilde{h}$ jako v poznámce. Potom musí existovat verze $\tilde{g}, \tilde{h} \geq 0$ měřitelná. Zbytek dostaneme z předchozí věty.
+\end{proof}
+
+\hfill \textit{konec 7. přednášky (10.3.2025)}