diff --git a/nahodne-veliciny.tex b/nahodne-veliciny.tex index 5cb19ea..a32a7ef 100644 --- a/nahodne-veliciny.tex +++ b/nahodne-veliciny.tex @@ -360,6 +360,7 @@ Analogicky s náhodnými veličinami si zformulujeme tvrzení o základních vla \end{proof} \begin{theorem}[Marginální distribuční funkce] + \label{thm-marginalization} Pokud je $F_{\vec{X}}$ sdružená distribuční funkce náhodného vektoru $\vec{X} = [X_1,\dots,X_d]^T$, pak $$ \lim_{x_d \rightarrow +\infty} F_{\vec{X}}(x_1,\dots,x_d) = F(x_1,\dots,x_{d-1}), \forall \vec{x}=[x_1,\dots,x_d]^T \in \mathbb{R}^d,$$ kde $F$ je distribuční funkce náhodného podvektoru $[X_1,\dots,X_{d-1}]^T$. @@ -398,3 +399,114 @@ $$ F_{\vec{X}} (\vec{x})= \int_{-\infty}^{x_1} \dots \int_{-\infty}^{x_d} f_{\ve pro všechna $\vec{x} = [x_1, \dots, x_d]^T \in \mathbb{R}^d$. Díky Fubiniově větě opět nezáleží na pořadí integrálů. \hfill \textit{konec 6. přednášky (4.3.2025)} + +\begin{theorem}[Hustota vzhledem k součinové referenční míře] + \label{thm-density-product} + Nechť $P_{\vec{X}}$ je rozdělení náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ a nechť existují $\sigma$-konečné míry $\mu_l, l\in\{1,\dots,d\}$ na $\mathbb{R}$ takové, že pro jejich součin platí $P_{\vec{X}} \ll \mu_1 \otimes \cdots \otimes \mu_d$. Potom $P_{X_l} \ll \mu_l$ pro všechny složky $l \in \{1, \dots, d\}$. Dále pak existují nezáporné měřitelné funkce (hustoty) $f_{\vec{X}} : \mathbb{R}^d \rightarrow [0, \infty)$ a $f_{X_l}: \mathbb{R} \rightarrow [0, \infty)$ pro $l \in \{1, \dots, d\}$ takové, že + $$ P_{\vec{X}} (\times_{l=1}^d (-\infty, x_l]) = F_{\vec{X}}(\vec{x}) = \int_{\times_{l=1}^d (-\infty, x_l]} f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d) $$ + pro všechna $\vec{x} = [x_1, \dots, x_d]^T$. Pro borelovskou množinu $B\in \mathcal{B}(\mathbb{R}^d)$ navíc platí + $$ P_{\vec{X}} (B) = \int_B f_{\vec{X}} (\vec{t}) d(\mu_1\otimes\dots\otimes\mu_d). $$ + Potom také $F_{X_l} (x_l) = \int_{-\infty}^{x_l} f_{X_l} (t) d\mu_l$ pro všechna $x_l \in \mathbb{R}$ a všechny složky $l \in \{1, \dots, d\}$, kde + $$f_{X_l}(t) = \int_{\mathbb{R}^{d-1}} f_{\vec{X}} (t_1,\dots, t_d) d(\mu_1\otimes\dots\otimes\mu_{l-1}\otimes\mu_{l+1}\otimes\dots\otimes\mu_d) $$ + platí $\mu_l$-skoro všude. +\end{theorem} + +\begin{proof} + Existence hustot plyne přímo z Radonovy-Nikodymovy věty. Zbytek plyne z Fubiniho věty (předpoklady splněny díky Radonově-Nikodymově větě a faktu, že pravděpodobnostní prostor je vždy normalizovaný). +\end{proof} + +Poznamenejme, že předpoklad existence příslušných měr je automaticky splněn v případě diskrétních nebo absolutně spojitých náhodných vektorů. + +\begin{example} + Mějme absolutně spojitý náhodný vektor $[X, Y]^T$. Potom existuje jeho sdružená distribuční funkce $F_{[X, Y]^T}(x, y)$. Chceme-li dostat jednorozměrnou distribuční funkci $F_X(x)$, s použitím Věty \ref{thm-marginalization} dostáváme $F_X(x) = \lim_{y \rightarrow \infty} F_{[X, Y]^T} (x, y)$. Potom jeho hustotu dostaneme, zderivováním $f_X(x) = F'_X(x)$. Navíc z předchozí věty (Věta \ref{thm-density-product}) máme, že existuje sdružená hustota $f_{[X, Y]^T}(x, y) = \pdv*{F_{[X, Y]^T}}{x, y}(x, y)$. Pro získání jednorozměrné hustoty $f_X$ pak už jen stačí zintegrovat podle $y$ přes celou reálnou osu. +\end{example} + +Nechť $\vec{X}$ je diskrétní náhodný vektor a $\nu$ čítací míra na $\{\vec{x}_i\}_{i \in I} \subset \mathbb{R}^d$, pak hustotu tohoto vektoru vzhledem k čítací míře $\nu$ nazýváme \textit{pravděpodobnostní funkcí} diskrétního mnohorozměrného rozdělení $\vec{X}$. + +\begin{example} + Uvažujme dvojrozměrný náhodný vektor $[X, Y]^T$. Pro přehlednost uvedeme i řádkové/sloupcové součty (jde o marginální hustoty). + \begin{center} + \begin{tabular}{c|cc|c} + & $Y = 0$ & $Y = 1$ & \\ + \hline + $X = 0$ & $1/9$ & $2/9$ & $1/3$ \\ + $X = 1$ & $2/9$ & $4/9$ & $2/3$ \\ + \hline + & $1/3$ & $2/3$ & $1$ + \end{tabular} + \end{center} + + Potom přímým výpočtem můžeme získat například $f_{[X, Y]^T} (1, 1) = P(X = 1, Y = 1) = 4/9$. +\end{example} + +\begin{example} + Nechť dvourozměrný náhodný vektor $[X, Y]^T$ je rovnoměrně rozdělen na jednotkovém čtverci. Pak z Věty \ref{thm-density-product} okamžitě vychází $f_{[X, Y]^T} (x, y) = \chi_{\{(x, y) \in [0, 1]^2\}}$. Určíme $P[X < 1/2, Y < 1/2]$. Tato událost $B := \{X < 1/2, Y < 1/2\}$ odpovídá podmnožině jednotkového čtverce, tedy zintegrováním přes tuto podmnožinu nepočítáme nic jiného než plošný obsah této množiny. Z Fubiniovy věty tedy dostáváme $P(B) = 1/4$. +\end{example} + +Uvedeme užitečný důsledek předchozí věty pouze v případě dvourozměrných vektorů, snadno se však dají rozšířit i pro případ vícerozměrných vektorů. + +\begin{corollary}[Marginální rozdělení pro dvourozměrné náhodné vektory] + Pokud diskrétní náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální pravděpodobnostní funkce pro $X$ je + $$ f_X(x) = P[X = x] = \sum_y P(X = x, Y = y) = \sum_y f_{[X, Y]^T} (x, y). $$ + + Pokud spojitý náhodný vektor $[X, Y]^T$ má sdruženou pravděpodobnostní funkci $f_{[X, Y]^T}$, pak marginální hustota pro $X$ je + $$ f_X(x) = \int f_{[X, Y]^T} (x, y) dy. $$ +\end{corollary} + +Věnujme opět pozornost pojmu nezávislosti náhodných veličin. Všimněme si, že platí následující vlastnost +$$ \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} F_{\vec{X}} (\vec{x}) = \lim_{x_j \rightarrow \infty \forall j \in \{1, \dots, d\} \setminus l} P[X_1 \leq x_1, \dots, X_d \leq x_d] =$$ +$$ P[X_l \leq x_l] =: F_{X_l}(x_l). $$ + +\begin{definition} + Náhodné veličiny $X_1, \dots, X_d$ jsou \textit{nezávislé}, pokud $F_{\vec{X}} (\vec{x}) = \prod_{l = 1}^d F_{X_l} (x_l)$ pro každý vektor $\vec{x} = [x_1 \dots, x_d]^T \in \mathbb{R}^d$. +\end{definition} + +Analogicky s předchozí definicí definujeme nezávislost náhodných vektorů. + +\begin{definition} + Náhodné vektory $\vec{X}_1, \dots, \vec{X}_d$ jsou \textit{nezávislé}, pokud + $$ F_{\vec{X}} (\vec{x}) = \prod_{l=1}^d F_{\vec{X}_l} (\vec{x}_l) $$ + pro každý ``nad-vektor" $\vec{x} = [\vec{x}_1^T, \dots, \vec{x}_d^T]^T \in \mathbb{R}^{\sum_{l=1}^d d_l}$ kde $\vec{X} = [\vec{X}_1^T,\dots, X_d^T]^T$ a $\vec{X}_l$ jsou $d_l$-rozměrné náhodné vektory pro všechna $l \in \{1, \dots d\}$. +\end{definition} + +Dalším důležitým pojmem je takzvaný nosič náhodné veličiny. Rozumíme tím v zásadě množinu, kde náhodná veličina ``žije". Uvedeme zde definici pro diskrétní a spojité náhodné veličiny. Tyto pojmy se budou hodit pro vymezení prostoru, přes který poté budeme integrovat. + +\begin{definition} + \textit{Nosičem} diskrétní náhodné veličiny $X$ nazýváme následující množinu $S(X) = \{x \in \mathbb{R}: P[X = x] > 0\}$. \textit{Nosičem} spojité náhodné veličiny $Y$ rozumíme množinu $S(Y) = \{y \in \mathbb{R}: f_Y(y) > 0\}$. Obdobně definujeme i nosič náhodného vektoru (cvičení). +\end{definition} + +\begin{theorem}[Ekvivalentní charakterizace nezávislosti] + Nechť sdružená pravděpodobnostní funkce diskrétního náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x}) = P[\vec{X} = \vec{x}]$. Pak platí, že náhodné veličiny $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když + $$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d P[X_l = x_l]$$ + pro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$. + + Nechť sdružená pravděpodobnostní funkce spojitého náhodného vektoru $\vec{X} = [X_1, \dots, X_d]^T$ je $f_{\vec{X}} (\vec{x})$. Pak platí, že $\{X_1, \dots, X_d\}$ jsou nezávislé právě tehdy, když + $$ P[\vec{X} = \vec{x}] = \prod_{l = 1}^d f_{X_l}(x_l) $$ + pro $\lambda^d$-skoro všechny vektory $\vec{x} = [x_1, \dots, x_d]^T \in \times_{l = 1}^d S(X_l)$. +\end{theorem} + +\begin{proof} + Dokážeme oba případy (spojitý a diskrétní) najednou tak, že budeme uvažovat příslušnou referenční součinovou míru. + + Nejdříve dokážeme implikaci $\Rightarrow$. Uvažujme vektor $\vec{x} = [x_1,\dots,x_d]^T$. Potom z definice nezávislosti a linearity integrálu dostáváme + $$ F_{\vec{X}}(\vec{x}) = \prod_{l=1}^d F_{X_l}(x_l) = \prod_{l=1}^d \int_{-\infty}^{x_l} f_{x_l} (t_l) d\mu_l = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1,$$ + kde druhá rovnost plyne z věty o hustotě vzhledem k součinové referenční míře (Věta \ref{thm-density-product}) s mírou $\lambda^d$, případně sčítací mírou $\nu$ na $\mathbb{R}^d$. Dále díky Fubiniově větě můžeme pokračovat v úpravách + $$ \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \prod_{l=1}^d f_{x_l}(t_l)d\mu_d\cdots d\mu_1 = \int_{(-\infty, \vec{x}]} \prod_{l=1}^d f_{x_l} (t_l) d(\mu_1 \otimes \cdots \otimes \mu_d).$$ + Pak už ale nutně musí platit $f_{\vec{X}}(t_1, \dots, t_d) = \prod_{l=1}^d f_{x_l} (t_l)$. + + Implikace $\Leftarrow$ se dokáže obráceným postupem (cvičení). +\end{proof} + +\begin{corollary} + Předpokládejme, že $S([X, Y]^T) = S(X) \times S(Y)$. Pokud pro sdruženou pravděpodobnostní funkci diskrétního náhodného vektoru $[X, Y]^T$ platí $P[X = x, Y = y] = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé. + + Obdobně, pokud pro sdruženou pravděpodobnostní funkci spojitého náhodného vektoru $[X, Y]^T$ platí $f_{[X, Y]^T}(x, y) = g(x) h(y)$ pro nějaké měřitelné funkce $g, h$ a pro $\lambda^2$-skoro všechna $[x, y]^T \in S([X, Y]^T)$, pak $X$ a $Y$ jsou nezávislé. + + Poznámka: $g$ a $h$ nutně nemusí být hustoty nebo pravděpodobnostní funkce, ale normovaná funkce $\tilde{g} := \frac{g}{\int g}$ již ano. +\end{corollary} + +\begin{proof} + Definujme $\tilde{g}$ a $\tilde{h}$ jako v poznámce. Potom musí existovat verze $\tilde{g}, \tilde{h} \geq 0$ měřitelná. Zbytek dostaneme z předchozí věty. +\end{proof} + +\hfill \textit{konec 7. přednášky (10.3.2025)} diff --git a/skripta.pdf b/skripta.pdf index 9f4b255..0144716 100644 Binary files a/skripta.pdf and b/skripta.pdf differ diff --git a/skripta.tex b/skripta.tex index 52074e1..4644440 100644 --- a/skripta.tex +++ b/skripta.tex @@ -5,6 +5,7 @@ \usepackage{amssymb} \usepackage{amsthm} \usepackage{enumerate} +\usepackage{derivative} \usepackage[hidelinks]{hyperref} \setdefaultlanguage{czech}