prednaska 11.3.2025 + random fix preklepu
This commit is contained in:
parent
1d7b4f3e5b
commit
ccc705a1c0
5 changed files with 189 additions and 2 deletions
|
@ -27,6 +27,7 @@ V předchozí kapitole jsme mluvili o pravděpodobnostním rozdělení, je na č
|
|||
Máme tedy jakýsi obraz míry $P$ v zobrazení $P_X$ čímž se $(\Omega, \mathcal{A}, P)$ zobrazí na pravděpodobnostní prostor $(\mathbb{R},\mathcal{B}(\mathbb{R}),P_X)$. V opačném směru můžeme použít takzvané kanonické vnoření do prostoru $(\mathbb{R}, \mathcal{B}, P_X)$, kde naší zvolenou měřitelnou funkcí bude identita, tedy není potřeba se bát, že by příslušný prostor nemusel existovat. Následující věta říká, že nezáleží ve kterém z těchto dvou prostorů integrujeme libovolnou funkci.
|
||||
|
||||
\begin{theorem}[O přenosu integrace]
|
||||
\label{thm-pushforward-measure}
|
||||
Buď $g$ měřitelná funkce na měřitelném prostoru $(\mathbb{M}, \mathcal{M})$ a $X: (\Omega, \mathcal{A}, P) \rightarrow (\mathbb{M}, \mathcal{M})$.
|
||||
Nechť $P_X$ je míra na $\mathcal{M}$ indukovaná zobrazením $X$, tedy $P_X(M) = P[X^{-1}(M)]$ pro $M \in \mathcal{M}$. Potom, je-li aspoň jedna strana definována, platí
|
||||
$$\int_\Omega g[X(\omega)] dP(\omega) = \int_\mathbb{M} g(x) dP_X(x).$$
|
||||
|
@ -289,17 +290,20 @@ Distribuční funkce $N(0, 1)$ nejde vyjádřit analyticky, máme jen $\Phi(x) :
|
|||
\hfill \textit{konec 5. přednášky (3.3.2025)}
|
||||
|
||||
\begin{definition}[$\chi^2$-rozdělení]
|
||||
\label{def-chi-2}
|
||||
Náhodná veličina $X$ má $\chi^2$-rozdělení s $p$ stupni volnosti (zapisujeme $X \sim \chi_p^2$) právě tehdy, když
|
||||
$$ f_X(x) = \frac{1}{\Gamma(p/2) 2^{(p/2)}} x^{p/2 - 1} e^{-x/2} \chi_{\{x > 0\}}.$$
|
||||
Máme-li soubor nezávislých náhodných veličin $X_1,\dots,X_p \sim N(0, 1)$, potom součet jejich druhých mocnin odpovídá $\chi^2$-rozdělení, $\sum_{i=1}^p X_i^2 \sim \chi_p^2$.
|
||||
\end{definition}
|
||||
|
||||
\begin{definition}[Studentovo $t$-rozdělení]
|
||||
\label{def-student}
|
||||
Náhodná veličina $X$ má Studentovo $t$-rozdělení s $\nu$ stupni volnosti (zapisujeme $X \sim t_\nu$) právě tehdy, když
|
||||
$$ f_X(x) = \frac{\Gamma((\nu + 1)/2)}{\Gamma(\nu/2)\sqrt{\pi\nu}} \frac{1}{(1+x^2/\nu)^{(\nu+1)/2}}. $$
|
||||
\end{definition}
|
||||
|
||||
\begin{definition}[Cauchyho rozdělení]
|
||||
\label{def-cauchy}
|
||||
Cauchyovo rozdělení je speciální případ $t$-rozdělení, když $\nu = 1$. Potom platí
|
||||
$$ f_X(x) = \frac{1}{\pi (1 + x^2)}.$$
|
||||
K zajímavým vlastnostem Cauchyova rozdělení patří například to, že nemá střední hodnotu (bude upřesněno později).
|
||||
|
@ -461,7 +465,7 @@ $$ P[X_l \leq x_l] =: F_{X_l}(x_l). $$
|
|||
Náhodné veličiny $X_1, \dots, X_d$ jsou \textit{nezávislé}, pokud $F_{\vec{X}} (\vec{x}) = \prod_{l = 1}^d F_{X_l} (x_l)$ pro každý vektor $\vec{x} = [x_1 \dots, x_d]^T \in \mathbb{R}^d$.
|
||||
\end{definition}
|
||||
|
||||
Analogicky s předchozí definicí definujeme nezávislost náhodných vektorů.
|
||||
Analogicky s předchozí definicí definujeme nezávislost náhodných vektorů. V literatuře se vyskytuje i jiná, ekvivaletní, definice nezávislosti, kterou uvedeme později.
|
||||
|
||||
\begin{definition}
|
||||
Náhodné vektory $\vec{X}_1, \dots, \vec{X}_d$ jsou \textit{nezávislé}, pokud
|
||||
|
@ -510,3 +514,67 @@ Dalším důležitým pojmem je takzvaný nosič náhodné veličiny. Rozumíme
|
|||
\end{proof}
|
||||
|
||||
\hfill \textit{konec 7. přednášky (10.3.2025)}
|
||||
|
||||
\begin{theorem}[Alternativní (ekvivalentní) definice nezávislosti]
|
||||
Náhodné veličiny $X_1, \dots, X_d$ jsou nezávislé právě tehdy, když
|
||||
$$ P_{\vec{X}} = \otimes_{l=1}^d P_{X_l}. $$
|
||||
\end{theorem}
|
||||
|
||||
\begin{proof}
|
||||
Začneme implikací zprava doleva ($\Leftarrow$). Jestliže pro všechny množiny $B_l \in \mathcal{B}(\mathbb{R}), l = 1,\dots,d$ platí
|
||||
$$ P_{\vec{X}} (\times_{l=1}^d B_l) = \prod_{l=1}^d P_{X_l}(B_l), $$
|
||||
pak vezmeme $B_l = (-\infty,x_l]$ pro fixní $\vec{x} = [x_1, \dots, x_d]$ generátory borelovské $\sigma$-algebry a můžeme počítat
|
||||
$$ F_{\vec{X}} (\vec{x}) = P_{\vec{X}}(\times_{l=1}^d (-\infty, x_l]) = \prod_{l = 1}^d P_{X_l} ((-\infty, x_l]) = \prod_{l = 1}^d F_{X_l} (x_l), $$
|
||||
což je přímo definice nezávislosti.
|
||||
|
||||
K důkazu opačné implikace (předpokládáme platnost $F_{\vec{X}} (\vec{x}) = \prod_{l=1}^d F_{X_l} (x_l)$ pro všechna $\vec{x} \in \mathbb{R}^d$) použijeme Dynkinův systém
|
||||
$$ D = \left\{ \times_{l = 1}^d (-\infty, x_l], x_l \in \mathbb{R}, \forall l \in \{1,\dots,d\}\right\}. $$
|
||||
Tento systém je uzavřený na průniky a generuje celou borelovskou $\sigma$-algebru $\mathcal{B}(\mathbb{R}^d)$. Jelikož $P_{\vec{X}}(\mathbb{R}^d) = 1$, dostáváme z věty o jednoznačnosti míry rovnost obou měr ($P_{\vec{X}}$ a $\otimes_{l=1}^d P_{X_l}$) na celé $\mathcal{B}(\mathbb{R}^d)$.
|
||||
\end{proof}
|
||||
|
||||
Vrátíme se opět k podmíněnosti, tentokrát budeme zkoumat podmíněnost náhodných veličin. Motivačním příkladem budiž zjištění průměrné mzdy občana, který vystudoval MatFyz na základě znalosti průměrné mzdy všech občanů ČR. Opět se jedná o zjednodušenou definici, ta obecnější bude uvedena v pokročilejších kurzech.
|
||||
|
||||
\begin{definition}
|
||||
Pro diskrétní náhodný vektor $[X, Y]^T$ je \textit{podmíněná pravděpodobnostní funkce} $X$ za podmínky $Y = y$ je
|
||||
$$ f_{X | Y} (x | y) \equiv P[X = x | Y = y] := \frac{P[X = x, Y = y]}{P[Y = y]} \equiv \frac{f_{[X, Y]^T} (x, y)}{f_Y(y)}, $$
|
||||
pokud $P[Y = y] > 0$.
|
||||
|
||||
Pro spojitý náhodný vektor $[X, Y]^T$ je \textit{podmíněná hustota} $X$ za podmínky $Y = y$ je
|
||||
$$ f_{X | Y} (x | y) := \frac{f_{(X, Y)} (x, y)}{f_Y(y)}, $$
|
||||
pokud $f_Y(y) > 0$.
|
||||
\end{definition}
|
||||
|
||||
Je třeba si uvědomit, že podmíněná pravděpodobnostní funkce (hustota) jsou funkce argumentu $x$ s parametrem $y$. V případech nepokrytých touto definicí můžeme definovat podmíněnou pravděpodobnost libovolně. Několik užitečných vzorců pro výpočet podmíněné pravděpodobnosti, pro diskrétní vektor platí $P[X\in A|Y = y] = \sum_{x \in A} P[X = x| Y = y]$ a pro spojitý vektor platí $P[X \in A | Y = y] = \int_A f_{X | Y} (x | y) dy$.
|
||||
|
||||
V dalších kapitolách budeme pracovat s mnohorozměrným normálním rozdělením, je proto vhodné si ho zadefinovat už teď. V obecném případě nestačí zadefinovat chování po složkách, je třeba nějakým způsobem zahrnout i vztahy mezi jednotlivými složkami.
|
||||
|
||||
\begin{definition}
|
||||
Náhodný vektor $\vec{X} = [X_1, \dots, X_d]^T$ má $d$-\textit{rozměrné normální rozdělení} s parametry $\mu \in \mathbb{R}^d$ a $\Sigma \in \mathbb{R}^{d \times d}$ (značíme $X \sim N_d(\mu, \Sigma)$), pokud existuje $k$-rozměrný náhodný vektor $\vec{Y} = [Y_1, \dots, Y_k]^T$ a matice $\mathbb{A} \in \mathbb{R}^{d \times k}$ takové, že
|
||||
\begin{enumerate}[(i)]
|
||||
\item $\{Y_1, \dots, Y_k\}$ jsou nezávislé;
|
||||
\item $Y_j \sim N(0, 1)$ pro všechny složky $j \in \{1, \dots, k\}$;
|
||||
\item $\mathbb{A}\mathbb{A}^T = \Sigma$;
|
||||
\item $\vec{X} = \mathbb{A}\vec{Y} + \mu$.
|
||||
\end{enumerate}
|
||||
\end{definition}
|
||||
|
||||
Takto komplikovaná definice je potřeba, neboť matice $\Sigma$ nutně nemusí mít jednoznačně určenou ``druhou odmocninu", proto musíme použit nějakou druhou odmocninu, která bude případně dávat nižší hodnost. Takto definovaná matice $\mathbb{A}$ a vektor $\mu$ jsou deterministické (nenáhodné). Pozornost si zaslouží tzv. standardní $d$-rozměrné normální rozdělení $N_d(\vec{0}, I_d)$.
|
||||
|
||||
Na závěr se budeme chvíli věnovat transformacím náhodných veličin. V obecném případě je možné formalizovat tuto představu pomocí věty o substituci z TMI, avšak pro naše účely postačí uvést jen několik speciálních případů.
|
||||
|
||||
Mějme diskrétní náhodnou veličinu $X$ a ne nutně monotónní funkci $t: \mathbb{R}\rightarrow \mathbb{R}$, pro kterou platí $Y := t(X)$. Chceme odvodit pravděpodobnostní funkci $P[Y = y]$. Můžeme psát
|
||||
$$ P[Y = y] = P[t(X) = y] = P[X \in t^{-1}(y)] = \sum_{t(x) = y} P[X = x]. $$
|
||||
|
||||
Dále mějme spojitou náhodnou veličinu $X$, známe její hustotu $f_X(x)$. Cílem je spočítat hustotu $f_Y(y)$, kde $Y = t(X)$. Pro každé $y$ můžeme nalézt množinu $\mathcal{T}_y = \{x: t(x) \leq y\}$. Poté můžeme spočítat distribuční funkci rozdělení $Y$.
|
||||
$$ F_Y(y) = P[Y \leq y] = P[t(X) \leq Y] = P[\omega: t(X(\omega)) \leq Y] = \int_{\mathcal{T}(y)} f_X(x) dx, $$
|
||||
hustotu poté můžeme získat pouhým zderivování distribuční funkce $F_y$.
|
||||
|
||||
Dále uvažujme případ (dvourozměrného) diskrétního náhodného vektoru $[X, Y]^T$ a transformace $Z = t(X, Y)$. Ze znalosti diskrétního rozdělení vektoru $[X, Y]$ chceme spočítat $P[Z = z]$. Můžeme psát
|
||||
$$ P[Z = z] = P[t(X, Y) = z] = P[\omega: t([X, Y]^T(\omega)) = z] = $$
|
||||
$$ P[[X, Y]^T \in t^{-1} (z)] = \sum_{t(x, y) = z} P[X = x, Y = y].$$
|
||||
|
||||
Nakonec mějme spojitý náhodný vektor $[X, Y]^T$, pro nějž známe hustotu $f_{[X, Y]^T}(x, y)$ a chceme získat hustotu $f_Z(z)$, jestliže náhodná veličina $Z$ je definována $Z := t(X, Y)$.
|
||||
V analogii se spojitou náhodnou veličinou nalezneme pro každé $z \in \mathbb{R}$ množinu $\mathcal{T}(z) = \{ [x, y]: t(x, y) \leq z \}$. Opět spočteme distribuční funkci $F_Z$ pomocí následujících kroků
|
||||
$$ F_Z(z) = P[Z \leq z] = P[t(X, Y) \leq z] = P[\omega: t([X, Y]^T(\omega)) \leq z] = $$
|
||||
$$ \iint_{\mathcal{T}(z)} f_{[X, Y]^T} (x, y) dxdy,$$
|
||||
hustotu $f_Z$ opět můžeme získat pomocí zderivování funkce $F_Z$.
|
||||
|
|
Loading…
Add table
Add a link
Reference in a new issue