prednaska 11.3.2025 + random fix preklepu
This commit is contained in:
parent
1d7b4f3e5b
commit
ccc705a1c0
5 changed files with 189 additions and 2 deletions
118
stredni-hodnota.tex
Normal file
118
stredni-hodnota.tex
Normal file
|
@ -0,0 +1,118 @@
|
|||
\section{Střední hodnota}
|
||||
|
||||
V této kapitole se budeme věnovat pojmu střední hodnoty, laicky řečeno, kolem jaké hodnoty se nachází naše rozdělení. Nejedná se ani o průměr ani o prostřední, případně nejčastější hodnotu, tyto pojmy zadefinujeme později a ve statistice mají svůj vlastní význam odlišný od střední hodnoty.
|
||||
|
||||
\begin{definition}
|
||||
\textit{Střední hodnota} náhodné veličiny $X$ je reálné číslo
|
||||
$$ \mathbb{E}[X] = \mathbb{E}X = \int XdP \equiv \int X(\omega) dP(\omega), $$
|
||||
pokud pravá strana existuje.
|
||||
\end{definition}
|
||||
|
||||
Tato definice je velmi teoretická, k praktickému výpočtu se hodí následující věta, kde převedeme integrál na výpočet pomocí obrazu pravděpodobnostní míry.
|
||||
|
||||
\begin{theorem}
|
||||
\label{thm-expected-value}
|
||||
Střední hodnota náhodné veličiny $X$ je $\mathbb{E}X = \int x dP_X(x)$, pokud pravá strana existuje.
|
||||
\end{theorem}
|
||||
|
||||
\begin{proof}
|
||||
Z věty o přenosu integrace (\ref{thm-pushforward-measure}) při volbě $g = Id$ a $(\mathbb{M}, \mathcal{M}) = (\mathbb{R}, \mathcal{B})$ dostáváme požadované tvrzení.
|
||||
\end{proof}
|
||||
|
||||
Z Radon-Nikodymovy věty ihned plyne následující pozorování
|
||||
|
||||
\begin{observation}
|
||||
Střední hodnota veličiny $X$ je
|
||||
$$ \mathbb{E}X = \begin{cases}\int_{-\infty}^\infty xf_X(x) dx, X \text{ spojitá};\\
|
||||
\sum_{x \in S(X)} xP[X = x], X \text{ diskrétní}. \end{cases} $$
|
||||
\end{observation}
|
||||
|
||||
Střední hodnota nemusí existovat vždy, jeden z takových případů uvedeme v následujícím příkladu.
|
||||
|
||||
\begin{example}
|
||||
Pokud $X \sim Cauchy$ (Definice \ref{def-cauchy}), pak $\mathbb{E}X$ neexistuje. Pomocí integrování per partes můžeme počítat
|
||||
$$ \int_0^\infty \frac{x}{\pi(1 + x^2)} dx = [x \arctan(x)]_0^\infty - \int_0^\infty \arctan(x) dx = \infty. $$
|
||||
Dostali jsme, že pro integrál přes celou reálnou přímku není definován výraz $\infty - \infty$.
|
||||
\end{example}
|
||||
|
||||
Uvažujme teď transformaci $Y = t(X)$. Následující věta nám umožní počítat střední hodnotu transformované náhodné veličiny.
|
||||
|
||||
\begin{theorem}[Pravidlo líného statitika]
|
||||
\label{thm-lazy-statistician}
|
||||
Buď $t: \mathbb{R} \rightarrow \mathbb{R}$ měřitelná funkce a nechť $Y = t(X)$. Pak
|
||||
$$ \mathbb{E} Y = \int t(x) dP_X(x), $$
|
||||
pokud pravá strana existuje.
|
||||
\end{theorem}
|
||||
|
||||
\begin{proof}
|
||||
Z Věty \ref{thm-pushforward-measure} dostáváme
|
||||
$$ \mathbb{E} Y = \mathbb{E} [ t(X) ] = \int_\mathbb{R} t(X(\omega)) dP(\omega) = \int_\mathbb{R} t(x) dP_X(x). $$
|
||||
\end{proof}
|
||||
|
||||
Poznamenejme si explicitní vzorce pro transformaci spojitých a diskrétní náhodných veličin, které jsou přímým důsledkem předchozí věty:
|
||||
|
||||
\begin{corollary}
|
||||
Mějme náhodné veličiny $X$ a $Y$ takové, že platí $Y = t(X)$ pro nějakou transformaci $t: \mathbb{R} \rightarrow \mathbb{R}$. Má-li $X$ diskrétní rozdělení, potom
|
||||
$$ \mathbb{E}Y = \sum_{x \in S(x)} t(x) P[X = x]. $$
|
||||
Je-li $X$ spojitá, potom platí
|
||||
$$ \mathbb{E}Y = \int_{\mathbb{R}} t(x) f_X(x) dx. $$
|
||||
\end{corollary}
|
||||
|
||||
Přímé využití pravidla líného statistika si uvedeme v definici a aplikacích následujícího pojmu, který jistým způsobem umožňuje charakterizovat chování rozdělení.
|
||||
|
||||
\begin{definition}
|
||||
Pro reálné číslo $k$ definujeme $k$-tý \textit{moment} náhodné veličiny $X$ jako $\mathbb{E}[X^k]$ za předpokladu, že $\mathbb{E}[|X|^k] < \infty$. Dále definujeme $k$-tý \textit{absolutní moment} jako $\mathbb{E}[|X|^k]$, pokud existuje.
|
||||
\end{definition}
|
||||
|
||||
V praxi se nejčastěji setkáme s momenty jen pro $k$ přirozené, pokud nebude řečeno jinak, všechny momenty budou mít přirozený parametr.
|
||||
|
||||
\begin{theorem}
|
||||
Pokud existuje $k$-tý moment, pak existuje $l$-tý moment pro jakékoli $l \in \{1, \dots, k\}$.
|
||||
\end{theorem}
|
||||
|
||||
\begin{proof}
|
||||
Potřebujeme ukázat, že $E[|X|^l] < \infty$. Můžeme počítat
|
||||
$$ \mathbb{E}[|X|^l] = \int_\mathbb{R} |x|^l dP_X(x) = \int_{|x| \leq 1} |x|^l dP_X(x) + \int_{|x| > 1} |x|^l dP_X(x) \leq $$
|
||||
$$ \int_{|x| \leq 1} dP_X(x) + \int_{|x| > 1} |x|^k dP_X(x) \leq \int_\mathbb{R} dP_X(x) + \int_\mathbb{R} |x|^k dP_X(x).$$
|
||||
Dostáváme $1 + \mathbb{E}[|X|^k] < \infty$, čímž je důkaz ukončen.
|
||||
\end{proof}
|
||||
|
||||
Některá zobrazení mají jen několik prvních momentů a žádné vyšší momenty neexistují.
|
||||
|
||||
\begin{example}
|
||||
Pro Studentovo $t$-rozdělení (Definice \ref{def-student}) s $\nu=3$ stupni volnosti platí $\mathbb{E}X = 0$, $\mathbb{E}X^2 = 2$ ale $\mathbb{E}|X|^3 = \infty$. (cvičení)
|
||||
\end{example}
|
||||
|
||||
Definujeme dále $\mathcal{L}^p$ prostory náhodných veličin, které jsou podobné $L^p$ prostorům z teorie míry a funkcionální analýzy.
|
||||
|
||||
\begin{definition}
|
||||
Pro přirozené číslo $p$ definujeme prostor $\mathcal{L}^p$ tak, že $X \in \mathcal{L}^p$, jestliže $\mathbb{E}[|X|^p] < \infty$.
|
||||
\end{definition}
|
||||
|
||||
V následující větě shrneme pár základních vlastností prostoru $\mathcal{L}^1$, které se mohou hodit při praktických aplikacích.
|
||||
|
||||
\begin{theorem}[Základní vlastnosti prostoru $\mathcal{L}^1$]
|
||||
Nechť jsou dány $X_1, \dots, X_d \in \mathcal{L}^1$ a $a_1, \dots, a_d$ jsou konstanty, pak platí linearita ve smyslu
|
||||
$$ \mathbb{E} \left(\sum_{l = 1}^d a_l X_l \right) = \sum_{l = 1}^d a_l \mathbb{E}X_l. $$
|
||||
|
||||
Dále mějme $X_1, \dots, X_d$ nezávislé náhodné veličiny, potom platí
|
||||
$$ \mathbb{E} \left(\prod_{l = 1}^d X_l\right) = \prod_{l = 1}^d \mathbb{E}X_l.$$
|
||||
\end{theorem}
|
||||
|
||||
\begin{proof}
|
||||
Linearita plyne z věty o přenosu integrace (Věta \ref{thm-pushforward-measure}) a linearity Lebesgueova integrálu.
|
||||
|
||||
Dokážeme druhou vlastnost. Nejprve ukážeme, že hledaná střední hodnota je dobře definovaná. Uvažujme posloupnost funkcí $\{g_n: \mathbb{R}^d \rightarrow \mathbb{R}\}$ definovaných jako $g_n(\vec{x}) = \prod_{l = 1}^d |x_l| \chi_{\{|x_l| \leq n\}}$. Pak pro každé $n \in \mathbb{N}$ je $g_n(\vec{X})$ omezená existuje její první moment $\mathbb{E} [g_n(\vec{X})] \in \mathbb{R}$. Díky nezávislosti můžeme psát
|
||||
$$ \mathbb{E} [g_n(\vec{X})] = \int_{\mathbb{R}^d} \prod_{l = 1}^d |x_l| \chi_{\{|x_l| \leq n\}} d(\otimes_{l = 1}^d P_{X_l}), $$
|
||||
odkud z Fubiniovy věty a následně linearity integrálu plyne
|
||||
$$ = \int_\mathbb{R} \cdots \int_\mathbb{R} \prod_{l = 1}^d |x_l| \chi_{\{|x_l| \leq n\}} dP_{X_1} \cdots dP_{X_d} = \prod_{l = 1}^d \mathbb{E}[|X_l| \chi_{\{|X_l| \leq n\}}] \leq \prod_{l = 1}^d \mathbb{E}[|X_l|]. $$
|
||||
|
||||
Platí, že funkce $g_n(\vec{x})$ jsou nezáporné a $g_n(\vec{x}) \uparrow \prod_{l = 1}^d |x_l|$ na celém $\mathbb{R}^d$. Tudíž z Leviho věty plyne, že $\mathbb{E}[g_n(X)] \uparrow \mathbb{E}[\prod_{l=1}^d |X_l|]$. Potom ale nutně $\mathbb{E}\left|\prod_{l=1}^d X_l \right| \leq \prod_{l = 1}^d \mathbb{E}|X_l| < \infty$, tedy příslušný první moment existuje.
|
||||
|
||||
Dále můžeme počítat
|
||||
$$ \mathbb{E}\left[\prod_{d=1}^l X_l \right] = \int_{\mathbb{R}^d} \prod_{l=1}^d x_l dP_{\vec{X}} = \int_{\mathbb{R}} \prod_{l=1}^d x_l d(\otimes_{l=1}^d P_{X_l}) = $$
|
||||
$$ \int_{\mathbb{R}}\cdots\int_{\mathbb{R}} \prod_{l=1}^d x_l dP_{X_1} \cdots dP_{X_d} = \prod_{l=1}^d \int_\mathbb{R} x_l dP_{X_l} = \prod_{l=1}^d \mathbb{E}X_l, $$
|
||||
kde druhá rovnost plyne z nezávislosti, třetí z Fubiniovy věty a předposlední z linearity integrálu.
|
||||
\end{proof}
|
||||
|
||||
\hfill \textit{konec 8. přednášky (11.3.2025)}
|
Loading…
Add table
Add a link
Reference in a new issue