118 lines
7.3 KiB
TeX
118 lines
7.3 KiB
TeX
\section{Střední hodnota}
|
|
|
|
V této kapitole se budeme věnovat pojmu střední hodnoty, laicky řečeno, kolem jaké hodnoty se nachází naše rozdělení. Nejedná se ani o průměr ani o prostřední, případně nejčastější hodnotu, tyto pojmy zadefinujeme později a ve statistice mají svůj vlastní význam odlišný od střední hodnoty.
|
|
|
|
\begin{definition}
|
|
\textit{Střední hodnota} náhodné veličiny $X$ je reálné číslo
|
|
$$ \mathbb{E}[X] = \mathbb{E}X = \int XdP \equiv \int X(\omega) dP(\omega), $$
|
|
pokud pravá strana existuje.
|
|
\end{definition}
|
|
|
|
Tato definice je velmi teoretická, k praktickému výpočtu se hodí následující věta, kde převedeme integrál na výpočet pomocí obrazu pravděpodobnostní míry.
|
|
|
|
\begin{theorem}
|
|
\label{thm-expected-value}
|
|
Střední hodnota náhodné veličiny $X$ je $\mathbb{E}X = \int x dP_X(x)$, pokud pravá strana existuje.
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Z věty o přenosu integrace (\ref{thm-pushforward-measure}) při volbě $g = Id$ a $(\mathbb{M}, \mathcal{M}) = (\mathbb{R}, \mathcal{B})$ dostáváme požadované tvrzení.
|
|
\end{proof}
|
|
|
|
Z Radon-Nikodymovy věty ihned plyne následující pozorování
|
|
|
|
\begin{observation}
|
|
Střední hodnota veličiny $X$ je
|
|
$$ \mathbb{E}X = \begin{cases}\int_{-\infty}^\infty xf_X(x) dx, X \text{ spojitá};\\
|
|
\sum_{x \in S(X)} xP[X = x], X \text{ diskrétní}. \end{cases} $$
|
|
\end{observation}
|
|
|
|
Střední hodnota nemusí existovat vždy, jeden z takových případů uvedeme v následujícím příkladu.
|
|
|
|
\begin{example}
|
|
Pokud $X \sim Cauchy$ (Definice \ref{def-cauchy}), pak $\mathbb{E}X$ neexistuje. Pomocí integrování per partes můžeme počítat
|
|
$$ \int_0^\infty \frac{x}{\pi(1 + x^2)} dx = [x \arctan(x)]_0^\infty - \int_0^\infty \arctan(x) dx = \infty. $$
|
|
Dostali jsme, že pro integrál přes celou reálnou přímku není definován výraz $\infty - \infty$.
|
|
\end{example}
|
|
|
|
Uvažujme teď transformaci $Y = t(X)$. Následující věta nám umožní počítat střední hodnotu transformované náhodné veličiny.
|
|
|
|
\begin{theorem}[Pravidlo líného statitika]
|
|
\label{thm-lazy-statistician}
|
|
Buď $t: \mathbb{R} \rightarrow \mathbb{R}$ měřitelná funkce a nechť $Y = t(X)$, kde $X$ je nějaká náhodná veličina. Pak
|
|
$$ \mathbb{E} Y = \int t(x) dP_X(x), $$
|
|
pokud pravá strana existuje.
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Z Věty \ref{thm-pushforward-measure} dostáváme
|
|
$$ \mathbb{E} Y = \mathbb{E} [ t(X) ] = \int_\mathbb{R} t(X(\omega)) dP(\omega) = \int_\mathbb{R} t(x) dP_X(x). $$
|
|
\end{proof}
|
|
|
|
Poznamenejme si explicitní vzorce pro transformaci spojitých a diskrétní náhodných veličin, které jsou přímým důsledkem předchozí věty:
|
|
|
|
\begin{corollary}
|
|
Mějme náhodné veličiny $X$ a $Y$ takové, že platí $Y = t(X)$ pro nějakou transformaci $t: \mathbb{R} \rightarrow \mathbb{R}$. Má-li $X$ diskrétní rozdělení, potom
|
|
$$ \mathbb{E}Y = \sum_{x \in S(x)} t(x) P[X = x]. $$
|
|
Je-li $X$ spojitá, potom platí
|
|
$$ \mathbb{E}Y = \int_{\mathbb{R}} t(x) f_X(x) dx. $$
|
|
\end{corollary}
|
|
|
|
Přímé využití pravidla líného statistika si uvedeme v definici a aplikacích následujícího pojmu, který jistým způsobem umožňuje charakterizovat chování rozdělení.
|
|
|
|
\begin{definition}
|
|
Pro reálné číslo $k$ definujeme $k$-tý \textit{moment} náhodné veličiny $X$ jako $\mathbb{E}[X^k]$ za předpokladu, že $\mathbb{E}[|X|^k] < \infty$. Dále definujeme $k$-tý \textit{absolutní moment} jako $\mathbb{E}[|X|^k]$, pokud existuje.
|
|
\end{definition}
|
|
|
|
V praxi se nejčastěji setkáme s momenty jen pro $k$ přirozené, pokud nebude řečeno jinak, všechny momenty budou mít přirozený parametr.
|
|
|
|
\begin{theorem}
|
|
Pokud existuje $k$-tý moment, pak existuje $l$-tý moment pro jakékoli $l \in \{1, \dots, k\}$.
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Potřebujeme ukázat, že $E[|X|^l] < \infty$. Můžeme počítat
|
|
$$ \mathbb{E}[|X|^l] = \int_\mathbb{R} |x|^l dP_X(x) = \int_{|x| \leq 1} |x|^l dP_X(x) + \int_{|x| > 1} |x|^l dP_X(x) \leq $$
|
|
$$ \int_{|x| \leq 1} dP_X(x) + \int_{|x| > 1} |x|^k dP_X(x) \leq \int_\mathbb{R} dP_X(x) + \int_\mathbb{R} |x|^k dP_X(x).$$
|
|
Dostáváme $1 + \mathbb{E}[|X|^k] < \infty$, čímž je důkaz ukončen.
|
|
\end{proof}
|
|
|
|
Některá zobrazení mají jen několik prvních momentů a žádné vyšší momenty neexistují, jako například Studentovo $t$-rozdělení (Definice \ref{def-student}) s $\nu = 3$ stupni volnosti.
|
|
|
|
\begin{example}
|
|
Pro $X \sim t_3$ platí $\mathbb{E}X = 0$, $\mathbb{E}X^2 = 2$ ale $\mathbb{E}|X|^3 = \infty$. (cvičení, použijte per partes)
|
|
\end{example}
|
|
|
|
Definujeme dále $\mathcal{L}^p$ prostory náhodných veličin, které jsou podobné $L^p$ prostorům z teorie míry a funkcionální analýzy.
|
|
|
|
\begin{definition}
|
|
Pro přirozené číslo $p$ definujeme prostor $\mathcal{L}^p$ tak, že náhodná veličina $X \in \mathcal{L}^p$, jestliže $\mathbb{E}[|X|^p] < \infty$.
|
|
\end{definition}
|
|
|
|
V následující větě shrneme pár základních vlastností prostoru $\mathcal{L}^1$, které se mohou hodit při praktických aplikacích.
|
|
|
|
\begin{theorem}[Základní vlastnosti prostoru $\mathcal{L}^1$]
|
|
Nechť jsou dány $X_1, \dots, X_d \in \mathcal{L}^1$ a $a_1, \dots, a_d$ jsou konstanty, pak platí linearita ve smyslu
|
|
$$ \mathbb{E} \left(\sum_{l = 1}^d a_l X_l \right) = \sum_{l = 1}^d a_l \mathbb{E}X_l. $$
|
|
|
|
Dále mějme $X_1, \dots, X_d \in \mathcal{L}^1$ nezávislé náhodné veličiny, potom platí
|
|
$$ \mathbb{E} \left(\prod_{l = 1}^d X_l\right) = \prod_{l = 1}^d \mathbb{E}X_l.$$
|
|
\end{theorem}
|
|
|
|
\begin{proof}
|
|
Linearita plyne z věty o přenosu integrace (Věta \ref{thm-pushforward-measure}) a linearity Lebesgueova integrálu.
|
|
|
|
Dokážeme druhou vlastnost. Nejprve ukážeme, že hledaná střední hodnota je dobře definovaná. Uvažujme posloupnost funkcí $\{g_n: \mathbb{R}^d \rightarrow \mathbb{R}\}$ definovaných jako $g_n(\vec{x}) = \prod_{l = 1}^d |x_l| \chi_{\{|x_l| \leq n\}}$. Pak pro každé $n \in \mathbb{N}$ je $g_n(\vec{X})$ omezená existuje její první moment $\mathbb{E} [g_n(\vec{X})] \in \mathbb{R}$. Díky nezávislosti můžeme psát
|
|
$$ \mathbb{E} [g_n(\vec{X})] = \int_{\mathbb{R}^d} \prod_{l = 1}^d |x_l| \chi_{\{|x_l| \leq n\}} d(\otimes_{l = 1}^d P_{X_l}), $$
|
|
odkud z Fubiniovy věty a následně linearity integrálu plyne
|
|
$$ = \int_\mathbb{R} \cdots \int_\mathbb{R} \prod_{l = 1}^d |x_l| \chi_{\{|x_l| \leq n\}} dP_{X_1} \cdots dP_{X_d} = \prod_{l = 1}^d \mathbb{E}[|X_l| \chi_{\{|X_l| \leq n\}}] \leq \prod_{l = 1}^d \mathbb{E}[|X_l|]. $$
|
|
|
|
Platí, že funkce $g_n(\vec{x})$ jsou nezáporné a $g_n(\vec{x}) \uparrow \prod_{l = 1}^d |x_l|$ na celém $\mathbb{R}^d$. Tudíž z Leviho věty plyne, že $\mathbb{E}[g_n(X)] \uparrow \mathbb{E}[\prod_{l=1}^d |X_l|]$. Potom ale nutně $\mathbb{E}\left|\prod_{l=1}^d X_l \right| \leq \prod_{l = 1}^d \mathbb{E}|X_l| < \infty$, tedy příslušný první moment existuje.
|
|
|
|
Dále můžeme počítat
|
|
$$ \mathbb{E}\left[\prod_{d=1}^l X_l \right] = \int_{\mathbb{R}^d} \prod_{l=1}^d x_l dP_{\vec{X}} = \int_{\mathbb{R}} \prod_{l=1}^d x_l d(\otimes_{l=1}^d P_{X_l}) = $$
|
|
$$ \int_{\mathbb{R}}\cdots\int_{\mathbb{R}} \prod_{l=1}^d x_l dP_{X_1} \cdots dP_{X_d} = \prod_{l=1}^d \int_\mathbb{R} x_l dP_{X_l} = \prod_{l=1}^d \mathbb{E}X_l, $$
|
|
kde druhá rovnost plyne z nezávislosti náhodných veličin $X_1,\dots,X_d$, třetí z Fubiniovy věty a předposlední z linearity integrálu.
|
|
\end{proof}
|
|
|
|
\hfill \textit{konec 8. přednášky (11.3.2025)}
|