5 Zufallsvektoren
Nehmen wir einmal an, dass in nächster Zeit eine Wahl anstünde und wir die Wahl mit stochastischen Mitteln prognostizieren wollen. Beispielsweise könnte man die Antwort eines Teilnehmers einer Wahlumfrage mit einer Zufallsvariable \(X_1\) modellieren. Üblicherweise reicht es allerdings nicht aus, nur eine Person zu befragen.
Also brauchen wir für die Antworten weiterer Umfrageteilnehmer ebenfalls Zufallsvariablen \(X_2, \ldots, X_n\). Wollen wir diese Zufallsvariablen nicht einzeln betrachten und unsere Stichprobe lieber als Ganzes betrachten, so können wir die Ergebnisse in einem Vektor \(X = (X_1, \ldots, X_n)\) bündeln. Dies bringt uns auf natürliche Weise zu dem Konzept von Zufallsvektoren.
Definition 5.1 (Zufallsvektor) Es seien \(X_1, \ldots, X_n\) Zufallsvariablen auf einem Wahrscheinlichkeitsraum \((\Omega, \mathcal{F}, \mathbb{P})\) gegeben. Dann nennen wir \(X = (X_1, \ldots, X_n)\) Zufallsvektor mit Komponenten \(X_1, \ldots, X_n\). Wir nennen \(X\) diskret bzw. absolutstetig, falls alle Komponenten diskret bzw. absolutstetig sind.
Glücklicherweise übertragen sich viele Konzepte aus dem Ein- ins Mehrdimensionale. Im diskreten Fall sprechen wir nun statt einer Zähldichte \(\mathbb{P}(X_1 = k_1)\) von einer gemeinsamen Zähldichte \(\mathbb{P}(X_1 = k_1, \ldots, X_n = k_n)\). Analog dazu gibt es im absolutstetigen Fall auch eine gemeinsame Dichtefunktion \(f_X(x_1, \ldots, x_n)\). Ebenso gibt es auch wieder die Verteilungsfunktion \[\begin{align*} F_X(x_1, \ldots, x_n) &= \mathbb{P}\big(X_1 \leq x_1, \ldots, X_n \leq x_n\big)\\ &= \begin{cases} \sum_{k_1 \leq x_1} \dots \sum_{k_n \leq x_n} \mathbb{P}(X_1 = k_1, \ldots, X_n = k_n) \\ \int_{-\infty}^{x_n} \dots \int_{-\infty}^{x_1} f_X(t_1, \ldots, t_n) \ dt_1 \dots dt_n \end{cases} \end{align*}\] Für unabhängige Zufallsvariablen lässt sich dies noch vereinfachen.
Theorem 5.1 Es sei \(X\) ein Zufallsvektor mit Komponenten \(X_1, \ldots, X_n\). Nun sind \(X_1, \ldots, X_n\) genau dann unabhängig, wenn \[\begin{align*} F_X(x_1, \ldots, x_n) = F_{X_1}(x_1) \cdots F_{X_n}(x_n) \end{align*}\] für alle \(x_1, \ldots, x_n \in \mathbb{R}\).
Annahme 5.1 Im diskreten Fall bedeutet dies, dass die gemeinsame Zählzähldichte von \(X\) in das Produkt der (Rand-)Zähldichten von \(X_1, \ldots, X_n\) zerfällt. Im absolutstetigen Fall passiert das gleiche bzgl. der gemeinsamen Dichtefunktion und den Randdichtefunktionen von \(X_1, \ldots, X_n\). Üblicherweise arbeitet man im Mehrdimensionalen überwiegend mit der Zähldichte und Dichtefunktion, da diese einfacher zu handhaben sind und die Verteilungsfunktion eindeutig charakterisieren.
Falls die Zufallsvariablen abhängig sind, so lässt sich auf den ersten Blick keine sinnvolle Aussage bzgl. dem Zusammenhang zwischen gemeinsamer Verteilungsfunktion und den Randverteilungsfunktionen treffen. Insbesondere lässt sich kein einfacher Schluss von den Randverteilungen auf die gemeinsame Verteilung ziehen. Dazu fehlt uns nämlich die Abhängigkeitsstruktur zwischen den einzelnen Zufallsvariablen. Andersherum lässt sich nach Kenntnis der gemeinsamen Verteilung glücklicherweise viel über die Randverteilungen sagen.
Theorem 5.2 Es sei \(X\) ein Zufallsvektor mit Komponenten \(X_1, \ldots, X_n\) und gemeinsamer Zähldichte \(p(k_1, \ldots, k_n)\) bzw. gemeinsamer Dichtefunktion \(f_X(x_1, \ldots, x_n)\). Dann gilt für alle \(i = 1, \ldots, n\) \[\begin{align} \mathbb{P}(X_i = x) = \sum_{k_1, \ldots, k_{i-1}, k_{i+1}, \ldots, k_n} p(k_1, \ldots, k_{i-1}, x, k_{i+1}, \ldots, k_n) \label{eq: Randdichte diskret} \tag{1} \end{align}\] bzw. \[\begin{align} f_{X_i}(x) = \int_{\mathbb{R}^{n-1}} f_X(t_1, \ldots,t_{i-i}, x, t_{i+1}, \ldots t_n)\ dt_1, \ldots, dt_{i-1} dt_{i+1} \ldots, dt_n. \label{eq: Randdichte stetig} \tag{2} \end{align}\]
Letztendlich bedeutet Gleichung \(\eqref{eq: Randdichte diskret}\), dass wenn man sich für die Randwahrscheinlichkeit \(\mathbb{P}(X_i = x)\) interessiert, lediglich die Wahrscheinlichkeiten aller Ereignisse summieren muss, die mit dem Ereignis \(\{ X_i = x \}\) konform sind. Dementsprechend lässt sich Gleichung \(\eqref{eq: Randdichte stetig}\) als infinitesimale Version von Gleichung \(\eqref{eq: Randdichte diskret}\) verstehen. Die beiden Gleichungen kann man auch auch so interpretieren, dass man die überflüssigen Variablen \(t_1, \ldots, t_{i-1}, t_{i+1}, \ldots, t_n\) “rausintegriert’’ bzw. im diskreten Fall \(k_1, \ldots, k_{i-1}, k_{i+1}, \ldots, k_n\)”raussummiert’’.
Die Idee, die Wahrscheinlichkeit eines beliebigen Ereignisses \(A\) über die Summation bzw. Integration von mit \(A\) konformen Mengen und der gemeinsamen (Zähl-)dichte zu berechnen, findet man oft in der Stochastik. Beispielsweise wird diese Technik auch für die Bestimmung der (Zähl-)Dichte von Funktionen von Zufallsvariablen genutzt.
Beispiel 5.1 Es seien \(X_1\) und \(X_2\) zwei beliebige Poi(\(\lambda\))-verteilte Zufallsvariablen, wobei \(\lambda > 0\). Da \(X_1, X_2 \in \{ 0, 1, \ldots \}\) f.s., ist ebenfalls \(Z := X_1 + X_2 \in \{ 0, 1, \ldots \}\) f.s..
Wollen wir nun die Dichte der Zufallsvariable \(Z\), d.h. die Wahrscheinlichkeit \(\mathbb{P}(Z = k) = \mathbb{P}(X_1 + X_2 = k)\) für alle \(k \in \mathbb{N}_0\), berechnen, so müssen wir lediglich die Wahrscheinlichkeiten aller möglichen Kombinationen \(\{ X_1 = i \} \cap \{ X_2 = j \}\) summieren, in denen \(i + j = k\). Somit berechnen wir \[\begin{align} \mathbb{P}(X_1 + X_2 = k) = \sum_{i = 0}^{\infty} \mathbb{P}(X_1 = i, X_2 = k - i). \label{eq: Summe von Poisson} \tag{3} \end{align}\]
Da wir an dieser Stelle die Abhängigkeitsstruktur von \(X_1\) und \(X_2\) nicht kennen (da wir nur die Randverteilungen angegeben haben), können wir leider nicht weiterrechnen. Nehmen wir zusätzlich an, \(X_1\) und \(X_2\) wären unabhängig, so zerfällt die gemeinsame Zähldichte in das Produkt der Randdichten und wir könnten den Ausdruck in Gleichung \(\eqref{eq: Summe von Poisson}\) weiter vereinfachen.
Die in Beispiel 5.1 illustrierte Vorgehensweise ist natürlich nicht nur für Poissonverteilte Zufallsvariablen gültig. Im Allgemeinen können wir das folgende Theorem formulieren:
Theorem 5.3 Seien \(X_1\) und \(X_2\) zwei absolutstetige Zufallsvariablen mit Dichte \(f_{X_1}\) und \(f_{X_2}\) und gemeinsamer Dichte \(f\). Dann gilt: \[\begin{align*} &f_{X_1+X_2}(z) = \int_{-\infty}^{\infty} f(z-t,t) \ dt\\ &f_{X_1-X_2}(z) = \int_{-\infty}^{\infty} f(z+t,t) \ dt\\ &f_{X_1 \cdot X_2}(z) = \int_{-\infty}^{\infty} \frac{1}{\vert t \vert} \ f\bigg(\frac{z}{t},t\bigg) \ dt\\ &f_{X_1 / X_2}(z) = \int_{-\infty}^{\infty} \vert t \vert \ f(zt,t) \ dt \end{align*}\]