5  Zufallsvektoren

Nehmen wir einmal an, dass in nächster Zeit eine Wahl anstünde und wir die Wahl mit stochastischen Mitteln prognostizieren wollen. Beispielsweise könnte man die Antwort eines Teilnehmers einer Wahlumfrage mit einer Zufallsvariable X1 modellieren. Üblicherweise reicht es allerdings nicht aus, nur eine Person zu befragen.

Also brauchen wir für die Antworten weiterer Umfrageteilnehmer ebenfalls Zufallsvariablen X2,,Xn. Wollen wir diese Zufallsvariablen nicht einzeln betrachten und unsere Stichprobe lieber als Ganzes betrachten, so können wir die Ergebnisse in einem Vektor X=(X1,,Xn) bündeln. Dies bringt uns auf natürliche Weise zu dem Konzept von Zufallsvektoren.

Definition 5.1 (Zufallsvektor) Es seien X1,,Xn Zufallsvariablen auf einem Wahrscheinlichkeitsraum (Ω,F,P) gegeben. Dann nennen wir X=(X1,,Xn) Zufallsvektor mit Komponenten X1,,Xn. Wir nennen X diskret bzw. absolutstetig, falls alle Komponenten diskret bzw. absolutstetig sind.

Glücklicherweise übertragen sich viele Konzepte aus dem Ein- ins Mehrdimensionale. Im diskreten Fall sprechen wir nun statt einer Zähldichte P(X1=k1) von einer gemeinsamen Zähldichte P(X1=k1,,Xn=kn). Analog dazu gibt es im absolutstetigen Fall auch eine gemeinsame Dichtefunktion fX(x1,,xn). Ebenso gibt es auch wieder die Verteilungsfunktion FX(x1,,xn)=P(X1x1,,Xnxn)={k1x1knxnP(X1=k1,,Xn=kn)xnx1fX(t1,,tn) dt1dtn Für unabhängige Zufallsvariablen lässt sich dies noch vereinfachen.

Theorem 5.1 Es sei X ein Zufallsvektor mit Komponenten X1,,Xn. Nun sind X1,,Xn genau dann unabhängig, wenn FX(x1,,xn)=FX1(x1)FXn(xn) für alle x1,,xnR.

Bemerkung 5.1 Im diskreten Fall bedeutet dies, dass die gemeinsame Zählzähldichte von X in das Produkt der (Rand-)Zähldichten von X1,,Xn zerfällt. Im absolutstetigen Fall passiert das gleiche bzgl. der gemeinsamen Dichtefunktion und den Randdichtefunktionen von X1,,Xn. Üblicherweise arbeitet man im Mehrdimensionalen überwiegend mit der Zähldichte und Dichtefunktion, da diese einfacher zu handhaben sind und die Verteilungsfunktion eindeutig charakterisieren.

Falls die Zufallsvariablen abhängig sind, so lässt sich auf den ersten Blick keine sinnvolle Aussage bzgl. dem Zusammenhang zwischen gemeinsamer Verteilungsfunktion und den Randverteilungsfunktionen treffen. Insbesondere lässt sich kein einfacher Schluss von den Randverteilungen auf die gemeinsame Verteilung ziehen. Dazu fehlt uns nämlich die Abhängigkeitsstruktur zwischen den einzelnen Zufallsvariablen. Andersherum lässt sich nach Kenntnis der gemeinsamen Verteilung glücklicherweise viel über die Randverteilungen sagen.

Theorem 5.2 Es sei X ein Zufallsvektor mit Komponenten X1,,Xn und gemeinsamer Zähldichte p(k1,,kn) bzw. gemeinsamer Dichtefunktion fX(x1,,xn). Dann gilt für alle i=1,,n (1)P(Xi=x)=k1,,ki1,ki+1,,knp(k1,,ki1,x,ki+1,,kn) bzw. (2)fXi(x)=Rn1fX(t1,,tii,x,ti+1,tn) dt1,,dti1dti+1,dtn.

Letztendlich bedeutet Gleichung (1), dass wenn man sich für die Randwahrscheinlichkeit P(Xi=x) interessiert, lediglich die Wahrscheinlichkeiten aller Ereignisse summieren muss, die mit dem Ereignis {Xi=x} konform sind. Dementsprechend lässt sich Gleichung (2) als infinitesimale Version von Gleichung (1) verstehen. Die beiden Gleichungen kann man auch auch so interpretieren, dass man die überflüssigen Variablen t1,,ti1,ti+1,,tn “rausintegriert’’ bzw. im diskreten Fall k1,,ki1,ki+1,,kn”raussummiert’’.

Die Idee, die Wahrscheinlichkeit eines beliebigen Ereignisses A über die Summation bzw. Integration von mit A konformen Mengen und der gemeinsamen (Zähl-)dichte zu berechnen, findet man oft in der Stochastik. Beispielsweise wird diese Technik auch für die Bestimmung der (Zähl-)Dichte von Funktionen von Zufallsvariablen genutzt.

Beispiel 5.1 Es seien X1 und X2 zwei beliebige Poi(λ)-verteilte Zufallsvariablen, wobei λ>0. Da X1,X2{0,1,} f.s., ist ebenfalls Z:=X1+X2{0,1,} f.s..

Wollen wir nun die Dichte der Zufallsvariable Z, d.h. die Wahrscheinlichkeit P(Z=k)=P(X1+X2=k) für alle kN0, berechnen, so müssen wir lediglich die Wahrscheinlichkeiten aller möglichen Kombinationen {X1=i}{X2=j} summieren, in denen i+j=k. Somit berechnen wir (3)P(X1+X2=k)=i=0P(X1=i,X2=ki).

Da wir an dieser Stelle die Abhängigkeitsstruktur von X1 und X2 nicht kennen (da wir nur die Randverteilungen angegeben haben), können wir leider nicht weiterrechnen. Nehmen wir zusätzlich an, X1 und X2 wären unabhängig, so zerfällt die gemeinsame Zähldichte in das Produkt der Randdichten und wir könnten den Ausdruck in Gleichung (3) weiter vereinfachen.

Die in Beispiel 5.1 illustrierte Vorgehensweise ist natürlich nicht nur für Poissonverteilte Zufallsvariablen gültig. Im Allgemeinen können wir das folgende Theorem formulieren:

Theorem 5.3 Seien X1 und X2 zwei absolutstetige Zufallsvariablen mit Dichte fX1 und fX2 und gemeinsamer Dichte f. Dann gilt: fX1+X2(z)=f(zt,t) dtfX1X2(z)=f(z+t,t) dtfX1X2(z)=1|t| f(zt,t) dtfX1/X2(z)=|t| f(zt,t) dt