Wspólny rozkład prawdopodobieństwa

Czarne punkty uzyskane z pomiaru dwóch zmiennych losowych X, Y – większej gęstości punktów w pobliżu danego punktu (x, y) odpowiada większe wspólne prawdopodobieństwo, że X przyjmie wartość w pobliżu x, a Y w pobliżu y. Pokazano też rozkłady brzegowe P(X=x) oraz P(Y=y).

Wspólny rozkład prawdopodobieństwa (ang. joint probability distribution) – rodzaj rozkładu prawdopodobieństwa, który zmiennym losowym X, Y, .... przypisuje prawdopodobieństwo, iż zmienne X, Y, .... przyjmą określone wartości (ciągłe lub dyskretne, należące do specyficznych dla każdej z nich zbiorów wartości).

Jeśli mamy tylko dwie zmienne losowe, to rozkład nazywamy dwuwymiarowym, a dla większej liczby zmiennych losowych rozkład nazywamy wielowymiarowym.

Wspólny rozkład prawdopodobieństwa może zostać wyrażony także jako wspólna dystrybuanta, wspólna funkcja gęstości prawdopodobieństwa (w przypadku zmiennych ciągłych) lub wspólna funkcja masy prawdopodobieństwa (w przypadku zmiennych dyskretnych). Te z kolei mogą być wykorzystywane do znalezienia dwóch innych rodzajów rozkładów: rozkładu brzegowego (czyli rozkładu prawdopodobieństwa dla jakiejś jednej zmiennej losowej bez odniesienia do pozostałych zmiennych) oraz rozkładu warunkowego (czyli rozkładu prawdopodobieństwa dla wybranego podzbioru zmiennych losowych przy ustalonych wartościach pozostałych zmiennych).

Przykład

Pomyślmy, że toczymy kostką do gry i uznajmy, że A = 1, jeśli liczba jest parzysta (in. jeśli wytoczymy liczbę 2, 4 lub 6) oraz A = 0, jeśli liczba jest nieparzysta (in. jeśli wytoczymy liczbę 1, 3 lub 5). Ponadto rozważmy, że B = 1, jeśli wytoczymy liczbę pierwszą (czyli 2, 3, 5) oraz B = 0, jeśli wytoczymy inną liczbę.

123456
A010101
B011010

Wtedy wspólny rozkład prawdopodobieństwa dla A i B, wyrażony jako funkcja masy prawdopodobieństwa, wynosi

Ważne rodzaje rozkładów

Nazwanymi wspólnymi rozkładami, powstającymi często w statystykach, są: wielowymiarowy rozkład normalny, wielowymiarowy rozkład stabilny, rozkład wielomianu, negatywny rozkład wielomianu, wielowymiarowy rozkład hipergeometryczny i rozkład eliptyczny.

Dystrybuanta

Wspólny rozkład prawdopodobieństwa dla pary zmiennych losowych może być wyrażona w terminie ich dystrybuanty:

Funkcja gęstości lub funkcja masy

Rozkłady dyskretne

Wspólna funkcja masy prawdopodobieństwa dla dwóch zmiennych losowych dyskretnych jest równa

Wspólny rozkład prawdopodobieństwa zmiennych losowych dyskretnych jest równy

Tożsamość ta jest znana jako reguła łańcucha prawdopodobieństwa.

Ponieważ są to prawdopodobieństwa, w przypadku dwóch zmiennych mamy

które uogólniają zmiennych losowych dyskretnych do

Rozkłady ciągłe

Wspólna funkcja gęstości prawdopodobieństwa dla zmiennych losowych ciągłych wynosi

gdzie i dają rozkład warunkowy, gdzie równa się a równa się natomiast i dają rozkład brzegowy odpowiednio dla i

Ponieważ są to rozkłady prawdopodobieństwa, po połączeniu ich uzyskamy:

Wspólny rozkład dla zmiennych niezależnych

Jeśli dla zmiennych losowych dyskretnych dla wszystkich i całkowicie zmiennych losowych ciągłych dla wszystkich i wtedy i są uważane za niezależne. Oznacza to, że pozyskiwanie informacji o wartości jednej lub więcej zmiennych losowych prowadzi do rozkładu warunkowego innych zmiennych, który jest identyczny do rozkładu bezwarunkowego (brzegowego), zatem nie zmienne są źródłem informacji o zmiennych losowych.

Wspólny rozkład dla zmiennych zależnych warunkowo

Jeśli podzbiór zmiennych jest warunkowo zależny, podany przez inny podzbiór tych zmiennych, wtedy wspólny rozkład jest równy W związku z tym może być skutecznie reprezentowany przez inne mniejsze wielowymiarowe rozkłady prawdopodobieństwa i Takie powiązania niezależności warunkowych (ang. conditional independence relations) mogą być reprezentowane w sieci bayesowskiej.

Zobacz też

Bibliografia

Media użyte na tej stronie

Multivariate normal sample.svg
Autor: IkamusumeFan, Licencja: CC BY-SA 3.0
An SVG version of File:MultivariateNormal.png