Centralne twierdzenie graniczne

Przykładowy rozkład prawdopodobieństwa pewnej zmiennej
Rozkład prawdopodobieństwa średniej dwóch takich niezależnych zmiennych
Rozkład prawdopodobieństwa średniej trzech takich niezależnych zmiennych
Rozkład prawdopodobieństwa średniej czterech takich niezależnych zmiennych. Jest już bardzo zbliżony do rozkładu normalnego.

Centralne twierdzenie graniczne – jedno z najważniejszych twierdzeń rachunku prawdopodobieństwa, uzasadniające powszechne występowanie w przyrodzie rozkładów zbliżonych do rozkładu normalnego.

Wersje

Sformułowanie szczególne

Centralne twierdzenie graniczne to twierdzenie matematyczne mówiące, że jeśli niezależnymi zmiennymi losowymi pochodzącymi z tej samej populacji o wartości oczekiwanej oraz dodatniej i skończonej wariancji to ciąg zmiennych losowych, w postaci znormalizowanych wartości oczekiwanych

zbieżny jest według rozkładu do standardowego rozkładu normalnego, gdy .

Tzn.

Sformułowanie ogólne

Centralne twierdzenie graniczne znane też pod nazwą twierdzenia Lindeberga-Lévy’ego mówi:

Niech będzie schematem serii, w którym dla i dla każdego mamy Jeśli spełniony jest warunek Lindeberga, tj. dla każdego zachodzi to

Dowód

Dowodów centralnego twierdzenia granicznego w wersji ogólnej jest kilka. Wszystkie są dość skomplikowane i wymagają korzystania z wielu zaawansowanych narzędzi matematycznych. Poniżej znajduje się jeden z prostszych dowodów, nie dający jednak oszacowania wartości błędu.

Pierwszym krokiem dowodu jest sformułowanie i udowodnienie użytecznych lematów.

Lemat 1

Niech będzie funkcją trzykrotnie różniczkowalną taką, że zachodzi oraz Wówczas:

  • a)
  • b)

Dowód

Oznaczmy Wówczas

Ustalmy dowolne Wówczas zgodnie z twierdzeniem Cauchy’ego istnieją takie że:

Na tej samej zasadzie:

Lemat 2

Jeżeli to

Dowód

Dokonujemy podstawienia

Teraz całkujemy przez części:

Drugi krok polega na oszacowaniu pewnej wartości:

Niech będzie funkcją trzykrotnie różniczkowalną taką, że oraz

Rozważamy niezależne zmienne o rozkładzie normalnym takie, że oraz

Wówczas:

Przy czym ostatnia nierówność to nierówność trójkąta.

Drugi ze składników daje się na podstawie Lematu 1 oszacować w sposób następujący:

Tymczasem gdzie W związku z tym (korzystając z Lematu 2):

Wobec tego

Pierwszy ze składników można natomiast oszacować w sposób następujący:

Z kolei szacujemy:

oraz

Ostatnia nierówność wynika z Lematu 1.

Zatem mamy następujące oszacowanie:

Trzeci krok polega na wielokrotnym zastosowaniu oszacowania uzyskanego powyżej.

Rozpatrzmy -ty z powyższych wyrazów.

Podstawiamy

Zmienna jest niezależna od i Wobec tego:

Zatem:

Pierwszy i ostatni składnik z warunku Lindeberga zbiegają do zera, gdy dąży do nieskończoności. W związku z tym:

Oznacza to, że:

gdzie

Czwarty krok polega na wyliczenie dystrybuanty granicznej na podstawie powyższych oszacowań.

Weźmy funkcję spełniającą warunek dla pewnych

Wówczas:

Ale:

oraz

W związku z tym:

oraz podobnie

Otrzymujemy więc

Ale z ciągłości dystrybuanty rozkładu normalnego wnioskujemy, że

Ponieważ punktowa zbieżność dystrybuant w punktach ciągłości dystrybuanty granicznej jest równoważna zbieżności według rozkładu, więc ostatecznie:

Częste nieporozumienia

  • Centralne twierdzenie graniczne nie sprawi, by przy dostatecznie dużej próbie rozkład stał się normalny. Jedynie rozkład średniej z tej próby upodabnia się do normalnego.
  • Centralne twierdzenie graniczne jest prawdziwe tylko dla rozkładów o skończonej wariancji. Zobacz stabilność struktury.

Zobacz też

Media użyte na tej stronie

Central limit thm 3.png
Autor: unknown, Licencja: CC-BY-SA-3.0
Central limit thm 1.png
Autor: unknown, Licencja: CC-BY-SA-3.0
Central limit thm 2.png
Autor: unknown, Licencja: CC-BY-SA-3.0
Central limit thm 4.png
Autor: unknown, Licencja: CC-BY-SA-3.0