Test serii

Test serii (zwany też testem serii Stevensa lub testem serii Walda-Wolfowitza) – nieparametryczny test losowości próby. Stosuje się go m.in. do sprawdzenia, czy wyniki eksperymentu spełniają postulat losowości próby.

Hipotezę zerową i alternatywną formułujemy w sposób następujący:

  • H0: dobór jednostek do próby jest losowy; model jest liniowy.
  • H1: dobór jednostek do próby nie jest losowy; model jest nieliniowy.

Jedną z metod weryfikacji wyżej zapisanej hipotezy jest test serii.

Pod pojęciem serii rozumiemy każdy ciąg identycznych elementów w zbiorze uporządkowanym według przyjętego kryterium. Na przykład jeżeli odnotujemy płeć studentów podchodzących kolejno do egzaminu, możemy otrzymać ciąg:

M M Ż Ż M Ż Ż Ż M M Ż M Ż Ż Ż.

W tym przykładowym ciągu, uporządkowanym według kolejności pojawiania się elementów dwóch rodzajów (M i Ż), powstało 8 serii składających się z jednakowych elementów występujących obok siebie. Zakładając, że pojawienie się kolejnych elementów jest losowe, ogólna liczba serii w ciągu n-elementowym jest zmienną losową o znanym i ujętym w tablice rozkładzie. Jest ona statystyką w opisywanym teście losowości próby.

Sposób wyznaczania wartości statystyki z próby:

  1. Kolejno zapisane obserwacji zmiennej ciągłej tworzy ciąg podstawowy;
  2. Obserwacje porządkujemy rosnąco i wyznaczamy medianę;
  3. W ciągu podstawowym oznaczamy symbolami i wartości różniące się od mediany:
    • oznaczamy
    • oznaczamy
    • pomijamy.
  4. Analizując ustawienie symboli i zliczamy utworzoną liczbę serii która jest wartością statystyki otrzymaną z próby.

Obszar krytyczny testu jest dwustronny.

Jeżeli to wartości krytyczne odczytujemy z tablic rozkładu liczby serii (tablica H) jako:

oraz
gdzie i oznaczają odpowiednio liczbę elementów oznaczonych symbolami i

Zliczoną w próbie liczbę serii porównujemy z wartościami krytycznymi testu.

Jeżeli wystąpi lub odrzucamy H0 na rzecz H1, co będzie oznaczało, że próba nie ma charakteru losowego.

Jeżeli i to zmienna losowa dąży asymptotycznie do rozkładu normalnego Wartość średnia i wariancja zmiennej są określone wzorami:

Wykorzystując te parametry, obliczamy statystykę która przy założeniu prawdziwości ma rozkład N(0,1).

Zobacz też