Średnia arytmetyczna

Średnia arytmetyczna – suma liczb podzielona przez ich liczbę.

Dla liczb jest to więc wyrażenie[1]:

W języku potocznym średnią arytmetyczną określa się po prostu jako średnią.

Na przykład średnią czterech liczb, –5, –3, 0 i 12, jest

Średnia arytmetyczna jest szczególnym przypadkiem średniej potęgowej rzędu 1.

Zastosowania

Średnia arytmetyczna jest jedną z najbardziej intuicyjnych miar oceny populacji, stosowanych często w codziennym życiu – przykładami mogą być średnia ocen z jakiegoś przedmiotu, średnia płaca w firmie, średnia cena pomarańczy na targowiskach w lipcu 2004 roku czy średni wzrost poborowych w danym roczniku.

Średnia arytmetyczna jest dobrą miarą położenia rozkładu i jednocześnie miarą tendencji centralnej. Jest to miara klasyczna rozkładu, czyli każda zmiana dowolnego elementu badanego zbioru pociąga za sobą zmianę wartości średniej.

Właściwości statystyczne średniej z próby

Odchylenie standardowe średniej

Jeśli uśredniamy nieskorelowanych[a] zmiennych o odchyleniach standardowych to odchylenie ich średniej arytmetycznej jest równe średniej kwadratowej odchyleń tych zmiennych:

Jeśli zmienne są skorelowane, wówczas odchylenie średniej będzie inne, np. dla dwóch zmiennych

gdzie to współczynnik korelacji między nimi.

W ogólnym przypadku dla skorelowanych zmiennych:

gdzie to kowariancja -tej i -tej zmiennej.

Prawo wielkich liczb

Niech będzie zmienną losową o skończonej wariancji i wartości oczekiwanej oraz niech będzie prostą próbą losową z tej zmiennej. Prawdopodobieństwo, że średnia będzie oszacowana precyzyjnie (znajdzie się nie dalej od prawdziwej wartości niż o dowolnie mały dodatni błąd ) dąży do 100% wraz ze wzrostem próby:

Innymi słowy średnia próbkowa dąży do wartości oczekiwanej w populacji wraz ze wzrostem liczności próby. Prawo wielkich liczb można wzmocnić na dwa sposoby, przedstawione dalej.

Centralne twierdzenie graniczne

Zgodnie z centralnym twierdzeniem granicznym rozkład średniej z -elementowej próby wraz ze wzrostem coraz lepiej odpowiada rozkładowi normalnemu o wartości oczekiwanej i odchyleniu gdzie oraz to odpowiednio wartość oczekiwana oraz odchylenie standardowe w populacji, z której losowana jest próba. Ściślej dla dowolnych liczb rzeczywistych takich, że

gdzie:

  • to zmienna o standardowym rozkładzie normalnym (o wartości oczekiwanej zero i wariancji równej jeden),
  • to dystrybuanta rozkładu normalnego

Twierdzenie to jest prawdziwe niezależnie od rozkładu w populacji. Właściwość ta jest wykorzystywana w wielu metodach statystycznych i estymatorach. Centralne twierdzenie graniczne jest uogólnieniem prawa wielkich liczb, gdyż opisuje zachowanie całego rozkładu średniej, podczas gdy prawo wielkich liczb opisywało jeden jego parametr (wartość oczekiwaną).

Właściwości średniej jako estymatora

Średnia arytmetyczna z próby jest, niezależnie od rozkładu, estymatorem zgodnym i nieobciążonym wartości oczekiwanej rozkładu, z którego próba była losowana. Jeśli jest to rozkład normalny, to średnia jest również estymatorem efektywnym.

Ograniczenia

Średnia arytmetyczna jest podatna na skośność rozkładu i obserwacje odstające. W takiej sytuacji inne średnie, takie jak mediana, czy statystyki odpornościowe, np. średnia ucinana lub metody z regularyzacją, mogą dawać lepsze wyniki[2][3].

Nierówność Jensena oznacza, że funkcja średnich ma inną wartość niż średnia tej funkcji.

Zobacz też

Uwagi

  1. Nie muszą być niezależne, wystarcza zerowa wartość współczynnika korelacji Pearsona.

Przypisy

  1. średnia arytmetyczna, [w:] Encyklopedia PWN [online] [dostęp 2021-10-01].
  2. Jeffrey N. Rouder, Jason Dana, Clintin P. Davis-Stober, Estimation accuracy in the psychological sciences, „PLOS One”, 13 (11), 2018, e0207239, DOI10.1371/journal.pone.0207239, ISSN 1932-6203, PMID30475810, PMCIDPMC6261010 [dostęp 2019-04-05] (ang.).
  3. Andy P. Field, Rand R. Wilcox, Robust statistical methods: A primer for clinical psychology and experimental psychopathology researchers, „Behaviour Research and Therapy”, 98, 2017, s. 19–38, DOI10.1016/j.brat.2017.05.013 [dostęp 2019-04-05] (ang.).

Bibliografia

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001. ISBN 83-204-2684-7.
  • W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, część 2. Statystyka matematyczna. Warszawa: PWN, 2006, s. 48. ISBN 83-01-14292-8.