Funkcja aktywacji

Funkcja aktywacji – pojęcie używane w sztucznej inteligencji do określenia funkcji, według której obliczana jest wartość wyjścia neuronów sieci neuronowej.

Po agregacji danych wejściowych z uwzględnieniem wag powstaje sygnał sumarycznego pobudzenia. Rola funkcji aktywacji polega na tym, że musi ona określić sposób obliczania wartości sygnału wyjściowego neuronu na podstawie wartości tego sumarycznego pobudzenia[1].

W literaturze rozważano wiele różnych propozycji funkcji aktywacji, jednak do powszechnego użytku weszły właściwie cztery z nich: funkcja liniowa (neuron liniowy), funkcja sigmoidalna (neuron sigmoidalny), funkcja tangensoidalna (dokładnie jest to funkcja tangens hiperboliczny, ale skrótowo mówi się właśnie neuron tangensoidalny) oraz funkcja Gaussa (neuron radialny)[1].

Do najczęściej używanych funkcji aktywacji należą:

Funkcja aktywacjiWzór matematycznyGładkaMonotonicznaRóżniczkowalnaUwagi
Funkcja liniowaTTT
  • Funkcja nieograniczona
  • Z reguły
Jednostronnie obcięta funkcja liniowaTTT (oprócz punktu )
  • Brak górnej granicy
Obcięta funkcja liniowa

NTT (oprócz punktów i )
  • Przedziałami liniowa
Funkcja progowa unipolarna

NTN
  • a – zadana wartość progowa
  • Z reguły
  • Taką funkcję aktywacji zastosowali w swojej pracy jako matematyczny model neuronu Warren McCulloch i Walter Pitts
Funkcja progowa bipolarna

NTN
  • a – zadana wartość progowa
  • Z reguły
Sigmoidalna funkcja unipolarna

TTT
  • Z reguły
  • Gdy funkcja przechodzi w progową unipolarną funkcję aktywacji
Sigmoidalna funkcja bipolarna (tangens hiperboliczny)

TTT
  • Z reguły
  • Gdy funkcja przechodzi w progową bipolarną funkcję aktywacji
Funkcja Gaussa

TNT
  • e – liczba Eulera
Znormalizowana funkcja wykładnicza (Softmax)TTT
  • Prawdopodobieństwo zawsze sumuje się do jedności:
  • e – liczba Eulera
  • K - szerokość wektorów wejściowego i wyjściowego
  • Stosowana głównie w najwyższej warstwie klasyfikatorów, w celu obliczenia prawdopodobieństwa przynależności wektora wejściowego z do każdej z K klas wyjściowych

Przypisy

  1. a b Ryszard Tadeusiewicz, Maciej Szaleniec: Leksykon sieci neuronowych. s. 34. ISBN 978-83-63270-10-0.

Media użyte na tej stronie