Sieć neuronowa

Sieć neuronowasystem przeznaczony do przetwarzania informacji, którego budowa i zasada działania są w pewnym stopniu wzorowane na funkcjonowaniu fragmentów rzeczywistego (biologicznego) systemu nerwowego. Na przesłankach biologicznych oparte są schematy sztucznych neuronów wchodzących w skład sieci oraz (w pewnym stopniu) jej struktura. Jednak schematy połączeń neuronów w sieci neuronowej są wybierane arbitralnie, a nie stanowią modelu rzeczywistych struktur nerwowych[1].

Wyróżniającą cechą sieci neuronowej jako narzędzia informatycznego jest możliwość komputerowego rozwiązywania przy jej pomocy praktycznych problemów bez ich uprzedniej matematycznej formalizacji. Dalszą zaletą jest brak konieczności odwoływania się przy stosowaniu sieci do jakichkolwiek teoretycznych założeń na temat rozwiązywanego problemu[1].

Najbardziej znamienną cechą sieci neuronowej jest jej zdolność uczenia się na podstawie przykładów i możliwość automatycznego uogólniania zdobytej wiedzy (generalizacja)[1].

Czasem nazwą „sztuczne sieci neuronowe” określa się interdyscyplinarną dziedzinę wiedzy zajmującą się konstrukcją, trenowaniem i badaniem możliwości tego rodzaju sieci.

Uproszczony schemat jednokierunkowej sieci neuronowej. Poszczególne „kółka” oznaczają sztuczne neurony

Typy sieci neuronowych

Cechą wspólną wszystkich sieci neuronowych jest to, że na ich strukturę składają się neurony połączone ze sobą synapsami. Z synapsami związane są wagi, czyli wartości liczbowe, których interpretacja zależy od modelu.

Sieci jednokierunkowe

Sieci jednokierunkowe to sieci neuronowe, w których nie występuje sprzężenie zwrotne, czyli pojedynczy wzorzec lub sygnał przechodzi przez każdy neuron dokładnie raz w swoim cyklu. Najprostszą siecią neuronową jest pojedynczy perceptron progowy, opracowany przez McCullocha i Pittsa w roku 1943.

W bardziej zaawansowanych rozwiązaniach stosuje się funkcje przejścia. Najpopularniejszą klasę funkcji stosowanych w sieciach neuronowych stanowią funkcje sigmoidalne, np. tangens hiperboliczny. Sieć zbudowana z neuronów wyposażonych w nieliniową funkcję przejścia ma zdolność nieliniowej separacji wzorców wejściowych. Jest więc uniwersalnym klasyfikatorem.

Do uczenia perceptronów wielowarstwowych stosuje się algorytmy spadku gradientowego, między innymi algorytm propagacji wstecznej.

Sieci jednokierunkowe dzielą się na jednowarstwowe, dwuwarstwowe i wielowarstwowe. Sieci jednowarstwowe mogą rozwiązać jedynie wąską klasę problemów. Sieci dwu i wielowarstwowe mogą rozwiązać znacznie szerszą klasę i są pod tym względem równoważne, jednak stosuje się do nich inne algorytmy uczenia (dla wielowarstwowych są one prostsze).

Sieci rekurencyjne

Mianem sieci rekurencyjnej określa się sieć, w której połączenia między neuronami stanowią graf z cyklami. Wśród różnorodności modeli rekurencyjnych sztucznych sieci neuronowych wyróżnić można:

  • sieć Hopfielda – układ gęsto połączonych ze sobą neuronów (każdy z każdym, ale bez połączeń zwrotnych) realizującą dynamikę gwarantującą zbieżność do preferowanych wzorców
  • maszyna Boltzmanna – opracowana przez Geoffa Hintona i Terry’ego Sejnowskiego stochastyczna modyfikacja sieci Hopfielda; modyfikacja ta pozwoliła na uczenie neuronów ukrytych i likwidację wzorców pasożytniczych kosztem zwiększenia czasu symulacji.

Sieci Hopfielda i maszyny Boltzmanna stosuje się jako pamięci adresowane kontekstowo, do rozpoznawania obrazów, rozpoznawania mowy, a także do rozwiązywania problemów minimalizacji (np. problemu komiwojażera).

Samoorganizujące się mapy

Samoorganizujące się mapy (Self Organizing Maps, SOM), zwane też sieciami Kohonena, to sieci neuronów, z którymi są stowarzyszone współrzędne na prostej, płaszczyźnie lub w dowolnej n-wymiarowej przestrzeni.

Uczenie tego rodzaju sieci polega na zmianach współrzędnych neuronów, tak, by dążyły one do wzorca zgodnego ze strukturą analizowanych danych. Sieci zatem „rozpinają się” wokół zbiorów danych, dopasowując do nich swoją strukturę.

Sieci te stosowane są do klasyfikacji wzorców, np. głosek mowy ciągłej, tekstu, muzyki. Do najciekawszych zastosowań należy rozpinanie siatki wokół komputerowego modelu skanowanego obiektu.

Inne

Popularnymi modelami są również maszyny wektorów wspierających (SVM), sieci oparte na radialnych funkcjach bazowych (sieci radialne, RBF) i sieci przesyłające żetony (ang. counter-propagation neural networks). Stosunkowo nowym modelem są sieci oparte na neuronach impulsujących.

Wybrane narzędzia do budowy sieci neuronowych

Matlab

Matlab jest środowiskiem interaktywnym, w którym wykonuje się obliczenia inżynierskie. Wyposażony jest we własny język programowania, który umożliwia pisanie w pełni funkcjonalnych programów. Pod względem grafiki istnieje możliwość rysowania dwu – trzywymiarowych wykresów, a także wizualizacji obliczonych wyników pod postacią rysunków statycznych oraz wyświetlenia jej animacji. Dane pomiarowe mogą być pobierane do poddania ich obróbce z urządzenia zewnętrznego przez porty. Funkcje specjalistyczne (tzw. toolbox), w które wyposażony jest Matlab zostały wykonane z myślą o: obliczeniach macierzowych, sieciach neuronowych, przetwarzaniu obrazów, przetwarzaniu sygnałów, logice rozmytej, statystyce, transformacji zafalowaniowej, identyfikacji systemów, optymalizacji, obliczeniach stałoprzecinkowych, analizie finansowej, akwizycji danych. Do tworzenia sieci neuronowej w Matlabie wykorzystuje się funkcję biblioteki Deep Learning Toolbox oraz Fuzzy Logic Toolbox[2].

Statistica Neural Networks

Statistica Neural Networks – wśród narzędzi, które są dostępne do projektowania i symulacji sieci neuronowych, jest to program najbardziej zaawansowany technologicznie [30]. Unikalne cechy, które są charakterystyczne dla tego programu to, duża sprawność w działaniu oraz dostępność wielu rzadko spotykanych narzędzi. Także dla użytkownika, który nie zajmuje się profesjonalnie projektowaniem sieci budowa i obsługa programu nie jest trudna. Dla mniej doświadczonych użytkowników dostępny jest, bowiem kreator, tzw. „Automatyczny projektant”, który służy użytkownikowi pomocą na każdym etapie budowy sieci neuronowej. Profesjonaliści znajdą tu duży zestaw typów sieci neuronowych oraz algorytmów uczących te sieci[2].

Zastosowania

Współcześnie nie ma wątpliwości, że sztuczne sieci neuronowe nie stanowią dobrego modelu mózgu, choć różne ich postacie wykazują cechy charakterystyczne dla biologicznych układów neuronowych: zdolność do uogólniania wiedzy, uaktualniania kosztem wcześniej poznanych wzorców, dawanie mylnych odpowiedzi po przepełnieniu. Mimo uproszczonej budowy sztuczne sieci neuronowe stosuje się czasem do modelowania schorzeń mózgu.

Sztuczne sieci neuronowe znajdują zastosowanie w rozpoznawaniu i klasyfikacji wzorców (przydzielaniu wzorcom kategorii), predykcji szeregów czasowych, analizie danych statystycznych, odszumianiu i kompresji obrazu i dźwięku oraz w zagadnieniach sterowania i automatyzacji.

Magazyn BYTE wymienia między innymi następujące zastosowania tych sieci:

  • diagnostyka układów elektronicznych
  • badania psychiatryczne
  • prognozy giełdowe
  • prognozowanie sprzedaży
  • poszukiwania ropy naftowej
  • interpretacja badań biologicznych
  • prognozy cen
  • analiza badań medycznych
  • planowanie remontów maszyn
  • planowanie postępów w nauce
  • analiza problemów produkcyjnych
  • optymalizacja działalności handlowej
  • analiza spektralna
  • optymalizacja utylizacji odpadów
  • dobór surowców
  • selekcja celów śledztwa w kryminalistyce
  • dobór pracowników
  • sterowanie procesów przemysłowych[3].

Najpopularniejsze obecnie zastosowanie sieci neuronowych:

  • w programach do rozpoznawania pisma (OCR)
  • na lotniskach do sprawdzania, czy prześwietlony bagaż zawiera niebezpieczne ładunki
  • do syntezy mowy.

W dziedzinie nauk technicznych sztuczne sieci neuronowe wykorzystuje się m.in. do[4]:

  • aproksymacji, prognozowania, przewidywania danych wyjściowych na podstawie danych wejściowych bez konieczności jawnego definiowania związku pomiędzy nimi;
  • klasyfikacji i rozpoznawania;
  • kojarzenia danych – sieci neuronowe pozwalają zautomatyzować procesy wnioskowania i pomagają wykrywać istotne powiązania pomiędzy danymi;
  • analizy danych, czyli poszukiwania związków pomiędzy danymi.

Zobacz też

Przypisy

  1. a b c Ryszard Tadeusiewicz, Maciej Szaleniec: Leksykon sieci neuronowych. s. 94. ISBN 978-83-63270-10-0.
  2. a b Krzysztof Różanowski, SZTUCZNA INTELIGENCJA: ROZWÓJ, SZANSE I ZAGROŻENIA.
  3. Ryszard Tadeusiewicz: Sieci neuronowe. Warszawa: Akademicka Oficyna Wydawnicza RM, 1993, s. 13–14.
  4. Tomasz Cepowski: Badania dotyczące właściwości morskich statku (pol.). W: Prace Instytutu Nawigacji Morskiej [on-line]. Akademia Morska w Szczecinie. [dostęp 2012-04-17]. [zarchiwizowane z tego adresu (2011-05-24)]., w tym: Application of statistical methods and artificial neural networks for appraximation of ship’s roll in beam.

Linki zewnętrzne

Media użyte na tej stronie

Neural network.svg
Autor: Dake, Mysid, Licencja: CC BY 1.0
A simplified view of an artifical neural network.