Gry różniczkowe
Gry różniczkowe – dział matematycznej teorii sterowania optymalnego, w którym rozpatruje się sterowanie w sytuacjach konfliktowych. Ma on także związek z teorią gier. Teoria powstała w latach 50. XX wieku.
Sformułowania problemów teorii gier różniczkowych
W teorii wyróżnia się dwa rodzaje gier:
- gra dwóch graczy,
- gra wielu graczy.
Podstawowe wyniki uzyskano dla gier różniczkowych dwóch graczy, a sama gra podporządkowana jest wtedy następującemu schematowi:
- dany jest pewien układ dynamiczny, w którym część sterujących działań podporządkowana jest graczowi I, a inna część graczowi II,
- zakłada się, że dla każdego z graczy wybór działań gwarantujących mu osiągnięcie założonego celu, przy dowolnym, nieznanym wcześniej sterowaniu przeciwnika, opiera się jedynie na informacji o bieżącym stanie układu[1].
W teorii gier różniczkowych rozpatruje się także problemy, w których zakłócenia działania układu traktuje się jako działania przeciwnika.
Zazwyczaj zakłada się, że ruch sterowanego układu jest podporządkowany równaniu różniczkowemu
gdzie jest wektorem fazowym układu, i – wektorami sterowania odpowiednio graczy I i II, a czasem. Określona jest klasa strategii gracza I, a dla każdej strategii określony jest wiązką ruchów która jest generowana przez tę strategię oraz wszystkie możliwe strategie przeciwnika. Wiązka ta wychodzi z początkowego stanu powyższego układu.
Na ruchach układu zadany jest funkcjonał nazywany płacą gry, którego wartość gracz I stara się zminimalizować. Czasem funkcjonał zależy także od realizacji sterowania obu graczy[2].
Biorąc pod uwagę także najbardziej niekorzystną realizację ruchu gdy wybór strategii jest pozostawiony graczowi II, jakość strategii jest oceniana za pomocą wielkości:
Zadanie gracza I polega na określeniu strategii na której realizowane jest minimum funkcjonału (jest to zadanie potęgi). Czasem rozpatruje się zadanie jakości, które polega na znalezieniu strategii spełniającej nierówność:
gdzie jest daną liczbą[3].
W analogiczny sposób można sformułować zadanie gracza II. Jego strategia jest oceniana przez wielkość:
Zadanie potęgi polega wtedy na znalezieniu strategii maksymalizującej wartość funkcjonału a zadanie jakości – na znalezieniu strategii dla której:
Jeśli w zadaniach graczy I i II klasy strategii i mają taką własność, że dla każdej pary uporządkowanej można określić choć jeden ruch
generowany przez tę parę, to oba te zadania generują grę różniczkową na klasie strategii
Jeśli w grze różniczkowej spełniona jest równość
to wielkość nazywa się ceną gry różniczkowej[3].
Przykład
Typowym przykładem gry różniczkowej jest zagadnienie pościgu-ucieczki[4]. W tej grze
gdzie są odpowiednio wektorami fazowymi ścigającego i uciekającego, a ich ruch opisywany jest równaniami
- [3].
Najczęściej rozpatruje się przypadki, gdy wybór sterowania podlega ograniczeniom typu
gdzie są pewnymi zbiorami zwartymi. Płacą w takiej grze jest czas spotkania, tzn.:
gdzie i są wektorami utworzonymi z pierwszych współrzędnych wektorów i Zatem zbliżenie punktów i na odległość mniejszą od jest interpretowane jako spotkanie obiektów.
Przypisy
- ↑ И.М. Виноградов (redaktor): Математическая Энциклопедия. T. 2. Д-Коо. Москва: Советская Энциклопедия, 1979, s. 329. (ros.).
- ↑ Математическая Энциклопедия, op. cit., s. 329.
- ↑ a b c Математическая Энциклопедия, op. cit., s. 330.
- ↑ Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Wiktor Gutenmacher, Nikołaj Wasiliew: Proste i krzywe. Warszawa: WSiP, 1995, s. 67–70. ISBN 83-02-05275-2.
Linki zewnętrzne
Media użyte na tej stronie
An icon to represent control engineering