Postać normalna (bazy danych)

Postać normalna – postać relacji w bazie danych, w której nie występuje redundancja (nadmiarowość), czyli powtarzanie się tych samych informacji. Doprowadzenie relacji do postaci normalnej nazywa się normalizacją (lub dekompozycją) bazy danych.

Rozróżniane postacie normalne

Pierwsza postać normalna (1NF)

Relacja jest w pierwszej postaci normalnej, jeśli:

  • opisuje jeden obiekt,
  • wartości atrybutów są elementarne (atomowe, niepodzielne) – każda kolumna jest wartością skalarną (atomową), a nie macierzą lub listą czy też czymkolwiek, co posiada własną strukturę[1],
  • nie zawiera kolekcji (powtarzających się grup informacji)
  • kolejność wierszy może być dowolna (znaczenie danych nie zależy od kolejności wierszy).

Tabela przed normalizacją

PłećImię
MęskaJan, Piotr, Zenon
ŻeńskaAnna, Maria, Zofia

Pierwsza postać normalna

PłećImię
MęskaJan
MęskaPiotr
MęskaZenon
ŻeńskaAnna
ŻeńskaMaria
ŻeńskaZofia

Właściwości, które muszą zaistnieć w 1 formie:

  1. Jest zdefiniowany klucz relacji.
  2. Wszystkie atrybuty niekluczowe są w zależności funkcyjnej od klucza.

Druga postać normalna (2NF)

Relacja jest w drugiej postaci normalnej wtedy i tylko wtedy, gdy jest w I postaci normalnej i żadna kolumna niekluczowa nie jest częściowo funkcyjnie zależna od jakiegokolwiek klucza potencjalnego.

Przykład tabeli „Pracownicy” przed normalizacją

ImięNazwiskoPłećStanowiskoStawka za godzinę
AntoniAnonimMęskaStolarz10 zł
NataliaNiewiadomaŻeńskaSekretarka20 zł
AlinaEnigmaŻeńskaSekretarka20 zł

Klucz potencjalny składa się tu z dwóch pól: "Imię" oraz "Nazwisko". Przy założeniu, że każde imię ma przypisaną jedną płeć, czyli, że płeć zależy tylko od jednego z atrybutów klucza potencjalnego, tabela nie spełnia warunków na drugą postać normalną.

Przykład tabeli „Pracownicy” po normalizacji do 2NF

ImięNazwiskoStanowiskoStawka za godzinę
AntoniAnonimStolarz10 zł
NataliaNiewiadomaSekretarka20 zł
AlinaEnigmaSekretarka20 zł

Każdy atrybut niekluczowy zależy od całego klucza potencjalnego.

Nowa tabela „Płeć imienia” po normalizacji

ImięPłeć
AntoniMęska
NataliaŻeńska
AlinaŻeńska

Trzecia postać normalna (3NF)

Relacja jest w trzeciej postaci normalnej wtedy i tylko wtedy, gdy jest w II postaci normalnej i żaden atrybut niekluczowy nie jest zależny funkcyjnie od innych atrybutów niekluczowych[1].

Przykład tabeli „Pracownicy” przed normalizacją

ImięNazwiskoStanowiskoStawka za godzinę
AntoniAnonimStolarz10 zł
NataliaNiewiadomaSekretarka20 zł
AlinaEnigmaSekretarka20 zł

Klucz potencjalny składa się tu z dwóch pól: "Imię" oraz "Nazwisko". Oba atrybuty niekluczowe: "Stanowisko" oraz "Stawka za godzinę" są zależne od całego klucza potencjalnego- tzn. dany pracownik ma przyporządkowane jedno stanowisko i jedną stawkę godzinową.

Jeśli założymy, że każde stanowisko jest tak samo płatne, to wartości w kolumnie „Stawka za godzinę” są zależne jedynie od pola „Stanowisko”, a tylko pośrednio od klucza potencjalnego. Prowadzi to do powtarzania się wartości „20 zł”, co powoduje redundancję (nadmiarowość danych). Może to też prowadzić do anomalii i niespójności danych, gdy np. pani Alinie zmienimy stawkę na 25 zł, a zapomnimy zmienić stawki drugiej sekretarce, pani Natalii.

Sprowadzenie do III postaci normalnej będzie polegać na przeniesieniu stawek do osobnej tabeli, a w tabeli pracowników pozostawienie jedynie nazwy stanowiska.

Tabela „Pracownicy” po normalizacji

ImięNazwiskoStanowisko
AntoniAnonimStolarz
NataliaNiewiadomaSekretarka
AlinaEnigmaSekretarka

Tabela „Stawki godzinowe” po normalizacji

StanowiskoStawka
Stolarz10 zł
Sekretarka20 zł

Postać normalna Boyce’a-Codda (BCNF lub 3.5NF)

W tej postaci zależności funkcyjne muszą mieć następującą postać: jeżeli X → A i atrybut A nie jest zawarty w X, to X jest kluczem lub zawiera klucz.

Czwarta postać normalna (4NF)

Relacja jest w czwartej postaci normalnej, jeżeli zbiór atrybutów X określa wartościowo Y, to zachodzi jeden z następujących warunków (trywialne zależności wielowartościowe)

  • Y jest puste lub zawiera się w X,
  • suma zbiorów X i Y jest pełnym zbiorem atrybutów,
  • X zawiera klucz.

Ponadto 4NF zachodzi wówczas gdy:

  • spełnione są warunki BCNF
  • istnieją nietrywialne zależności gdzie Y wynika z X, X i Y są rozdzielne oraz X jest kluczem.

Czwarta i piąta postać normalna są w zasadzie używane wyłącznie przy okazji rozważań teoretycznych.

Przypisy

Bibliografia

  • Jeffrey D. Ullman, Jennifer Wisdom: Podstawowy kurs systemów baz danych. Helion, 2011. ISBN 83-246-3224-7. (pol.).