Elementy logiki i teorii mnogości
Short Description
Download Elementy logiki i teorii mnogości...
Description
Elementy logiki i teorii mnogości Kazimierz Trzęsicki 2006
4 Wyd. II poprawione i zmienione. Wersja elektroniczna.
Spis treści 1 Logika zdań 1.1 Pojęcie logiki . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Język logiki zdań . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Pojęcie języka logiki zdań . . . . . . . . . . . . . 1.2.2 Definicja zdania . . . . . . . . . . . . . . . . . . . 1.2.3 Język formalny . . . . . . . . . . . . . . . . . . . 1.2.4 Język a metajęzyk . . . . . . . . . . . . . . . . . 1.2.5 Rekurencyjny charakter definicji zdania . . . . . . 1.2.6 Model i prawdziwość . . . . . . . . . . . . . . . . 1.3 Rachunek zdań . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Tautologia . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Wybrane tautologie klasycznej logiki zdań . . . . 1.3.3 Tablice semantyczne . . . . . . . . . . . . . . . . 1.3.4 Tautologia a zdanie logicznie prawdziwe . . . . . 1.3.5 Spójniki prawdziwościowe . . . . . . . . . . . . . 1.3.6 Funkcjonalna pełność . . . . . . . . . . . . . . . . 1.3.7 Postacie normalne . . . . . . . . . . . . . . . . . 1.3.8 Elektroniczna interpretacja spójników . . . . . . . 1.3.9 Dowód w rachunku zdań . . . . . . . . . . . . . . 1.3.10 Twierdzenie o dedukcji . . . . . . . . . . . . . . . 1.3.11 Sprzeczne i niesprzeczne zbiory zdań . . . . . . . 1.3.12 Wynikanie syntaktyczne a wynikanie semantyczne 1.3.13 Reguły, schematy i prawa logiki . . . . . . . . . . 1.3.14 Systemy logiki zdań . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
11 11 14 14 15 18 23 25 28 31 31 37 41 51 53 56 58 61 64 67 70 70 72 78
2 Logika predykatów 95 2.1 Język rachunku predykatów . . . . . . . . . . . . . . . . . . . 95 2.1.1 Dziedzina . . . . . . . . . . . . . . . . . . . . . . . . . 95 5
6
SPIS TREŚCI
2.2
2.1.2 Stałe i zmienne indywiduowe . . 2.1.3 Litery funkcyjne . . . . . . . . . 2.1.4 Term . . . . . . . . . . . . . . . 2.1.5 Litery predykatowe . . . . . . . 2.1.6 Formuła . . . . . . . . . . . . . 2.1.7 Podstawialność . . . . . . . . . Rachunek predykatów . . . . . . . . . 2.2.1 Dowód w rachunku predykatów 2.2.2 Twierdzenie o dedukcji . . . . . 2.2.3 Postacie normalne . . . . . . . 2.2.4 Tablice semantyczne . . . . . . 2.2.5 Dedukcja naturalna . . . . . . . 2.2.6 Model i prawdziwość . . . . . . 2.2.7 Pełność rachunku predykatów . 2.2.8 Problem rozstrzygalności . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
3 Algebra zbiorów 3.1 Zbiór i element zbioru . . . . . . . . . . . . . . . . . . . 3.2 Równość zbiorów . . . . . . . . . . . . . . . . . . . . . . 3.3 Zawieranie się zbiorów . . . . . . . . . . . . . . . . . . . 3.4 Operacje na zbiorach . . . . . . . . . . . . . . . . . . . . 3.4.1 Dopełnienie zbioru . . . . . . . . . . . . . . . . . 3.4.2 Suma zbiorów . . . . . . . . . . . . . . . . . . . . 3.4.3 Przecięcie zbiorów . . . . . . . . . . . . . . . . . 3.4.4 Różnica i różnica symetryczna zbiorów . . . . . . 3.4.5 Związki między działaniami teoriomnogościowymi 3.4.6 Uogólnione suma i przecięcie zbiorów . . . . . . . 3.5 Aksjomaty algebry zbiorów . . . . . . . . . . . . . . . . . 4 Relacje i funkcje 4.1 Iloczyn kartezjański zbiorów . . . . . . . . . . . . 4.2 Relacje . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Pojęcie relacji . . . . . . . . . . . . . . . . 4.2.2 Relacje zwrotna i przeciwzwrotna . . . . . 4.2.3 Relacje symetryczna, przeciwsymetryczna i tryczna . . . . . . . . . . . . . . . . . . . . 4.2.4 Relacja przechodnia . . . . . . . . . . . . . 4.2.5 Relacja równoważności . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
96 97 98 99 100 105 106 106 115 120 128 135 138 153 154
. . . . . . . . . . .
161 . 161 . 167 . 170 . 173 . 173 . 175 . 177 . 179 . 180 . 183 . 186 191 . 191 . 196 . 196 . 200
. . . . . . . . . . . . . . . . . . . . . . . . antysyme. . . . . . . 202 . . . . . . . 205 . . . . . . . 207
SPIS TREŚCI
7
4.3 Rachunek relacji . . . . . . . . . . . . 4.4 Funkcja . . . . . . . . . . . . . . . . 4.4.1 Pojęcie funkcji . . . . . . . . . 4.4.2 Funkcja odwrotna . . . . . . . 4.4.3 Superpozycja funkcji . . . . . 4.4.4 Obrazy i przeciwobrazy . . . . 4.5 Uogólniony iloczyn kartezjański . . . 4.6 Uporządkowanie zbiorów . . . . . . . 4.6.1 Zbiory uporządkowane . . . . 4.6.2 Zbiory liniowo uporządkowane 4.6.3 Zbiory dobrze uporządkowane 5 Moce zbiorów 5.1 Równoliczność zbiorów . . . . . . . 5.2 Zbiory przeliczalne i nieprzeliczalne 5.3 Arytmetyka liczb kardynalnych . . 5.4 Zbiory mocy continuum . . . . . . 5.5 Zbiór potęgowy . . . . . . . . . . .
. . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
218 222 222 228 231 233 236 237 237 244 247
. . . . .
249 . 249 . 253 . 263 . 276 . 282
8
SPIS TREŚCI
Przedmowa Niniejsze Elementy logiki i teorii mnogości są przygotowane z myślą o studiujących informatykę oraz ekonometrię i informatykę na poziomie inżynierskim lub licencjackim. Objętościowo książka przekracza standardowy wykład. Tym samym wykładowcom stwarza różne możliwości doboru tematów, a studentom daje szansę poszerzenia wiedzy. Elementy logiki i teorii mnogości obejmują klasyczną logikę zdań, klasyczną logikę predykatów oraz teorię mnogości. Dobór zagadnień oraz sposób ich ujęcia ma być „przyjazny” dla informatyków, czyli odpowiedni do potrzeb i zgodny co do stylu myślenia. Książka ma umożliwić studentowi opanowanie aparatu pojęciowego oraz symboliki, niezbędnych do rozumienia wykładu podstawowych przedmiotów teoretycznych oraz kierunkowych zawodowych. Miejscami książka wykracza poza te ramy. Ma to jednak miejsce tam, gdzie trudno było pominąć problematykę chociażby z powodu jej niezbędności do wyłożenia innych kwestii lub aby nie tworzyć jakieś niezrozumiałej luki. Książka ta od mojej Logiki i teorii mnogości różni się nie tylko zakresem. Niewątpliwie najbardziej widoczne jest pominięcie wielu kwestii i mniej szczegółowe ujęcie niektórych, co doprowadziło do zasadniczego zmniejszenia objętości książki. Zachowany został układ, a mianowicie wpierw rozważane są zagadnienia logiczne a następnie teoriomnogościowe. Praktyczne podejście do logiki wymaga pokazania zastosowania jej w praktyce matematycznej. Taki układ mają zwykle różne zbiory zadań, jak na przykład popularny w Polsce zbiór zadań W. Marka i J. Onyszkiewicza Logika i teoria mnogości w zadaniach. Mając do dyspozycji aparat logiczny możemy zastosować go w teorii mnogości do zapisu twierdzeń i wykorzystać w dowodach. Wykład teorii mnogości zyskuje zaś na ścisłości.
9
10
Rozdział 1 Logika zdań 1.1
Pojęcie logiki
Logika to przede wszystkim teoria rozumowań. Rozumowanie — najogólniej rzecz biorąc — to proces poznawczy pozyskiwania nowej wiedzy na podstawie tylko dotychczas posiadanej wiedzy. Można powiedzieć więc, że logika jest działem teorii przetwarzania informacji: formułuje zasady przetwarzania, zachowującego własności logiczne informacji takie jak np. prawdziwość. Rachunki logiczne wyrosły z zamiaru oceny poprawności rozumowań poprzez kontrolę przestrzegania zasad przekształceń wyrażeń, za których pomocą informacja została zapisana. Logikę interesuje język głównie, choć nie jedynie, jako narzędzie przekazu informacji. Z tego względu mówiąc o zdaniu ma się na uwadze zdanie oznajmujące w sensie gramatycznym. Przez zdania rozumiemy wszystkie i tylko te wyrażenia, które nadają się do formułowania twierdzeń (wiedza w sensie obiektywnym) lub przekonań (wiedza w sensie subiektywnym). Poprawna metodologicznie definicja zdania możliwa jest, gdy określony jest język, czyli gdy zdefiniowany jest zbiór symboli (słownik języka) i zasady budowy (reguły syntaktyczne1 ) jego wy1
Przez semiotykę rozumie się logiczną teorię języka. Za Ch. Morrisem (1938) wyróżnia
się: • syntaktykę, która opisuje stosunki między znakami; • semantykę, rozważa ona związki między znakami a rzeczywistością, do której te znaki odnoszą;
11
12
ROZDZIAŁ 1. LOGIKA ZDAŃ
rażeń (poprawnie zbudowanych). Zdanie to każdy i tylko taki ciąg symboli, który jest elementem wyróżnionej klasy wyrażeń (poprawnie zbudowanych), klasy zdań. Zdanie jest prawdziwe, wtedy i tylko gdy w rzeczywistości jest tak jak to zdanie głosi. Zdanie jest zaś fałszywe, wtedy i tylko gdy w rzeczywistości nie jest tak jak zdanie to głosi. Przykład 1.1.2 Zdanie: 2+2=4 jest prawdziwe. Zdanie: 2+2=5 jest fałszywe.
°
Powyższe określenia prawdziwości i fałszywości zdań są potocznym sformułowaniem klasycznej koncepcji prawdy. Klasyczne pojęcie prawdy jest pojęciem relacyjnym. Zwykle, gdy mówimy, że zdanie jest prawdziwe, nie dodajemy ze względu na jaki «świat» jest ono prawdziwe. Domyślnie przyjmujemy, że jest to świat realny, otaczająca nas rzeczywistość. Gdy jednak mówimy o prawdziwości lub fałszywości zdań niekoniecznie mając na uwadze świat realny, trzeba stworzyć jego substytut, chociażby w postaci jakiegoś czysto abstrakcyjnego konstruktu. Taki konstrukt będziemy nazywać modelem 3 . • pragmatykę, jej przedmiotem są relacje między znakami a ich użytkownikami. 2
Użycie wyrażenia jako nazwy samego siebie zaznacza się biorąc to wyrażenie w cudzysłów. W niniejszej książce będzie szereg odstępstw od tej zasady. Kierujemy się bowiem również zasadą ekonomii, która nakazuje zastosowanie tylko tyle środków wyrazu, ile jest konieczne, aby tekst był zrozumiały i jednoznaczny dla tego, do kogo jest adresowany. Zgodnie z tą zasadą cudzysłowy opuszczane będą wszędzie tam, gdzie ich brak nie będzie źródłem jakichś wątpliwości, co do sposobu rozumienia. W szczególności nie ma potrzeby brania w cudzysłów, jeśli używamy nazwy rodzaju wyrażenia, czyli na przykład gdy piszemy, że podajemy przykłady zdań. Podobnie, gdy używamy zwrotów w rodzaju: nazywamy, określamy. 3 Należy tu dodać, że kiedy mówi się o modelu języka, to ma się na uwadze pewnego rodzaju «rzeczywistość», do mówienia o której dany język może być używany. Kiedy mówi się o modelu jakiegoś zbioru zdań, to mówi sie o tego rodzaju «rzeczywistości», w której wszystkie zdania z tego zbioru są prawdziwe.
1.1. POJĘCIE LOGIKI
13
Prawdziwość i fałszywość to wartości logiczne zdań. Przyjmujemy zasadę dwuwartościowości ; tzn. przyjmujemy, że zdania są bądź prawdziwe, bądź fałszywe. Nie dopuszczamy istnienia zdań, które nie są ani prawdziwe, ani fałszywe. Nie dopuszczamy również wartości logicznych innych niż prawda i fałsz. Wnioskowanie to pośrednie uzasadnianie, czyli uzasadnianie poprzez odwołanie się do uprzednio uznanych zdań. Wnioskowanie służy więc do: 1. poszerzania naszej wiedzy obiektywnej, czyli systemów wiedzy, poprzez odwołanie się do zdań już należących do tych systemów oraz 2. wzbogacania naszej wiedzy subiektywnej, czyli zasobu naszych przekonań, na podstawie już żywionych przekonań. Przesłanki we wnioskowaniu to zdania skądinąd uznane bądź jako takie założone. Stanowią one punkt wyjścia wnioskowania. Wniosek zaś jest zdaniem, które we wnioskowaniu zostaje uznane. Na to, aby wnioskowanie było poprawne, konieczne jest, żeby między jego przesłankami a wnioskiem zachodził stosunek uzasadniania. Szczególnym rodzajem stosunku uzasadniania jest stosunek wynikania. Wnioskowania, w których prawdziwość przesłanek gwarantuje prawdziwość wniosku — czyli gdy nie jest możliwy taki stan rzeczy, aby przesłanki były prawdziwe a wniosek fałszywy — to wnioskowania, w których wniosek wynika (logicznie) z przesłanek. Są to wnioskowania dedukcyjne. Teoria wynikania logicznego jest zasadniczym zagadnieniem logiki. Podstawowym działem logiki jest więc teoria wnioskowań dedukcyjnych. Zdania, z których jakieś zdanie wynika nazywamy jego racjami, a zdanie, które wynika z jakichś zdań nazywamy ich następstwem. Rachunki logiczne tworzone są m.in. po to, aby metodami rachunkowymi stwierdzić poprawność rozumowania. Rozważymy problem rachunku dla logiki zdań. Logika zdań jest logiką języka, którego najprostsze, wewnętrznie nieanalizowalne elementy to zdania proste (atomowe). Znaczenie zdania, czyli sposób jego rozumienia wyczerpuje się w jego wartości logicznej, czyli prawdziwości lub fałszywości. W języku zdaniowym wszystkie elementy znaczeniowe wiążące te zdania ze sobą są wyrażalne przez spójniki zdaniowe. Spójniki te
14
ROZDZIAŁ 1. LOGIKA ZDAŃ
są prawdziwościowe wtedy i tylko wtedy, gdy wartość logiczna zdań złożonych zbudowanych za pomocą tych spójników jest wyznaczana przez wartości logiczne zdań składowych (a więc z pominięciem treści tych zdań). Zasady logiki zdań stosują się do wszystkich języków o tyle, o ile abstrahujemy od wewnętrznej złożoności ich zdań prostych. Rachunek dla logiki zdań jest fragmentem bogatszego rachunku dla logiki języka, w którym wyróżnia się elementy składowe zdań — będzie to rachunek predykatów. Klasyczna logika zdań to logika zdań języka, którego wszystkie spójniki są prawdziwościowe i w której przyjmuje się zasadę dwuwartościowości.
1.2 1.2.1
Język logiki zdań Pojęcie języka logiki zdań
Na język logiki zdań, jak na każdy język, składają się słownik (alfabet), reguły syntaktyczne (gramatyczne) oraz reguły semantyczne (znaczeniowe). Słownik języka, to zbiór symboli, z których budowane są wyrażenia (poprawnie zbudowane). Wyrażenia są skończonymi ciągami elementów słownika zbudowanymi zgodnie z regułami syntaktycznymi. W wypadku języka logiki zdań jedynymi poprawnie zbudowanymi wyrażeniami będą zdania. Zatem określenie reguł syntaktycznych tego języka sprowadza się do definicji zdania. Zdania budujemy, aby mówić o pewnej rzeczywistości, o jakimś świecie. W logice matematycznej takim «światem» jest abstrakcyjny konstrukt: model. Będzie on tak zbudowany, aby ujmował interesujące nas aspekty odnoszenia zdań do świata. Ściśle określony «świat», model, umożliwi definicję prawdziwości zdania (w modelu). Pojęcie prawdziwości zdania jest pojęciem semantycznym. Reguły semantyczne języka logiki zdań sprowadzają się zatem do definicji prawdziwości zdania w modelu. Zdania są jedynymi wyrażeniami poprawnie zbudowanymi języka logiki zdań. Mogą być one proste lub złożone. Proste to takie, których żadna część właściwa, czyli różna od całości nie jest zdaniem. Zdanie złożone to takie, którego jakaś część właściwa jest zdaniem. W każdym języku istnieją różne sposoby tworzenia zdań ze zdań. Zdania można tworzyć ze zdań za pomocą różnych wyrażeń (w gramatyce nazywanych spójnikami i partykułami) lub
1.2. JĘZYK LOGIKI ZDAŃ
15
zestawienia zdań (połączenia zdań składowych wraz z użyciem: w języku mówionym — stosownej intonacji, a w języku pisanym — odpowiedniej interpunkcji). Spójnik to każde i tylko takie wyrażenie, które łącznie ze zdaniem bądź zdaniami tworzy zdanie. Przykład 1.2. Spójnikami są.: „nieprawda, że. . . ”, „konieczne jest, że . . . ” oraz „. . . lub . . . ” i „. . . oraz . . . ”. Spójnikiem nie jest: „. . . jest”. ° Zdania, z których dany spójnik tworzy zdanie to argumenty tego spójnika. Spójniki dzieli się ze względu na ilość ich argumentów. Wyróżniamy więc spójniki jednoargumentowe, dwuargumentowe itd. Zdania, które otrzymujemy w wyniku dopisania zdania lub zdań do spójnika to zdania złożone. Zdania proste to zdania, które nie są złożone, czyli w których nie występują spójniki. Przykład 1.3. Zdaniami prostymi są: 2+2=4 Trójkąt ma trzy boki Zdaniami złożonymi są: Nieprawda, że 2 + 2 = 4. Jeżeli czworokąt ma cztery boki równe, to ma dwa kąty równe.
1.2.2
°
Definicja zdania
Podane będą dwie definicje zdania. Jedna ze względu na to, że jest standardowa, powszechna. Druga, łukasiewiczowska, ze względu na wykorzystanie i samej definicji i pomysłu na zapis — w szczególności w informatyce. Zdanie w notacji standardowej Alfabet języka logiki zdań Alfabet A języka logiki zdań jest zbiorem następujących obiektów (symboli): 1. p0 , p1 , . . . , 2. ¬, 3. ⇒, ∨, ∧, ⇔,
16
ROZDZIAŁ 1. LOGIKA ZDAŃ 4. ), (.
p0 , p1 , . . . to litery zdaniowe. Intuicyjnie reprezentują one zdania proste, czyli zdania, w których nie występują spójniki. Stąd też nazywane są atomami. Dopuszczamy, aby zdań tych było tyle, ile jest liczb naturalnych, czyli przeliczalnie nieskończenie wiele. Zwykle jako liter zdaniowych używać będziemy liter: p, q, r, . . . . ¬ jest spójnikiem jednoargumentowym. Nazywamy go negacją. Spójniki: ⇒, ∨, ∧, ⇔ są dwuargumentowe. Nazywamy je, odpowiednio: implikacją, alternatywą, koniunkcją i równoważnością. W wypadku implikacji jej pierwszy argument nazywamy poprzednikiem a drugi następnikiem. Nawiasy: ) — nawias prawy, ( — nawias lewy, pełnią funkcję znaków interpunkcyjnych. Znaki te w naszym języku logiki zdań są niezbędne dla jednoznacznego zapisu wyrażeń tego języka. Zwykle w tym celu, aby napis był bardziej czytelny stosuje się też nawiasy innych kształtów: ], [; }, {. Znaczenie, czyli sposób rozumienia poszczególnych spójników będzie określone przez reguły semantyczne. Reguły te podamy w związku z definicją prawdziwości zdania w modelu. Dla zdefiniowania wyrażeń (poprawnie zbudowanych) znajomość znaczenia nie jest konieczna. Z elementów powyżej opisanego słownika (alfabetu) budujemy zdania. Zdania są jedynymi poprawnie zbudowanymi wyrażeniami języka logiki zdań. Przypomnijmy, że ciąg to funkcja ze zbioru liczb naturalnych. Zamiast f (n) pisze się fn , a zwykle an . Wartości tej funkcji, an , to wyrazy ciągu. Ciąg jest skończony wtedy i tylko wtedy, gdy liczba jego wyrazów jest równa pewnej liczbie naturalnej n, czyli gdy jest to funkcja ze zbioru {1, 2, . . . , n}. Niech A∗ będzie zbiorem wszystkich i tylko skończonych ciągów elementów A. Definicja 1.1 (zdania). Niech α i β będą dowolnymi skończonymi ciągami symboli alfabetu języka logiki zdań, czyli α i β są elementami A∗ (α, β ∈ A∗ ). 1. litery zdaniowe są zdaniami; 2. jeżeli α jest zdaniem, to ¬ α jest zdaniem; 3. jeżeli α, β są zdaniami, to (α ⇒ β), (α ∨ β), (α ∧ β), (α ⇔ β) są zdaniami;
1.2. JĘZYK LOGIKI ZDAŃ
17
4. nie ma innych zdań oprócz liter zdaniowych oraz tych wyrażeń, które są skończonymi ciągami symboli spełniającymi warunki 2 i 3. Warunek 4 można zastąpić warunkiem równoważnym: 5. zbiór zdań jest najmniejszym zbiorem skończonych ciągów symboli spełniających warunki 1–34 . Znaczenie warunku 4 (5) można zilustrować przykładem. Ciąg p1 ¬ p2 nie jest zdaniem właśnie na mocy tego warunku. Nie można bowiem tego ciągu skonstruować według warunków 1–3. Same warunki 1–3 nie pozwalałyby na takie stwierdzenie. Przykład 1.4. Zdaniami są: p0 , p4 , p5 , ¬p0 , (p5 ∨ p0 ), (¬(p0 ∧ p5 ) ∨ p0 ), (((p0 ⇒ p1 ) ∧ p2 ) ⇔ (p3 ∨ (p1 ⇒ ¬ p2 ))). Zdaniami nie są: (p0 ), ¬(p0 )¬(p5 ) ∨ (p0 ), ¬(p0 p5 ) ∨ (p0 ), (p0 ∨ p1 ) ∧ (p0 ∨ p1 ) ∧ (p0 ∨ p1 ) ∧ . . . ° Znaczenie zdań określone będzie przez znaczenie liter zdaniowych oraz przez znaczenie spójników. Podane zostanie w definicji prawdziwości zdania w modelu. Definicja 1.2 (spójnika głównego). Spójnikami głównymi w zdaniach: ¬α, (α ⇒ β), (α ∨ β), (α ∧ β), (α ⇔ β) są spójniki, odpowiednio: implikacji, alternatywy, koniunkcji i równoważności. Zdania te skrótowo określamy jako, odpowiednio: negację, implikację, alternatywę, koniunkcję i równoważność. Notacja łukasiewiczowska W wypadku, gdy wszystkie spójniki są prefiksami (czyli gdy pisane są przed swoimi argumentami) lub gdy wszystkie spójniki są sufiksami (czyli gdy pisane są po swoich argumentach) możliwe jest wyeliminowanie nawiasów. 4
Najmniejszy zbiór spełniający jakieś warunki to taki i tylko taki zbiór, którego każdy podzbiór właściwy nie spełnia tych warunków lub — inaczej — taki i tylko taki zbiór, który jest podzbiorem każdego zbioru spełniającego te warunki. A ⊆ B (A jest podzbiorem B) wtedy i tylko wtedy, gdy każdy element A jest elementem B. W szczególności każdy zbiór jest swoim podzbiorem. Zbiór A jest podzbiorem właściwym B wtedy i tylko wtedy, gdy A jest podzbiorem B i jest różny od B.
18
ROZDZIAŁ 1. LOGIKA ZDAŃ
Notację prefiksową języka rachunku zdań wynalazł Jan Łukasiewicz5 . Taką notację wykorzystuje się w informatyce. Słownik 1. p0 , p1 , . . . , 2. N 3. C, A, K, E; p0 , p1 , . . . , to litery zdaniowe. N to jednoargumentowy spójnik negacji zaś C, A, K, E są dwuargumentowymi spójnikami, odpowiednio: implikacji, alternatywy, koniunkcji i równoważności. Wszystkie one są prefiksami. Definicja 1.3 (zdania). Niech α i β będą dowolnymi ciągami symboli. 1. litery zdaniowe są zdaniami; 2. jeżeli α jest zdaniem, to N α jest zdaniem; 3. jeżeli α, β są zdaniami, to C αβ, Aαβ, K αβ, E αβ są zdaniami. 4. nie ma innych zdań oprócz liter zdaniowych oraz tych wyrażeń, które można w skończonej ilości kroków skonstruować wedle punktów 1–3. Zdaniu: (p0 ∨p1 )∧p0 odpowiada zdanie w notacji Łukasiewicza: KAp0 p1 p0 a zdaniu: p0 ∨ (p1 ∧ p0 ) — Ap0 Kp1 p0 .
1.2.3
Język formalny
Język rachunku zdań jest przykładem języka formalnego. Zbiór wszystkich wyrażeń poprawnie zbudowanych języka formalnego zostaje ustalony decyzją twórcy tego języka. Zazwyczaj podaje się: • zbiór symboli (alfabet, słownik), • reguły konstrukcji wyrażeń (reguły syntaktyczne). 5
Notacja łukasiewiczowska w literaturze anglojęzycznej określana jest jako polska (Polish notation). Podobna idea wykorzystana jest w notacji sufiksowej (reverse Polish notation).
1.2. JĘZYK LOGIKI ZDAŃ
19
Przykład 1.5. Niech wyrażeniem poprawnie zbudowanym będzie każdy skończony ciąg symboli: ∇, ♦ rozpoczynający się od symbolu: ∇. Taki język jest językiem formalnym. ° Przykład 1.6. Niech wyrażeniem poprawnie zbudowanym będzie każdy sensowny ciąg elementów słownika języka polskiego. W tym wypadku o poprawności budowy przesądzają reguły semantyczne. Tak określony język nie jest więc językiem formalnym. ° Definicja 1.4 (słowa nad alfabetem). Niech A będzie zbiorem. Nazywać będziemy go alfabetem. Elementy A∗ , czyli skończone ciągi elementów A to słowa nad alfabetem A. Niech teraz α, β, . . . będą dowolnymi skończonymi ciągami elementów alfabetu (słowami). Definicja 1.5 (długości słowa, | |). Długość słowa α, |α|, to liczba wystąpień elementów alfabetu w ciągu α. Definicja 1.6 (konkatenacji, ˆ). Konkatenacja, ˆ , słów α[= (a1 , a2 , . . . , an )] i β[= (b1 , b2 , . . . , bm )], ai ∈ A, bi ∈ B, to słowo αˆβ powstałe przez napisanie ciągu β bezpośrednio po ostatnim wyrazie ciągu α, czyli słowo: (a1 , a2 , . . . , an , b1 , b2 , . . . , bm ). Operacja konkatenacji jest łączna, czyli: (αˆβ)ˆγ = αˆ(βˆγ). Łączność operacji konkatenacji zwalnia nas z użycia nawiasów do wskazywania argumentów tej operacji: w jakiejkolwiek kolejności wykonamy operację konkatenacji (zachowując porządek argumentów) uzyskamy ten sam rezultat. Definicja 1.7 (słowa pustego, ε). Słowo puste ε to ciąg, którego liczba wyrazów równa jest 0, czyli |ε| = 0. Słowo puste jest elementem neutralnym operacji konkatenacji, czyli εˆα = α, αˆε = α. A+ to zbiór wszystkich i tylko niepustych ciągów elementów A, czyli A+ = A∗ \ {ε}.
20
ROZDZIAŁ 1. LOGIKA ZDAŃ
Definicja 1.8 (podsłowa). Słowo α jest podsłowem słowa β wtedy i tylko wtedy, gdy istnieją słowa γ i δ takie, że β = γˆαˆδ. Definicja 1.9 (podsłowa właściwego). α jest podsłowem właściwym słowa β(= γˆαˆδ) wtedy i tylko wtedy, gdy γ = 6 ε lub δ 6= ε, bądź — co na jedno wychodzi — gdy γˆδ 6= ε. Definicja 1.10 (słowa początkowego). α jest słowem początkowym, inaczej prefiksem słowa β(= γˆαˆδ) wtedy i tylko wtedy, gdy γ = ε. Definicja 1.11 (słowa końcowego). α jest słowem końcowym, inaczej sufiksem słowa β(= γˆαˆδ) wtedy i tylko wtedy, gdy δ = ε. Zwykle konkatenację słów, gdy nie prowadzi to do niejasności, zapisuje się bez użycia symbolu konkatenacji, czyli zamiast np. αˆβ pisze się po prostu: αβ. Definicja 1.12 (produkcji, ::=). Produkcją lub regułą przepisywania słów α i β jest: α ::= β co czytamy: α jest zastępowane przez β. α to poprzednik produkcji a β to następnik produkcji. γ::=δ
Definicja 1.13 (wyprowadzenia ze słowa). α −→ β, czyli słowo β jest wyprowadzeniem ze słowa α na podstawie produkcji γ ::= δ wtedy i tylko wtedy, gdy istnieją takie α1 i α2 , że • α = α1 γα2 , • β = α1 δα2 . Poprzednik produkcji może być w kilku miejscach podsłowem danego słowa. Wynik operacji wyprowadzania ze słowa zależy więc od tego, za które wystąpienie poprzednika (jako podsłowa danego słowa) wpisujemy następnik produkcji. Wynik operacji zastępowania nie jest więc określony jednoznacznie. Definicja 1.14 (podstawienia). Produkcja, której poprzednik jest symbolem (słowem o długości 1) to podstawienie. Słowo α powstałe ze słowa β przez podstawienie a ::= γ, gdzie a ∈ A, w miejsce każdego wystąpienia symbolu a to słowo β[a ::= γ].
1.2. JĘZYK LOGIKI ZDAŃ
21
Definicja 1.15 (języka). Językiem L nad alfabetem A jest dowolny podzbiór zbioru A∗ .
Zdania są słowami nad alfabetem A języka rachunku zdań. Na słowach definiowana jest operacja konkatenacji. Zbiór wyrażeń poprawnie zbudowanych, w tym wypadku zdań, jest podzbiorem A∗ , czyli jest językiem formalnym. Warto zauważyć, że z punktu widzenia możliwości konstrukcji wyrażeń nie ma znaczenia, czy alfabet ma przeliczalnie nieskończenie wiele elementów (tyle, ile jest liczb naturalnych), czy też ma dwa elementy. Niech A ma przeliczalnie nieskończenie wiele elementów. Niech B ma dwa elementy, czyli niech to będzie np. zbiór {0, 1}. Istnieje wzajemnie jednoznaczne przyporządkowanie elementów zbioru A∗ i podzbioru zbioru B ∗ , którego elementami są skończone ciągi zer i jedynek takie, że ani pierwszy, ani ostatni wyraz ciągu nie jest zerem oraz jeżeli zero jest k-tym wyrazem ciągu, to nie jest nim wyraz (k+1)-szy, czyli inaczej mówiąc zero nigdy nie następuje po zerze. Takimi ciągami są np. (110111), (1011011101) a nie są nimi np. (011), (100111). Elementy A mogą być ustawione w ciąg a1 , a2 , . . . . Każdemu symbolowi an przyporządkowujemy n-wyrazowy ciąg jedynek. Przyporządkowanie to jest wzajemnie jednoznaczne. Mając ciąg elementów zbioru A przyporządkowujemy mu ciąg elementów zbioru B w taki sposób, że po każdym ciągu jedynek przyporządkowanemu symbolowi, jeżeli nie jest to ostatni symbol rozważanego słowa, piszemy zero. Przyporządkowanie to jest wzajemnie jednoznaczne. Na przykład, wyrazowi (a3 a1 a4 ) przyporządkowny jest ciąg (1110101111). Te ciągi binarne wypełniają rolę, którą mogą pełnić elementy A∗ . Po prostu słowa nad A są kodowane binarnie. Języki zwykle definiuje się rekurencyjnie. W tym celu korzysta się z gramatyki formalnej6 .
6
Idea opisu języka za pomocą gramatyki sięga starożytności. Współczesne studia nad gramatyką, przede wszystkim porównawcze, podjęto na początku XIX wieku. Pojęcie gramatyki jako czegoś na wzór programu, wytwarzającego wyrażenia poprawnie zbudowane ujawnia się z pełną jasnością dopiero w pracach Noama Chomskiego w połowie lat pięćdziesiątych XX wieku.
22
ROZDZIAŁ 1. LOGIKA ZDAŃ
Przykładem takiej gramatyki jest gramatyka bezkontekstowa7 . Gramatyka bezkontekstowa G to czwórka: hΣ, V, XI , Ri, gdzie zbiory Σ i V są rozłączne, czyli Σ ∩ V = ∅, XI jest elementem V , czyli XI ∈ V . Zbiór Σ to alfabet gramatyki G, a jego elementy to symbole końcowe (terminalne) gramatyki G. Elementy V to symbole niekońcowe (nieterminalne) lub inaczej zmienne gramatyki G. Wyróżniony symbol XI to symbol początkowy (startowy) gramatyki G. R to zbiór reguł przepisywania, czyli produkcji. O regule przepisywania przyjmuje się, że jest postaci: v ::= α, gdzie v ∈ V , czyli v jest symbolem nieterminalnym a α jest niepustym słowem nad alfabetem złożonym z elementów symboli terminalnych i nieterminalnych, czyli α ∈ (Σ ∪ V )+ . Wszystkie produkcje o poprzedniku v i następnikach α1 , . . . , αn zapisujemy następująco8 : v ::= α1 | . . . |αn . Tu symbol „|” rozumiemy jak alternatywę (nierozłączną) i czytamy tak jak alternatywę, czyli: lub. Język klasycznego rachunku zdań określamy następująco: Σ = {p, 0 } ∪ {¬, ∧, ∨, ⇒, ⇔} ∪ { ), ( } V = {zdanie, litera-zdaniowa} XI = zdanie R = {zdanie ::= litera-zdaniowa | ¬ zdanie | (zdanie ∧ zdanie) | (zdanie ∨ zdanie) | (zdanie ⇒ zdanie) | (zdanie ⇔ zdanie) litera-zdaniowa ::= p | litera-zdaniowa0 }9 . 7
Wszystkie współcześnie powszechnie używane języki programowania oparte są na gramatyce bezkontekstowej. O ich powszechności przesądzają możliwości specyfikacji i implementacji jak i łatwość uczenia się ich. Języki programowania pojawiły się w początkach lat pięćdziesiątych XX wieku, zastępując jako języki wyższego poziomu uciążliwe programowanie w kodzie maszynowym. Rozwijany od 1954 r. FORTRAN bazował na notacji matematycznej. W 1958 r. John Backus w ramach projektu ALGOL wykorzystał znaną z logiki matematycznej ideę systemów produkcji. Było to rozwiązanie równoważne gramatyce bezkontekstowej. Około 1970 r. bezkontekstowy opis gramatyki stał się standardem dla języków programowania. 8 Jest to notacja zaproponowana przez Backusa, a na szerszą skalę zastosowana przez duńskiego informatyka Naura, redaktora opisu języka ALGOL 60. Stąd jej nazwa: notacja Backusa-Naura. 9 Poszczególne produkcje pisze się w odrębnych wierszach, bez rozdzielania przecinkiem.
1.2. JĘZYK LOGIKI ZDAŃ
23
Dla określenia zbioru wyrażeń poprawnie zbudowanych zbyteczna jest znajomość interpretacji, czyli znaczeń wyrażeń. Język formalny, taki jak język rachunku zdań, mogłaby w pełni przyswoić sobie maszyna, np. komputer. Język formalny jest zwykle tak opisany, że dane wyrażenie poprawnie zbudowane tego języka może być zbudowane, w sensie procesu konstrukcji, w jeden i tylko jeden sposób. Przyporządkowanie językowi interpretacji, czyli sposobu rozumienia jego wyrażeń jest — najogólniej rzecz biorąc — przedmiotem semantyki. Teoria modeli bada związki semantyczne, inaczej mówiąc jest teorią interpretacji. Podanie aparatu logicznego, a więc określenie zależności logicznych ze względu na zasady budowy wyrażeń, czyli ze względu na syntaktykę prowadzi to zagadnień teorii dowodu. Jest to teoria wynikania syntaktycznego. Wyrażenia poprawnie zbudowane — w wypadku języka rachunku zdań — zdania, są przedmiotami abstrakcyjnymi. Reprezentantem wyrażenia poprawnie zbudowanego jest konkretny napis (lub dźwięk). Dwa napisy (dźwięki) mogą być reprezentantami tego samego wyrażenia. Istnienie wyrażenia nie jest uwarunkowane aktualnym istnieniem konkretnych napisów (dźwięków), ani naszymi możliwościami zapisu. Pozwala to mówić zarówno o wyrażeniach, których zapis przekracza fizyczne możliwości człowieka jak i o językach mających nieskończenie wiele wyrażeń. Mówimy tu o możliwości w takim samym sensie, jak w arytmetyce liczb naturalnych — gdzie dysponujemy dziesięcioma cyframi — mówimy, że możemy zapisać nazwę dowolnej liczby naturalnej.
1.2.4
Język a metajęzyk
Język rachunku zdań jest dla nas — gdy uprawiamy logikę — językiem przedmiotowym. Jest to język, o którym mówimy. Język, którym mówimy, a więc język tej książki, to metajęzyk. Oczywiście, metajęzyk sam może być przedmiotem rozważań i wówczas staje się językiem przedmiotowym. Język, którym mówi się o metajęzyku z punktu widzenia pierwotnego języka przedmiotowego jest metametajęzykiem. W ten sposób tworzona może być hierarchia języków. Pojęcia języka przedmiotowego, metajęzyka, metametajęzyka itd. są więc pojęciami relacyjnymi. W metajęzyku tworzy się nazwy wyrażeń językowych biorąc je w cudzysłów. Są to tak zwane nazwy cudzysłowowe. Fałszem jest, że czasownik jest rzeczownikiem. Prawdą zaś jest, że „czasownik” jest rzeczownikiem. Na-
24
ROZDZIAŁ 1. LOGIKA ZDAŃ
zwa „ „czasownik” ” jest bowiem nazwą wyrażenia, które w języku, w którym występuje, jest rzeczownikiem. Jednak nie jest prawdą, że czasownik jest rzeczownikiem. Na przykład „stoi” jest czasownikiem a nie jest rzeczownikiem. Metajęzykiem musimy posługiwać się wszędzie tam, gdzie mówimy o języku. Informatycy mówią o języku programowania. Język, którym to mówią jest metajęzykiem dla tego języka programowania. Nie można mylić języka z metajęzykiem. Ktoś, kto nie rozróżnia języka od metajęzyka postępuje podobnie do kogoś, kto nie rozróżnia między np. krzesłem a słowem „krzesło”. Zgodnie z zasadą ekonomii — o czym była już mowa — użycie cudzysłowów może być pominięte, jeżeli dla osoby/osób, do której/których skierowany jest tekst z kontekstu jest jasne, w jakiej roli występuje wyrażenie, czy w językowej, czy w metajęzykowej. Z powodzeniem moglibyśmy więc napisać: słowo krzesło zamiast: słowo „krzesło”. W języku mówionym wyrażenia te nie różnią się, a jednak można je właściwie rozumieć. Zasady ekonomii nie traktujemy jednak jako nakazu nieliczącego się z pewnymi zwyczajami i przyzwyczajeniami. Z tego powodu preferowane są zapisy drugiego rodzaju. Jednak piszemy: słowo krzesło a nie: słowo „krzesło”. Pisać będziemy mniej nawiasów niż wynikałoby to z definicji zdania. Za zbędne uważamy nawiasy zewnętrzne, czyli zamiast: (α) piszemy: α. Jeżeli spójnik dwuargumentowy s1 wiąże mocniej niż spójnik dwuargumentowy s2 , to zamiast: (αs1 β)s2 γ piszemy: αs1 βs2 γ; podobnie, zamiast: αs2 (βs1 γ) piszemy: αs2 βs1 γ. Przyjmujemy, że spośród spójników dwuargumentowych najmocniej wiąże koniunkcja, następnie alternatywa a po niej implikacja i równoważność. Jeżeli spójniki s1 i s2 wiążą z jednakową mocą, to zamiast αs1 (βs2 γ) możemy pisać αs1 βs2 γ. Jest to tak zwana zasada wiązania na lewo. Zwykle dla
1.2. JĘZYK LOGIKI ZDAŃ
25
większej czytelności pozostawiamy więcej nawiasów niż to wynikałoby z zasad opuszczania nawiasów. Ponadto, można używać nawiasy innych kształtów: {, }; [, ]. Gdy wyrażenie α chcemy ująć w nawias, to piszemy: [α], jeśli w α występują: (, ). Piszemy zaś {α}, gdy w α występują: [, ]. Nasze zasady używania i opuszczania nawiasów nie różnią się w jakiś istotny sposób od zasad znanych z arytmetyki szkolnej. Na użytek definicji zdania przyjęliśmy umowę, że litery greckie „α”, „β”, . . . , ewentualnie z indeksami, oznaczają dowolny ciąg symboli. Teraz odstępujemy od tej umowy. Liter greckich „α”, „β”, . . . będziemy używali — jeżeli nie powiemy inaczej — tylko na oznaczenie zdań. Wyrażenia „α” i np. „¬α” należą do języka, którym mówimy, a nie do języka, o którym mówimy, czyli należą do metajęzyka. Wyrażenia te nie są zdaniami metajęzyka. Są w nim nazwami zdań języka, o którym mówimy (w metajęzyku). Wyrażenia zbudowane wyłącznie z liter „α”, „β”, . . . oraz spójników i nawiasów mogą — jeżeli wcześniej nie jest ustalone do jakiego zdania odnoszą — oznaczać każde zdanie, które można otrzymać przez wpisanie w miejsce poszczególnych liter „α”, „β”, . . . jakichś zdań. O wyrażeniach takich mówimy, że są to schematy zdaniowe. Język, którym mówi się o logice nie różni się istotnie od języka naturalnego, w naszym wypadku polskiego. W zasadzie różnica ta sprowadza się do tego, że jest tu wiele słów — są to terminy specyficzne logiki — których na co dzień nie używamy. Język logiki jest językiem uniwersalnym w tym sensie, że nie zależy od języka narodowego, którym się mówi o logice. Podobnie jak język arytmetyki jest wspólny wszystkim, którzy mówią o arytmetyce, choć każdy mówi o niej jakimś językiem narodowym.
1.2.5
Rekurencyjny charakter definicji zdania
Definicja zdania jest definicją rekurencyjną (indukcyjną). Najogólniej rzecz biorąc ten sposób definiowania polega na wskazaniu pewnej klasy (zbioru) przedmiotów (prostych, atomowych). Może to być klasa skończona, np. jednoelementowa, której jedynym elementem jest „|”; a może to być również jakaś klasa nieskończona, np. jak ma to miejsce w wypadku definicji zdania. Ponadto podane są reguły budowy obiektów złożonych oraz może być wyróżniona pewna klasa przedmiotów, które jedynie służą do «budowy» obiektów złożonych. Przedmioty te nie należą do definiowanej klasy obiektów. W wypadku języka rachunku zdań są nimi spójniki i nawiasy. Reguły bu-
26
ROZDZIAŁ 1. LOGIKA ZDAŃ
dowy obiektów złożonych są pewnego rodzaju przepisami określającymi, jaki dokładnie jeden obiekt powstanie, gdy do budowy zostaną użyte określone obiekty. Np. mając obiekt „|” oraz operację konkatenacji, czyli operację dopisywania symbolu „|” po prawej stronie danego obiektu, możemy skonstruować obiekty: |, ||, |||, . . . . Klasa indukcyjna to najmniejszy zbiór zawierający wszystkie elementy proste oraz wszystkie te przedmioty, które dadzą się zbudować z elementów prostych. Zbiór taki, że zastosowanie reguł konstrukcji do jego elementów daje w wyniku przedmiot będący elementem tego zbioru to zbiór domknięty ze względu na te reguły konstrukcji. Definicja 1.16 (definicji rekurencyjnej, indukcyjnej). W definicji rekurencyjnej (indukcyjnej) wyróżniamy trzy warunki: 1. bazowy (po prostu: baza) lub początkowy — przez podanie nazw wskazane są pewne obiekty, które są elementami definiowanego zbioru; 2. indukcyjny (po prostu: indukcja) — warunek ten określa, jaki dokładnie jeden obiekt powstanie z elementów definiowanego zbioru, jeżeli zastosowana zostanie do nich jedna z reguł konstrukcji; 3. końcowy — warunek ten mówi, że przedmiot jest elementem definiowanego zbioru tylko wówczas, gdy może być skonstruowany z elementów bazowych przez stosowanie reguł konstrukcji. Warunek 3 może być wyrażony równoważnie przez jeden z następujących warunków: 30
Definiowany zbiór jest najmniejszym takim zbiorem, którego elementami są wszystkie elementy bazowe oraz który jest domknięty ze względu na reguły konstrukcji.
300
Definiowany zbiór jest przekrojem wszystkich i tylko takich zbiorów, których elementami są elementy bazowe i które są domknięte ze względu na reguły konstrukcji.
3000 Definiowany zbiór to taki zbiór, którego żaden właściwy podzbiór nie ma jako swych elementów wszystkich elementów bazowych lub nie jest domknięty za względu na reguły konstrukcji.
1.2. JĘZYK LOGIKI ZDAŃ
27
Definicje rekurencyjne (indukcyjne) pozwalają na drodze wnioskowania, określanego jako wnioskowanie przez indukcję (matematyczną) dowodzić własności obiektów spełniających warunki definicji. Liczby naturalne możemy pojąć jako obiekty: |, ||, |||, . . . . Na to, aby dowieść, że każda liczba naturalna ma jakąś własność W wystarczy pokazać — jest to znany ze szkoły średniej schemat wnioskowania — że 1. własność W przysługuje obiektowi: |; oraz 2. jeżeli własność W przysługuje obiektowi α, to przysługuje obiektowi: α|. Podobnie, aby dowieść, że każde zdanie ma jakąś własność W (W jest formułą z jedną zmienną wolną, której zakresem zmienności jest zbiór zdań) wystarczy pokazać, że 1. każdej literze zdaniowej przysługuje własność W , 2. jeżeli α i β mają własność W , to ¬α, α ⇒ β, α ∨ β, α ∧ β, α ⇔ β mają własność W . Warunki 1 i 2 można wyrazić równoważnie, odpowiednio: 3. zachodzi W (α), jeżeli α jest literą zdaniową, 4. jeżeli zachodzi W (α) i W (β), to • W (¬α), • W (αsβ), gdzie s jest jednym z dwuargumentowych spójników. Własności zdań będziemy dowodzić na drodze wnioskowania indukcyjnego. Twierdzenie o poprawności takiego postępowania nosi nazwę zasady indukcji strukturalnej dla rachunku zdań. Warunek 1 (3) to warunek początkowy (bazowy). Warunek 2 (4) to teza indukcyjna. Rzeczywiście, zgodnie z warunkiem początkowym własność W ma każda litera zdaniowa. Z tezy indukcyjnej, czyli warunku 2 (4), dostajemy, że jeżeli własność W mają zdania α i β, to mają ją również zdania złożone z α i β. Stwierdzenie, że własność W mają wszystkie zdania wymaga odwołania się do faktu, że zdaniami są tylko te wyrażenia, które są literami zdaniowymi lub dadzą się z nich skonstruować za pomocą reguł budowy zdań.
28
ROZDZIAŁ 1. LOGIKA ZDAŃ O poprawności takiego postępowania mówi zasada rekurencji strukturalnej. Niech f będzie funkcją określoną na zbiorze zdań L. 1. warunek początkowy: dla dowolnej litery zdaniowej p dana jest wartość f (p), 2. warunek indukcyjny: • wartość f (¬ α) jest określona jednoznacznie przez f (α), • wartość f (αsβ), gdzie s jest jednym ze spójników dwuargumentowych, jest jednoznacznie określona przez f (α) i f (β). Funkcja zdefiniowana zgodnie z podanymi zasadami jest dokładnie jedna.
Dla wykazania, że funkcja f określona jest dla wszystkich zdań korzysta się z tego, że f określona jest dla liter zdaniowych, a na podstawie warunku indukcyjnego, jeżeli jest określona dla α i β, to określona jest dla zdań z nich zbudowanych. Ponieważ zdaniami są tylko litery zdaniowe i wyrażenia otrzymane z liter zdaniowych za pomocą reguł konstrukcji, więc f jest określona dla dowolnego zdania. Dla wykazania, że jest tylko jedna funkcja spełniająca podane warunki, wystarczy zauważyć, że dane zdanie złożone może być tylko w jeden sposób rozczłonowane na części składowe10 . Inaczej mówiąc, wartość f zależy od rozczłonowania zdania. Gdyby dane zdanie mogło być analizowane na różne sposoby, to temu zdaniu mogłyby być przyporządkowane różne wartości. Tym samym funkcja f nie byłaby jedyną, która spełnia warunki zasady rekurencji strukturalnej.
1.2.6
Model i prawdziwość
W modelu każde zdanie proste powinno być bądź prawdziwe, bądź fałszywe. Interpretacja (określenie znaczeń zdań w modelu) polega na przyporządkowaniu poszczególnym zdaniom prostym znaczenia jednego z terminów: „prawda”, „fałsz”. Pomijając nieistotne detale możemy model po prostu utożsamić z jakimś podzbiorem M zbioru S liter zdaniowych. Jeżeli litera zdaniowa pn należy do podzbioru M zbioru S, to będziemy przez to rozumieć, że pn jest prawdziwe w modelu M. Gdy pn nie należy do M, to będziemy 10
Twierdzenie o takim fakcie określane jest jako twierdzenie o rozbiorze.
1.2. JĘZYK LOGIKI ZDAŃ
29
przez to rozumieć, że pn jest fałszywe w modelu M. Prawdziwość i fałszywość zdań złożonych określa się zaś ze względu na prawdziwość i fałszywość zdań składowych. Zamiast mówić, że zdanie jest prawdziwe w modelu będziemy też mówić, że jest spełnione w modelu. Do zapisania, że zdanie α jest prawdziwe w modelu M używać będziemy specjalnego oznaczenia: M |= α. Definicja 1.17 (M |= α). Niech M będzie podzbiorem zbioru S liter zdaniowych (M ⊆ S). α jest prawdziwe (spełnione) w modelu M, M |= α, wtedy i tylko wtedy, gdy: 1. jeżeli α jest literą zdaniową, to M |= α wtedy i tylko wtedy, gdy α ∈ M; 2. jeżeli α jest zdaniem ¬β, to M |= α wtedy i tylko wtedy, gdy nie jest tak, że M |= β; 3. jeżeli α jest zdaniem β ⇒ γ, to M |= α wtedy i tylko wtedy, gdy nie jest tak, że M |= β lub jest tak, że M |= γ; 4. jeżeli α jest zdaniem β ∨ γ, to M |= α wtedy i tylko wtedy, gdy
30
ROZDZIAŁ 1. LOGIKA ZDAŃ M |= β lub M |= γ; 5. jeżeli α jest zdaniem β ∧ γ, to M |= α wtedy i tylko wtedy, gdy M |= β i M |= γ; 6. jeżeli α jest zdaniem β ⇔ γ, to M |= α wtedy i tylko wtedy, gdy (M |= β wtedy i tylko wtedy M |= γ).
Spójniki: ¬, ⇒, ∨, ∧, ⇔ w języku polskim będą odczytywane za pomocą wyrażeń, odpowiednio: „nieprawda, że . . . ”, „ jeżeli . . . , to . . . ”, „ . . . lub . . . ”, „ . . . i . . . ”, „ . . . wtedy i tylko wtedy, gdy . . . ”. Symbole: ¬, ⇒, ∨, ∧, ⇔ są symbolami języka logiki zdań, a więc należą do języka, o którym mówimy. Z punktu widzenia języka, którym mówimy są one pewnego rodzaju przedmiotami, o których się mówi. Symbole te nie należą do języka, którym pisany jest ten tekst. Symboli tych i wyrażeń z nich zbudowanych używamy wyłącznie jako «cytatów», jako «przytoczeń» symboli i wyrażeń języka, o którym mówimy. Nie możemy użyć ich jako wygodnych skrótów dla spójników języka, którym mówimy. Nie możemy więc zastąpić, np. „ jeżeli. . . , to. . . ” i „wtedy i tylko wtedy, gdy” przez, odpowiednio: ⇒, ⇔. W naszym tekście o języku rachunku zdań, symbole i wyrażenia tego języka występują w supozycji materialnej, czyli na oznaczenie samych siebie. Definicja 1.18 (prawdziwości zdania). Zdanie α jest (logicznie) prawdziwe, co oznaczamy: |= α, wtedy i tylko wtedy, gdy α jest prawdziwe we wszystkich modelach; czyli wtedy i tylko wtedy, gdy dla każdego M ⊆ S : M |= α.
1.3. RACHUNEK ZDAŃ
31
Tam, gdzie będzie istniała obawa nieporozumień, że „prawdziwe” (bez odnoszenia do jakiegoś modelu) będzie brane w znaczeniu „prawdziwe w świecie realnym”, zamiast o prawdziwości zdania będziemy mogli mówić o jego logicznej prawdziwości. Naszym celem jest wskazanie czysto syntaktycznych własności zdań prawdziwych, a więc tych własności ich kształtu, budowy, które są charakterystyczne dla zdań prawdziwych we wszystkich modelach. Wyróżnimy pewną klasę zdań, które będziemy określali jako tautologie. Pojęcie tautologii będzie więc pojęciem syntaktycznym.
1.3
Rachunek zdań
Pojęcie zdania logicznie prawdziwego jest pojęciem semantycznym. Przedmiotem semantyki są relacje między znakiem a rzeczywistością (do której odnosi się ten znak). Zależy nam na syntaktycznym scharakteryzowaniu pojęcia zdania logicznie prawdziwego. Przedmiotem syntaktyki są relacje między znakami. Chcemy więc znaleźć takie własności zdań jako wyrażeń, które dałyby się opisać w kategoriach relacji między znakami bez odwoływania się do relacji między znakami a rzeczywistością i które wyróżniałyby zdania logicznie prawdziwe. Interesuje nas wynikanie jako relacja między przesłankami a wnioskiem. Podamy definicję dowodu jako pewnej procedury o charakterze rachunkowym. Reguły dowodu zostaną dobrane tak, aby zdanie miało dowód ze zbioru zdań wtedy i tylko wtedy, gdy z tego zbioru zdanie to rzeczywiście wynika. Podana będzie definicja rzeczywistego, czyli semantycznego wynikania.
1.3.1
Tautologia
Zdanie jest skończonym ciągiem symboli, a więc w jego skład wchodzi skończona ilość liter zdaniowych. Dla każdego zdania można zatem wskazać taki początkowy skończony odcinek ciągu S liter zdaniowych, w którym znajdują się wszystkie litery występujące w tym zdaniu. Niech p0 , p1 , . . . , pn będzie ciągiem liter zdaniowych, wśród których znajdują się wszystkie litery zdaniowe występujące w α. Każdej literze zdaniowej przyporządkowujemy jeden z symboli: F , T . To, czym są te symbole nie jest
32
ROZDZIAŁ 1. LOGIKA ZDAŃ
ważne. Mogą to być np. impulsy elektryczne. O symbolach tych jedynie zakładamy, że są różne. Definicja 1.19 (wartości logicznej). F i T to wartości logiczne 11 . Definicja 1.20 (interpretacji). Niech p0 , p1 , . . . , pn będzie ciągiem liter zdaniowych, wśród których znajdują się wszystkie litery występujące w α. Ciąg: v0 , v 1 , . . . , v n , gdzie vi , 0 ≤ i ≤ n jest jednym z symboli F lub T to interpretacja (zdania α). W ramach logiki zdań interpretacja liter zdaniowych wyczerpuje się więc w określeniu ich wartości logicznej. Definicja 1.21 (wartości logicznej zdania). Wartość logiczną zdania α dla interpretacji v0 , v1 , . . . , vn określamy (rekurencyjnie) następująco: • jeżeli α jest literą zdaniową pm , to wartością logiczną zdania α jest vm ; • wartości logiczne zdań złożonych obliczamy zaś zgodnie z poniżej podanymi tabelkami wartości logicznych: β T F
¬β F T
β T T F F
γ T F T F
β∨γ T T T F
β∧γ T F F F
β⇒γ T F T T
β⇔γ T F F T
Przykład 1.7. Zdanie: p1 ∨ (p3 ∧ ¬p2 ) dla interpretacji: F, T, T, T przyjmuje wartość: T. 11
„F ” jest literą z angielskiego słowa „false” (fałsz), a „T ” — „true” (prawda).
°
1.3. RACHUNEK ZDAŃ
33
Zauważmy, że jedyna istotna różnica formalna pomiędzy określeniem prawdziwości zdań w modelu a definicją wartości zdania polega na tym, że modeli jest nieskończenie wiele. Dokładnie tyle, ile jest podzbiorów zbioru liter zdaniowych, czyli podzbiorów zbioru 2N . Takich podzbiorów jest zaś tyle, ile jest liczb rzeczywistych, czyli c12 . Ilość interpretacji jest zaś skończona. Interpretacji o długości n jest tyle, ile jest n wyrazowych ciągów liter T i F , czyli 2n . Definicja 1.22 (tautologii). Zdanie α jest tautologią, co oznaczamy: ` α, wtedy i tylko wtedy, gdy α dla dowolnej interpretacji v0 , v1 , . . . , vn przyjmuje wartość T . Definicja 1.23 (kontrtautologii). Zdanie α jest kontrtautologią wtedy i tylko wtedy, gdy α dla dowolnej interpretacji przyjmuje wartość F . Pytanie, czy zdanie jest tautologią jest rozstrzygalne. Aby tego dowieść należy wskazać «rachunkową» procedurę, która stosuje się do każdego zdania i która w wypadku każdego zdania po wykonaniu skończonej ilości kroków/operacji pozwoli dać odpowiedź na pytanie, czy zdanie to jest, czy też nie jest tautologią. Twierdzenie 1.1. Problem, czy zdanie jest tautologią jest rozstrzygalny, czyli istnieje metoda, która w skończonej liczbie operacji/kroków umożliwia znalezienie odpowiedzi TAK lub NIE na pytanie, czy dane zdanie klasycznej logiki zdań jest tautologią. Dowód. Niech α będzie zbudowane z n różnych liter zdaniowych (litery te mogą występować wielokrotnie). Zgodnie z definicją tautologii należy wziąć taki początkowy fragment ciągu liter zdaniowych, w którym mieszczą się wszystkie litery zdaniowe występujące w α. Zauważmy jednak, że dla interpretacji nieróżniących się na miejscach, odpowiadających literom zdaniowym występującym w α, wartości logiczne α też się nie różnią. Pod uwagę wystarczy zatem wziąć wszystkie tylko takie interpretacje, które różnią się na miejscach odpowiadających literom zdaniowym występującym w α. Ponieważ w α występuje dokładnie n różnych liter zdaniowych i mamy dokładnie dwie wartości logiczne, zatem takich interpretacji jest 2n . Problem, jaka wartość logiczna przysługuje zdaniu α dla danej interpretacji jest rozstrzygalny. Wartość logiczną zdania α dla zadanej interpretacji 12
Użyte tu pojęcia i oznaczenia są objaśnione w części poświęconej teorii mnogości.
34
ROZDZIAŁ 1. LOGIKA ZDAŃ
ustalamy w m krokach, gdzie m jest liczbą spójników występujących w zdaniu α. Ilość spójników określamy tak, że każde wystąpienie spójnika (każdy symbol) liczymy osobno. W celu określenia wartości logicznej zdania dla danej interpretacji korzystamy z tabelek wartości logicznych. Szczegóły takiego postępowania opiszemy niżej jako metodę wprost. Definicja 1.24 (metody wprost). W celu znalezienia metodą sprawdzania wprost odpowiedzi na pytanie, czy zdanie jest tautologią: 1. określamy wszystkie możliwe układy wartości logicznych zdań prostych, z których zbudowane jest dane zdanie; porządkujemy je np. alfabetycznie według zasady pi wyprzedza pi+1 a T wyprzedza F ; 2. dla każdego układu wartości pod każdą literą zdaniową podpisujemy wartość logiczną, jaka przysługuje jej dla rozpatrywanego układu; 3. tam, gdzie pod argumentami jakiegoś spójnika znajdują się podpisane wartości logiczne, określamy zgodnie z tabelkami wartość logiczną zdania zbudowanego za pomocą tego spójnika i wartość tę podpisujemy pod tym spójnikiem; postępowanie to kontynuujemy tak długo, aż zostanie podpisana wartość logiczna pod spójnikiem głównym rozpatrywanego zdania; 4. zdanie jest tautologią wtedy i tylko wtedy, gdy dla każdego układu wartości — określonego zgodnie z pkt. 1 — pod spójnikiem głównym tego zdania znajduje się litera T . Przykład 1.8. Zdanie: [p ∧ (p ⇒ q)] ⇒ q jest tautologią. Musimy rozważyć cztery wypadki: {T, T }, {T, F }, {F, T }, {F, F }. I.
[p ∧(p ⇒q )]⇒q T T T T T T T
1.3. RACHUNEK ZDAŃ II.
III.
IV.
35
[p ∧ (p ⇒q )]⇒q T T F F F F T [p ∧ (p ⇒q )]⇒q F F T T T F T [p ∧ (p ⇒q )]⇒q F F F F T F T
°
Zauważmy, że nie jest konieczne za każdym krokiem wypisywanie liter T i F w różnych wierszach. Metodę można stosować pisząc je na jednej linii. Na przykład dla wypadku I mamy: [ p ∧( p ⇒ q )]⇒ q T T T T T T T Znajdowanie odpowiedzi na pytanie, czy zdanie jest tautologią za pomocą metody sprawdzania wprost jest uciążliwe. W praktyce zwykle korzystniej jest stosować metodę sprawdzania niewprost13 . Metoda niewprost, podobnie jak metoda wprost, ma charakter czysto «mechaniczny», tzn. stosując ją do dowolnego zdania postępujemy krok po kroku zgodnie z podanymi regułami. Nie są to jedyne metody tego rodzaju. Taki sam charakter również metoda tablic semantycznych, którą tu opiszemy. Ponadto zauważmy, że zawsze możemy zastosować szczególną procedurę, na jaką zezwala budowa zdania, o które pytamy się czy jest tautologią. 13
Metodę sprawdzania wprost oraz metodę niewprost określa się jako metodę zerojedynkową, a to dlatego, że zwykle stosowano cyfry „1” i „0”, a nie litery „T ” i „F ”.
36
ROZDZIAŁ 1. LOGIKA ZDAŃ
Definicja 1.25 (metody niewprost). W celu sprawdzenia metodą niewprost, czy zdanie jest tautologią postępujemy następująco: 1. pod spójnikiem głównym danego zdania piszemy literę F ; 2. jeżeli pod spójnikiem napisana jest jakaś litera, to rozważamy tyle wypadków (przez powtórzenie danego „rysunku”), ile zgodnie z tabelkami wartości logicznych jest możliwych sposobów podpisania liter T i F pod argumenty tego spójnika; każdy taki wypadek rozważamy oddzielnie; gdy podpisujemy wartość logiczną pod jakąś literą zdaniową, to wartość tę podpisujemy pod każde wystąpienie tej litery zdaniowej; Opisaną procedurę przeprowadzamy dla każdego wypadku z osobna aż do momentu, gdy: (a) pod jakimś spójnikiem lub literą zdaniową pojawią się litery T i F lub (b) wyczerpane zostaną wszystkie możliwości i pod każdą literą znajduje się dokładnie jedna z liter T lub F ; 3. zdanie jest tautologią wtedy i tylko wtedy, gdy w każdym wypadku otrzymanym zgodnie z pkt. 2 stwierdzamy, że pod jakimś spójnikiem lub jakąś literą zdaniową podpisane zostały obie litery T i F . Przykład 1.9. Zdanie: (p ⇒ q) ⇒ (¬p ⇒ ¬q) nie jest tautologią. (p ⇒q )⇒(¬p ⇒¬ q ) F T F T F F T F T T Inne przykłady zastosowania metody niewprost znajdujemy poniżej.
°
1.3. RACHUNEK ZDAŃ
37
Przykład 1.10. Niech αn będzie zdaniem: (. . . (p ⇒ p) ⇒ p) . . . ) ⇒ p, w którym litera zdaniowa p występuje dokładnie n razy. Zdanie to jest tautologią wtedy i tylko wtedy, gdy n jest liczbą parzystą. Dowód. Niech αn to zdanie o budowie: (. . . (p ⇒ p) ⇒ p) . . . ) ⇒ p, w którym litera p występuje dokładnie n razy. Dowodzimy przez indukcję ze względu na budowę zdania αn . W wypadku n = 1 mamy, że liczba wystąpień nie jest parzysta a zdanie α1 (= p) nie jest tautologią, zatem zdanie α1 jest tautologią wtedy i tylko wtedy, gdy liczba wystąpień litery p jest liczbą parzystą. Założenie indukcyjne. Niech dla i(≤ k) zdanie αi będzie tautologią wtedy i tylko wtedy, gdy i będzie liczbą parzystą. TEZA INDUKCYJNA Zdanie αk+1 jest tautologią wtedy i tylko wtedy, gdy k + 1 jest liczbą parzystą. Udowodnimy dwa zdania: 1. Jeżeli αk+1 jest tautologią, to k + 1 jest liczbą parzystą. 2. Jeżeli k + 1 jest liczbą parzystą, to αk+1 jest tautologią. Dowód tezy 1. Niech αk+1 będzie tautologią. Ponieważ jest to zdanie αk ⇒ p, zatem αk nie jest tautologią. Na podstawie założenia indukcyjnego k nie jest liczbą parzystą. Z tego mamy, że k + 1 jest liczba parzystą. Dowód tezy 2. Niech teraz k + 1 będzie liczba parzystą. Z tego mamy, że k − 1 jest liczbą parzystą. Na podstawie założenia indukcyjnego αk−1 jest tautologią. Zdanie αk+1 to zdanie (αk−1 ⇒ p) ⇒ p. Korzystając z tego, że αk−1 jest tautologią stwierdzamy, że αk+1 jest tautologią.
1.3.2
Wybrane tautologie klasycznej logiki zdań
Rozważymy teraz przykłady tautologii. Będą to tautologie najbardziej podstawowe i najprostsze, więc odnoszące do podstawowych zasad rozumowania.
38
ROZDZIAŁ 1. LOGIKA ZDAŃ 1. [(¬p ⇒ q) ∧ (¬p ⇒ ¬q)] ⇒ p Sprawdzenie metodą niewprost: [(¬p ⇒q )∧(¬p ⇒¬ q )]⇒p F T F T T F F T F T T T T T T T T T T T T F F Zdanie: [(¬p ⇒ q) ∧ (¬p ⇒ ¬q)] ⇒ p jest tautologią. 2. (p ⇔ q) ⇔ [(p ⇒ q) ∧ (q ⇒ p)] Sprawdzenie metodą wprost: (p ⇔q )⇔[(p ⇒q )∧(q ⇒p )] T T T T T T T T T T T T (p ⇔q )⇔[(p ⇒q )∧ (q ⇒p )] T F T F F T F F T F F T (p ⇔q )⇔[(p ⇒q )∧ (q ⇒p )] F T F T T F F T F F F T
1.3. RACHUNEK ZDAŃ
39
(p ⇔q )⇔[(p ⇒q )∧(q ⇒p )] F F F F F F T T T T T T Zdanie: (p ⇔ q) ⇔ [(p ⇒ q) ∧ (q ⇒ p)] jest tautologią. 3. (p ⇒ q) ⇒ (¬q ⇒ ¬p) Sprawdzenie metodą niewprost: (p ⇒q )⇒(¬q ⇒¬ p ) F T F T T F T F T T T F F Zdanie: (p ⇒ q) ⇒ (¬q ⇒ ¬p) jest tautologią. 4. (¬q ⇒ ¬p) ⇒ (p ⇒ q) Sprawdzenie metodą niewprost: (¬q ⇒¬ p )⇒(p ⇒q ) F T F T T F F T T T T F F Zdanie: (¬q ⇒ ¬p) ⇒ (p ⇒ q)
40
ROZDZIAŁ 1. LOGIKA ZDAŃ jest tautologią. 5. ¬(p ⇒ q) ⇒ (p ∧ ¬q) Sprawdzenie metodą niewprost: ¬(p ⇒q )⇒(p ∧ ¬q ) F T F F F T F F T F F T F T T Zdanie:
¬(p ⇒ q) ⇒ (p ∧ ¬q)
jest tautologią. 6. (p ∧ ¬q) ⇒ ¬(p ⇒ q) Sprawdzenie metodą niewprost: (p ∧¬q )⇒¬ (p ⇒q ) F T F T T T T F T T T F F Zdanie:
(p ∧ ¬q) ⇒ ¬(p ⇒ q)
jest tautologią. Na podstawie powyższych tautologii można zauważyć, że tautologiami są również: 7. (p ⇔ q) ⇔ [(p ⇒ q) ∧ (¬p ⇒ ¬q)] 8. (p ⇔ q) ⇔ [(¬q ⇒ ¬p) ∧ (¬p ⇒ ¬q)]
1.3. RACHUNEK ZDAŃ
41
9. ¬(p ⇒ q) ⇔ (p ∧ ¬q) Tautologią jest także 10. (p ⇔ q) ⇔ [¬(p ∧ ¬q) ∧ ¬(¬p ∧ q)] Tautologią zaś nie jest: 11. (p ⇔ q) ⇔ [(p ⇒ q) ∧ (¬q ⇒ ¬p)].
1.3.3
Tablice semantyczne
Metoda zero-jedynkowa pozwala w wypadku dowolnego zdania rozstrzygnąć, czy jest ono tautologią, czy też nie jest. Jest to jednak metoda, która wymaga wykonania bardzo wielu operacji. Zrozumiałe jest więc poszukiwanie bardziej efektywnych sposobów znajdowania odpowiedzi na pytanie, czy zdanie jest tautologią. Jednym z nich jest metoda tablic semantycznych. Metoda ta, w odróżnieniu od metody zero-jedynkowej, ma zastosowanie — oczywiście, po stosownym uzupełnieniu — w rachunku predykatów. Oprócz logiki klasycznej wykorzystywana jest także w innych logikach, jak np. logiki modalne i logika intuicjonistyczna. Metoda tablic semantycznych ma jednak przewagę dydaktyczna nad metodą nie tylko z powodu uniwersalności, odwołując się do intuicji przestrzennej jest również łatwiejsza w zrozumieniu. Podane zostaną reguły budowy pewnych konstrukcji, które są rysunkiem schematycznym drzewa postawionego pniem do góry. Konstrukcje te będziemy nazywali tablicami semantycznymi. Górę drzewa tworzy jego korzeń. Na dole są liście. Odcinki łączące korzeń z liśćmi to gałęzie. Drzewo, które ma więcej niż jedną gałąź, rozdziela się, rozgałęzia. Drzewo ma tyle gałęzi, ile ma liści. Odcinek powyżej rozgałęzień to pień. Definicja 1.26 (tablicy semantycznej). Tablica semantyczna to drzewo ze zdaniami. Zdanie może znajdować się po lewej bądź po prawej stronie gałęzi. Zdania znajdujące się na pniu znajdują się na każdej gałęzi. Definicja 1.27 (relacji leżenia poniżej). Niech α i β będą różnymi napisami (napis α różni się od napisu β miejscem, lecz niekoniecznie kształtem). Zdanie α leży poniżej zdania β wtedy i tylko wtedy, gdy od zdania β można „przejść” do zdania α poruszając się odcinkami wyłącznie w dół drzewa. Stosunek leżenia poniżej jest więc tego rodzaju, że jeżeli α leży poniżej β, a β leży poniżej γ, to α leży poniżej γ (czyli, stosunek ten jest przechodni).
42
ROZDZIAŁ 1. LOGIKA ZDAŃ
Definicja 1.28 (gałęzi sprzecznej). Gałąź jest sprzeczna (zamknięta) wtedy i tylko wtedy, gdy po obu stronach, prawej i lewej, odcinków wskazujących stosunek leżenia poniżej znajduje się jakieś zdanie α, czyli na tej gałęzi po każdej ze jej stron znajdują się, przynajmniej po jednym, równokształtne napisy. Fakt, że gałąź jest sprzeczna zaznacza się pisząc kreskę poziomą na końcu tej gałęzi (na poziomie najniżej leżącego zdania). Definicja 1.29 (gałęzi otwartej). Gałąź, która nie jest zamknięta, jest otwarta. Definicja 1.30 (tablicy zamkniętej). Tablica jest zamknięta wtedy i tylko wtedy, gdy zamknięte są wszystkie gałęzie składające się na tę tablicę. Definicja 1.31 (tablicy otwartej). Tablica, które nie jest zamknięta, jest otwarta. Będziemy mieli dwa rodzaje reguł. Takie, które wymagają tylko dopisania jednego odcinka pod każdą gałęzią, na której znajduje się badane zdanie; oraz takie, które wymagają dopisania dwóch odcinków pod każdą gałęzią, na której znajduje się badane zdanie. Te ostatnie reguły powodują rozgałęzienie. W wypadku metody zero-jedynkowej wprost postępujemy „z dołu do góry” — przypisujemy wartości literom zdaniowym, a następnie obliczamy wartość logiczną zdania. Metoda tablic semantycznych oparta jest na strategii „z góry do dołu” — rozpoczynamy od wartości logicznej zdania, dochodząc do wartości logicznych liter zdaniowych, czyli postępujemy tak jak w wypadku metody zero-jedynkowej niewprost. Reguły tworzenia tablic semantycznych są regułami analitycznymi — zdaniu złożonemu przyporządkowują jego części składowe. Zaczynamy zawsze od spójnika głównego. Zdanie składowe może mieć wartość T lub F . W zależności od tego, piszemy je po, odpowiednio, lewej lub prawej stronie odcinka. Dla każdego spójnika potrzebujemy dwóch reguł: jedna mówi jak postępować ze zdaniem znajdującym się po lewej, a druga jak postępować ze zdaniem znajdującym się po prawej stronie gałęzi. Będziemy więc odróżniali reguły lewostronne (L) i prawostronne (P ). Będziemy mieli zatem reguły: ¬L, ¬P , ∧L, ∧P , ∨L, ∨P , ⇒ L, ⇒ P , ⇔ L, ⇔ P . Fakt zastosowania reguły do danego zdania zaznaczać będziemy pisząc przy tym zdaniu X. Zdań oznaczonych X nie bierze się pod uwagę w dalszej konstrukcji drzewa; informacja w nich zawarta została wykorzystana do rozbudowy drzewa. Zdania oznaczone X to zdania martwe, zdania nieoznakowane tak to zdania żywe.
1.3. RACHUNEK ZDAŃ
43
Definicja 1.32 (tablicy zakończonej). Tablica jest zakończona wtedy i tylko wtedy, gdy jest (a) zamknięta lub (b) jedynymi żywymi zdaniami na niej są litery zdaniowe. Konstrukcję tablicy prowadzimy tak długo, aż otrzymamy tablicę zamkniętą lub gdy jedynymi żywymi zdaniami będą litery zdaniowe. W wypadku logiki zdań, liczba elementów tablicy zawsze będzie skończona. Ponadto, tablica będzie binarna, tzn. rozgałęzienie dokonuje się na dokładnie dwie gałęzie. REGUŁY ¬ αX
¬L
.. . α Reguła stosuje się do zdania ¬ α, znajdującego się po lewej stronie gałęzi. Ta strona reprezentuje wartość T . Jeśli zdanie ¬ α ma wartość T , to jaką wartość ma α? Oczywiście, α ma wartość F . Zatem piszemy α po prawej stronie na każdej już istniejącej otwartej gałęzi, znajdującej się poniżej ¬ α (jako napisu). ¬ αX
¬P .. . α
Reguła ta stosuje się do zdania ¬ α, znajdującego się po prawej stronie gałęzi. Strona ta reprezentuje wartość F . Jeśli zdanie ¬ α ma wartość F , to jakie jest zdanie α? Oczywiście, zdanie α ma wartość T . Zatem piszemy α po lewej stronie na każdej już istniejącej otwartej gałęzi, znajdującej się poniżej ¬ α (jako napisu). ∧L
α ∧ βX .. . α β
44
ROZDZIAŁ 1. LOGIKA ZDAŃ
Reguła ta stosuje się do zdania α ∧ β, znajdującego się po lewej stronie gałęzi. Zdanie α ∧ β ma wartość T , a więc zarówno α jak i β mają wartość T . Oba te zdania, α i β, piszemy więc jedno pod drugim na przedłużeniu drzewa po lewej stronie każdej otwartej gałęzi, znajdującej się poniżej α ∧ β (jako napisu). α ∧ βX
∧P .. . α
β
Reguła ta stosuje się do zdania α ∧ β, znajdującego się po prawej stronie gałęzi. Strona ta reprezentuje wartość F . Zdanie α ∧ β ma wartość F , gdy α ma wartość F lub gdy β ma wartość F . W celu zapisania tego faktu do każdej już istniejącej otwartej gałęzi, znajdującej się poniżej zdania α ∧ β (jako napisu) dopisujemy dwie gałęzie. Po prawej stronie na jednej piszemy α, a na drugiej β. ∨L
α ∨ βX .. . α
β
Reguła ta stosuje się do zdania α ∨ β, znajdującego się po lewej stronie gałęzi. Zdanie takie ma wartość T , zatem wartość T ma zdanie α lub wartość T przysługuje zdaniu β. W celu zapisania tego faktu do każdej już istniejącej otwartej gałęzi, znajdującej się poniżej α ∨ β (jako napisu), dopisujemy dwie gałęzie. Po lewej stronie na jednej piszemy α, a na drugiej β. α ∨ βX
∨P .. .
α β Reguła ta stosuje się do zdania α ∨ β, znajdującego się po prawej stronie gałęzi. Zdanie takie ma wartość F , zatem wartość F przysługuje zdaniu α
1.3. RACHUNEK ZDAŃ
45
i wartość F przysługuje zdaniu β. Zatem po prawej stronie na każdej już istniejącej otwartej gałęzi, znajdującej się poniżej α∨β (jako napisu), piszemy jedno pod drugim α i β. α ⇒ βX
⇒L
.. . α
β
Reguła ta stosuje się do zdania α ⇒ β, znajdującego się po lewej stronie gałęzi. Zdanie takie ma wartość T , zatem α ma wartość F lub β ma wartość T . Nasze drzewo będzie się więc rozgałęziać. Do każdej już istniejącej otwartej gałęzi, znajdującej się poniżej α ⇒ β (jako napisu), dopisujemy dwie gałęzie. Po prawej stronie jednej z nich piszemy α, a po lewej stronie drugiej piszemy β. α ⇒ βX
⇒P .. . α
β Reguła ta stosuje się do zdania α ⇒ β, znajdującego się po prawej stronie gałęzi. Zdanie takie ma wartość F , zatem α ma wartość T , a β ma wartość F . Na każdej otwartej gałęzi, znajdującej się poniżej α ⇒ β (jako napisu), piszemy po lewej stronie α, a po prawej β. ⇔L
α ⇔ βX .. . α β
α β
Reguła ta stosuje się do zdania α ⇔ β, znajdującego się po lewej stronie gałęzi. Zdanie takie ma wartość T , zatem wartość T przysługuje zarówno zdaniu α jak i zdaniu β lub wartość F mają zdania α i β. Drzewo będzie się więc rozgałęziać. Do każdej już istniejącej otwartej gałęzi, znajdującej
46
ROZDZIAŁ 1. LOGIKA ZDAŃ
się poniżej α ⇔ β (jako napisu), dopisujemy dwie gałęzie. Po lewej stronie jednej z nich piszemy jedno pod drugim α i β i tak samo po prawej stronie drugiej z nich. α ⇔ βX
⇔P .. . α
α β
β
Reguła ta stosuje się do zdania α ⇔ β, znajdującego się po prawej stronie gałęzi. Zdanie takie ma wartość F , zatem zdaniu α przysługuje wartość T , a zdaniu β przysługuje wartość F lub odwrotnie, zdanie α ma wartość F , a zdanie β ma wartość T . Drzewo będzie się więc rozgałęziać. Do każdej już istniejącej otwartej gałęzi, znajdującej się poniżej α ⇔ β (jako napisu), dopisujemy dwie gałęzie. W wypadku jednej z nich, po lewej stronie piszemy α a po prawej β, a w wypadku drugiej z nich odwrotnie, po prawej piszemy α a po lewej β. Podane reguły są tego rodzaju, że stosują się do dwóch dowolnych skończonych zbiorów zdań: jednego zapisanego po lewej, a drugiego zapisanego po prawej stronie pnia. Konstrukcję uzyskaną dla danych zbiorów zdań nazywamy tablicą semantyczną lub drzewem analitycznym tych zbiorów. Reguły odnoszące się do poszczególnych spójników mogą być stosowane w dowolnej kolejności. Z formalnego punktu widzenia kolejność stosowania reguł nie ma znaczenia, czyli — inaczej mówiąc — odpowiedź na pytanie, czy dla danych zbiorów zdań — jednego zapisanego po lewej a drugiego zapisanego po prawej stronie pnia — drzewo jest zamknięte, nie zależy od tego, w jakiej kolejności stosujemy poszczególne reguły. Od ich kolejności zależy jednak kształt drzewa, w szczególności jedne drzewa mogą być większe (w sensie ilości gałęzi) od innych. Zależy nam na możliwie najmniejszym drzewie. Uzyskaniu takiego drzewa sprzyja stosowanie reguły o charakterze pragmatycznym, a mianowicie: reguły nierozgałęźne stosujemy przed regułami rozgałęźnymi. Mając dwa zbiory zdań, Γ i Σ możemy pytać, czy istnieje interpretacja taka, że wszystkie zdania z Γ mają wartość T , a wszystkie zdania z Σ mają
1.3. RACHUNEK ZDAŃ
47
wartość F . Odpowiedź na to pytanie uzyskamy konstruując tablicę semantyczną. Na początku konstrukcji po lewej stronie piszemy wszystkie zdania z Γ, a po prawej stronie wszystkie zdania z Σ. Jeżeli uzyskamy tablicę zamkniętą, to taka możliwość jest wykluczona. Jeżeli zaś zakończona tablica będzie otwarta, to taka możliwość istnieje. Interpretację, dla której to zachodzi określamy biorąc pod uwagę jedną z otwartych gałęzi. Wszystkim literom zdaniowym znajdującym się na tej gałęzi, jeśli znajdują się po stronie lewej przypisujemy wartość T , a gdy znajdują się po prawej przypisujemy wartość F . Literom zdaniowym, które nie występują na branej pod uwagę gałęzi przypisujemy dowolną z wartości T i F . Dla tak określonej interpretacji wszystkie zdania ze zbioru Γ mają wartość T , a wszystkie zdania ze zbioru Σ mają wartość F . W szczególnym wypadku może być tak, że zbiór Γ jest pusty, a zbiór Σ ma dokładnie jeden element. Pytanie o to, czy może być tak, że wszystkie zdania z Γ mają wartość T , a wszystkie zdania z Σ mają wartość F jest wówczas pytaniem o to, czy możliwa jest interpretacja taka, że zdanie z Σ ma wartość F . Pytanie to jest więc pytaniem o to, czy ten jedyny element Σ jest tautologią. Definicja 1.33 (tautologii). Zdanie α jest tautologią wtedy i tylko wtedy, gdy zamknięta jest tablica semantyczna ze zdaniem α jako zdaniem początkowym znajdującym się po prawej stronie pnia. W wypadku, gdy zbiór Γ jest jednoelementowy, a zbiór Σ jest pusty pytanie o możliwość interpretacji takiej, że wszystkie zdania z Γ mają wartość T , a zdania z Σ mają wartość F jest pytaniem o to, czy zdanie będące jedynym elementem Γ jest kontrtautologią. Definicja 1.34 (kontrtautologii). Zdanie α jest kontrtautologią wtedy i tylko wtedy, gdy zamknięta jest tablica semantyczna ze zdaniem α jako zdaniem początkowym znajdującym się po lewej stronie pnia. Zauważmy, że podane reguły analizy zdań są tego rodzaju, że w wyniku ich zastosowania uzyskujemy zdanie lub zdania prostsze niż zdanie, do którego reguły są stosowane, a ponadto zdanie, do którego zastosowano odpowiednią regułę staje się martwe, czyli nie może być przedmiotem ponownego zastosowania któreś z reguł. Proces budowy tablicy semantycznej zawsze więc będzie mógł być zakończony. W szczególności, w wyniku stosowania reguł otrzymamy litery zdaniowe. Oznacza to nic innego, jak tylko
48
ROZDZIAŁ 1. LOGIKA ZDAŃ
to, że rozstrzygalny jest problem, czy mając skończony zbiór zdań języka rachunku zdań możliwa jest taka interpretacja, żeby każde z tych zdań miało wskazaną dla niego wartość logiczną. Jeżeli zostaną wyczerpane wszystkie możliwości stosowania podanych reguł i tablica jest zamknięta, to taka możliwość jest wykluczona. Jeżeli zaś tablica pozostaje niezamknięta (gdy chociaż jedna gałąź nie jest zamknięta), to wówczas możliwe jest jednoczesne przysługiwanie wskazanych wartości wszystkim zdaniom ze zbioru zdań będącego przedmiotem analizy. Ażeby wskazać interpretację, dla której to ma miejsce, wystarczy wziąć pod uwagę jedną z niezamkniętych gałęzi i literze zdaniowej przypisać wartość T , gdy litera ta znajduje się po lewej stronie, a wartość F gdy litera ta znajduje się po prawej stronie gałęzi. W wypadku liter zdaniowych występujących w zdaniu, a niewystępujących na rozważanej gałęzi, wystarczy wziąć dowolną literę T lub F . Przykład 1.11. PYTANIE Czy tautologią jest zdanie: ((p ∧ (q ∨ r)) ⇒ ((p ∧ q) ∨ (p ∧ r)))? TABLICA SEMANTYCZNA ((p ∧ (q ∨ r)) ⇒ ((p ∧ q) ∨ (p ∧ r)))X (p ∧ (q ∨ r))X
((p ∧ q) ∨ (p ∧ r))X
p
(p ∧ q)X
(p ∧ r)X
(q ∨ r)X
q p
r q
p
q p
r
ODPOWIEDŹ: Zdanie: ((p ∧ (q ∨ r)) ⇒ ((p ∧ q) ∨ (p ∧ r))) jest tautologią.
°
1.3. RACHUNEK ZDAŃ
49
Przykład 1.12. PYTANIE Czy możliwa jest taka interpretacja, aby zdaniu ¬ (p ⇔ q) przysługiwała wartość F w wypadku, gdy zdaniom (p ⇔ ¬ (q ⇔ r)) i r przysługuje wartość T? Problem ten można w sposób równoważny można sformułować następująco: Czy tautologią jest zdanie: (((p ⇔ ¬ (q ⇔ r)) ∧ r) ⇒ ¬(p ⇔ q))? Z tego zdania — jako zdania początkowego konstrukcji — po zastosowaniu właściwych reguł dojdziemy do zdań, które są w treści naszego pytania. TABLICA SEMANTYCZNA ((p ⇔ ¬(q ⇔ r) ∧ r) ⇒ ¬(p ⇔ q))X (p ⇔ ¬(q ⇔ r) ∧ r)X
(¬(p ⇔ q))X
(p ⇔ ¬(q ⇔ r))X r (p ⇔ q)X
p
p
p
q
q
p
p
¬(q ⇔ r) X
(q ⇔ r)
¬(q ⇔ r)X
q
q
r
r
p
¬(q ⇔ r) ¬(q ⇔ r)X q
(q ⇔ r)X q
r
r
ODPOWIEDŹ: Wykluczona jest interpretacja taka, żeby zdaniom (p ⇔ ¬ (q ⇔ r)) oraz r przysługiwała wartość T a zdaniu ¬ (p ⇔ q) przysługiwała wartość F (lub,
50
ROZDZIAŁ 1. LOGIKA ZDAŃ
co jest temu równoważne, zdanie: (((p ⇔ ¬ (q ⇔ r)) ∧ r) ⇒ ¬ (p ⇔ q)) jest tautologią).
°
Przykład 1.13. PYTANIE Czy tautologią jest zdanie: ((p ⇒ q) ⇒ (¬ p ⇒ ¬ q))? TABLICA SEMANTYCZNA X
(p ⇒ q)
X
(¬p) q
p
((p ⇒ q) ⇒ (¬p ⇒ ¬q))X (¬p ⇒ ¬q)X (¬q)X p q
ODPOWIEDŹ: Zdanie: ((p ⇒ q) ⇒ (¬ p ⇒ ¬ q)) nie jest tautologią. Przyjmuje ono wartość F dla takiej interpretacji, gdy p przyjmuje wartość F a q wartość T . ° Metoda tablic semantycznych zwykle jest sprawniejsza niż metoda zerojedynkowa wprost. Tak czy owak, liczba operacji rośnie wykładniczo w zależności od długości zdania. Chociaż problem, czy zdanie jest tautologią jest rozstrzygalny, to jednak nie jest on praktycznie rozstrzygalny w tym sensie, że w wypadku odpowiednio długich zdań oczekiwanie na wynik traci sens w perspektywie nie tylko życia człowieka. Metoda zero-jedynkowa jest algorytmem, działającym w czasie wykładniczym. Oznacza to np., że gdyby wykonanie jednej operacji trwało jeden chronom (10−43 s.), to wykonanie 2n operacji dla n = 200 przekracza czas życia człowieka, a dla n = 500 przekracza wiek wszechświata. Podzielenie zadania i wykonywanie go przez wiele komputerów też sprawy nie rozwiązuje. Zawsze można wskazać takie n, żeby mimo wykorzystania wszystkich istniejących maszyn czas wykonania zadania przekraczał z góry zadaną granicę. Tradycyjnie problem obliczeniowy
1.3. RACHUNEK ZDAŃ
51
uważa się za praktycznie rozwiązywalny, gdy istnieje stała k taka, że dla n danych algorytm wymaga wykonania co najwyżej nk operacji. O takich algorytmach mówi się, że działają w czasie wielomianowym. Jak na razie nie udało się znaleźć tego rodzaju algorytmu dla rozstrzygania, czy dane zdanie jest tautologią.
1.3.4
Tautologia a zdanie logicznie prawdziwe
Nim przystąpimy do dowodu twierdzenia o pełności udowodnijmy przydatny lemat. Lemat 1.2. Niech vM0 , vM1 , . . . , vMn będzie interpretacją taką, że vMm = T wtedy i tylko wtedy, gdy pm jest elementem M (pm ∈ M), czyli vMm = F wtedy i tylko wtedy, gdy pm nie jest elementem M (pm 6∈ M). M |= α wtedy i tylko wtedy, gdy α dla interpretacji vM0 , vM1 , . . . , vMn przyjmuje wartość T. Dowód. Dowodzić będziemy przez indukcję ze względu na długość zdania. Niech α będzie zdaniem, którego wszystkie litery zdaniowe znajdują się wśród (n + 1) liter: p0 , p1 , . . . , pn . Weźmy dowolny model M. Niech vM0 , vM1 , . . . , vMn będzie interpretacją spełniającą założenia lematu. W wypadku, gdy α jest literą zdaniową, to zgodnie z określeniem interpretacji vM0 , vM1 , . . . , vMn stwierdzamy, że M |= α wtedy i tylko wtedy, gdy α przyjmuje wartość T . Założenie indukcyjne. Niech 1. M |= β wtedy i tylko wtedy, gdy β dla interpretacji vM0 , vM1 , . . . , vMn przyjmuje wartość T , oraz 2. M |= γ wtedy i tylko wtedy, gdy γ dla interpretacji vM0 , vM1 , . . . , vMn przyjmuje wartość T . (¬) Niech α będzie zdaniem: ¬ β. Niech M |= α. Z definicji |= dostajemy, że nie zachodzi M |= β. Z założenia indukcyjnego otrzymujemy, że dla interpretacji vM0 , vM1 , . . . , vMn
52
ROZDZIAŁ 1. LOGIKA ZDAŃ
zdanie β przyjmuje wartość F , a zatem zdanie α (¬ β) dla tej interpretacji przyjmuje wartość T . Niech α dla interpretacji vM0 , vM1 , . . . , vMn przyjmuje wartość T . A więc β przyjmuje wartość F . Z założenia indukcyjnego wynika więc, iż nie zachodzi M |= β, a zatem zachodzi M |= α (¬ β). (⇒) Niech α będzie zdaniem: β ⇒ γ. Niech nie zachodzi M |= α. Z definicji |= wynika, że zachodzi M |= β oraz że nie zachodzi M |= γ. Korzystając z założenia indukcyjnego dostajemy, że β dla interpretacji vM0 , vM1 , . . . , vMn przyjmuje wartość T zaś γ dla tej interpretacji przyjmuje wartość F . Z tego więc dostajemy, że dla interpretacji vM0 , vM1 , . . . , vMn zdanie α (β ⇒ γ) przyjmuje wartość F . Niech α dla interpretacji vM0 , vM1 , . . . , vMn przyjmuje wartość F . Pokażemy, że nie zachodzi M |= α. Mamy bowiem, że β dla tej interpretacji przyjmuje wartość T zaś γ przyjmuje wartość F . Korzystając z założenia indukcyjnego dostajemy, że zachodzi M |= β a nie zachodzi M |= γ, a więc nie zachodzi również M |= α (β ⇒ γ). W wypadku koniunkcji postępujemy podobnie jak w wypadku negacji, zaś w wypadku alternatywny podobnie jak w wypadku implikacji. Z równoważnością możemy postępować jak z negacją, czyli zakładać, że M |= β ⇔ γ a następnie zakładać, że dla interpretacji vM0 , vM1 , . . . , vMn zdanie β ⇔ γ przyjmuje wartość T . Możemy również postępować jak w wypadku implikacji, czyli zakładając wpierw, że nie zachodzi M |= β ⇔ γ a następnie zakładając, że dla interpretacji vM0 , vM1 , . . . , vMn zdanie β ⇔ γ przyjmuje wartość F . Zależy nam na tym, aby pojęcia tautologii i prawdziwości były sobie równoważne, czyli aby α było tautologią wtedy i tylko wtedy, gdy α jest (logicznie) prawdziwe. Mówi o tym twierdzenie o pełności. Twierdzenie 1.3 (o pełności). ` α wtedy i tylko wtedy, gdy |= α. Dowód. Dowiedziemy dwóch tez, które łącznie składają sie na dowodzone twierdzenie. Wpierw dowodzimy, że jeżeli ` α, to |= α.
1.3. RACHUNEK ZDAŃ
53
Załóżmy, że ` α. Gdyby nie zachodziło |= α, to istniałby model M taki, że α nie byłoby w nim prawdziwe. Na podstawie lematu 1.2 dla interpretacji vM0 , vM1 , . . . , vMn zdanie α przyjmowałoby wartość F , a to przeczyłoby założeniu. Zatem α jest prawdziwe we wszystkich modelach, czyli |= α. Teraz dowiedziemy, że jeżeli |= α, to ` α. Niech |= α oraz niech 6` α. Z tego mamy więc, że α dla jakiejś interpretacji przyjmuje wartość F . Weźmy dowolny model M taki, że jego elementem nie jest żadna z liter, która w rozważanej interpretacji przyjmuje wartość F . Na podstawie lematu 1.2 mamy, że M 6|= α. A to przeczy założeniu, że |= α. Dowiedzione twierdzenie pozwala zastąpić semantyczne pojęcie logicznej prawdziwości syntaktycznym pojęciem tautologiczności. Twierdzenie to umożliwia nam opuszczenie dowodu, że zdanie jest logicznie prawdziwe jeżeli wiadomo, że jest ono tautologią. Ponieważ rozstrzygalny jest problem, czy zdanie jest tautologią, więc na podstawie twierdzenia o pełności jest jasne, że również rozstrzygalny jest problem, czy zdanie jest logicznie prawdziwe.
1.3.5
Spójniki prawdziwościowe
Definicja 1.35 (spójnika prawdziwościowego). Spójnik prawdziwościowy to spójnik taki, że wartość logiczna zdania złożonego zbudowanego za pomocą tego spójnika jest wyznaczona przez wartości logiczne zdań-argumentów tego spójnika, czyli wartość logiczna zdania złożonego jest funkcją wartości logicznych zdań-argumentów. Na to, aby określić wartość logiczną zdania „nieprawda, że α” wystarczy znać wartość logiczną zdania α. Fraza „nieprawda, że . . . ” jest spójnikiem prawdziwościowym. Przykładem dwuargumentowego spójnika, który nie jest prawdziwościowy może być spójnik „z tego, że . . . wynika, że . . . ”. Wartość logiczna zdania „z tego, że α wynika, że β” jest określona w wypadku, gdy α jest prawdziwe a β jest fałszywe; zdanie to wówczas jest fałszywe. W pozostałych możliwych wypadkach układów wartości zdań α i β, wartość logiczna zdania złożonego nie jest określona przez wartości logiczne zdań-argumentów. Na przykład, niech prawdziwe będą zdania:
54
ROZDZIAŁ 1. LOGIKA ZDAŃ 1. A jest trójkątem równobocznym; 2. A jest trójkątem równoramiennym; 3. B jest kwadratem.
Otóż ze zdania 1 wynika zdanie 2. Ze zdania 1 nie wynika zdanie 3, zaś implikacja, której poprzednikiem jest 1 a następnikiem 3 jest zdaniem prawdziwym. Spójnik implikacji jest prawdziwościowy, nie należy go więc mylić z wynikaniem. Spójniki: ¬, ⇒, ∨, ∧, ⇔ są spójnikami prawdziwościowymi. Definicja 1.36 (równoważności spójników). Dwa spójniki są równoważne (ekstensjonalnie równe), wtedy i tylko wtedy, gdy zawsze dla tych samych zdań-argumentów wartość logiczna zdań złożonych zbudowanych za pomocą tych spójników jest taka sama. Można obliczyć, że są dokładnie cztery (teoretycznie możliwe) ekstensjonalnie różne jednoargumentowe spójniki prawdziwościowe. Takich spójn ników dwuargumentowych jest szesnaście. Ogólnie, jest 22 ekstensjonalnie różnych n-argumentowych spójników prawdziwościowych (n = 1, 2, 3, . . . ). Inaczej mówiąc, są dokładnie cztery funkcje jednoargumentowe ze zbioru dwuelementowego do zbioru dwuelementowego oraz szesnaście takich funkcji dwuargumentowych. Ogólnie biorąc, funkcji n-argumentowych ze zbioru n dwuelementowego do zbioru dwuelementowego jest 22 . W słowniku języka rachunku zdań opisanym na str. 15 pod uwagę wzięliśmy pięć spójników. Teraz rozważymy inne spójniki prawdziwościowe. Definicja 1.37 (alternatywy rozłącznej, ⊕). Alternatywa rozłączna zdań α i β, α ⊕ β, charakteryzowana jest następującą tabelką wartości logicznych: α T T F F
β T F T F
α⊕β F T T F
W języku polskim na odczytanie alternatywy rozłącznej znajdujemy wyrażenie „. . . albo . . . ” lub „albo . . . albo . . . ”. Jak się zdaje intuicja może podpowiadać, że zamiast powiedzieć „Albo Jan jest w domu albo w kinie”
1.3. RACHUNEK ZDAŃ
55
moglibyśmy w sposób równoważny wypowiedzieć: „Jan jest w domu wtedy i tylko wtedy, gdy nie ma go w kinie” lub — symetrycznie — „Jana nie ma w domu wtedy i tylko wtedy, gdy jest w kinie”. Uogólniając przykład stwierdzamy, że zdanie „albo α albo β” jest równoważne zdaniu „α wtedy i tylko wtedy, gdy nieprawda, że β” lub zdaniu „(nieprawda, że α) wtedy i tylko wtedy, gdy β”. Można obliczyć, że w żadnym wypadku wartość logiczna zdania α ⊕ β nie różni się od wartości logicznej zdania ¬ α ⇔ β oraz zdania α ⇔ ¬ β i zdania ¬ (α ⇔ β). Inaczej mówiąc, zdania te są jedno drugiemu równoważne. Definicja 1.38 (binegacji, ↓). Binegacja zdań α i β, α ↓ β, charakteryzowana jest następującą tabelką wartości logicznych: α T T F F
β T F T F
α↓β F F F T
W języku polskim na odczytanie binegacji znajdujemy wyrażenie „ani . . . , ani . . . ”. Takie bowiem znaczenie musimy przypisać temu wyrażeniu choćby w takich zwrotach języka polskiego jak: „ani słychu, ani widu o nim”, „ani mnie to grzeje, ani ziębi”. Kierując się wyłącznie intuicją znaczeń wyrażeń języka polskiego zauważmy, iż zamiast powiedzieć, np. „ani Jan zdolny, ani pracowity” 14 możemy z zachowaniem myśli zawartej w tym zdaniu powiedzieć „Jan nie jest zdolny i nie jest pracowity”. Różnica pomiędzy obu zdaniami jest tylko różnicą stylu. Uogólniając przykład stwierdzamy, że zdanie „ani α, ani β” jest równoważne zdaniu „nieprawda, że α i nieprawda, że β”. Można obliczyć, że wartość logiczna zdania α ↓ β nie różni się od wartości logicznej zdania zdania ¬ α ∧ ¬ β, czyli zdania te są jedno drugiemu równoważne. Problem wyrażenia jakiegoś n-argumentowego spójnika prawdziwościowego s przez inne spójniki polega więc na tym, żeby znaleźć zdanie zbudowane za pomocą tych innych spójników i (niekoniecznie wszystkich i niekoniecznie tylko) zdań-argumentów spójnika s, aby dla każdej interpretacji 14
Zgodnie z frazeologią języka polskiego powiemy: „Ani Jan nie jest zdolny, ani nie jest pracowity”. Podobnie jest w wypadku innych spójników języka rachunku zdań — w zależności od kontekstu mogą być wyrażane inaczej niż to ustaliliśmy jako sposób ich odczytywania.
56
ROZDZIAŁ 1. LOGIKA ZDAŃ
wartość logiczna tego zdania była taka sama jak zdania zbudowanego za pomocą spójnika s.
1.3.6
Funkcjonalna pełność
Nim pokażemy, że wszystkie teoretycznie możliwe spójniki prawdziwościowe dadzą się wyrazić za pomocą tylko trzech spójników: negacji, alternatywy i koniunkcji, podajmy twierdzenie, z którego będziemy korzystać w dowodzie tego faktu. β::=γ
Twierdzenie 1.4 (o zastępowaniu). Niech α −→ δ, czyli niech zdanie δ będzie wynikiem zastąpienia w zdaniu α zdania β przez zdanie γ. Jeżeli ` β ⇔ γ, to ` α ⇔ δ. Twierdzenie to głosi, że jeżeli w zdaniu α zastąpimy, będący zdaniem, występujący w nim ciąg symboli β ciągiem symboli γ takim, że zdania β oraz γ są równoważne (` β ⇔ γ), to otrzymamy zdanie δ równoważne zdaniu α (` α ⇔ δ). Dowód. Dowodzić będziemy przez indukcję ze względu na budowę zdania α. Niech α będzie zdaniem β. Po zastąpieniu β przez γ otrzymamy zdanie γ. Ponieważ z założenia ` β ⇔ γ, więc ` α ⇔ δ. β::=γ
β::=γ
Założenie indukcyjne. Niech α1 −→ δ1 oraz α2 −→ δ2 (¬) Jeżeli α jest zdaniem ¬ α1 a ` β ⇔ γ, to na podstawie założenia indukcyjnego mamy, że dla dowolnej interpretacji wartość logiczna δ1 jest taka sama jak wartość logiczna α1 . Zatem dla dowolnej interpretacji wartość logiczna ¬ α1 jest taka sama jak ¬ δ1 , czyli ` α ⇔ δ. Dla wszystkich spójników dwuargumentowych postępujemy podobnie. Rozważmy więc tylko wypadek alternatywy. (∨) Jeżeli α jest zdaniem α1 ∨ α2 a zastępowania dokonujemy w α1 , to na podstawie założenia indukcyjnego dla dowolnej interpretacji wartość logiczna α1 jest taka sama jak wartość logiczna δ1 . Zatem dla dowolnej interpretacji wartość logiczna α1 ∨ α2 jest taka sama jak wartość logiczna δ1 ∨ α2 , czyli ` α ⇔ δ. Podobnie postępujemy, gdy zastępowania dokonujemy w α2 . Dla dowolnego zdania α, w którym występują tylko spójniki prawdziwościowe istnieje logicznie równoważne mu zdanie β (` α ⇔ β), w którym występują tylko spójniki: ¬, ∨, ∧, czyli
1.3. RACHUNEK ZDAŃ
57
Twierdzenie 1.5 (o funkcjonalnej pełności). Zbiór spójników {¬, ∨, ∧} jest funkcjonalnie pełny. Dowód. Niech dany będzie n-argumentowy spójnik prawdziwościowy s. Niech spójnik ten będzie charakteryzowany przez następującą tabelkę wartości logicznych: α1
α2
...
αn
s(α1 , α2 , . . . , αn )
v11 ... v1j ... n v12
v21 ... v2j ... n v22
... ... ... ... ...
vn1 ... vnj ... n vn2
v1 ... vj ... v2n
Dowodzić będziemy przez indukcję. Budować będziemy takie zdanie α0 równoważne zdaniu α, w którym występują tylko spójniki: ¬, ∨ i ∧. Rozważmy wpierw wypadek, gdy α jest zdaniem, w którym występuje tylko spójnik s (wszystkie argumenty spójnika s są literami zdaniowymi). W wypadku, gdy wszystkie wartości v1 , . . . , vj , . . . , v2n , jakie przyjmuje α są równe F , to jako α0 bierzemy koniunkcję wszystkich występujących w α liter zdaniowych i ich negacji. Zdanie to dla dowolnej interpretacji przyjmuje wartość F . Jest zatem równoważne zdaniu α. Niech teraz dla jakiegoś układu wartości v1j , v2j , . . . , vnj zdanie α przyjmuje wartość T . Dla każdego układu wartości v1j , v2j , . . . , vnj (j = 1, . . . , 2n ), dla którego α przyjmuje wartość T bierzemy koniunkcję liter zdaniowych pi , gdy vij przyjmuje wartość T i ¬ pi , gdy vij przyjmuje wartość F . Koniunkcja ta przyjmuje wartość T wtedy i tylko wtedy, gdy litera zdaniowa pi przyjmuje wartość vij , (i = 1, . . . , n; j = 1, . . . , 2n ). Alternatywa wszystkich takich koniunkcji jest równoważna zdaniu α. Założenie indukcyjne. Niech β1 , . . . βn będą zdaniami takimi, że istnieją równoważne im zdania, odpowiednio, β10 , . . . , βn0 zbudowane tylko za pomocą spójników: ¬, ∨, ∧. Niech α będzie zdaniem s(β1 , . . . , βn ). Postępujemy podobnie jak w wypadku, gdy argumentami s były litery zdaniowe. Tym razem jednak zamiast liter zdaniowych bierzemy zdania β10 , . . . , βn0 i ich negacje. Korzystając z założenia indukcyjnego i twierdzenia o zastępowaniu stwierdzamy, że uzyskane konstrukcje są równoważne zdaniu α. Można pokazać, że
58
ROZDZIAŁ 1. LOGIKA ZDAŃ
Wniosek 1.6. Każdy ze zbiorów spójników {¬, ∨}, {¬, ∧}, {¬, ⇒} jest funkcjonalnie pełny. W dowodzie wystarczy skorzystać z równoważności: (α ∧ β) (α ∨ β) (α ⇒ β) (α ∨ β) (α ⇒ β) (α ∧ β)
⇔ ⇔ ⇔ ⇔ ⇔ ⇔
¬ (¬ α ∨ ¬ β) ¬ (¬ α ∧ ¬ β) (¬ α ∨ β) (¬ α ⇒ β) ¬ (α ∧ ¬ β) ¬ (α ⇒ ¬ β).
Okazuje się, że sam spójnik ↓ (ani . . . , ani . . . ) wystarcza dla konstrukcji zdań logicznie równoważnych zdaniom zbudowanym za pomocą jakichkolwiek (nawet tylko dających się pomyśleć) spójników prawdziwościowych. Pokazano również, że taką samą własność ma także spójnik zwany kreską Sheffera, oznaczany |, a odczytywany „albo nie . . . albo nie . . . ”. Spójnik ten jest charakteryzowany następującą tabelką: β T T F F
γ T F T F
β|γ F T T T
Dla ciekawości dodajmy, że oprócz „ani . . . , ani . . . ” i „albo nie . . . albo nie . . . ” żaden inny co najwyżej dwuargumentowy spójnik sam jeden nie wystarcza dla wypowiedzenia wszystkich pozostałych spójników prawdziwościowych.
1.3.7
Postacie normalne
Zdania o postaci opisanej w dowodzie twierdzenia o funkcjonalnej pełności mają szczególną budowę. Taką budowę mają zdania o postaci normalnej dysjunkcyjnej (alternatywnej). Dla różnych celów, zarówno teoretycznych jak i praktycznych, wygodne jest korzystanie z jakiejś standardowej (kanonicznej) postaci zdań. Definicja 1.39 (literału). Literał to litera zdaniowa lub litera zdaniowa poprzedzona spójnikiem negacji.
1.3. RACHUNEK ZDAŃ
59
Litery zdaniowe to literały pozytywne, a negacje liter zdaniowych to literały negatywne. Przykład 1.14. Literałami są: p1 , ¬ p1 , p2 , ¬ p2 , . . . p1 , p2 , . . . to literały pozytywne, a ¬ p1 , ¬ p2 , . . . to literały negatywne. ° Definicja 1.40 (koniunkcji elementarnej). Zdanie: λ1 ∧ λ2 ∧ · · · ∧ λn , gdzie λi jest literałem, 1 ≤ i ≤ n,
to koniunkcja elementarna.
Definicja 1.41 (dysjunkcyjnej postaci normalnej, DNF15 ). Zdanie: δ1 ∨ δ2 ∨ · · · ∨ δn , gdzie δi jest koniunkcją elementarną, 1 ≤ i ≤ n, to dysjunkcyjna (alternatywna) postać normalna zdania. Zdanie α ma postać normalną dysjunkcyjną (alternatywną) wtedy i tylko wtedy, gdy α jest koniunkcją zdań, z których każde jest literą zdaniową lub literą zdaniową poprzedzoną spójnikiem negacji, albo α jest alternatywą takich koniunkcji. Przykład 1.15. Zdaniem o postaci normalnej dysjunkcyjnej jest: (p ∧ r) ∨ (p ∧ q ∧ ¬ r).
°
Definicja 1.42 (dysjunkcji elementarnej, klauzuli). Zdanie: λ1 ∨ λ2 ∨ · · · ∨ λn , gdzie λi jest literałem, 1 ≤ i ≤ n, to dysjunkcja elementarna lub klauzula. Klauzula to alternatywa literałów. Definicja 1.43 (koniunkcyjnej postaci normalnej, CNF16 ). Zdanie: κ1 ∧ κ2 ∧ · · · ∧ κn , gdzie κi jest dysjunkcją elementarną, 1 ≤ i ≤ n, to koniunkcyjna postać normalna zdania. 15 16
Z angielskiego: Disjunctive Normal Form. Z angielskiego: Conjunctive Normal Form.
60
ROZDZIAŁ 1. LOGIKA ZDAŃ
Zdanie α ma koniunkcyjną postać normalną wtedy i tylko wtedy, gdy α jest alternatywą zdań, z których każde jest literą zdaniową lub literą zdaniową poprzedzoną znakiem negacji, albo α jest koniunkcją takich alternatyw. Przykład 1.16. Zdaniem o postaci normalnej koniunkcyjnej jest: (p ∨ ¬ p ∨ q) ∧ (p ∨ ¬ q).
°
Dla każdego zdania sformułowanego w języku klasycznej logiki zdań można skonstruować logicznie równoważne zdanie o postaci alternatywnej normalnej oraz logicznie równoważne zdanie o postaci koniunkcyjnej normalnej. Pierwszym krokiem zarówno w wypadku procedury uzyskania postaci alternatywnej jak i koniunkcyjnej jest wyeliminowanie spójników implikacji i równoważności. Dokonujemy tego przez zastąpienie każdej podformuły, w której taki spójnik występuje przez formułę równoważną bez tych spójników. Korzystamy z następujących równoważności: 1. (α ⇔ β) ⇔ [(α ⇒ β) ∧ (β ⇒ α)], 2. (α ⇒ β) ⇔ (¬ α ∨ β). Kolejnym krokiem uzyskania zarówno jednej jak i drugiej postaci jest doprowadzenie do sytuacji, gdy spójniki negacji jako argumenty mają tylko litery zdaniowe. W tym celu korzysta się z następujących równoważności: 3. ¬ ¬ α ⇔ α, 4. ¬ (α ∨ β) ⇔ (¬ α ∧ ¬ β), 5. ¬ (α ∧ β) ⇔ (¬ α ∨ ¬ β). Zastępowanie z wykorzystaniem równoważności 1–5 prowadzi się tak długo, jak to jest możliwe. W rezultacie otrzymuje się zdanie, które jest zbudowane tylko z literałów oraz spójników alternatywy i koniunkcji. Teraz w zależności od tego, jaka interesuje nas postać, stosujemy jedną z dwóch równoważności. Dla uzyskania zdania o dysjunkcyjnej postaci normalnej korzystamy z: 6. [α ∧ (β ∨ γ)] ⇔ [(α ∧ β) ∨ (α ∧ γ)]. Dla uzyskania zdania o koniunkcyjnej postaci normalnej korzystamy z:
1.3. RACHUNEK ZDAŃ
61
7. [α ∨ (β ∧ γ)] ⇔ [(α ∨ β) ∧ (α ∨ γ)]. Do konstrukcji postaci normalnych można wykorzystać drzewa analityczne. Pod uwagę bierzemy tablice zakończone, czyli takie, w których jedynymi żywymi zdaniami są litery zdaniowe. W wypadku postaci normalnej dysjunkcyjnej konstruujemy drzewo zapisując po lewej stronie zdanie, którego normalną postać dysjunkcyjną chcemy znaleźć. Dla każdej gałęzi bierzemy koniunkcję, której wszystkimi i tylko członami są litery zdaniowe znajdujące się po lewej stronie i negacje liter zdaniowych znajdujących się po prawej stronie tej gałęzi. Alternatywa takich koniunkcji, dających się skonstruować dla wszystkich i tylko gałęzi takiego drzewa analitycznego, jest zdaniem o normalnej postaci dysjunkcyjnej równoważnym zdaniu α. W wypadku postaci normalnej koniunkcyjnej konstruujemy drzewo zapisując po prawej stronie zdanie, którego normalną postać koniunkcyjną chcemy znaleźć. Dla każdej gałęzi bierzemy alternatywę, której wszystkimi i tylko członami są litery zdaniowe znajdujące się po prawej stronie i negacje liter zdaniowych znajdujących się po lewej stronie tej gałęzi. Koniunkcja takich alternatyw, dających się skonstruować dla wszystkich i tylko gałęzi takiego drzewa analitycznego, jest zdaniem o normalnej postaci koniunkcyjnej równoważnym zdaniu α. Zdanie o postaci normalnej koniunkcyjnej jest tautologią wtedy i tylko wtedy, gdy na każdą alternatywę zdań będącą członem koniunkcji składa się jakaś litera zdaniowa pi oraz ¬ pi , a więc gdy wszystkie człony koniunkcji są tautologiami. Zauważmy, że zdanie o postaci normalnej dysjunkcyjnej jest kontrtautologią wtedy i tylko wtedy, gdy alternatywę tworzą koniunkcje takie, że w każdej z nich występuje jakaś litera zdaniowa pi oraz ¬ pi , a więc gdy wszystkie człony alternatywy są kontrtautologiami.
1.3.8
Elektroniczna interpretacja spójników
Rachunek zdań znalazł interesujące zastosowanie techniczne w maszynach matematycznych. Wartości logiczne zdań złożonych w zależności od spójnika i wartości logicznych zdań-argumentów można interpretować jako opis działania pewnych układów elektronicznych. Przyjmuje się, że każde z wejść może znajdować się w jednym z dwóch stanów. Są to dwa rozróżnialne stany fizyczne. Mogą nimi być np. pary: impuls, brak impulsu; napięcie v1 , na-
62
ROZDZIAŁ 1. LOGIKA ZDAŃ
pięcie v2 (v1 6= v2 ). Stany te można oznaczać: 0, 1. Ponadto zakłada się, że układy te działają bezczasowo, tzn. że stan wyjścia nie zależy od czasu przetwarzania danych na wejściu, a jedynie od stanów wejść. Takie układy to sieci logiczne. Poszczególnym spójnikom przyporządkowuje się tzw. bramki logiczne lub po prostu bramki. Nazwy bramek pochodzą z języka angielskiego. NOT to negacja, AND — koniunkcja, OR — alternatywa, XOR — alternatywa wyłączająca (eXclusive). NAND (dysjunkcja Sheffera), NOR (binegacja), XNOR (równoważność) to skróty dla, odpowiednio, NOT AND, NOT OR, NOT XOR. α
¬α
Bramka NOT α
α∧β
β Bramka AND Zamiast: α β
¬(α ∧ β)
korzystamy z: α β
¬(α ∧ β)
1.3. RACHUNEK ZDAŃ
63 Bramka NAND
α α∨β β Bramka OR
Zamiast: α
α∨β
¬(α ∨ β)
β korzystamy z: α ¬(α ∨ β) β Bramka NOR
α α⊕β
β Bramka XOR Zamiast: α β
α⊕β
¬(α ⊕ β)
64
ROZDZIAŁ 1. LOGIKA ZDAŃ
korzystamy z: α ¬(α ⊕ β) β Bramka XNOR Związki między wartościami logicznymi zdań-argumentów a wartością logiczną zdania złożonego opisywane są przez tablicę. Sieć logiczna realizuje tablicę, jeśli mając na wejściu wartości przyporządkowane zdaniomargumentom, na wyjściu ma stan odpowiadający wartości logicznej zdania złożonego. Układami (sieciami) podstawowymi są sieci realizujące tablice negacji, alternatywy i koniunkcji. Okazuje się, że możliwe jest zbudowanie dowolnej bramki, używając tylko bramki NAND. Zauważmy, że jako bramkę NOT bierzemy bramkę NAND tylko z jednym wejściem. Bramka AND może być zbudowana za pomocą bramek NAND, jako pierwszej i na jej wejściu bramki NOT, która — jak wyżej zauważyliśmy — daje się zbudować za pomocą NAND. Bramkę OR budujemy poprzedzając bramkę NAND bramki NOT (którą potrafimy zbudować z bramki NAND) na każdym wejściu. Jeżeli więc w danej technologii łatwiej zbudować bramkę NAND, to możemy wykorzystać omówiony fakt i konstruować dowolne bramki tylko z bramki NAND. Podobnie można pokazać, że każdą bramkę można zbudować korzystając tylko z bramki NOR. Zasadniczym problemem teorii sieci logicznych jest określenie takich zasad, aby dla dowolnej zadanej tablicy można było zbudować realizującą ją sieć złożoną z układów podstawowych. Jest to tzw. problem syntezy sieci logicznych. Sprowadza się on do podania odpowiadającego danej tablicy wyrażenia rachunku zdań zbudowanego za pomocą spójników negacji, alternatywy i koniunkcji. Dla takiego wyrażenia konstruuje się sieci z układów podstawowych.
1.3.9
Dowód w rachunku zdań
Podstawową regułą syntaktyczną (operacją na napisach) będzie reguła odrywania (MP, modus ponens).
1.3. RACHUNEK ZDAŃ
65
Definicja 1.44 (reguły odrywania, MP). Ze zdań α i α ⇒ β wyprowadzalne jest zdanie β. Zdanie α daje się wyprowadzić ze zdań β i γ za pomocą reguły odrywania, gdy γ jest zdaniem β ⇒ α. Definicja 1.45 (dowodu). Niech Σ będzie dowolnym (skończonym lub nieskończonym) zbiorem zdań. α wynika syntaktycznie (daje się wyprowadzić z, ma dowód z, jest konsekwencją, jest wnioskiem z) Σ, co oznaczamy: Σ ` α, wtedy i tylko wtedy, gdy istnieje taki skończony ciąg zdań α0 , α1 , . . . , αn , że α = αn oraz dla każdego i, 0 ≤ i ≤ n, spełniony jest przynajmniej jeden z warunków: 1. αi jest tautologią, 2. αi należy do Σ, 3. istnieją j, k < i takie, że αi daje się za pomocą reguły odrywania wyprowadzić ze zdań αj i αk . Ciąg α0 , α1 , . . . , αn to dowód z Σ zdania α. Ilość zdań-wyrazów ciągu dowodowego to długość dowodu. Zdania ze zbioru Σ to założenia (dowodu z Σ). Dowody zapisujemy w postaci kolumny wierszy dowodowych, na które składać się będą: • kolejny numer zdania, • zdanie, oraz • wskazanie racji, dla których to zdanie można dołączyć do dowodu. — Będziemy pisali „tautologia”, jeżeli dołączone zdanie jest tautologią. — „Założenie” piszemy w wypadku, gdy zdanie to należy do zbioru Σ. — Jeżeli zdanie będzie uzyskane w wyniku użycia reguły odrywania, będziemy pisali „MP” oraz, po średniku, podajemy numery wierszy dowodowych, w których znajdują się zdania, do których reguła ta została zastosowana.
66
ROZDZIAŁ 1. LOGIKA ZDAŃ
Przykład 1.17. Pokażemy że zdanie a < c ma dowód ze zbioru: {a < b ∧ b < c ⇒ a < c, a < b, b < c}; czyli że {a < b ∧ b < c ⇒ a < c, a < b, b < c} ` a < c17 . 1. a < b ⇒ (b < c ⇒ ((a < b ∧ b < c ⇒ a < c) ⇒ a < c)) 2. a < b
założenie
3. b < c ⇒ ((a < b ∧ b < c ⇒ a < c) ⇒ a < c) 4. b < c
(MP 2, 1) założenie
5. (a < b ∧ b < c ⇒ a < c) ⇒ (a < c) 6. a < b ∧ b < c ⇒ a < c 7. a < c
tautologia
(MP 4, 3) założenie
(MP 6, 5)
°
Lemat 1.7. Jeżeli α i α ⇒ β są tautologiami, to β jest tautologią. Dowód. Niech w ciągu p0 , p1 , . . . , pn znajdują się wszystkie litery zdaniowe, z których jest zbudowane zdanie α ⇒ β i niech β nie będzie tautologią. Istnieje zatem taka interpretacja v0 , v1 , . . . , vn , że zdanie β dla tej interpretacji przyjmuje wartość F . Ponieważ z założenia α ⇒ β jest tautologią, więc α dla tej interpretacji musi przyjmować wartość F , a to przeczy założeniu, że α jest tautologią. α ma dowód z pustego zbioru zdań wtedy i tylko wtedy, gdy α jest tautologią, czyli Lemat 1.8. ∅ ` α wtedy i tylko wtedy, gdy ` α Dowód. Jeżeli α jest tautologią, to ciąg, którego jedynym wyrazem jest α jest dowodem α z pustego zbioru zdań, czyli mamy: jeżeli ` α to ∅ ` α. 17
Poszczególne wyrażenia języka teorii mniejszości: a < b, b < c, a < c odpowiadają literom zdaniowym, czyli są przez nas traktowane jako wewnętrznie niezłożone.
1.3. RACHUNEK ZDAŃ
67
Niech α ma dowód z pustego zbioru zdań. Niech α0 , α1 , . . . , αn będzie jakimś dowodem α. Przez indukcję, ze względu na długość tego dowodu, pokażemy, że α jest tautologią. Ponieważ Σ jest puste, więc zgodnie z definicją dowodu α0 może być tylko tautologią. Założenie indukcyjne. Niech dla i ≤ k, αi będzie tautologią. Pokażemy, że αk+1 jest tautologią. Zgodnie z definicją dowodu αk+1 może być tautologią lub może być otrzymane przez zastosowanie reguły odrywania do wyrazów poprzedzających αk+1 w ciągu α0 , α1 , . . . , αn . Jeżeli jednak stosujemy regułę odrywania do zdań, które są tautologiami, to w wyniku otrzymujemy tautologię. W każdym wypadku αk+1 jest więc tautologią. Mamy zatem, że jeżeli ∅ ` α to ` α.
Wniosek 1.9. α jest tautologią wtedy i tylko wtedy, gdy α ma dowód z dowolnego zbioru zdań. UWAGA: W wypadku gdy Σ jest pustym zbiorem zdań (Σ = ∅) zamiast: ∅`α będziemy pisali: ` α. Lemat 1.10. Jeżeli α jest tautologią, to β ⇒ α jest tautologią. Dowód. Niech w ciągu p0 , p1 , . . . , pn znajdują się wszystkie litery zdaniowe, z których jest zbudowane zdanie β ⇒ α. Gdyby β ⇒ α nie było tautologią, to istniałaby interpretacja v0 , v1 , . . . , vn taka, że dla tej interpretacji zdanie β ⇒ α przyjmowałoby wartość F . Byłoby to jednak możliwe tylko wówczas, gdyby α dla tej interpretacji przyjmowało wartość F , a to jest wykluczone, z założenia bowiem α jest tautologią.
1.3.10
Twierdzenie o dedukcji
Intuicyjnie utożsamiane są stwierdzenia:
68
ROZDZIAŁ 1. LOGIKA ZDAŃ zdanie β jest wnioskiem ze zdania α i twierdzeniem jest, że jeżeli α, to β.
Mając do udowodnienia zdanie „ jeżeli α, to β” bierzemy zdanie α jako przesłankę, a następnie wyprowadzamy β jako wniosek z α. Mając zaś udowodnione, że β jest wnioskiem z α, przyjmujemy jako udowodnione zdanie: „ jeżeli α, to β”. Twierdzenie 1.11 (o dedukcji). Σ ∪ {α} ` β wtedy i tylko wtedy, gdy Σ ` α ⇒ β. Dowód. Udowodnimy dwie tezy, które łącznie składają się na twierdzenie o dedukcji, a mianowicie: Teza 1. jeżeli Σ ` α ⇒ β, to Σ ∪ {α} ` β Teza 2. jeżeli Σ ∪ {α} ` β, to Σ ` α ⇒ β. Dowód tezy 1 jest krótki. Niech α0 , α1 , . . . , αn będzie dowodem ze zbioru Σ zdania α ⇒ β. W wypadku, gdy zbiorem założeń jest zbiór zdań Σ ∪ {α}, zdanie α jest założeniem, więc może być dołączone do dowodu. Mamy zatem: α0 , α1 , . . . , αn , α. Ponieważ β daje się za pomocą MP wyprowadzić z αn (= α ⇒ β) i α, zatem do ciągu dowodowego α0 , α1 , . . . , αn , α możemy również dołączyć β. Ciąg α0 , α1 , . . . , αn , α, β jest dowodem ze zbioru Σ ∪ {α} zdania β. Dowód tezy 2 jest bardziej złożony. Niech Σ ∪ {α} ` β, czyli niech istnieje dowód β ze zbioru Σ ∪ {α}. Niech α0 , α1 , . . . , αn będzie tym dowodem. Przez indukcję ze względu na długość tego dowodu, pokażemy, że dla każdego i, 0 ≤ i ≤ n, Σ ` α ⇒ αi . W szczególności dla i = n będzie: Σ ` α ⇒ β. Pokażmy to wpierw dla i = 0. α0 może być tautologią, bądź może być założeniem. Gdy α0 jest tautologią, to — na podstawie wyżej udowodnionego lematu 1.10 — α ⇒ α0 jest tautologią, a więc ma dowód z dowolnego zbioru zdań, w szczególności z Σ.
1.3. RACHUNEK ZDAŃ
69
Jeżeli α0 jest założeniem, to jest to bądź zdanie α, bądź jakiś element zbioru Σ. Jeżeli α0 jest zdaniem α, to zdanie α ⇒ α ma dowód z Σ, jest bowiem tautologią. Niech α0 ∈ Σ. Ciąg: 1. α0 ⇒ (α ⇒ α0 )
tautologia
2. α0
założenie
3. α ⇒ α0
(MP; 1,2)
będzie dowodem zdania α ⇒ α0 ze zbioru Σ. Założenie indukcyjne. Niech dla i ≤ k < n zachodzi: Σ ` α ⇒ αi . Pokażemy, że dla i = k + 1 zachodzi: Σ ` α ⇒ αk+1 . Zgodnie z definicją dowodu, αk+1 może być bądź tautologią, bądź założeniem, bądź może być uzyskane przez zastosowanie reguły odrywania. Jeżeli αk+1 jest tautologią lub założeniem, to postępujemy tak samo jak w wypadku α0 . Rozważmy więc tylko wypadek, gdy αk+1 uzyskane jest przez zastosowanie reguły odrywania. Niech więc w ciągu dowodowym αk+1 będzie poprzedzane przez zdania αm oraz αm ⇒ αk+1 . Zgodnie z założeniem indukcyjnym zdania α ⇒ αm i α ⇒ (αm ⇒ αk+1 ) mają dowód ze zbioru Σ. Niech ciąg: β0 , β1 , . . . , βl (= α ⇒ αm ) będzie dowodem ze zbioru Σ zdania α ⇒ αm a ciąg: γ0 , γ1 , . . . , γu [= α ⇒ (αm ⇒ αk+1 )] będzie dowodem ze zbioru Σ zdania α ⇒ (αm ⇒ αk+1 ). Ciąg: β0 , β 1 , . . . , β l , γ 0 , γ 1 , . . . , γ u , przedłużony o następujące trzy zdania: (l+u+3). [α ⇒ (αm ⇒ αk+1 )] ⇒ [(α ⇒ αm ) ⇒ (α ⇒ αk+1 )] (l+u+4). (α ⇒ αm ) ⇒ (α ⇒ αk+1 ) (l+u+5). α ⇒ αk+1 jest dowodem ze zbioru Σ zdania α ⇒ αk+1 .
tautologia
(MP; l+u+2, l+u+3) (MP; l+u+4, l + 1).
70
ROZDZIAŁ 1. LOGIKA ZDAŃ
1.3.11
Sprzeczne i niesprzeczne zbiory zdań
Definicja 1.46 (syntaktycznie sprzecznego zbioru zdań). Σ jest (syntaktycznie) sprzecznym zbiorem zdań wtedy i tylko wtedy, gdy: dla dowolnego α : Σ ` α. Zbiór zdań, który nie jest sprzeczny jest niesprzeczny. Definicja 1.47 (syntaktycznie niesprzecznego zbioru zdań). Σ jest (syntaktycznie) niesprzecznym zbiorem zdań wtedy i tylko wtedy, gdy: dla pewnego α nie jest tak, że Σ ` α. Zbiór zdań, który nie jest niesprzeczny jest sprzeczny. Definicja zbioru sprzecznego jest równoważna określeniu zbioru sprzecznego jako takiego zbioru, którego zbiór konsekwencji, a więc zdań z niego wyprowadzalnych jest równy zbiorowi L wszystkich zdań, czyli Σ jest sprzecznym zbiorem zdań wtedy i tylko wtedy, gdy {α : Σ ` α} = L. Intuicyjne pojęcie semantycznie niesprzecznego zbioru zdań jest takie, że za niesprzeczny (semantycznie) uważamy każdy zbiór zdań prawdziwych w jakiejś dziedzinie przedmiotowej (byłby to warunek wystarczający niesprzeczności semantycznej) a istnienie jakiejś „rzeczywistości”, w której prawdziwe są wszystkie zdania z jakiegoś zbioru zdań uznajemy za warunek konieczny niesprzeczności (semantycznej) tego zbioru. A zatem w terminologii logicznej znaczyłoby to, że Definicja 1.48 (semantycznie niesprzecznego zbioru zdań). Zbiór zdań jest semantycznie niesprzeczny wtedy i tylko wtedy, gdy ma model. W wypadku, gdy istnieje równoważność wynikania syntaktycznego i semantycznego, pojęcia niesprzeczności syntaktycznej i semantycznej są też równoważne. W zastosowaniach logiki nie będzie więc potrzeby ich odróżniania.
1.3.12
Wynikanie syntaktyczne a wynikanie semantyczne
Reguły rachunku logicznego winny być tak dobrane, aby stosunek wynikania według tych reguł pokrywał się z rzeczywistym stosunkiem wynikania. Dla stwierdzenia zachodzenia takiej równości konieczne jest zdefiniowanie tego, co określamy jako rzeczywiste wynikanie. Zdefiniowane pojęcie wynikania rzeczywistego określimy jako wynikanie semantyczne.
1.3. RACHUNEK ZDAŃ
71
Definicja 1.49 (modelu zbioru zdań). M jest modelem zbioru zdań Σ, co zapisujemy: M |= Σ wtedy i tylko wtedy, gdy każde zdanie ze zbioru Σ jest prawdziwe w M; czyli gdy dla każdego α: jeżeli α ∈ Σ, to M |= α. O zbiorze Σ mówimy, że jest spełniony w M. Definicja 1.50 (wynikania semantycznego, |=). Zdanie α wynika semantycznie z Σ (jest następstwem zdań z Σ, zdania z Σ są racjami α), co zapisujemy: Σ |= α, wtedy i tylko wtedy, gdy dla każdego modelu M: jeżeli M |= Σ, to M |= α, czyli w każdym modelu, w którym prawdziwe są wszystkie zdania z Σ, prawdziwe jest również zdanie α. Twierdzenie głoszące, że wynikanie syntaktyczne pokrywa się z wynikaniem semantycznym, czyli uogólnione twierdzenie o pełności jest konsekwencją twierdzenia głoszącego, że zbiór zdań jest (syntaktycznie) niesprzeczny wtedy i tylko wtedy, gdy ma model, czyli jest wnioskiem z uogólnionego twierdzenia o niesprzeczności. Twierdzenie 1.12 (uogólnione twierdzenie o niesprzeczności). Zbiór zdań Σ jest niesprzeczny wtedy i tylko wtedy, gdy ma model. Twierdzenie to pozostawiamy bez dowodu. Wnioskiem z uogólnionego twierdzenia o niesprzeczności jest twierdzenie, które głosi, że α wynika semantycznie ze zbioru Σ wtedy i tylko wtedy, gdy wynika z tego zbioru syntaktycznie. Twierdzenie 1.13 (uogólnione twierdzenie o pełności). Σ |= α wtedy i tylko wtedy, gdy Σ ` α. Dowód. Dowieść należy dwóch tez. Teza 1. Jeżeli Σ |= α, to Σ ` α, oraz
72
ROZDZIAŁ 1. LOGIKA ZDAŃ
Teza 2. Jeżeli Σ ` α, to Σ |= α. Rozpoczniemy od tezy 1. Dowodzić będziemy niewprost. Niech więc Σ |= α i nieprawda, że Σ ` α. Z tego, że nieprawda, iż Σ ` α mamy, że zbiór Σ∪{¬ α} jest niesprzeczny. Zatem na podstawie uogólnionego twierdzenia o niesprzeczności Σ ∪ {¬ α} ma model. Ten model jest modelem zbioru Σ a nie jest modelem zdania α, zatem α nie wynika semantycznie z Σ. A to przeczy założeniu. Dla dowodu niewprost tezy 2 załóżmy, że Σ ` α i nieprawda, że Σ |= α. Z tego, że nieprawda Σ |= α mamy, że istnieje taki model zbioru Σ, który nie jest modelem α. Model ten jest więc modelem zbioru Σ ∪ {¬ α}. Na podstawie uogólnionego twierdzenia o niesprzeczności zbiór Σ ∪ {¬ α} jest niesprzeczny. W takim razie nie jest prawdą, że Σ ` α. To zaś przeczy założeniu. Uogólnione twierdzenie o pełności pozwala dla języka klasycznej logiki zdań na opuszczenie dowodu, że jakieś zdanie wynika semantycznie, jeżeli tylko pokazane jest, że zdanie to wynika syntaktycznie. W praktycznym stosowaniu logiki nie istnieje więc potrzeba odróżniania pomiędzy wynikaniem syntaktycznym a semantycznym. Jest to sytuacja analogiczna do znanej z arytmetyki szkolnej, gdzie nie odróżniamy np. pomiędzy rzeczywistym iloczynem liczb a liczbą wyrachowaną zgodnie z regułami pisemnego mnożenia. W dalszych rozważaniach w zakresie logiki zdań wszędzie tam, gdzie odróżnienie to nie jest ważne, będziemy mówili po prostu o wynikaniu (logicznym).
1.3.13
Reguły, schematy i prawa logiki
Jesteśmy zainteresowani praktycznym wykorzystaniem rachunku logicznego. Jednak przeprowadzanie dowodów tak, jak ono zostało opisane, byłoby uciążliwe i nienaturalne. Zainteresowani jesteśmy raczej regułami (syntaktycznymi), które pozwalałyby na pokazywanie zachodzenia stosunku wynikania logicznego w sposób bardziej sprawny i faktycznie przeprowadzanym wnioskowaniom bliższy niż jest to w wypadku, gdy jedyną regułą dowodzenia jest reguła odrywania. Reguła odrywania stosowana była do dwóch zdań, przesłanek. W wyniku jej zastosowania otrzymywaliśmy jedno zdanie, wniosek. To, do jakich zdań mogła być zastosowana i jakie zdanie w wyniku jej zastosowania otrzymywaliśmy, wyznaczone było przez kształt, formę zdań (treść zdań była obojętna).
1.3. RACHUNEK ZDAŃ
73
Reguła odrywania może więc być opisana jako klasa par uporządkowanych zbiorów zdań: {({α, α ⇒ β}, {β})}, gdzie α i β są dowolnymi zdaniami. Ogólnie, przez regułę wnioskowania możemy rozumieć sposób przyporządkowania określonemu zbiorowi zdań jakiegoś określonego zbioru zdań, czyli Definicja 1.51 (reguły). Reguła to klasa par zbiorów zdań. Reguła może być klasą par skończonych zbiorów zdań takich, że wszystkie pary zbiorów mają jeden i ten sam schemat18 , czyli daje się opisać jako: {({Φ1 , Φ2 , . . . , Φm }, {Ψ1 , Ψ2 , . . . , Ψn })}. Definicja 1.52 (schematu wnioskowania). Reguła: {({Φ1 , Φ2 , . . . , Φn }, {Ψ})}, gdzie Φ1 , Φ2 , . . . , Φn , Ψ są schematami zdaniowymi, to schemat wnioskowania. Schematy wnioskowania — w zależności od tego, jak będzie wygodniej — zapisujemy zaś w postaci jednej z trzech figur: Φ1 , Φ2 , . . . , Φn Ψ Φ1 , Φ2 , . . . , Φn /Ψ
Φ1 Φ2 . . . Φn Ψ
Reguła odrywania jako schemat wnioskowania mogłaby więc być opisana na trzy następujące sposoby: α, α ⇒ β
α, α ⇒ β/β
β
α α⇒β β
Schemat wnioskowania mówi zatem, że zdaniom otrzymanym przez podstawienie określonych zdań w miejsce wszystkich zmiennych metaprzedmiotowych α, β, γ, . . . (czyli zmiennych, których zakresem zmienności jest zbiór 18
Takie reguły określa się jako strukturalne.
74
ROZDZIAŁ 1. LOGIKA ZDAŃ
zdań) występujących w schematach zdań Φ1 , Φ2 , . . . , Φn dana reguła przyporządkowuje zdanie otrzymane przez podstawienie w schemacie zdania Ψ tych samych zdań za te same zmienne. Zdania otrzymane z Φ1 , Φ2 , . . . , Φn to przesłanki, zaś zdanie otrzymane z Ψ to wniosek. Interesują nas logiczne schematy wnioskowania, tzn. takie schematy, które przesłankom przyporządkowują jako wniosek zdanie, które z tych przesłanek wynika logicznie. Definicja 1.53 (logicznego schematu wnioskowania). Schemat wnioskowania: Φ1 , Φ2 , . . . , Φn /Ψ jest logiczny wtedy i tylko wtedy, gdy dla dowolnych zdań α1 , α2 , . . . , αn , α — jeżeli wszystkie one dadzą się otrzymać przez jednoczesne podstawienie jakichś zdań za wszystkie zmienne metaprzedmiotowe występujące w schematach zdań, odpowiednio, Φ1 , Φ2 , . . . , Φn , Ψ — zachodzi {α1 , α2 , . . . , αn } ` α lub — co na jedno wychodzi: {α1 , α2 , . . . , αn } |= α. Twierdzenie 1.14. Schemat: Φ1 , Φ2 , . . . , Φn /Ψ jest logiczny wtedy i tylko wtedy, gdy w każdym wypadku, jeżeli zdania: α1 , α2 , . . . , αn , α zostały otrzymane ze schematów, odpowiednio, Φ1 , Φ2 , . . . , Φn , Ψ przez jednoczesne podstawienie jakichś zdań za wszystkie zmienne metaprzedmiotowe (występujące w tych schematach), to zachodzi: ` (α1 ∧ α2 ∧ · · · ∧ αn ) ⇒ α. Dowód. Z definicji schemat wnioskowania jest logiczny wtedy i tylko wtedy, gdy {α1 , α2 , . . . , αn } ` α.
1.3. RACHUNEK ZDAŃ
75
Na podstawie twierdzenia o dedukcji wystarczy pokazać, że {α1 , α2 , . . . , αn } ` α wtedy i tylko wtedy, gdy: {α1 ∧ α2 ∧ · · · ∧ αn } ` α. Niech {α1 , α2 , . . . , αn } ` α. Niech β1 , β2 , . . . , βm (= α) będzie dowodem α ze zbioru {α1 , α2 , . . . , αn }. Dowód α ze zbioru {α1 ∧ α2 ∧ · · · ∧ αn } uzyskujemy uzupełniając ciąg β1 , β2 , . . . , βm w taki sposób, że w każdym wypadku, gdy βi , 1 ≤ i ≤ m, jest zdaniem αj , 1 ≤ j ≤ n, przed βi dopisujemy dwa zdania: α1 ∧ α2 ∧ · · · ∧ αn ⇒ αj oraz α1 ∧ α2 ∧ · · · ∧ αn . Pierwsze z nich jest tautologią, a drugie możemy dopisać do dowodu ze zbioru {α1 ∧ α2 ∧ · · · ∧ αn } z tej racji, że jest założeniem. Otrzymany ciąg jest dowodem zdania α ze zbioru {α1 ∧ α2 ∧ · · · ∧ αn }. Niech teraz β1 , β2 , . . . , βm (= α) będzie dowodem zdania α ze zbioru {α1 ∧ α2 ∧ · · · ∧ αn }. Dowód α ze zbioru {α1 , α2 , . . . , αn } uzyskamy biorąc jako początkowe wyrazy ciągu dowodowego tautologię: • α1 ⇒ (α2 ⇒ (· · · ⇒ (αn ⇒ α1 ∧ α2 ∧ · · · ∧ αn ) . . . )), • wszystkie zdania α1 , α2 , . . . , αn – wolno je dołączyć do dowodu, gdyż są założeniami tego dowodu, oraz • wszystkie zdania, które otrzymamy stosując regułę odrywania kolejno do zdań αi i αi ⇒ (αi+1 ⇒ (· · · ⇒ (αn ⇒ α1 ∧ α2 ∧ · · · ∧ αn ) . . . )), (1 ≤ i ≤ n). Zauważmy, że wynikiem odrywania będzie kolejno zdanie, (2 ≤ i ≤ n): αi+1 ⇒ (αi+2 ⇒ (· · · ⇒ (αn ⇒ α1 ∧ α2 ∧ · · · ∧ αn ) . . . )), czyli zdanie, do którego stosujemy regułę odrywania w kolejnym kroku. Ostatnim z tych zdań będzie α1 ∧ α2 ∧ · · · ∧ αn , a więc założenie dowodu α ze zbioru jednoelementowego: {α1 ∧ α2 ∧ · · · ∧ αn }. Po tym zdaniu dopisujemy ciąg:
76
ROZDZIAŁ 1. LOGIKA ZDAŃ • β1 , β2 , . . . , βm .
Otrzymany ciąg jest dowodem ze zbioru: {α1 , α2 , . . . , αn } zdania α. Definicja 1.54 (odpowiedniości schematów wnioskowania i zdania). Schematowi wnioskowania Φ1 , . . . , Φ2 . . . , Φn /Ψ będziemy przyporządkowywali schemat zdaniowy: Φ1 ∧ Φ2 ∧ · · · ∧ Φn ⇒ Ψ, n ∈ N. O schemacie zdaniowym, który jest w ten sposób przyporządkowany schematowi wnioskowania będziemy mówili, że odpowiada temu schematowi. Podobnie o schemacie wnioskowania będziemy mówili, że odpowiada schematowi zdania, gdy zdanie to daje się we wskazany sposób przyporządkować temu schematowi. W szczególnym wypadku, gdy n = 1 schematowi wnioskowania: Φ1 /Ψ przyporządkowany zostaje schemat zdaniowy: Φ1 ⇒ Ψ. Zauważmy, że opisane tu przyporządkowanie schematów wnioskowania schematom zdaniowym jest wzajemnie jednoznaczne. Na podstawie twierdzenia 1.14 pytanie o to, czy schemat jest logiczny, jest równoważne pytaniu o to, czy tautologiami są wszystkie zdania, które dadzą się otrzymać ze schematu zdaniowego odpowiadającego temu schematowi wnioskowania. Definicja 1.55 (prawa logiki). Schemat zdania taki, że wszystkie zdania o tym schemacie są tautologiami to prawo logiki. Podamy teraz przykłady schematów wnioskowania i odpowiadających im praw logiki. Obok praw logiki umieszczone będą ich tradycyjne nazwy.
1.3. RACHUNEK ZDAŃ Schemat wnioskowania α⇒β α
77
Prawo logiki
Nazwa
[(α ⇒ β) ∧ α] ⇒ β
modus ponendo ponens
β α⇒β ¬β
[(α ⇒ β) ∧ ¬ β] ⇒ ¬ α
modus tollendo tollens
¬α α⇒β β⇒γ
[(α ⇒ β) ∧ (β ⇒ γ)] ⇒ (α ⇒ γ)
α⇒γ α ⇒ (β ⇒ γ)
sylogizm hipotetyczny
[α ⇒ (β ⇒ γ)] ⇒ [(α ∧ β) ⇒ γ]
importacja
[(α ∧ β) ⇒ γ] ⇒ [α ⇒ (β ⇒ γ)]
eksportacja
[α ⇒ (β ⇒ γ)] ⇒ [β ⇒ (α ⇒ γ)]
komutacja
(α ⇒ β) ⇒ (¬ β ⇒ ¬ α)
transpozycja 19
(α ∧ β) ⇒ γ (α ∧ β) ⇒ γ α ⇒ (β ⇒ γ) α ⇒ (β ⇒ γ) β ⇒ (α ⇒ γ) α⇒β ¬β⇒¬α Wymieńmy jeszcze niektóre ważniejsze i bardziej znane prawa: α⇒α
zasada tożsamości
¬ (α ∧ ¬ α)
zasada niesprzeczności
19
Prawo transpozycji określa się również mianem prawa kontrapozycji.
78
ROZDZIAŁ 1. LOGIKA ZDAŃ
α∨¬ α
zasada wyłączonego środka
α ⇒ (¬ α ⇒ β)
prawo Dunsa Szkota20
(α ⇒ ¬ α) ⇒ ¬ α
prawo redukcji do absurdu
(¬ α ⇒ α) ⇒ α
odwrotne prawo redukcji do absurdu
(α ⇒ β) ⇒ [(α ⇒ ¬ β) ⇒ ¬ α]
drugie prawo redukcji do absurdu.
¬¬α⇒α ¬ (α ∨ β) ⇔ (¬ α ∧ ¬ β)
prawo podwójnego przeczenia (podwójnej negacji) pierwsze prawo De Morgana
¬ (α ∧ β) ⇔ (¬ α ∨ ¬ β)
drugie prawo De Morgana
[(α ⇒ β) ∧ (¬ α ⇒ β)] ⇒ β
prawo dylematu
1.3.14
Systemy logiki zdań
Na pytanie, czy zdanie jest tautologią, możemy znajdować odpowiedź na różne sposoby, wykorzystując różne rachunki. Wybór sposobu ma wpływ na definicję dowodu. Związki między prawami logiki a schematami/regułami wyznaczają dwa zasadnicze sposoby. W jednym wypadku ograniczymy się do np. reguły odrywania i przyjmujemy bez dowodu pewne zdania, aksjomaty. Współcześnie system dowodzenia takiego typu określany jest jako hilbertowski. W drugim wypadku — w stosunku do pierwszego jakby odwrotnym — korzystamy tylko z reguł. Aksjomatyczny system rachunku zdań Istnieje wiele aksjomatycznych ujęć rachunku zdań. Tu podamy pewne, w których jedyną regułą jest reguła odrywania. W takim wypadku mamy 20
Jan Duns Szkot (ok. 1270–1308), franciszkanin, filozof i teolog. Prawo to tak nazywa Łukasiewicz, obierając je jako jeden z trzech aksjomatów swojej implikacyjno-negacyjnej aksjomatyki klasycznej logiki zdań.
1.3. RACHUNEK ZDAŃ
79
nieskończenie wiele aksjomatów podpadających pod skończoną liczbę schematów tautologii. Jest to inwariantny system rachunku zdań. W wypadku ujęć, w których występuje reguła podstawiania liczba aksjomatów jest skończona. Aksjomatyka Aksjomatami rachunku zdań są wszystkie zdania o poniższych schematach: I. Aksjomaty implikacji 1. 2.
α ⇒ (β ⇒ α) [α ⇒ (β ⇒ γ)] ⇒ [(α ⇒ β) ⇒ (α ⇒ γ)]
prawo poprzednika prawo Fregego
II. Aksjomaty negacji 3. 4.
(α ⇒ β) ⇒ (¬ β ⇒ ¬ α) ¬¬ α ⇒ α
5.
α ⇒ ¬¬ α
prawo transpozycji prawo podwójnego przeczenia odwrotne prawo podwójnego przeczenia
III. Aksjomaty koniunkcji 6. 7.
α∧β ⇒α α∧β ⇒β
8.
(α ⇒ β) ⇒ [(α ⇒ γ) ⇒ (α ⇒ β ∧ γ)]
prawo symplifikacji drugie prawo symplifikacji prawo mnożenia następnika
IV. Aksjomaty alternatywy 9. 10. 11.
α⇒α∨β β ⇒α∨β (α ⇒ γ) ⇒ [(β ⇒ γ) ⇒ (α ∨ β ⇒ γ)]
prawo addycji drugie prawo addycji prawo dodawania poprzedników
V. Aksjomaty równoważności 12. 13. 14.
(α ⇔ β) ⇒ (α ⇒ β) (α ⇔ β) ⇒ (β ⇒ α) (α ⇒ β) ⇒ [(β ⇒ α) ⇒ (α ⇔ β)]
(MP) Reguła odrywania: jeżeli α ⇒ β i α, to β. Definicja 1.56 (dowodu ze zbioru Σ zdania α). Niech Σ będzie dowolnym zbiorem zdań języka rachunku zdań. Zdanie α ma dowód z Σ wtedy i tylko
80
ROZDZIAŁ 1. LOGIKA ZDAŃ
wtedy, gdy istnieje skończony ciąg zdań α0 , α1 , . . . , αn taki, że αn = α oraz dla każdego i, 0 ≤ i ≤ n, spełniony jest przynajmniej jeden z warunków: 1. αi jest aksjomatem, 2. αi jest elementem Σ, 3. istnieją j, k < i takie, że αi za pomocą reguły odrywania daje się wyprowadzić z αj i αk . Ciąg α0 , α1 , . . . , αn (= α) to dowód ze zbioru Σ zdania α. Zauważmy, że jedyną różnicę w stosunku do wcześniej zdefiniowanego pojęcia dowodu znajdujemy w punkcie 1. Poprzednio do dowodu można było dołączać wszystkie tautologie, teraz tylko zdania będące aksjomatami. Definicja 1.57 (tezy rachunku zdań). Zdanie, które ma dowód z pustego zbioru, to teza rachunku zdań. Dowieść można, że zbiór tez opisanego wyżej systemu aksjomatycznego rachunku zdań pokrywa się ze zbiorem tautologii języka logiki zdań. Aksjomatyka Łukasiewicza, system implikacyjno-negacyjny, składa się z tylko trzech aksjomatów i trzech reguł: odrywania, podstawiania i zastępowania oraz trzech definicji: spójnika alternatywy, spójnika koniunkcji i spójnika równoważności. Te trzy spójniki, alternatywy, koniunkcji i równoważności, traktowane są jako wygodne skróty. O tym, jak można z nich korzystać mówi reguła zastępowania. Gdy zrezygnuje się z reguły podstawiania, to należy korzystać ze schematów aksjomatów: Ł1. (α ⇒ β) ⇒ [(β ⇒ γ) ⇒ (α ⇒ γ)] Ł2. (¬ α ⇒ α) ⇒ α Ł3. α ⇒ (¬ α ⇒ β)
Korzysta się α ∨ β ⇔ df α ∧ β ⇔df α ⇔ β ⇔df
też z definicji: ¬α⇒β ¬ (α ⇒ ¬ β) (α ⇒ β) ∧ (β ⇒ α)
Prawo sylogizmu hipotetycznego Prawo Claviusa Prawo Dunsa Szkota
1.3. RACHUNEK ZDAŃ
81
Aksjomatyka Łukasiewicza W oryginalnym sformułowaniu Łukasiewicza, a więc z zastosowaniem symboliki łukasiewiczowskiej i z regułą podstawiania, są to następujące aksjomaty: Ł1’. CCpqCCqrCpr Ł2’. CCNppp Ł3’. CpCNpq Dla implikacyjno-negacyjnej logiki istnieje system aksjomatyczny tylko z jednym aksjomatem. Dedukcja naturalna Systemy rachunku omawiane w tej części określane są jako dedukcja naturalna. Zauważono, że rachunki logiczne w postaci systemów aksjomatycznych z nielicznymi regułami bezpośrednio nie opisują sposobów wnioskowania stosowanych w praktyce. Stąd powstał problem naturalności dedukcji. Jednym z systemów dedukcji naturalnej jest metoda dowodów założeniowych. Definicja dowodu założeniowego Dowód założeniowy jest ciągiem zdań. Te zdania to wiersze dowodowe. Zdanie, dla którego istnieje dowód to twierdzenie. O tym, w jaki sposób buduje się dowód21 , mówią reguły tworzenia dowodu. Od tych reguł należy odróżnić reguły dołączania nowych wierszy dowodowych. Wpierw omówione zostaną reguły tworzenia dowodu a następnie reguły dołączania nowych wierszy dowodowych. Reguły tworzenia dowodu Opiszemy dwa rodzaje dowodu założeniowego: dowód założeniowy wprost i dowód założeniowy niewprost. Przedmiot dowodu Przedmiotem dowodu mogą być zdania. Zdanie, dla którego istnieje dowód założeniowy to twierdzenie. Dowodzić możemy również tego, że z jakichś danych zdań-przesłanek, α1 , α2 , . . . , αn , wynika logicznie zdanie-wniosek, α, czyli że α1 , α2 , . . . , αn ` α, co będziemy zwykle zapisywali: 21
W tym fragmencie tekstu na temat dedukcji naturalnej, kiedy mówimy po prostu o dowodzie, mamy zawsze na uwadze dowód założeniowy.
82
ROZDZIAŁ 1. LOGIKA ZDAŃ α1 α2 . . . αn α
Druga możliwość jest sprowadzalna do pierwszej, a mianowicie dowód założeniowy dla α1 , α2 , . . . , αn ` α istnieje tylko wtedy, gdy istnieje dowód założeniowy dla zdania α1 ∧ α2 ∧ · · · ∧ αn ⇒ α22 . Pierwsza możliwość jest szczególnym wypadkiem drugiej, a mianowicie jest to sytuacja, gdy pytamy o dowód z pustego zbioru przesłanek. Opis zasad konstrukcji dowodu można więc ograniczyć do sytuacji, gdy przedmiotem dowodu jest to, czy α1 , α2 , . . . , αn ` α, czyli czy z α1 , α2 , . . . , αn wynika α. Zasady dopisywania wierszy dowodowych Dowód założeniowy jest ciągiem zdań. Poszczególne wyrazy tego ciągu, wiersze dowodowe, są dopisywane do dowodu zgodnie z określonymi zasadami. Zasady te dla dowodu wprost różnią się od zasad dla dowodu niewprost. Wpierw podane zostaną te zasady dopisywania wierszy dowodowych, które są dla tych sposobów wspólne. Niech przedmiotem dowodu będzie: α1 α2 . . . αn α 1. Jako wiersze dowodowe bierzemy wszystkie zdania α1 , α2 , . . . , αn , czyli — jak będziemy mówili — zdania znajdujące się nad kreską. Są to założenia dowodu założeniowego. 22
Faktu tego można dowieść dopiero po opisaniu systemu dowodów założeniowych.
1.3. RACHUNEK ZDAŃ
83
2. Jeżeli zdanie α, wyrażenie pod kreską, ma postać: β1 ⇒ (β2 ⇒ (· · · ⇒ (βm ⇒ β) . . . )), to jako wiersze dowodowe możemy wziąć zdania β1 , β2 , . . . , βm . Są to założenia dowodu założeniowego. 3. Jeżeli β jest twierdzeniem, to β może być dopisane do dowodu. 4. Niech
Φ1 Φ2 . . . Φn Ψ
będzie regułą (pierwotną lub wtórną) dołączania nowych wierszy dowodowych. Niech wpisując jednocześnie te same zdania za te same zmienne metaprzedmiotowe, występujące w Φ1 , Φ2 , . . . , Φm , Ψ ze schematu Φi otrzymamy zdanie βi , 1 ≤ i ≤ m, a ze schematu Ψ otrzymamy zdanie β. Jeżeli w dowodzie występują jako wiersze dowodowe zdania β1 , β2 , . . . , βm , to jako kolejny wiersz dowodowy wolno dopisać zdanie β. 1. REGUŁY TWORZENIA DOWODU NIEWPROST Jako założenie dowodu niewprost bierze się: (a) ¬ α lub (b) jeśli α jest zdaniem β1 ⇒ (β2 ⇒ (· · · ⇒ (βm ⇒ β) . . . )), to jako założenia dowodu niewprost można wziąć ¬ β. (c) Dowód kończy się, gdy dla pewnego γ otrzymuje się dwa wiersze dowodowe, z których jeden to zdanie γ, a drugi to zdanie ¬ γ. 2. REGUŁY TWORZENIA DOWODU WPROST (a) Dowód kończy się, gdy jako wiersz dowodowy otrzymuje się wyrażenie znajdujące się pod kreską, czyli α lub
84
ROZDZIAŁ 1. LOGIKA ZDAŃ (b) jeśli α jest zdaniem β1 ⇒ (β2 ⇒ (· · · ⇒ (βm ⇒ β) . . . )), to dowód kończy się, gdy jako wiersz dowodowy otrzymujemy zdanie β.
Zauważmy, że w każdym wypadku, gdy istnieje dowód wprost, to istnieje dowód niewprost. Aby z dowodu wprost otrzymać dowód niewprost do dowodu wprost wystarczy dopisać jako założenie zdanie ¬ α lub ¬ β, co wolno uczynić zgodnie z zasadami tworzenia dowodu niewprost. Obok wierszy dowodowych zaznacza się, czy zostały one przyjęte jako założenia, czy na podstawie reguł. W tym ostatnim wypadku zaznacza się użytą regułę i wiersze dowodowe, do których została zastosowana. Korzystać będziemy z następujących skrótów: zał. — założenie z.d.n. — założenie dowodu niewprost sprzecz. — sprzeczność Dowieść można, że wnioskowanie jest dedukcyjne wtedy i tylko wtedy, gdy ma dowód założeniowy niewprost. Trudność praktyczną stwarzać mogą dowody w wypadku, gdy brak wierszy «nad kreską», a więc gdy mamy dowieść: `β a β nie jest implikacją, np. α ∨ ¬ α. Ograniczając się do opisanych reguł tworzenia dowodu musimy przeprowadzać dowód niewprost. REGUŁY DOŁĄCZANIA NOWYCH WIERSZY DOWODOWYCH Reguły dołączania nowych wierszy dowodowych dzieli się na pierwotne i wtórne. Reguły pierwotne to reguły przyjęte bez dowodu. Na reguły pierwotne nadają się reguły, które są intuicyjnie logiczne. Intuicyjność logiczności to kryterium o charakterze subiektywnym. Z formalnego punktu widzenia chodzi zaś o takie i o tyle reguł, aby powstały system rachunku logicznego był niesprzeczny i pełny, czyli obejmował wszystkie i tylko te reguły, które są logiczne (formalne i niezawodne): jeśli w modelu prawdziwe są przesłanki, to otrzymany zgodnie z nimi wniosek też jest w tym modelu prawdziwy. Regułami wtórnymi są wszystkie reguły udowodnione.
1.3. RACHUNEK ZDAŃ
85
REGUŁY PIERWOTNE (RO) Reguła odrywania α⇒β α β (DK) Reguła dołączania koniunkcji α β
α β
α∧β
β∧α
(OK) Reguła opuszczania koniunkcji α∧β
α∧β
α
β
(DA) Reguła dołączania alternatywy α
β
α∨β
α∨β
(OA) Reguła opuszczania alternatywy α∨β ¬α
α∨β ¬β
β
α
(DE) Reguła dołączania równoważności α⇒β β⇒α
α⇒β β⇒α
α⇔β
β⇔α
(OE) Reguła opuszczania równoważności α⇔β
α⇔β
α⇒β
β⇒α
86
ROZDZIAŁ 1. LOGIKA ZDAŃ
ZASADY DOWODZENIA REGUŁ WTÓRNYCH W dowolnej tautologii wpisując jednocześnie w miejsce wszystkich występujących w niej liter zdaniowych tę samą zmienną metaprzedmiotową za tę samą literę zdaniową otrzymamy schemat zdaniowy taki, że każde zdanie podpadające pod ten schemat będzie tautologią. Podobnie jest w wypadku dowodów założeniowych. Mając udowodnione, że α1 α2 . . . αn α możemy jednocześnie we wszystkich zdaniach α1 , α2 , . . . , αn , α w miejsce każdej litery zdaniowej wpisać tę samą zmienną metaprzedmiotową za tę samą literę zdaniową. Otrzymujemy schemat wnioskowania. Niech będzie to: Φ1 Φ2 . . . Φn Ψ. Z takiego schematu po wpisaniu zdań w miejsce zmiennych metaprzemiotowych otrzymamy wnioskowanie, którego dowód założeniowy nie będzie co do sposobu dowodzenia różnił się od dowodu wnioskowania, które było przedmiotem operacji wpisywania zmiennych metaprzedmiotowych. Występować będą tylko inne zdania. Ten schemat wnioskowania to reguła wtórna. Na przykład, dowodzimy, że p∨q ¬p⇒q 1. p ∨ q zał. 2. ¬ p zał. 3. q (OA; 1,2) Możemy zatem przyjąć regułę wtórną:
1.3. RACHUNEK ZDAŃ
87 α∨β ¬α⇒β
Zauważmy, że to, iż schemat: Φ1 Φ2 . . . Φn Ψ nie ma dowodu nie znaczy, że każde wnioskowanie podpadające pod ten schemat nie ma dowodu. Na przykład, dowodu nie ma schemat: α β Pod ten schemat podpada jednak: p p Prosto zaś można pokazać, że prawdą jest, iż p p Przykład 1.18 (dowodu założeniowego). S1. Sylogizm warunkowy p⇒q q⇒r p⇒r Dowód wprost: 1. p ⇒ q zał. 2. q ⇒ r zał. 3. p zał. 4. q (RO; 1,3) 5. r (RO;2,4)
88
ROZDZIAŁ 1. LOGIKA ZDAŃ
S2. Zasada podwójnej negacji (z.p.n.) ¬¬ p p Dowód niewprost: 1. ¬¬ p zał. 2. ¬ p z.d.n. sprzecz. (1,2) S3. Modus tollens p⇒q ¬q ¬p Dowód niewprost: 1. p ⇒ q zał. 2. ¬ q zał. 3. ¬¬ p z.d.n. 4. p (z.p.n.;3) 5. q (RO;1,4,) sprzecz. (2,5) S4. ¬ (p ∨ q) ¬p Dowód niewprost: 1. ¬ (p ∨ q) zał. 2. ¬ ¬ p z.d.n. 3. p (z.p.n.;2) 4. p ∨ q (DA,3) sprzecz. (1,4) S5. ¬ (p ∨ q) ¬q
1.3. RACHUNEK ZDAŃ
89
Dowód niewprost: 1. ¬ (p ∨ q) zał. 2. ¬ ¬ q z.d.n. 3. q (z.p.n.;2) 4. p ∨ q (DA,3) sprzecz. (1,4) S6. I prawo De Morgana dla rachunku zdań ¬ (p ∨ q) ¬ p∧¬ q Dowód wprost: 1. ¬ (p ∨ q) 2. ¬ p 3. ¬ q 4. ¬ p ∧ ¬ q
zał. (S4,1) (S5,1) (DK;2,3) °
Rachunek rezolucyjny W związku z tworzeniem algorytmów automatycznego dowodzenia poszukuje się rozwiązań, które dowodzenie to uczyniłyby bardziej efektywnym. J. A. Robinson (1965) sformułował system dowodzenia z regułą rezolucji 23 . Metoda Robinsona stosuje się do formuł o normalnej postaci koniunkcyjnej. Niech λi , 1 ≤ i ≤ n, będzie literałem, czyli literą zdaniową lub literą zdaniową poprzedzoną spójnikiem negacji. Klauzula ma więc postać: λ1 ∨ λ2 ∨ · · · ∨ λn , n ∈ N. Szczególną klauzulą jest klauzula pusta ¥ . Niech κi , 1 ≤ i ≤ n będzie klauzulą. Zdanie o normalnej postaci koniunkcyjnej jest zdaniem typu: κ1 ∧ κ2 ∧ · · · ∧ κn , n ∈ N. 23
Reguła ta oparta jest o wyniki J. Herbranda (1929) oraz pracę M. Davisa i H. Putnama (1960).
90
ROZDZIAŁ 1. LOGIKA ZDAŃ
Klauzula może być zapisana jako zbiór literałów. Logicznie taki zbiór odpowiada zdaniu będącemu alternatywą wszystkich i tylko elementów (literałów) tego zbioru. To, że literał λ jest członem klauzuli κ można więc zapisać: λ ∈ κ. Klasa klauzul logicznie odpowiada formule będącej koniunkcją wszystkich i tylko klauzul będących elementami tej klasy. Zdanie w koniunkcyjnej postaci normalnej można więc zapisać jako: {κ1 , κ2 , . . . , κn } lub — jeżeli jest to jasne z kontekstu — mogą zostać opuszczone symbole zbioru, czyli zdanie takie zapisuje się: κ1 , κ2 , . . . , κn Do opisu klauzul i ich koniunkcji mogą być wykorzystane też inne symbole teoriomnogościowe. Definicja 1.58 (literałów komplementarnych). Literał pozytywny i literał negatywny zbudowane z tej samej litery zdaniowej tworzą parę literałów komplementarnych. Definicja 1.59 (rezolwenty klauzul). Klauzula κ1 \λ1 ∪κ2 \λ2 jest rezolwentą klauzul κ1 i κ2 wtedy i tylko wtedy, gdy 1. literały λ1 i λ2 tworzą parę komplementarną, 2. λ1 ∈ κ1 , λ2 ∈ κ2 . Definicja 1.60 (literału czynnego). W rezolwencie κ1 \ λ1 ∪ κ2 \ λ2 klauzul κ1 i κ2 literały λ1 oraz λ2 to literały czynne. Definicja 1.61 (klauzuli uzgodnionej). Klauzule, dla których istnieje ich rezolwenta to klauzule uzgodnione. Można pokazać, że rezolwenta klauzul jest konsekwencją tych klauzul. Klauzule są zdaniami. Możemy więc pytać o stosunek wynikania. Twierdzenie 1.15. Niech κ1 i κ2 będą klauzulami oraz niech λ1 i λ2 będą literałami komplementarnymi, takimi że λ1 ∈ κ1 , λ2 ∈ κ2 . Niech rez(κ1 , κ2 ) = κ1 \ λ1 ∪ κ2 \ λ2 . Zachodzi wówczas: κ1 , κ2 ` rez(κ1 , κ2 ). Dowód. Mamy pokazać, że (κ1 \ λ1 ) ∪ λ1 , (κ2 \ λ2 ) ∪ λ2 ` (κ1 \ λ1 ) ∪ (κ2 \ λ2 ).
1.3. RACHUNEK ZDAŃ
91
Niech κ1 \ λ1 = κ01 , κ2 \ λ2 = κ02 . Ponieważ (κ1 \ λ1 ) ∪ λ1 jest równoważne κ1 a (κ2 \ λ2 ) ∪ λ2 jest równoważne κ2 (różnić mogą się tylko wielokrotnością wystąpienia jako członów alternatywy literałów, odpowiednio, λ1 i λ2 ), więc w takim razie mamy pokazać, że (κ01 ∪ λ1 ), (κ02 ∪ λ2 ) ` κ01 ∪ κ02 . Zgodnie z przyjętą konwencją znaczy to, że mamy udowodnić: (κ01 ∨ λ1 ) ∧ (κ02 ∨ λ2 ) ` κ01 ∨ κ02 . Na podstawie prawa logiki zdań: ` [(α ∨ β) ∧ (γ ∨ ¬ β)] ⇒ (α ∨ γ), z uwagi na to, że literały λ1 i λ2 są komplementarne mamy, że ` [(κ01 ∨ λ1 ) ∧ (κ02 ∨ λ2 )] ⇒ (κ01 ∨ κ02 ). Stąd na podstawie twierdzenia o dedukcji: (κ01 ∨ λ1 ) ∧ (κ02 ∨ λ2 ) ` κ01 ∨ κ02 . Zgodnie z przyjętą konwencją więc: κ01 ∪ λ1 , κ02 ∪ λ2 ` κ01 ∪ κ02 , czyli: κ1 , κ2 ` rez(κ1 , κ2 ). Niezawodna jest zatem każda reguła postaci: κ1 , κ 2 (κ1 \ λ1 ) ∪ (κ2 \ λ2 ) gdzie λ1 ∈ κ1 , λ2 ∈ κ2 oraz literały λ1 , λ2 tworzą parę literałów komplementarnych. Definicja 1.62 (reguły rezolucji). Reguła: κ1 , κ 2 (κ1 \ λ1 ) ∪ (κ2 \ λ2 ) gdzie λ1 ∈ κ1 , λ2 ∈ κ2 a literały λ1 , λ2 tworzą parę literałów komplementarnych to reguła rezolucji.
92
ROZDZIAŁ 1. LOGIKA ZDAŃ
Definicja 1.63. Faktoryzacja klauzuli to wyeliminowanie z niej powtarzających się literałów. Klauzula i klauzula otrzymana w wyniku faktoryzacji są sobie równoważne. Ten fakt oparty jest na prawie logiki zdań: (α ∨ α) ⇔ α. Zgodne jest to z teoriomnogościową konwencją notacyjną. Mamy bowiem: {α, α} \ {α} = ∅. Faktoryzacji dokonuje się w miarę potrzeby, gdy w którejś z klauzul ten sam literał pojawia się przynajmniej dwukrotnie. W rachunku rezolucyjnym dowodzi się generując z wyjściowych i już wygenerowanych klauzul kolejne klauzule. Jedyną regułą generowania jest reguła rezolucji. Definicja 1.64 (dowodu w rachunku rezolucyjnym). Klauzula κ ma dowód z klauzul κ1 , . . . , κn , n ∈ N, wtedy i tylko wtedy, gdy istnieje skończony ciąg klauzul κ∗1 , . . . , κ∗m , m ∈ N taki, że 1. κ = κm ∗, 2. dla każdego i, 1 ≤ i ≤ m, istnieją komplementarne literały λ1 i λ2 oraz j, k takie, że κ∗j i κ∗j dają się uzgodnić dla tych literałów a κ∗i = κ∗j \ λ1 ∪ κ∗k \ λ2 . Okazuje się, że ciąg klauzul dla dowolnej interpretacji przyjmuje wartość F wtedy i tylko wtedy, gdy dowód z niego ma klauzula pusta. Zatem ze zbioru zdań Σ wynika zdanie α wtedy i tylko wtedy, gdy z ciągu klauzul przyporządkowanych — zgodnie z zasadami tworzenia CNF oraz klauzul — zbiorowi Σ i zdaniu ¬ α daje się wygenerować pustą klauzulę. Przykład 1.19. Czy p ⇒ q, q ⇒ r ` p ⇒ r ? Tworzymy ciąg klauzul, odpowiadający temu pytaniu: ¬ p ∨ q, ¬ q ∨ r, p, ¬ r. 1. ¬ q ∨ r 2. ¬ r 3. ¬ q (z 1 i 2) 4. ¬ p ∨ q
1.3. RACHUNEK ZDAŃ 5. p 6. q 7. ¥
93
(z 4 i 5) (z 3 i 6).
Ponieważ uzyskaliśmy klauzulę pustą, na postawione pytanie odpowiadamy: TAK. ° Przykład 1.20. Czy p ⇒ q ` ¬ p ⇒ ¬ q ? Tworzymy ciąg klauzul odpowiadający temu pytaniu: ¬ p ∨ q, ¬ p, ¬ q. 1. ¬ p ∨ q 2. ¬ p 3. ¬ q 4. ¬ p (z 1 i 3) Jedynymi klauzulami, które dają się uzgodnić są pierwsza i ostatnia. Przez zastosowanie reguły rezolucji uzyskujemy klauzulę: ¬ p. Klauzula ta nie daje się uzgodnić z żadną inną. Wyczerpane zostały więc możliwości stosowania reguły rezolucji. To, że nie ma dowodu pustej klauzuli pokazuje, że odpowiedzią na postawione pytanie jest: NIE. °
94
ROZDZIAŁ 1. LOGIKA ZDAŃ
Rozdział 2 Logika predykatów Rachunek zdań wiernie opisuje wynikanie semantyczne dla języka, którego zdania są za pomocą spójników zbudowane ze zdań prostych o wewnętrznie nieanalizowalnej strukturze. Zdania proste języka potocznego, języków nauk przyrodniczych, humanistycznych oraz matematyki są wewnętrznie złożone. Na to, aby rachunek logiczny nadawał się do wszystkich rozumowań poprawnych przeprowadzanych w takich językach, konieczne jest, aby był rachunkiem, którego język uwzględnia tę wewnętrzną złożoność zdań prostych. Tworząc formalny język rachunku predykatów kierujemy się postulatem analizy wewnętrznej struktury zdań.
2.1
Język rachunku predykatów
W języku rachunku predykatów elementarnymi, wewnętrznie nieanalizowalnymi wyrażeniami będą litery predykatowe, litery funkcyjne oraz stałe indywiduowe i zmienne indywiduowe. Słowa „litera” — podobnie jak w wypadku rachunku zdań — używamy dla zaznaczenia wewnętrznej nieanalizowalności omawianych wyrażeń. Wśród stałych logicznych oprócz spójników zdaniowych będą kwantyfikatory.
2.1.1
Dziedzina
Opis kategorii wyrażeń, z których zbudowane jest zdanie, poprzedzimy opisem dziedziny, która ma być przedmiotem wnioskowań przeprowadzanych w języku klasycznego rachunku predykatów. 95
96
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Przede wszystkim dziedzina ta składa się z pewnego zbioru przedmiotów indywidualnych, czyli indywiduów. Na przykład, w arytmetyce indywiduami są liczby naturalne. Jako logicy nie musimy się jednak martwić tym, czym jest indywiduum. W poprawnie metodologicznie określonej dziedzinie rozważań wyróżniona jest pewna kategoria przedmiotów jako indywiduów. Zbiór indywiduów danej dziedziny rozważań to przestrzeń, zbiór uniwersalny albo, po prostu, uniwersum. Indywidua mogą pozostawać w pewnych zależnościach, związkach czy — jak będziemy ogólnie mówić — relacjach. W zbiorze liczb może to być np. relacja mniejszości: 0,
2.2. RACHUNEK PREDYKATÓW
107
Aksjomat 3. (vi ≡ v ∧ P v1 . . .vi−1 vi vi+1 . . .vn ) ⇒ P v1 . . .vi−1 vvi+1 . . .vn , gdzie P jest n-argumentową literą predykatową, a n > 0. Predykat identyczności jest predykatem używanym w zasadzie we wszystkich językach (teoriach) mających praktyczne znaczenie. Dążymy do stworzenia rachunku dla logiki predykatów, czyli do syntaktycznego scharakteryzowania pojęcia wynikania rzeczywistego. Musimy więc sprecyzować pojęcie dowodu. Zbiór reguł dowodowych w rachunku zdań wzbogacamy o nowe reguły dowodzenia. W rachunku predykatów mamy następujące reguły: Reguła odrywania MP. z ϕ i ϕ ⇒ φ wynika φ, mamy jeszcze: Reguła podstawiania Sb. z ϕ wynika ϕ[v ::= t], jeżeli term t jest podstawialny w miejsce zmiennej v. Reguła opuszczania dużego kwantyfikatora O∀. z ϕ ⇒ ∀v : φ wynika ϕ ⇒ φ. Reguła dołączania dużego kwantyfikatora D∀. z ϕ ⇒ φ wynika ϕ ⇒ ∀v : φ, jeżeli v nie jest zmienną wolną w ϕ. Reguła opuszczania małego kwantyfikatora O∃. z ∃v : ϕ ⇒ φ wynika ϕ ⇒ φ. Reguła dołączania małego kwantyfikatora D∃. z ϕ ⇒ φ wynika ∃v : ϕ ⇒ φ, jeżeli v nie jest zmienną wolną w φ.
108
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Reguły są tak dobrane, żeby zachowywały rzeczywisty stosunek wynikania. Stosujemy je do formuł, które nie muszą być zdaniami. Mówienie więc o prawdziwości wyrażeń, do których reguły są stosowane nie jest zasadne. Zamiast terminu „prawda” możemy tu użyć ogólniejszego terminu „spełnianie”. Najprościej mówiąc formuła jest spełniona wtedy i tylko wtedy, gdy w każdym wypadku przyporządkowania znaczeń występującym w niej zmiennym otrzymamy zdanie prawdziwe. Reguła podstawiania odpowiada sposobowi takiego rozumowania, gdy na przykład mając formułę2 : x2 ≥ 0 przyjmujemy: (y + 1)2 ≥ 0 22 ≥ 0. Obie otrzymane formuły są spełnione w zbiorze liczb rzeczywistych. Pierwsza dla wszystkich możliwych znaczeń, jakie może przyjmować zmienna y w zbiorze liczb rzeczywistych, zaś druga nie zawierając zmiennych jest po prostu prawdziwa. Sposób rozumowania odpowiadający regule opuszczania dużego kwantyfikatora stosujemy na przykład wówczas, gdy na podstawie: a > 0 ⇒ ∀x : (x > 0 ⇒ x + a > 0) uznajemy: a > 0 ⇒ (x > 0 ⇒ x + a > 0). Regułę dołączania dużego kwantyfikatora stosujemy na przykład wówczas, gdy na podstawie: y > 0 ⇒ (x > 0 ⇒ x + y > 0) uznajemy: y > 0 ⇒ ∀x : (x > 0 ⇒ x + y > 0). Warunek nałożony na poprzednik (ϕ) implikacji, do której następnika (φ) dołączamy duży kwantyfikator jest istotny. Na przykład, na podstawie: 2
Formuła ta wyraża prawdziwą zależność w zbiorze liczb rzeczywistych. Staje się zdaniem prawdziwym po związaniu przez duży kwantyfikator wszystkich zmiennych wolnych, czyli formuła ta jest spełniona dla dowolnego znaczenia, jakie możemy przyporządkować zmiennej x w zbiorze liczb rzeczywistych.
2.2. RACHUNEK PREDYKATÓW
109
y > 0 ⇒ (x > 0 ⇒ x + y > 0) nie możemy uznać: y > 0 ⇒ ∀y : (x > 0 ⇒ x + y > 0)3 . Regule opuszczania małego kwantyfikatora odpowiada rozumowanie, gdy na przykład na podstawie: ∃x : (0 < x ∧ x ≤ y) ⇒ 0 < y uznajemy: 0 < x ∧ x ≤ y ⇒ 0 < y. Sposób rozumowania odpowiadający regule dołączania małego kwantyfikatora możemy zastosować na przykład do: 0 < x ∧ x ≤ y ⇒ 0 < y. Warunek nałożony na następnik (φ) implikacji, do której poprzednika (ϕ) dołączamy mały kwantyfikator jest istotny. Na przykład na podstawie: x ≥ 0 ⇒ (y > x ⇒ y > 0) nie możemy uznać: ∃x : (x ≥ 0) ⇒ (y > x ⇒ y > 0). Definicja 2.15 (dowodu w rachunku predykatów). Formuła ϕ ma dowód ze zbioru Σ formuł języka rachunku predykatów — co zapisujemy: Σ ` ϕ — wtedy i tylko wtedy, gdy istnieje skończony ciąg formuł ϕ0 , ϕ1 , . . ., ϕn taki, że ϕn = ϕ, gdzie „=” jest skrótem dla „ jest równokształtne z” oraz dla każdego i (0 ≤ i ≤ n) spełniony jest przynajmniej jeden z warunków: 3
W tym wypadku kolidowałoby to z regułą podstawiania. Mianowicie, zgodnie z tą regułą za zmienną wolną y moglibyśmy podstawić dowolną liczbę dodatnią i stosując regułę odrywania otrzymalibyśmy: ∀y : (x > 0 ⇒ x + y > 0). Podstawiając zaś dowolną liczbę za zmienną x, lub po prostu wiążąc ją dużym kwantyfikatorem, otrzymujemy zdanie fałszywe. Tymczasem formuła: y > 0 ⇒ (x > 0 ⇒ x + y > 0) jest spełniona.
110
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
1. ϕi jest elementem Σ, 2. ϕi jest tautologią (języka rachunku predykatów), 3. ϕi jest aksjomatem (teorii) identyczności, 4. istnieją ϕj , ϕk takie, że ϕk = ϕj ⇒ ϕi ; j, k < i, 5. istnieją ϕk , k < i, oraz term t i zmienna v takie, że t jest podstawialne za v w formule ϕk i ϕk [v ::= t] = ϕi , 6. istnieje ϕk , k < i, takie, że ϕk = φ ⇒ ∀v : ψ oraz ϕi = φ ⇒ ψ, 7. istnieje ϕk , k < i, takie, że ϕk = φ ⇒ ψ i zmienna v nie występuje jako zmienna wolna w φ oraz ϕi = φ ⇒ ∀v : ψ, 8. istnieje ϕk , k < i, takie, że ϕk = ∃v : φ ⇒ ψ oraz ϕi = φ ⇒ ψ, 9. istnieje ϕk , k < i, takie, że ϕk = φ ⇒ ψ i zmienna v nie występuje jako zmienna wolna w ψ oraz ϕi = ∃v : φ ⇒ ψ. Definicja 2.16 (tezy rachunku predykatów). Formuły mające dowód z pustego zbioru formuł to tezy rachunku predykatów. Definicja 2.17 (sprzecznego zbioru formuł). Zbiór formuł jest sprzeczny wtedy i tylko wtedy, gdy z tego zbioru ma dowód dowolna formuła. Definicja 2.18 (niesprzecznego zbioru formuł). Zbiór formuł jest niesprzeczny wtedy i tylko wtedy, gdy nie jest sprzeczny. Teoria rozumiana jako zbiór formuł taki, że każda formuła mająca dowód z tego zbioru jest jego elementem, czyli tezą (zbiór zamknięty na operację konsekwencji) powinna być niesprzeczna. Rachunek logiczny, jako zbiór formuł mających dowód z pustego zbioru formuł, aby wart był rozważania, musi być niesprzeczny. Chodzi więc o to, aby zbiór jego tez — formuł mających dowód z pustego zbioru (formuł) — nie był równy zbiorowi wszystkich formuł języka tego rachunku, czyli żeby dla dowolnego ϕ nie było prawdą, że: ` ϕ. Przykład 2.11. Formuła: ∀x : P x ⇒ P x ma dowód z pustego zbioru formuł, czyli ` ∀x : P x ⇒ P x.
2.2. RACHUNEK PREDYKATÓW
111
Dowód. 1. ∀x : P x ⇒ ∀x : P x 2. ∀x : P x ⇒ P x
tautologia (O∀; 1)
Zauważmy, że dla dowolnej zmiennej v i dowolnej formuły ϕ analogicznie można dowieść, że T 1. ` ∀v : ϕ ⇒ ϕ. Zamiast dowodzić poszczególnych formuł będziemy więc podawali schematy dowodów. Z takiego schematu będzie można otrzymać dowód każdej formuły o schemacie formuły podanej jako teza. Dowód z pustego zbioru formuł ma formuła: ϕ ⇒ ∃v : ϕ czyli jest ona tezą rachunku predykatów, a więc zachodzi: T 2. ` ϕ ⇒ ∃v : ϕ. Dowód. 1. 2.
∃v : ϕ ⇒ ∃v : ϕ ϕ ⇒ ∃v : ϕ
tautologia (O∃; 1)
Zastosowanie reguły podstawiania będziemy wskazywali podając numer wiersza dowodowego, w którym dokonuje się podstawienia oraz zmienną i podstawiany za nią term. T 3. ` ∀v : ϕ ⇒ ϕ[v ::= t], jeżeli term t jest podstawialny za v w ϕ. Dowód. 1. 2. 3.
∀v : ϕ ⇒ ∀v : ϕ ∀v : ϕ ⇒ ϕ ∀v : ϕ ⇒ ϕ[v ::= t]
tautologia (O∀; 1) (2; v ::= t) jeżeli term t jest podstawialny za v w ϕ.
112
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
T 4. ` ϕ[v ::= t] ⇒ ∃v : ϕ, jeżeli term t jest podstawialny za v w ϕ. Dowód. 1. 2. 3.
∃v : ϕ ⇒ ∃v : ϕ ϕ ⇒ ∃v : ϕ ϕ[v ::= t] ⇒ ∃v : ϕ
tautologia (O∃; 1) (2; v ::= t) jeżeli term t jest podstawialny za v w ϕ.
Zrezygnujemy z przeprowadzania dowodów ściśle według definicji. Zwykle takie dowody są długie i nieprzejrzyste. Krótsze, a dla znających podstawowe prawa i reguły logiki prostsze są dowody, w których korzysta się z tych podstawowych praw i reguł. Pisząc w wierszu dowodowym nazwę tezy wskazujemy, że dowód formuły znajdującej się w tym wierszu przebiega według schematu dowodu tezy, na którą się powołujemy. Korzystać będziemy również z praw logiki zdań — jest oczywiste, że stosują się one do dowodów w rachunku predykatów — może to być wskazywane przez podanie nazwy zastosowanego prawa lub jego treści. T 5. ` ∃v1 : ∀v2 : ϕ ⇒ ∀v2 : ∃v1 : ϕ Dowód. 1. 2. 3. 4. 5.
∀v2 : ϕ ⇒ ϕ ϕ ⇒ ∃v1 : ϕ ∀v2 : ϕ ⇒ ∃v1 : ϕ ∃v1 : ∀v2 : ϕ ⇒ ∃v1 : ϕ ∃v1 : ∀v2 : ϕ ⇒ ∀v2 : ∃v1 : ϕ
T1 T2 (SYLL; 1,2) (D∃; 3) (D∀; 4)
T 6. ` ∃v : (ϕ ∧ ψ) ⇒ (∃v : ϕ ∧ ∃v : ψ) Dowód. 1. 2. 3. 4.
∃v : ϕ ⇒ ∃v : ϕ ϕ ⇒ ∃v : ϕ ∃v : ψ ⇒ ∃v : ψ ψ ⇒ ∃v : ψ
tautologia (O∃; 1) tautologia (O∃; 3)
2.2. RACHUNEK PREDYKATÓW 5.
(ϕ ∧ ψ) ⇒ (∃v : ϕ ∧ ∃v : ψ)
6.
∃v : (ϕ ∧ ψ) ⇒ (∃v : ϕ ∧ ∃v : ψ)
113 α⇒γ β ⇒ δ; 2,4 α∧β ⇒γ∧δ (D∃; 5)
T 7. ` t ≡ t Dowód. 1. 2.
x≡x t≡t
aksjomat 1 (1; x ::= t).
Teza T7 głosi, że identyczność jest zwrotna. T 8. ` (t ≡ t1 ) ⇒ (t1 ≡ t) Dowód. 1. 2. 3. 4. 5. 6.
[(x ≡ x1 ) ∧ (x ≡ x)] ⇒ (x1 ≡ x) {[(x ≡ x1 ) ∧ (x ≡ x)] ⇒ (x1 ≡ x)} ⇒ {(x ≡ x) ⇒ [(x ≡ x1 ) ⇒ (x1 ≡ x)]} (x ≡ x) ⇒ [(x ≡ x1 ) ⇒ (x1 ≡ x)] (x ≡ x) (x ≡ x1 ) ⇒ (x1 ≡ x) (t ≡ t1 ) ⇒ (t1 ≡ t)
aksjomat 3 tautologia (MP; 1,2) aksjomat 1 (MP; 4,3) (5; x ::= t, x1 ::= t1 )
Teza 8 głosi, że identyczność jest symetryczna. T 9. ` (t ≡ t1 ) ⇒ [(t1 ≡ t2 ) ⇒ (t ≡ t2 )] Dowód. 1. 2. 3.
[(x1 ≡ x) ∧ (x1 ≡ x2 )] ⇒ (x ≡ x2 ) {[(x1 ≡ x) ∧ (x1 ≡ x2 )] ⇒ (x ≡ x2 )} ⇒ {(x1 ≡ x) ⇒ [(x1 ≡ x2 ) ⇒ (x ≡ x2 )]} (x1 ≡ x) ⇒ [(x1 ≡ x2 ) ⇒ (x ≡ x2 )]
aksjomat 3 tautologia (MP; 1,2)
114 4. 5. 6.
ROZDZIAŁ 2. LOGIKA PREDYKATÓW (x ≡ x1 ) ⇒ (x1 ≡ x) T8 (x ≡ x1 ) ⇒ [(x1 ≡ x2 ) ⇒ (x ≡ x2 )] (SYLL; 3,4) (t ≡ t1 ) ⇒ [(t1 ≡ t2 ) ⇒ (t ≡ t2 )] (5; x ::= t, x1 ::= t1 , x2 ::= t2 )
Teza 9 głosi, że identyczność jest przechodnia. A oto niektóre ważniejsze prawa, schematy i reguły klasycznej logiki predykatów. Rozumiemy je analogicznie do praw, schematów i reguł rachunku zdań. ϕ/∀v : ϕ — reguła generalizacji ∀v : ϕ ⇒ ϕ[v ::= t],
jeśli term t jest podstawialny za v
ϕ[v ::= t] ⇒ ∃v : ϕ,
jeśli term t jest podstawialny za v
4
∀v : ϕ ⇒ ∃v : ϕ
∀v1 : ∀v2 : ϕ ⇔ ∀v2 : ∀v1 : ϕ ∃v1 : ∃v2 : ϕ ⇔ ∃v2 : ∃v1 : ϕ ∃v1 : ∀v2 : ϕ ⇒ ∀v2 : ∃v1 : ϕ5 Kwantyfikatory a spójnik negacji — prawa De Morgana ¬ ∀v : ϕ ⇔ ∃v : ¬ ϕ ¬ ∃v : ϕ ⇔ ∀v : ¬ ϕ Kwantyfikatory a spójnik implikacji ∀v : (ϕ ⇒ φ) ⇒ (∀v : ϕ ⇒ ∀v : φ) ∀v : (ϕ ⇒ φ) ⇒ (∃v : ϕ ⇒ ∃v : φ) 4 5
Prawo to jest ograniczone do dziedziny niepustej. Warto tu zauważyć, że prawem nie jest ∀v2 : ∃v1 : φ ⇒ ∃v1 : ∀v2 : φ.
Prawdziwe nie jest zdanie ∀x : ∃y : (x < y) ⇒ ∃y : ∀x : (x < y), czyli prawdziwe nie jest zdanie: jeżeli dla każdej liczby istnieje liczba od niej większa, to istnieje liczba taka, która jest większa od każdej liczby.
2.2. RACHUNEK PREDYKATÓW
115
Kwantyfikatory a spójnik koniunkcji ∀v : (ϕ ∧ φ) ⇔ (∀v : ϕ ∧ ∀v : φ) ∃v : (ϕ ∧ φ) ⇒ (∃v : ϕ ∧ ∃v : φ) Kwantyfikatory a spójnik alternatywy (∀v : ϕ ∨ ∀v : φ) ⇒ ∀v : (ϕ ∨ φ) ∃v : (ϕ ∨ φ) ⇔ (∃v : ϕ ∨ ∃v : φ) Kwantyfikatory a spójnik równoważności — prawa ekstensjonalności ∀v : (ϕ ⇔ φ) ⇒ [∀v : (ϕ ⇒ φ) ∧ ∀v : (φ ⇒ ϕ)] ∀v : (ϕ ⇔ φ) ⇒ (∀v : ϕ ⇔ ∀v : φ) ∀v : (ϕ ⇔ φ) ⇒ (∃v : ϕ ⇔ ∃v : φ).
2.2.2
Twierdzenie o dedukcji
Twierdzenie o dedukcji dla rachunku predykatów w swoim sformułowaniu różni się od twierdzenia o dedukcji dla rachunku zdań tylko pewnym zastrzeżeniem spowodowanym tym, że w rachunku predykatów — inaczej niż w rachunku zdań — oprócz zdań wyrażeniami poprawnie zbudowanymi są również formuły nie będące zdaniami. Twierdzenie 2.1 (o dedukcji). Niech ϕ będzie zdaniem (φ nie musi być zdaniem). Σ ∪ {ϕ} ` φ wtedy i tylko wtedy, gdy Σ ` ϕ ⇒ φ. Dowód. Dowód tego twierdzenia przebiega w analogiczny sposób jak w wypadku rachunku zdań. Jest jednak bardziej złożony. We fragmencie, w którym dowodzimy, że jeżeli Σ ∪ {ϕ} ` φ, to Σ ` ϕ ⇒ φ
116
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
trzeba rozważyć zastosowanie reguł rachunku predykatów. Niech: γ1 , γ2 , . . ., γn będzie dowodem formuły φ ze zbioru Σ ∪ {ϕ}. Przez indukcję ze względu na długość dowodu: γ1 , γ2 , . . ., γn dowodzimy, że ze zbioru Σ istnieje dowód formuły ϕ ⇒ γi , 1 ≤ n. Rozpoczynamy od wypadku, gdy i = 1. γ1 może być elementem zbioru Σ ∪ {ϕ}, tautologią języka rachunku predykatów lub aksjomatem teorii identyczności. Dowód, że formuła ϕ ⇒ γ1 ma dowód ze zbioru Σ niczym w istocie nie różni się od analogicznego wypadku w dowodzie twierdzenia o dedukcji dla logiki zdań. Założenie indukcyjne. Jako założenie indukcyjne przyjmujemy, że ze zbioru Σ istnieje dowód formuły ϕ ⇒ γi , i ≤ k. W dowodzie tezy indukcyjnej, że ze zbioru Σ istnieje dowód formuły ϕ ⇒ γk+1 ograniczymy się do pokazania jak postępujemy w wypadku reguły podstawiania oraz reguł dołączania (D∀) i opuszczania (O∀) dużego kwantyfikatora. (Reguła podstawiania) Niech γk+1 będzie otrzymane przez podstawienie termu t w miejsce zmiennej v w γi , czyli γk+1 = γi [v ::= t]. Niech ψ1 , ψ2 , . . ., ψm (= ϕ ⇒ γi ) będzie dowodem ze zbioru Σ formuły ϕ ⇒ γi . Z założenia twierdzenia o dedukcji ϕ jest zdaniem, czyli nie zawiera zmiennych wolnych, zatem (ϕ ⇒ γi )[v ::= t] = ϕ ⇒ γi [v ::= t]. Dowód ϕ ⇒ γk+1 ze zbioru Σ uzyskamy dopisując ϕ ⇒ γi [v ::= t] jako kolejny wyraz do ciągu ψ1 , ψ2 , . . ., ψm , czyli dopisując formułę otrzymaną przez zastosowanie do ψm reguły podstawiania. (D∀) Pokażemy, że jeżeli γk+1 zostało otrzymane przez zastosowanie reguły D∀ do γi , to ze zbioru Σ istnieje dowód dla ϕ ⇒ γk+1 . Niech γi = ξ ⇒ λ i niech γk+1 = ξ ⇒ ∀v : λ. Z tego wynika, że ξ nie zawiera zmiennej v jako wolnej. Z założenia indukcyjnego dostajemy, że ze zbioru Σ istnieje dowód dla ϕ ⇒ γi , czyli dla ϕ ⇒ (ξ ⇒ λ). Niech ψ1 , ψ2 , . . ., ψm [= ϕ ⇒ (ξ ⇒ λ)] będzie tym dowodem. Aby uzyskać dowód formuły ϕ ⇒ γk+1 , czyli formuły ϕ ⇒ (ξ ⇒ ∀v : λ), do ciągu ψ1 , ψ2 , . . ., ψm dopisujemy jako kolejne wyrazy następujące formuły: (m+1). (m+2). (m+3).
[ϕ ⇒ (ξ ⇒ λ)] ⇒ (ϕ ∧ ξ ⇒ λ) ϕ∧ξ ⇒λ ϕ ∧ ξ ⇒ ∀v : λ
tautologia (MP; m, m+1) (D∀; m+2)
2.2. RACHUNEK PREDYKATÓW (m+4). (m+5).
(ϕ ∧ ξ ⇒ ∀v : λ) ⇒ [ϕ ⇒ (ξ ⇒ ∀v : λ)] ϕ ⇒ (ξ ⇒ ∀v : λ)
117 tautologia (MP; m+3, m+4).
Zauważmy, że do wiersza (m+2) można było zastosować regułę dołączania dużego kwantyfikatora ponieważ: 1. z założenia twierdzenia o dedukcji ϕ jest zdaniem, a 2. ξ nie zawiera v jako zmiennej wolnej. γk+1 (= ξ ⇒ ∀v : λ) zostało uzyskane z γi (= ξ ⇒ λ) przez zastosowanie reguły D∀, co jest możliwe tylko w wypadku, gdy ξ nie zawiera v jako zmiennej wolnej. (O∀) Niech γk+1 będzie otrzymane przez zastosowanie reguły opuszczania dużego kwantyfikatora do γi (= ξ ⇒ ∀v : λ), czyli γk+1 (= ξ ⇒ λ). Niech ψ1 , ψ2 , . . ., ψm [= ϕ ⇒ (ξ ⇒ ∀v : λ)] będzie dowodem ze zbioru Σ formuły ϕ ⇒ γi . Dowód ze zbioru Σ formuły ϕ ⇒ (ξ ⇒ λ) uzyskujemy dopisując do ciągu ψ1 , ψ2 , . . ., ψm jako kolejne wyrazy następujące formuły: (m+1). (m+2). (m+3). (m+4). (m+5).
[ϕ ⇒ (ξ ⇒ ∀v : λ)] ⇒ (ϕ ∧ ξ ⇒ ∀v : λ) ϕ ∧ ξ ⇒ ∀v : λ ϕ∧ξ ⇒λ (ϕ ∧ ξ ⇒ λ) ⇒ [ϕ ⇒ (ξ ⇒ λ) ϕ ⇒ (ξ ⇒ λ)
tautologia (MP; m, m+1) (O∀, m+2) tautologia (MP;m+3, m+4)
Dowód tezy: jeżeli Σ ` ϕ ⇒ φ, to Σ ∪ {ϕ} ` φ przebiega w sposób nieistotnie różniący się od analogicznego fragmentu dowodu twierdzenia o dedukcji dla rachunku zdań: do dowodu ze zbioru Σ formuły ϕ ⇒ φ dopisujemy jako kolejne wyrazy ciągu ϕ – jest to element zbioru Σ ∪ {ϕ} — oraz φ — co uzyskujemy stosując regułę odrywania. Kiedy mamy dowód φ ze zbioru Σ, a dowodzimy ϕ ze zbioru Σ i w ciągu dowodowym pojawia się φ, to dowód ϕ możemy „skrócić” zastępując fragment ciągu będący dowodem φ powołaniem się na to, że φ ma dowód z Σ. W szczególnym wypadku może to być powołanie się na już udowodnione tezy (formuły mające dowód z pustego zbioru formuł). Twierdzenie o dedukcji daje dodatkową możliwość „skracania” — pozwala na wykorzystywanie
118
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
dowodu λ ⇒ ξ ze zbioru Σ dowodem ξ ze zbioru Σ ∪ {λ}, i na odwrót. Korzystając ze wskazanych „skrótów” w opisie dowodu, w niczym nie naruszamy jego istoty, czyli nie zmieniamy jego definicji. T 10. ` ∀x : (P x ⇒ Qx) ⇒ (∃x : P x ⇒ ∃x : Qx). Dowód. 1. ` ∀x : (P x ⇒ Qx) ⇒ (P x ⇒ Qx) 2. ∀x : (P x ⇒ Qx) ` P x ⇒ Qx6 3. ` Qx ⇒ ∃x : Qx 4. ∀x : (P x ⇒ Qx) ` P x ⇒ ∃x : Qx 5. ∀x : (P x ⇒ Qx) ` ∃x : P x ⇒ ∃x : Qx 6. ` ∀x : (P x ⇒ Qx) ⇒ (∃x : P x ⇒ ∃x : Qx)
T3 (Tw. o dedukcji; 1) T4 (SYLL; 2, 3) (D∃; 4) (tw. o dedukcji; 5)
Założenie, że poprzednik implikacji — do której stosujemy twierdzenie o dedukcji — jest zdaniem jest istotne. W wyżej przeprowadzonym dowodzie twierdzenia o dedukcji było ono wykorzystane, gdy rozważaliśmy zastosowanie reguły podstawiania oraz reguły dołączania dużego kwantyfikatora. Pokażemy — będzie to przykład odnoszący się do reguły podstawiania — że jego zignorowanie prowadzi do niepożądanych konsekwencji, do możliwości otrzymywania fałszywych wniosków z prawdziwych przesłanek. Przykład 2.12. Niech Σ będzie teorią nierówności > (⊆ R × R). Zatem prawdą jest, że 1. Σ ` x > 2 ⇒ x > 1. Przejście od 1 do 2: 2. Σ ∪ {x > 2} ` x > 1 nie jest uprawnione. Stosując regułę generalizacji otrzymamy bowiem: 3. Σ ∪ {x > 2} ` ∀x : (x > 1). Ponowne zastosowanie twierdzenia o dedukcji daje: 4. Σ ` x > 2 ⇒ ∀x : (x > 1). Teraz podstawiamy za zmienną wolną x stałą, powiedzmy 3. Dostajemy: 6
Jeżeli nie prowadzi to do nieporozumienia zamiast: {ϕ1 , . . . , ϕn } ` φ piszemy: ϕ 1 , . . . , ϕn ` φ
2.2. RACHUNEK PREDYKATÓW
119
5. Σ ` 3 > 2 ⇒ ∀x : (x > 1). Ponieważ: 6. Σ ` 3 > 2, więc stosując M P dostajemy: 7. Σ ` ∀x : (x > 1). 7 nie jest prawdziwe.
°
T 11. ` ∀v : (ϕ ⇒ ψ) ⇒ (∃v : ϕ ⇒ ∃v : ψ) Dowód. 1.
` ∀v : (ϕ ⇒ ψ) ⇒ [ϕ[v ::= v1 ] ⇒ ψ[v ::= v1 ]]
2. 3. 4. 5.
∀v : (ϕ ⇒ ψ) ` ϕ[v ::= v1 ] ⇒ ψ[v : colon = v1 ] ` ψ[v ::= v1 ] ⇒ ∃v : ψ ∀v : (ϕ ⇒ ψ) ` ϕ[v ::= v1 ] ⇒ ∃v : ψ ∀v : (ϕ ⇒ ψ) ` [ϕ[v ::= v1 ]][v1 ::= v] ⇒ ∃v : ψ ∀v : (ϕ ⇒ ψ) ` ϕ ⇒ ∃v : ψ ∀v : (ϕ ⇒ ψ) ` ∃v : ϕ ⇒ ∃v : ψ ` ∀v : (ϕ ⇒ ψ) ⇒ (∃v : ϕ ⇒ ∃v : ψ)
6. 7.
T3, gdzie v1 nie występuje w ϕ ⇒ ψ (Tw. o dedukcji; 1) T4 (SYLL; 2, 3) (4) (D∃; 5) (tw. o dedukcji; 6)
Udowodnimy teraz twierdzenie, które mówi, że dokonując w jakiejś formule ϕ zastąpienia podformuły przez formułę jej równoważną otrzymamy formułę równoważną formule ϕ. ψ::=χ
Twierdzenie 2.2 (o zastępowaniu). Niech ϕ −→ φ, czyli niech formuła φ będzie wynikiem zastąpienia w formule ϕ formuły ψ przez formułę χ. Jeżeli ψ ⇔ χ, to ϕ ⇔ φ. Dowód. Dowodzimy podobnie jak twierdzenia o zastępowaniu dla rachunku zdań, czyli przez indukcję ze względu na konstrukcję formuły. Niech ψ będzie formuła ϕ. Z założenia ψ ⇔ χ, zatem ϕ ⇔ χ. Ponieważ χ jest równokształtne z φ, więc χ ⇔ φ, a zatem ϕ ⇔ φ.
120
ROZDZIAŁ 2. LOGIKA PREDYKATÓW ψ::=χ
Założenie indukcyjne. Niech ϕ1 −→ φ1 , ψ ⇔ χ i niech ϕ1 ⇔ φ1 . ψ::=χ
(¬) Niech ϕ będzie formułą ¬ ϕ1 . Zauważmy, że ¬ ϕ1 −→ ¬ φ1 . Ponieważ ϕ1 ⇔ φ1 , więc ¬ ϕ1 ⇔ ¬ φ1 , czyli ϕ ⇔ φ. (∨) Niech teraz ϕ będzie formułą ϕ1 ∨ϕ2 . Z założenia indukcyjnego ϕ1 ⇔ φ1 , ψ::=χ
zatem (ϕ1 ∨ ϕ2 ) ⇔ (φ1 ∨ ϕ2 ). Ponieważ ϕ1 ∨ ϕ2 −→ φ1 ∨ ϕ2 , zatem ϕ ⇔ φ. Podobnie postępuje się, gdy zastępowana podformuła występuje w drugim argumencie alternatywy. Pozostałe wypadki spójników zdaniowych są analogiczne. Rozważmy jeszcze wypadek, gdy formuła ϕ to formuła ∀v : ϕ1 . Z założenia indukcyjnego ϕ1 ⇔ φ1 . W takim razie ∀v : ϕ1 ⇔ ∀v : φ1 . Ponieważ ψ::=χ ∀v : ϕ1 −→ ∀v : phi1 , więc ϕ ⇔ φ.
2.2.3
Postacie normalne
Podobnie jak w wypadku rachunku zdań możemy ustalić pewne szczególne standardowe postacie formuł, postacie normalne. Definicja 2.19 (przedrostkowej postaci normalnej, PNF7 ). Formuła ψ ma przedrostkową (prefiksową) postać normalną wtedy i tylko wtedy, gdy jest postaci: Q1 v1 : Q2 v2 : . . . Qn vn : ϕ, gdzie 1. Qi ∈ {∀, ∃}, 1 ≤ i ≤ n, 2. vi 6= vj , jeżeli i 6= j, 3. w formule ϕ nie występuje żaden kwantyfikator, 4. vi ∈ V (ϕ), 1 ≤ i ≤ n, czyli każda zmienna wiązana przez którykolwiek z kwantyfikatorów Qi występuje w formule ϕ lub — inaczej mówiąc – każda zmienna występująca w przedrostku występuje też w matrycy. Q1 v1 : Q2 v2 : . . . Qn vn : to przedrostek (prefiks) formuły ψ, matryca formuły ψ. 7
Po angielsku: Prenex Normal Form.
a ϕ to
2.2. RACHUNEK PREDYKATÓW
121
Zauważmy, że nie wykluczyliśmy możliwości występowania w matrycy zmiennej, która nie jest wiązana przez kwantyfikator (występujący w przedrostku). Inaczej mówiąc, w postaci normalnej mogą znajdować się formuły otwarte (niebędące zdaniami). Przykład 2.13. Następujące formuły mają przedrostkową postać normalną: ∀x : ∃y : [P (x, y) ∨ R(y)], ∀x : ∀y : [¬ P (x) ∧ R(x, y)].
°
Przykład 2.14. Formuła: ∀x : [¬ P (x, y) ∨ ∃y : R(y)] nie jest formułą o postaci normalnej.
°
Pokażemy, że dla każdej formuły istnieje jej równoważna formuła o przedrostkowej postaci normalnej. Twierdzenie 2.3. Dla każdej formuły ϕ istnieje jej równoważna formuła ψ o przedrostkowej postaci normalnej. Dowód. Dla dowodu podamy sposób przekształcania formuły w jej równoważną formułę o postaci normalnej. Rozpoczynamy od opuszczenia zbędnych kwantyfikatorów. Opieramy się na tym, że Qv : φ ⇔ φ, jeśli v nie występuje jako zmienna wolna w φ. Każdą podformułę formuły ϕ, w której kwantyfikator wiąże zmienną niewystępującą w tej podformule zastępujemy jej równoważną formułą bez tego kwantyfikatora. Na podstawie twierdzenia o zastępowaniu otrzymana w wyniku formuła jest równoważna formule ϕ. Przy przekształcaniu formuły ϕ w jej równoważną formułę o przedrostkowej postaci normalnej korzysta się z następujących równoważności: 1. (ϕ ⇔ ψ) ⇔ [(ϕ ⇒ ψ) ∧ (ψ ⇒ ϕ)], 2. ¬ ∀v : ϕ ⇔ ∃v : ¬ ϕ, 3. ¬ ∃v : ϕ ⇔ ∀v : ¬ ϕ, O formułach 4–15 zakładamy, że v1 nie występuje ani w ϕ, ani w ψ.
122
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
4. [∀v : ϕ ∨ ψ] ⇔ ∀v1 : [ϕ[v ::= v1 ] ∨ ψ], 5. [ϕ ∨ ∀v : ψ] ⇔ ∀v1 : [ϕ ∨ ψ[v ::= v1 ]], 6. [∃v : ϕ ∨ ψ] ⇔ ∃v1 : [ϕ[v ::= v1 ] ∨ ψ], 7. [ϕ ∨ ∃v : ψ] ⇔ ∃v1 : [ϕ ∨ ψ[v ::= v1 ]], 8. [∀v : ϕ ∧ ψ] ⇔ ∀v1 : [ϕ[v ::= v1 ] ∧ ψ], 9. [ϕ ∧ ∀v : ψ] ⇔ ∀v1 : [ϕ ∧ ψ[v ::= v1 ]], 10. [∃v : ϕ ∧ ψ] ⇔ ∃v1 : [ϕ[v ::= v1 ] ∧ ψ], 11. [ϕ ∧ ∃v : ψ] ⇔ ∃v1 : [ϕ ∧ ψ[v ::= v1 ]], 12. [∀v : ϕ ⇒ ψ] ⇔ ∃v1 : [ϕ[v ::= v1 ] ⇒ ψ], 13. [ϕ ⇒ ∀v : ψ] ⇔ ∀v1 : [ϕ ⇒ ψ[v ::= v1 ]], 14. [∃v : ϕ ⇒ ψ] ⇔ ∀v1 : [ϕ[v ::= v1 ] ⇒ ψ], 15. [ϕ ⇒ ∃v : ψ] ⇔ ∃v1 : [ϕ ⇒ ψ[v ::= v1 ]]. Każdą podformułę o postaci równoważności zastępujemy w formule ϕ zgodnie z pierwszym prawem. Postępujemy tak długo, aż otrzymamy formułę, w której nie występuje spójnik równoważności. Oczywiście, zgodnie z twierdzeniem o zastępowaniu otrzymana formuła będzie równoważna formule ϕ. Do podformuł formuły ϕ w zależności od ich budowy stosujemy odpowiednie równoważności i dokonujemy ich zastąpienia przez drugi argument równoważności. Procedurę tę kontynuujemy aż do wyczerpania wszystkich możliwości. Otrzymana w ten sposób formuła będzie równoważna formule ϕ, kwantyfikatory będą występować tylko na początku tej formuły a ponadto w związku z tym, że wyeliminowane zostały wszystkie zbędne kwantyfikatory oraz, że przy zastępowaniu wprowadzamy zmienne, niewystępujące w formule, w której dokonywana jest operacja zastępowania, wszystkie zmienne tej formuły będą się różniły jedna od drugiej a nadto będą różne od występujących w niej zmiennych wolnych. Otrzymana formuła spełnia zatem wszystkie warunki nałożone na przedrostkową postać normalną.
2.2. RACHUNEK PREDYKATÓW
123
Przedrostkową postać normalną formuły ϕ oznaczmy P N F (ϕ). Z opisu procedury znajdowania takiej formuły widać — choćby dlatego, że nie jest zdeterminowana kolejność zastępowania — że dla danej formuły może istnieć więcej niż jedna jej równoważna formuła o przedrostkowej postaci normalnej, inaczej mówiąc dla danej formuły ϕ nie jest jednoznacznie określona formuła P N F (ϕ). Przykład 2.15. Przekształcimy do przedrostkowej postaci normalnej formułę: ∀x : [P (x) ⇒ ∃y : Q(y, x)] ⇒ ¬ ∃x : R(x, x). Dokonujemy podstawień otrzymując kolejno formuły równoważne rozważanej formule. 1. ∀x : [P (x) ⇒ ∃y : Q(y, x)] ⇒ ∀x : ¬ R(x, x). Na podstawie 15 mamy: 2. ∀x : ∃z : [P (x) ⇒ Q(z, x)] ⇒ ∀x : ¬ R(x, x). Z tego korzystając z 13 dostajemy: 3. ∀y : {∀x : ∃z : [P (x) ⇒ Q(z, x)] ⇒ ¬ R(y, y)}. Na podstawie 12: 4. ∀y : ∃t : {∃z : [P (t) ⇒ Q(z, t)] ⇒ ¬ R(y, y)}. Ostatecznie z 14 mamy: 5. ∀y : ∃t : ∀x : {[P (t) ⇒ Q(x, t)] ⇒ ¬ R(y, y)}. Zauważmy, że formule z naszego przykładu możemy zgodnie z opisaną procedurą przyporządkować inną formułę nie tylko różniącą się kształtem zmiennych, lecz również formułę o innej kolejności kwantyfikatorów w przedrostku. 6. ∀x : [P (x) ⇒ ∃y : Q(y, x)] ⇒ ∀x : ¬ R(x, x). Na podstawie 15 mamy: 7. ∀x : ∃z : [P (x) ⇒ Q(z, x)] ⇒ ∀x : ¬ R(x, x). Z tego korzystając z 12 dostajemy:
124
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
8. ∃t : {∃z : [P (t) ⇒ Q(z, t)] ⇒ ∀x : ¬ R(x, x)}. Na podstawie 13: 9. ∃t : ∀y : {∃z : [P (t) ⇒ Q(z, t)] ⇒ ¬ R(y, y)}. Ostatecznie z 14 mamy: 10. ∃t : ∀y : ∀x : {[P (t) ⇒ Q(x, t)] ⇒ ¬ R(y, y)}.
°
Szczególnym kształtem formuły jest standardowa postać skolemowska8 . Zauważmy, że spełnienie formuły ∃x : ϕ znaczy tyle, że jest taki przedmiot c, że prawdziwe jest ϕ[x ::= c]. Inaczej mówiąc, formuła ∃x : ϕ jest spełniona wtedy i tylko wtedy, gdy spełniona jest formuła ϕ[x ::= c]. Definicja 2.20 (standardowej postaci skolemowskiej). Formuła o standardowej postaci przedrostkowej ma standardową postać skolemowską wtedy i tylko wtedy, gdy w jej prefiksie nie występują kwantyfikatory szczegółowe. Niech Skol(ϕ) będzie standardową skolemowską postacią formuły ϕ. Procedura przekształcania formuły do standardowej postaci skolemowskiej to skolemizacja. Skolemizacja jest metodą eliminacji kwantyfikatorów szczegółowych przez zastępowanie stałymi lub funkcjami wiązanych przez nie zmiennych. Skolemizacja formuły poprzedzona jest jej sprowadzeniem do przedrostkowej postaci normalnej. Niech formuła ϕ znajduje się w przedrostkowej postaci normalnej. Skolemizacji formuły ϕ dokonujemy następująco: 1. Kwantyfikatorami ogólnymi wiążemy wszystkie (i tylko) zmienne wolne występujące w ϕ. 2. Jeżeli formuła ma postać ∃v : ψ, to zastępujemy ją formułą ψ[v ::= c], gdzie stała c nie występuje w formule ψ. Każdy występujący w prefiksie kwantyfikator szczegółowy, który nie jest poprzedzany przez kwantyfikator ogólny eliminujemy wpisując jedną i tę samą stałą w miejsce każdego wystąpienia zmiennej wiązanej przez ten kwantyfikator. Przy tym za różne co do kształtu zmienne związane wpisujemy różne stałe. Stałe te to stałe Skolema. 8
Thoralf Skolem, matematyk norweski, wykazał, że z prefiksowej postaci normalnej formuły ϕ można wyeliminować wszystkie kwantyfikatory szczegółowe tak, że otrzymana formuła jest spełniona wtedy i tylko wtedy, gdy jest spełniona formuła ϕ.
2.2. RACHUNEK PREDYKATÓW
125
3. Jeżeli formuła ma postać ∀v1 : . . . ∀vn : ∃v : ψ, to zastępujemy ją formułą ∀v1 : . . . ∀vn : ψ[v ::= F (v1 , . . . , vn ], gdzie litera funkcyjna F nie występuje w formule ψ. Jeżeli kwantyfikator szczegółowy w prefiksie formuły ϕ0 uzyskanej przez wykonanie którejś z operacji 1–3 poprzedzany jest przez kwantyfikatory ogólne wiążące zmienne v1 , . . . , vn , to w miejsce każdego wystąpienia zmiennej wiązanej przez ten kwantyfikator szczegółowy wpisujemy term F (v1 , . . . , vn ), gdzie litera funkcyjna F nie występuje w rozważanej formule ϕ0 . Funkcja F (v1 , . . . , vn ) to funkcja Skolema (Herbranda 9 ). Operacje opisane w powyższych punktach wykonujemy tak długo aż otrzymamy formułę o przedrostkowej postaci normalnej, w której prefiksie nie występują kwantyfikatory szczegółowe. Opisany sposób skolemizacji formuły w przedrostkowej postaci normalnej prowadzi do formuł różniących się jedynie wyborem symboli stałych indywiduowych i liter funkcyjnych. Przykład 2.16. Skolemowską postacią normalną formuły: ∃t : ∀y : ∀x : {[P (t) ⇒ Q(x, t)] ⇒ ¬ R(y, y)} jest formuła: ∀y : ∀x : {[P (a) ⇒ Q(x, a)] ⇒ ¬ R(y, y)}.
°
Przykład 2.17. Skolemowską postacią normalną formuły: ∀x : ∃y : P (x, y) jest formuła: ∀x : P (x, f (x)).
°
W wypadku P N F (ϕ) ma miejsce równoważność: ϕ ⇔ P N F (ϕ), czyli: ` ϕ ⇔ P N F (ϕ). Tak nie musi być w wypadku Skol(ϕ), czyli nie musi zachodzić równoważność: ϕ ⇔ Skol(ϕ) (` ϕ ⇔ Skol(ϕ).) W tym wypadku związek jest słabszy, a mianowicie: ϕ jest spełnione wtedy i tylko wtedy, gdy Skol(ϕ) jest spełnione (czyli zachodzi |= ϕ ⇔ Skol(ϕ)). Skolemizacja prowadzi do szczególnej postaci prefiksu: występują w nim tylko kwantyfikatory ogólne. Standaryzacji można poddać również matrycę formuły w przedrostkowej postaci normalnej. 9
J. Herbrand, 1908–31, swoimi pracami dał podstawy takiego ujęcia rachunku kwantyfikatorów.
126
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Definicja 2.21 (literału). Literał to formuła atomowa lub formuła atomowa poprzedzona spójnikiem negacji. Formuły atomowe to literały pozytywne, a negacje formuł atomowych to literały negatywne. Przykład 2.18. Literałami są: P (x), ¬ P (x), Q(x, y), R(f (x), x). P (x), Q(x, y), R(f (x), x) to literały pozytywne, a ¬ P (x) to literał negatywny. ° Definicja 2.22 (klauzuli). Klauzula to skończona alternatywa literałów, czyli λ1 ∨ λ2 ∨ · · · ∨ λn , gdzie λi ; 1 ≤ i ≤ n to literał. Przykład 2.19. Klauzulami są: Q(x, y), P (x) ∨ ¬ P (x), P (x) ∨ Q(f (x), y). Klauzulą nie jest: ¬ [P (x) ∨ ¬ P (x)]. ° Klauzula może być zapisana jako zbiór literałów. Logicznie taki zbiór odpowiada formule będącej alternatywą wszystkich i tylko jego elementów (literałów). Klasa klauzul logicznie odpowiada formule będącej koniunkcją wszystkich i tylko klauzul będących jej elementami. Matryca formuły o przedrostkowej postaci normalnej nie zawiera kwantyfikatorów. Podobnie jak zdanie z rachunku zdań może więc zostać przedstawiona w postaci normalnej, w szczególności jako koniunkcja klauzul. W wypadku formuł o standardowej postaci skolemowskiej można pominąć prefiks. Domyślnie przyjmuje się, że wszystkie zmienne indywiduowe związane są kwantyfikatorami ogólnymi. Domyślność ta ma ugruntowanie w prawie rachunku kwantyfikatorów, w zasadzie generalizacji. Formuła o standardowej postaci skolemowskiej może więc być zapisana jako klasa klauzul, czyli klasa zbiorów literałów. W informatyce szczególnie ważne są klauzule hornowskie10 . Definicja 2.23 (klauzuli hornowskiej). Klauzula Horna to klauzula z co najwyżej jednym pozytywnym literałem. Pozytywna klauzula Horna to klauzula, która ma jeden literał pozytywny. Negatywna klauzula Horna to klauzula, która nie ma literału pozytywnego. 10
Alfred Horn (1951) pierwszy wskazał na znaczenie takich klauzul w 1951 r.
2.2. RACHUNEK PREDYKATÓW
127
Niech λ, ewentualnie z indeksami, będzie literałem pozytywnym, formułą atomową. Klauzulami Horna są zatem wyrażenia następujących postaci: 1. ¬ λ1 ∨ · · · ∨ ¬ λn ∨ λ, n ∈ N, gdy klauzula Horna zawiera literał pozytywny, 2. ¬ λ1 ∨ · · · ∨ ¬ λn , n ∈ N, gdy klauzula Horna nie zawiera żadnego literału pozytywnego, 3. λ, gdy klauzula Horna nie zawiera żadnego literału negatywnego, 4. klauzula pusta, gdy klauzula Horna nie zawiera ani literału negatywnego ani pozytywnego. Klauzula z pozytywnym literałem może być w sposób równoważny przedstawiona jako: λ1 ∧ · · · ∧ λn ⇒ λ. Z rachunku kwantyfikatorów mamy, że ` λ1 ∧ · · · ∧ λn ⇒ λ wtedy i tylko wtedy, gdy: λ1 ∧ · · · ∧ λn ` λ, czyli: formuła λ1 ∧ · · · ∧ λn ⇒ λ jest tezą rachunku kwantyfikatorów wtedy i tylko wtedy, gdy λ wynika (logicznie) z λ1 ∧ · · · ∧ λn . Informatycy używają specyficznej notacji. Klauzule11 Horna zapisywane są za pomocą odwróconej implikacji, ⇐12 . W miejsce spójnika koniunkcji stosowany jest zaś przecinek. Poszczególne klauzule mają swoje specyficzne nazwy. Poszczególnym klauzulom 1–4 odpowiadają więc następujące wyrażenia: 11
W PROLOG–u klazulami nazywa się reguły, fakty i zapytania. Implikacja odwrócona, ⇐, to spójnik prawdziwościowy taki, że zdanie złożone jest fałszywe tylko w jednym wypadku, gdy pierwszy argument jest fałszywy, a drugi argument jest prawdziwy. 12
128 10 . 20 . 30 . 40 .
ROZDZIAŁ 2. LOGIKA PREDYKATÓW λ ⇐ λ1 , . . . , λn , n 6= 0 λ⇐ ⇐ λ1 , . . . , λn , n 6= 0
— — — —
reguła; fakt, zanegowane pytanie; klauzula pusta (sprzeczność)
Kolejnym krokiem standaryzacji postaci formuł jest standaryzacja literałów. Tu można ustalić postać termów. Procedura standaryzacji termów to unifikacja. Zastosowanie rachunku rezolucyjnego dla logiki kwantyfikatorów oprócz przedstawienia formuł w standardowej postaci skolemowskiej wymaga też unifikacji termów.
2.2.4
Tablice semantyczne
W wypadku rachunku zdań — korzystając z definicji tautologii — podaliśmy metody sprawdzania tautologiczności zdań, w szczególności metodę tablic semantycznych. Powstaje pytanie o możliwość takiej metody dla rachunku predykatów. Chodzi więc o uogólnienie metody tablic semantycznych na rachunek predykatów. Uczynimy to dla języka, który nie zawiera liter funkcyjnych. Wszystkie zasady konstrukcji drzewa oraz reguły przyjęte dla metody tablic semantycznych dla rachunku zdań uzupełniamy o następujące reguły specyficzne dla rachunku predykatów. ∃v : ψ X
∃L
.. . ψ[v ::= c] Reguła ∃L stosuje się do zdania ∃v : ψ zapisanego po lewej stronie gałęzi. Zdanie ∃v : ψ jest prawdziwe wtedy i tylko wtedy, gdy dla pewnej stałej c prawdą jest, że ψ[v ::= c]. Zdanie to zapisujemy po lewej stronie na każdej gałęzi, na której znajduje się analizowane zdanie ∃v : ψ. Stała indywiduowa c musi być stałą, która nie występuje na gałęziach, na których dopisujemy zdanie ψ[v ::= c]. Do danego zdania regułę ∃L stosujemy tylko raz. Jest to reguła jednokrotna. Fakt zastosowania ∃L zaznaczamy za pomocą X. ∃v : ψ ?
∃P .. .
ψ[v ::= c]
2.2. RACHUNEK PREDYKATÓW
129
Reguła ∃P stosuje się do zdania ∃v : ψ zapisanego po prawej stronie gałęzi. Zdanie ∃v : ψ nie jest prawdziwe wtedy i tylko wtedy, gdy dla każdej stałej c nie jest prawdziwe ψ[v ::= c]. Zdanie ψ[v ::= c] piszemy po prawej stronie każdej gałęzi, na której znajduje się ∃v : ψ. Stała c jest dowolna. Ponieważ bez względu na to, jaką weźmiemy stałą c nie jest spełnione ψ[v ::= c], więc reguła ∃P może być do tego zdania stosowana wielokrotnie. Jest to reguła wielokrotna. Fakt zastosowania ∃P zaznaczamy za pomocą ?. ∀v : ψ ?
∀L
.. . ψ[v ::= c] Reguła ∀L stosuje się do zdania ∀v : ψ zapisanego po lewej stronie gałęzi. Takie zdanie jest prawdziwe wtedy i tylko wtedy, gdy dla dowolnej stałej c prawdą jest, że ψ[v ::= c]. Zdanie ψ[v ::= c] zapisujemy po lewej stronie każdej gałęzi, na której znajduje się ∀v : ψ. Stała c jest dowolna. Ponieważ bez względu na to, jaką weźmiemy stałą c prawdą jest ψ[v ::= c], więc regułę ∀L możemy stosować do tego zdania wielokrotnie. Jest to reguła wielokrotna. Fakt zastosowania ∀L zaznaczamy pisząc ?. ∀v : ψ X
∀P .. .
ψ[v ::= c] Reguła ∀P stosuje się do zdania ∀v : ψ zapisanego po prawej stronie gałęzi. Zdanie takie nie jest prawdziwe wtedy i tylko wtedy, gdy dla przynajmniej jednej stałej c nie jest prawdą ψ[v ::= c]. Zdanie ψ[v ::= c] piszemy po prawej stronie każdej gałęzi, na której znajduje się ∀v : ψ. Stała c nie może wystąpić wcześniej na żadnej gałęzi, na której dopisujemy ψ[v ::= c]. Regułę ∀P stosujemy tylko raz. Fakt zastosowania ∀P zaznaczamy za pomocą X. Reguły ∀P i ∃L to reguły niepowtarzalne, jednokrotne. Reguły ∀L i ∃P to reguły powtarzalne, wielokrotne. To, że reguły ∀L i ∃P mogą być wielokrotnie stosowane do tej samego zdania powoduje, że tam, gdzie z tych reguł korzystamy proces konstrukcji drzewa nie jest ograniczony. Jest więc inaczej niż w wypadku rachunku zdań, gdzie dane zdanie tylko raz mogło być przedmiotem analizy.
130
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Struktura zdania w języku rachunku zdań i formuły (w języku rachunku predykatów) jednoznacznie wskazuje na to, jaka reguła może być użyta do ich analizy. W wypadku reguł zdaniowych jednoznacznie określony jest wynik analizy. Nie jest tak w wypadku reguł ∃L i ∀P oraz ∀L i ∃P . Dla ∃L i ∀P formalnie wykluczone jest użycie niektórych stałych. Zaś dla ∀L i ∃P to, której stałej użyjemy, nie jest w ogóle wyznaczone przez formalne reguły konstrukcji drzewa. Ta swoboda wyboru stałych wymusza namysł nad tym, jakiej stałej użyje się. Można bowiem postępować tak, że mimo iż badana zdanie jest tezą, nie będzie dochodzić do zamknięcia tablicy, choćby po prostu za każdym krokiem stosując stałą, która jeszcze nie była użyta. Jeżeli tablica semantyczna jest zamknięta, to analizowane zdanie jest tezą lub ma miejsce wynikanie, czyli z koniunkcji zdań znajdujących się po lewej stronie wynika alternatywa zdań znajdujących się po stronie prawej. Jeżeli zdanie jest tezą lub ma miejsce wynikanie: z koniunkcji zdań znajdujących się po lewej stronie wynika alternatywa zdań znajdujących się po stronie prawej, to dla analizowanego wypadku istnieje skończona zamknięta tablica. Dla każdej tezy lub wypadku, gdy z koniunkcji zdań znajdujących się po stronie lewej wynika alternatywa zdań znajdujących się po stronie prawej, istnieje więc taki skończony zbiór stałych, dla których tablica jest zamknięta. Jednak z góry nie potrafimy określić wielkości tego zbioru. Fakt ten jest równoważny półrozstrzygalności rachunku predykatów. Jeżeli zdanie nie jest tezą lub z koniunkcji zdań znajdujących sie po lewej stronie nie wynika alternatywa zdań znajdujących sie po prawej stronie, to tablica nie musi być skończona. Fakt, że na danym etapie konstrukcji tablica semantyczna tezy (wynikania) nie jest zamknięta nie przesądza, że w kolejnym kroku to nie nastąpi. Nie wiemy bowiem z góry jak wielka ma być konstrukcja. Ponadto, formalne reguły konstrukcji umożliwiają tworzenie również dla niektórych tez (wynikania) niekończących się niezamkniętych tablic. Na przykład, mając po stronie lewej zdanie postaci ∀φ wystarczy ograniczyć się do stosowania tylko reguły ∀L — jest to reguła wielokrotna, a stałych mamy nieskończenie wiele. Powyższe uwagi o regułach dają podstawę następującym zaleceniom w sprawie konstruowania tablicy semantycznej. • Mając do wyboru analizę zdania, do którego stosuje się jedna z reguł ∀L lub ∃P , czyli reguł wielokrotnych i analizę zdania, do którego stosuje się jedna z reguł ∀P lub ∃L, czyli reguł jednokrotnych, jako pierwsze analizujemy zdanie, do którego stosuje się jedna z reguł jednokrotnych:
2.2. RACHUNEK PREDYKATÓW
131
∀P lub ∃L. • Stałe powinno dobierać się tak, aby poszczególne gałęzie zamykały się. Nie ma tu jednak jakieś jednej uniwersalnej reguły, jak należy te stałe dobierać. Można jednak przyjąć, że należy dążyć do użycia możliwie najmniej różnych stałych. Wyniki konstrukcji tablicy semantycznej mogą być następujące: 1. Tablica jest zamknięta; na każdej gałęzi po lewej i prawej stronie występuje jakieś jedno i to samo zdanie, czyli — jak to mówimy — na każdej gałęzi ma miejsce sprzeczność. Sytuacja taka ma miejsce np. w wypadku pytania, czy tezą rachunku predykatów jest: ∀x : P (x) ⇒ ∃x : P (x), oraz w wypadku pytania, czy tezą rachunku predykatów jest: ∃x : ∀y : R(x, y) ⇒ ∀y : ∃x : R(x, y). 2. Istnieje co najmniej jedna gałąź, na której nie wystąpiła sprzeczność, a ewentualne stosowanie reguł ∀L i ∃P (powtarzalnych) do takiej sprzeczności nie doprowadzi, jak na przykład wówczas, gdy na gałęzi pozostało tylko stosowanie do jakiegoś zdania reguły ∀L albo ∃P i miały miejsce wszystkie wypadki stosowania tej reguły z użyciem stałych już wykorzystanych na tej gałęzi. Sytuacja taka ma miejsce np. w wypadku pytania, czy tezą rachunku predykatów jest: ∃x : P (x) ⇒ ∀x : P (x), oraz czy tezą rachunku predykatów jest: ∀x : ∃y : R(x, y) ⇒ ∀x : ∀y : R(x, y). 3. Istnieje co najmniej jedna gałąź, na której nie wystąpiła sprzeczność i brak podstaw, aby twierdzić, że stosowanie reguł ∀L i ∃P w jakimś momencie nie doprowadzi do sprzeczności. Podanie w tym wypadku jakiegoś przykładu sprawia kłopot spowodowany tym, że mówimy tu o braku podstaw dla uznania, że stosowanie reguł nie doprowadzi do sprzeczności. Dlatego też w tym wypadku nie możemy dać żadnej odpowiedzi. Nie możemy bowiem wykluczyć, że kolejne zastosowania reguł może takie podstawy stworzyć. Jako przykład wskażmy pytanie, czy tezą rachunku predykatów jest: ¬{∀x : ∃y : R(x, y)∧∀x : ¬ R(x, x)∧∀x, y, z : [R(x, y)∧R(y, z) ⇒ R(x, z)]}.
132
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
W wypadku 1 twierdzimy, że pytanie o istnienie dowodu danego zdania z danego zbioru zdań ma odpowiedź pozytywną. W wypadku 2 zaś, że ma odpowiedź negatywną. Wypadek 3 pozostawia to pytanie nierozstrzygniętym. Wszystkie pozostałe kwestie budowy tablicy rozwiązujemy, stosując się do zasad konstrukcji tablic semantycznych wskazanych dla zdań języka rachunku zdań. Przykład 2.20. PYTANIE Czy prawdą jest, że
∀x : (P x ⇒ Qx), ∀x : P x ` ∀xQx?
TABLICA SEMANTYCZNA ∀x : (P x ⇒ Qx)?
∀x : QxX
∀x : P x? (P a ⇒ Qa)X
Qa
Pa Pa
Qa
ODPOWIEDŹ: Prawdą jest, że: ∀x : (P x ⇒ Qx), ∀x : P x ` ∀x : Qx. Przykład 2.21. PYTANIE Czy prawdą jest, że
∀x : (P x ⇒ Qx), ∀x : Qx ` ∀x : P x?
°
2.2. RACHUNEK PREDYKATÓW
133
TABLICA SEMANTYCZNA ∀x : (P x ⇒ Qx)?
∀x : P xX
∀x : Qx? (P a ⇒ Qa)X
Pa
Qa ODPOWIEDŹ: Nie jest prawdą jest, że: ∀x : (P x ⇒ Qx), ∀x : Qx ` ∀x : P x. Tablica nie może zostać zamknięta. Zauważmy bowiem, że pozostaje tylko stosowanie reguły ∀L do zdania ∀x : (P x ⇒ Qx) lub do zdania ∀x : Qx. Kontynuując konstrukcję na kolejnych gałęziach dopisywać będziemy po lewej stronie tylko P c ⇒ Qc i Qc, a po prawej stronie tylko P c, gdzie c jest dowolną stałą. ° Przykład 2.22. W pewnym miasteczku był golibroda, który golił wszystkich i tylko tych, którzy nie golili się sami. Kto golił golibrodę? Niech dwuargumentowa litera predykatowa: G(. . . , . . . ) znaczy: . . . goli . . . Nasze zdanie możemy zapisać: ∃x : ∀y : [G(x, y) ⇔ ¬ G(y, y)]. PYTANIE Czy wewnętrznie sprzeczne jest zdanie: ∃x : ∀y : [G(x, y) ⇔ ¬G(y, y)]? TABLICA SEMANTYCZNA ∃x : ∀y : [G(x, y) ⇔ ¬G(y, y)]X ∀y : [G(a, y) ⇔ ¬G(y, y)]? G(a, a) ⇔ ¬G(a, a)X
G(a, a)
G(a, a)
G(a, a)
¬G(a, a)X
¬G(a, a)X G(a, a)
134
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
ODPOWIEDŹ: Zdanie: ∃x : ∀y : [G(x, y) ⇔ ¬ G(y, y)] jest wewnętrznie sprzeczne.
°
Przykład 2.23. Czy poniższe rozumowanie jest poprawne? Wszyscy kochają kochającego. Jerzy nie kocha siebie. Wobec tego Jerzy nie kocha Marty (?, s. 95). Niech K . . . , . . . będzie dwuargumentową literą predykatową; skrótem dla: . . . kocha . . . . Niech a będzie skrótem dla: Jerzy; a b niech będzie skrótem dla: Marta. Rozważane rozumowanie możemy zatem zapisać: ∀x.[∃y.K(x, y) ⇒ ∀z.K(z, x)], ¬K(a, a) ` ¬K(a, b) TABLICA SEMANTYCZNA ∀x.[∃y.K(x, y) ⇒ ∀z.K(z, x)]? ¬K(a, b)X ¬K(a, a)X K(a, a) K(a, b) ∃y.K(a, y) ⇒ ∀z.K(z, a)X ∃y.K(a, y)? ∀z.K(z, a)? K(a, b)
K(a, a)
ODPOWIEDŹ: Tablica semantyczna jest zamknięta, zatem w omawianym rozumowaniu wniosek wynika logicznie z przesłanek. ° Przykład 2.24. Czy poniższe rozumowanie jest poprawne? Albo wszyscy kochają, albo niektórzy ludzie nie kochają. Jeśli wszyscy kochają, to z pewnością Piotr kocha. Jeśli nie wszyscy kochają, to istnieje co najmniej jedna osoba, która nie kocha; nazwiemy ją Anią. Wobec tego, jeśli Ania kocha, to wszyscy kochają (?, s. 95). Niech K . . . , . . . będzie dwuargumentową literą predykatową; skrótem dla: . . . kocha . . . . Niech a będzie skrótem dla: Piotr; a b niech będzie skrótem dla: Ania. Rozważane rozumowanie możemy zapisać:
2.2. RACHUNEK PREDYKATÓW
135
∀x.∃y.K(x, y) ∨ ∃x.∀y¬K(x, y), ∀x.∃y.K(x, y) ⇒ ∃y.K(a, y), ¬∀x.∃y.K(x, y) ⇒ ∃x.∀y.[¬K(x, y)∧(x = b)] ` ∃y.K(b, y) ⇒ ∀x.∃y.K(x, y). Zauważmy, że pierwsze dwie przesłanki są tezami rachunku predykatów. Możemy je zatem pominąć w konstrukcji tablicy semantycznej. Wystarczy rozważyć tylko poprawność następującego rozumowania: ¬∀x.∃y.K(x, y) ⇒ ∃x.∀y.[¬K(x, y)∧(x = b)] ` ∃y.K(b, y) ⇒ ∀x.∃y.K(x, y). TABLICA SEMANTYCZNA X ¬∀x.∃y.K(x, y) ⇒ ∃x.∀y.[¬K(x, y) ∧ (x = b)] ∃y.K(b, y) ⇒ ∀x.∃y.K(x, y)X
∃y.K(b, y)X ∀x.∃y.K(x, y)X K(b, c) ∃y.K(d, y)? ¬∀x.∃y.K(x, y)X ∃x.∀y.[¬K(x, y) ∧ (x = b)]X ∀x.∃y.K(x, y)?
∀y.[¬K(b, y) ∧ (b = b)]?
∃y.K(d, y)X K(d, e) K(d, e)
K(d, e) [¬K(b, y) ∧ (b = b)]X ¬K(bc)X (b = b)
K(b, c) ODPOWIEDŹ: Tablica semantyczna jest zamknięta, zatem w omawianym rozumowaniu wniosek wynika logicznie z przesłanek. °
2.2.5
Dedukcja naturalna
Podobnie jak w wypadku rachunku zdań, mamy różne ujęcia rachunku predykatów, które są bliskie intuicjom, jakimi kierujemy się stosując logikę w rozumowaniach. Tu przedstawimy system nadbudowany nad systemem dowodów założeniowych logiki zdań. W mocy pozostają wszystkie reguły dowodzenia oraz wszystkie reguły pierwotne, jakie przyjęliśmy dla rachunku zdań z tym, że słowo „zdanie” zastępujemy słowem „formuła”. Dochodzą tylko reguły specyficzne dla ra-
136
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
chunku predykatów. Są nimi reguły dołączania i opuszczania kwantyfikatorów, małego i dużego. Pomijamy predykat identyczności. Reguły pierwotne rachunku predykatów D∀. Reguła dołączania dużego kwantyfikatora Z ..... ψ ∀v : ψ jeżeli v nie jest zmienną wolną w żadnej formule z Z, a Z jest zbiorem założeń, z których dowodzone jest ψ. O∀. Reguła opuszczania dużego kwantyfikatora ∀v : ψ
∀v : ψ
∀v : ψ
ψ
ψ[v ::= v1 ]
ψ[v ::= c]
D∃. Reguła dołączania małego kwantyfikatora ψ
ψ
ψ(c)
∃v : ψ
∃v : ψ[v1 ::= v]
∃v : ψ[c ::= v]
O∃. Reguła opuszczania małego kwantyfikatora ∃v : ψ ψ[v ::= cv1 ,...,vn ] gdzie cv1 ,...,vn to stała zależna od v1 , . . . vn . v1 , . . . vn są wszystkimi i tylko zmiennymi wolnymi występującymi w ∃v : ψ. Aby uczynić jasną ideę stałej, o której mowa w regule (O∃), rozważmy wpierw przykłady. Zdanie: ∃x : x + 3 = 5 jest prawdziwe. Na jego podstawie, zgodnie z regułą (O∃), dochodzimy do wniosku: 2 + 3 = 5.
2.2. RACHUNEK PREDYKATÓW
137
Formuła: ∃x : x + y = 5 jest dla dowolnego y spełniona w zbiorze liczb całkowitych, a więc prawdą jest, że ∀y : ∃x : x + y = 5. Tym razem w miejsce x nie możemy wpisać jakiejkolwiek nazwy liczby całkowitej. Powiedzmy bowiem, że wpisaliśmy 2. Mamy więc: 2 + y = 5. Ta formuła nie jest jednak spełniona dla dowolnego y, a więc nie jest prawdą, że ∀y : 2 + y = 5. Stała c, którą wpisujemy w miejsce x zależy teraz od wartości y. Możemy więc przyjąć: c(y) + y = 5. Ta formuła jest spełniona dla dowolnego y. Prawdą bowiem jest, że ∀y : (5 − y) + y = 5. Mówiąc o stałej zależnej od zmiennych wolnych występujących w formule mamy na uwadze stałą, której wartość zależy od wartości, jakie przyjmą te zmienne. Przykład 2.25.
∀v : (φ ⇒ ϕ) ∀v : φ ⇒ ∀v : ϕ
Dowód wprost 1. ∀v : (φ ⇒ ϕ) 2. ∀v : φ 3. φ ⇒ ϕ 4. φ 5. ϕ 6. ∀v : ϕ
zał. zał. O∀; 1 O∀; 2 (MP; 3,4) (D∀; 5) °
138
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Przykład 2.26.
¬ ∃v : φ ¬φ
Dowód niewprost 1. ¬ ∃v : φ 2. ¬ ¬ φ 3. φ 4. ∃v : φ (1, 4)–sprzeczność
zał. zał. dow. niewprost (zasada podwój. negacji.; 2) (D∃; 3) °
Przykład 2.27.
¬ ∃v : φ
∀v : ¬φ Dowód wprost 1. ¬ ∃v : φ zał. 2. ¬ φ (reg. z przykł. 2.26; 1) 3. ∀v : ¬ φ (D∀; 2) °
2.2.6
Model i prawdziwość
Zdefiniowane zostało wynikanie syntaktyczne. Porównanie wynikania syntaktycznego z semantycznym wymaga zdefiniowania wynikania semantycznego. Logika predykatów od logiki zdań różni się znacznie pojęciami modelu i prawdziwości w modelu. Istota i sama idea tego, czym są model i prawdziwość w modelu pozostają jednak te same. W wypadku języka logiki zdań wyrażenia były zbudowane z symboli zdaniowych (zdań prostych), których znaczenia były całkowicie charakteryzowane przez wartości logiczne. Dlatego też pojęcie modelu było stosunkowo proste. Teraz na język składają się między innymi stałe indywiduowe, litery funkcyjne oraz litery predykatowe. Dla określenia ich znaczeń musimy dysponować dziedziną, w której będą przedmioty indywiduowe — indywidua — oraz n-argumentowe funkcje (n = 1, 2, . . .) określone w zbiorze indywiduów, czyli w zbiorze uniwersalnym i n-członowe relacje (n = 1, 2, . . .) zachodzące pomiędzy elementami zbioru uniwersalnego. Przyporządkowanie stałym indywiduowym, literom
2.2. RACHUNEK PREDYKATÓW
139
funkcyjnym i literom predykatowym, odpowiednio, indywiduów, funkcji i relacji nazywamy interpretacją. Interpretacja to — mówiąc po prostu — przyporządkowanie dokładnie jednego znaczenia przedmiotom pewnego rodzaju, jakimi są wyrażenia językowe. Definicja 2.24 (modelu). Modelem jest para (U, I), gdzie U jest zbiorem uniwersalnym a I funkcją, która n-argumentowym literom predykatowym przyporządkowuje n-członowe relacje, n-argumentowym literom funkcyjnym przyporządkowuje n-argumentowe funkcje określone w U, stałym indywiduowym przyporządkowuje zaś elementy zbioru U. Definicja 2.25 (modelu języka). Jeżeli L jest językiem o sygnaturze: {P0 , P1 , . . ., Pn , F0 , F1 , . . ., Fm , a0 , a1 , . . ., aq }, to modelem M tego języka będzie: (U, R0 , R1 , . . ., Rn , G0 , G1 , . . ., Gm , x0 , x1 , . . ., xq ), gdzie I(Pi ) = Ri , 0 ≤ i ≤ n; I(Fi ) = Gi , 0 ≤ i ≤ m; I(ai ) = xi 13 , 0 ≤ i ≤ q. W wypadku języka rachunku zdań nie było mowy o indywiduach. Teraz wartość logiczna zdania zależy — mówiąc swobodnie — od tego, o jakim przedmiocie jest to zdanie. Chcemy podać ścisłą definicję prawdziwości zdania w modelu. Chcemy więc wiedzieć, co to znaczy, że zdanie ϕ jest prawdziwe w modelu M. Jeżeli zdanie ϕ jest zdaniem postaci: ¬ φ, to ϕ jest prawdziwe, gdy φ jest fałszywe. Tak samo prawdziwość zdania ϕ jest wyznaczona przez wartości logiczne zdań φ i ψ, jak to było w wypadku rachunku zdań, gdy ϕ jest zdaniem postaci: φ ∨ ψ, φ ∧ ψ, φ ⇒ ψ lub φ ⇔ ψ. Zdanie ϕ może być jednak zdaniem postaci: ∀v : φ lub ∃v : φ, a φ nie musi być zdaniem. W takiej sytuacji nie możemy po prostu mówić o wartości logicznej φ. Pytanie o wartość logiczną φ jest bezpodstawne. Pytanie takie bowiem zakładałoby, że φ jest zdaniem. Dla formuły φ, w której jedyną zmienną wolną jest zmienna v, ma jednak sens pytanie: 13
Zmienne indywiduowe mogą oznaczać dowolny obiekt z dziedziny. Interpretacja przyporządkowuje więc każdej stałej indywiduowej dokładnie jeden, ale dowolny obiekt z dziedziny. Nie jest wykluczone, że różne zmienne oznaczają ten sam obiekt. Interpretacja może więc różnym stałym przyporządkować ten sam element dziedziny.
140
ROZDZIAŁ 2. LOGIKA PREDYKATÓW Czy formuła φ jest prawdziwa w modelu M, gdy mówi ona o a?
Jeżeli dla każdego przedmiotu należącego do U odpowiedź ta będzie pozytywna, to możemy powiedzieć, że zdanie ∀v : φ jest zdaniem prawdziwym w modelu M. Jeżeli będzie pozytywna chociaż o jednym przedmiocie, to będziemy mogli powiedzieć, że zdanie ∃v : φ jest prawdziwe w modelu M. Jeżeli zaś znajdziemy taki przedmiot, dla którego odpowiedź będzie negatywna, to powiemy, że zdanie ∀v : φ jest fałszywe. A gdy okaże się negatywna dla wszystkich przedmiotów, to powiemy, że zdanie ∃v : φ jest fałszywe. Na pytanie: Czy φ jest prawdziwe, gdy mówi o przedmiocie a? będziemy znajdować odpowiedź biorąc pod uwagę budowę formuły φ. I tak np., gdy φ będzie postaci ¬ ψ, to φ będzie prawdziwe o przedmiocie x, gdy ψ będzie o tym przedmiocie fałszywe. Podobne będzie w wypadku pozostałych spójników zdaniowych. Może jednak być tak, że φ jest formułą postaci ∀v1 : ψ lub ∃v1 : ψ a w ψ będą występowały dwie zmienne wolne v i v1 . W takim wypadku problem, czy φ o x jest prawdziwe w modelu M komplikuje się. Pytanie o prawdziwość ϕ zaczyna zależeć od odpowiedzi na pytanie: Czy formuła ψ jest prawdziwa w modelu M, jeżeli ψ mówi o parze elementów a i b z U? Proces ten można kontynuować. Okazuje się więc, że w wypadku języka rachunku predykatów pojęcie prawdziwości zdania w modelu zakłada inne pojęcie, a mianowicie pojęcie prawdziwości w modelu formuły ze zmiennymi wolnymi v0 , v1 , . . ., vn , gdy znaczeniami tych zmiennych są, odpowiednio: x0 , x1 , . . ., xn . Chcemy znajdować odpowiedź na pytanie, czy formuła jest prawdziwa, gdy mówi o przedmiotach x0 , x1 , . . ., xn ze względu na formuły składające się na daną formułę, czyli ze względu na jej podformuły. Zauważmy, że w podformule zmiennymi wolnymi mogą być zmienne, które nie są zmiennymi wolnymi w formule. Np. jedyną zmienną wolną w formule: x > 0 ⇒ ∃y : (0 < y < x) jest zmienna x. Podformułą tej formuły jest: 0 < y < x.
2.2. RACHUNEK PREDYKATÓW
141
Teraz mamy dwie zmienne wolne: x, y. Ogólnie chodzi o to, że w wypadku, gdy podformuła znajduje się w zasięgu jakiegoś kwantyfikatora wiążącego zmienną v, to gdy zmienna v jest wolna w tej podformule, to może ona nie być wolna w formule. Powstały problem ma charakter techniczny i rozwiązujemy go w ten sposób, że zamiast mówić o formule, której jedynymi zmiennymi wolnymi są v0 , v1 , . . ., vn , będziemy mówili o formule, której wszystkie zmienne, zarówno wolne jak związane, znajdują się w ciągu v0 , v1 , . . ., vn . Oczywiście, teraz wszystkie zmienne wolne każdej podformuły znajdują się w tym ciągu zmiennych. Gdy formuła, która mówi o przedmiotach x0 , x1 , . . ., xn a wszystkie jej zmienne znajdują się w ciągu v0 , v1 , . . ., vn , jest prawdziwa w modelu M, to w logice mówimy, że formuła ta jest spełniona przez ciąg x0 , x1 , . . ., xn . Podamy indukcyjną definicję spełniania formuły przez ciąg indywiduów. Postąpimy więc tak, że najpierw odpowiemy na pytanie, co to znaczy, że formuła atomowa ψ(v0 , v1 , . . ., vn ) jest spełniona przez ciąg x0 , x1 , . . ., xn . Następnie, stosując procedurę indukcyjną odpowiemy na pytanie, co to znaczy, że formuła ϕ, której wszystkie zmienne wolne i związane znajdują się w ciągu v0 , v1 , . . ., vn jest spełniona przez x0 , x1 , . . ., xn . W końcu będzie można pokazać, że odpowiedź na pytanie o spełnianie formuły przez x0 , x1 , . . ., xn zależy wyłącznie od tych przedmiotów z ciągu, które odpowiadają zmiennym wolnym w formule. A więc, w szczególności, gdy formuła nie zawiera żadnych zmiennych wolnych — czyli gdy jest zdaniem — to pytanie, czy jest spełniona w modelu w ogóle nie zależy od tego, jaki weźmiemy ciąg przedmiotów. Niech ϕ będzie dowolną formułą, której wszystkie zmienne wolne i związane znajdują się w ciągu v0 , v1 , . . ., vn i niech: x0 , x1 , . . ., xn będzie dowolnym ciągiem przedmiotów ze zbioru U (zbiór uniwersalny). Fakt, że formuła ϕ jest spełniona w modelu M przez x0 , x1 , . . ., xn zapisujemy: M |= ϕ[x0 x1 . . .xn ]. Definicja 2.26 (spełniania). Definicję spełniania w modelu M formuły ϕ przez ciąg: x0 , x1 , . . ., xn podamy w trzech krokach. 1. Wartość termu t(v0 , v1 , . . ., vn ) dla ciągu: x0 , x1 , . . ., xn — wartość tę będziemy oznaczać: t[x0 x1 . . .xn ] — określa się następująco: • jeżeli t = vi , to t[x0 x1 . . .xn ] = xi ; • jeżeli t jest stałą indywiduową c, to jako t[x0 x1 . . .xn ] bierzemy interpretację stałej c w modelu M; czyli t[x0 x1 . . .xn ] = I(c);
142
ROZDZIAŁ 2. LOGIKA PREDYKATÓW • jeżeli t = F t1 t2 . . .tm i F jest m-argumentową literą funkcyjną, to t[x0 x1 . . .xn ] = G(t1 [x0 x1 . . .xn ]. . .tm [x0 x1 . . .xn ]), gdzie G jest interpretacją w modelu M litery funkcyjnej F .
2. Niech φ(v0 , v1 , . . ., vn ) będzie formułą atomową postaci: P t1 . . .tm , gdzie P jest m-argumentową literą predykatową a t1 (v0 v1 . . .vn ), . . ., tm (v0 v1 . . .vn ) są termami. Formuła φ jest spełniona przez x0 , x1 , . . ., xn wtedy i tylko wtedy, gdy Rt1 [x0 x1 . . .xn ]. . .tm [x0 x1 . . .xn ], gdzie R jest interpretacją w modelu M predykatu P , czyli R = I(P ). Piszemy więc: M |= P t1 . . .tm [x0 x1 . . .xn ], jeżeli i tylko, gdy Rt1 [x0 x1 . . .xn ]. . .tm [x0 x1 . . .xn ]. 3. Niech ϕ będzie formułą, której wszystkie zmienne wolne i związane znajdują się w ciągu v0 , v1 , . . ., vn . • Jeżeli ϕ jest postaci: ¬ φ, φ ∨ ψ, φ ∧ ψ, φ ⇒ ψ, φ ⇔ ψ, to spełnianie ϕ w modelu M przez ciąg x0 , x1 , . . ., xn określamy zgodnie ze znaczeniem, jakie nadaliśmy spójnikom zdaniowym: ∨, ∧, ⇒, ⇔. Np. gdy ϕ jest postaci ¬ φ mamy: M |= ϕ[x0 x1 . . .xn ]
2.2. RACHUNEK PREDYKATÓW
143
wtedy i tylko wtedy gdy nieprawda, że M |= φ[x0 x1 . . .xn ]. • Jeżeli ϕ ma postać ∀vi : φ, gdzie i ≤ n, to M |= ϕ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= φ[x0 x1 . . .xi−1 xxi+1 . . .xn ] dla dowolnego x(∈ U, dla dowolnego indywiduum). • jeżeli ϕ ma postać ∃vi : φ, gdzie i ≤ n, to M |= ϕ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= φ[x0 x1 . . .xi−1 xxi+1 . . .xn ] dla pewnego x(∈ U , dla jakiegoś indywiduum). Twierdzenie 2.4. Niech term t będzie taki, że wszystkie występujące w nim zmienne znajdują się w ciągu v0 , v1 , . . ., vl . Jeżeli dla każdego i takiego, że vi występuje w termie t ciągi x0 , x1 , . . ., xn (l ≤ n) oraz y0 , y1 , . . ., ym (l ≤ m) są takie, że xi = yi , to t[x0 x1 . . .xn ] = t[y0 y1 . . .ym ]. Dowód. Dowodzić będziemy przez indukcję ze względu na strukturę termu. (I) Termy proste (niezłożone) to zmienna i stała. Jeżeli term jest zmienną, czyli t = vi , to na podstawie definicji dostajemy, że t[x0 x1 . . .xn ] = xi , a t[y0 y1 . . .ym ] = yi . Zatem na podstawie założenia, że xi = yi mamy: t[x0 x1 . . .xn ] = t[y0 y1 . . .ym ]. Jeżeli term jest stałą, czyli t = c, to zgodnie z definicją wartości termu jest, że t[x0 x1 . . .xn ] = t[y0 y1 . . .ym ]. Założenie indukcyjne. Niech termy t1 , t2 , . . ., tk będą takie, że zachodzi dla nich dowodzone twierdzenie, czyli dla 1 ≤ i ≤ k: ti [x0 x1 . . .xn ] = ti [y0 y1 . . .ym ].
144
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
(II) Teraz rozważymy wypadek termu złożonego. Niech t = F t1 t2 . . .tk . Niech G będzie interpretacją w modelu M litery funkcyjnej F (G = IF ). Zatem zgodnie z definicją wartości termu: t[x0 x1 . . .xn ] = G(t1 [x0 x1 . . .xn ]. . .tk [x0 x1 . . .xn ]) t[y0 y1 . . .ym ] = G(t1 [y0 y1 . . .ym ]. . .tk [y0 y1 . . .ym ]) Na podstawie założenia indukcyjnego mamy, że G(t1 [x0 x1 . . .xn ]. . .tk [x0 x1 . . .xn ]) = G(t1 [y0 y1 . . .ym ]. . .tk [y0 y1 . . .ym ]). A zatem: t[x0 x1 . . .xn ] = t[y0 y1 . . .ym ].
Twierdzenie 2.5. Niech formuła ϕ będzie taka, że wszystkie występujące w niej zmienne znajdują się w ciągu v0 , v1 , . . ., vl . Jeżeli dla każdego i takiego, że vi jest zmienną wolną w formule ϕ ciągi x0 , x1 , . . ., xn (l ≤ n) oraz y0 , y1 , . . ., ym (l ≤ m) są takie, że xi = yi , to M |= ϕ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= ϕ[y0 y1 . . .ym ]. Dowód. Dowodzić będziemy przez indukcję ze względu na budowę formuły. Rozpoczynamy od formuł prostych. (I) Niech ϕ będzie formułą postaci t1 ≡ t2 . Korzystając z poprzedniego twierdzenia 2.4 mamy, że 1. t1 [x0 x1 . . .xn ] = t1 [y0 y1 . . .ym ] 2. t2 [x0 x1 . . .xn ] = t2 [y0 y1 . . .ym ]. Na podstawie równości 1 i 2 oraz definicji spełniania następujące kolejne stwierdzenia są sobie równoważne: 3. M |= (t1 ≡ t2 )[x0 x1 . . .xn ],
2.2. RACHUNEK PREDYKATÓW
145
4. t1 [x0 x1 . . .xn ] = t2 [x0 x1 . . .xn ], 5. t1 [y0 y1 . . .ym ] = t2 [y0 y1 . . .ym ], 6. M |= (t1 ≡ t2 )[y0 y1 . . .ym ], czyli ostatecznie: M |= (t1 ≡ t2 )[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= (t1 ≡ t2 )[y0 y1 . . .ym ]. (I0 ) Niech ϕ będzie formułą atomową postaci P t1 t2 . . .tk . Niech R będzie interpretacją w modelu M litery predykatowej P (R = I(P )). Korzystając z poprzedniego twierdzenia mamy, że dla 1 ≤ i ≤ k ti [x0 x1 . . .xn ] = ti [y0 y1 . . .ym ]. Zatem: Rt1 [x0 x1 . . .xn ]. . .tk [x0 x1 . . .xn ] wtedy i tylko wtedy, gdy Rt1 [y0 y1 . . .ym ]. . .tk [y0 y1 . . .ym ]. Ponieważ: M |= ϕ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy Rt1 [x0 x1 . . .xn ]. . .tk [x0 x1 . . .xn ] a M |= ϕ[y0 y1 . . .ym ] wtedy i tylko wtedy, gdy Rt1 [y0 y1 . . .ym ]. . .tk [y0 y1 . . .ym ], więc: M |= ϕ[x0 x1 . . .xn ]
146
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
wtedy i tylko wtedy, gdy M |= ϕ[y0 y1 . . .ym ]. Założenie indukcyjne. Niech formuły φ i ψ będą takie, że zachodzi dla nich dowodzone twierdzenie, czyli: M |= φ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= φ[y0 y1 . . .ym ], M |= ψ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= ψ[y0 y1 . . .ym ]. (II) (¬) Niech ϕ będzie formułą postaci ¬ φ. Zgodnie z definicją spełniania: M |= ¬ φ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy nie zachodzi: M |= φ[x0 x1 . . .xn ]. Na podstawie założenia indukcyjnego: M |= φ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= φ[y0 y1 . . .ym ]. Zatem: M |= ¬ φ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= ¬ φ[y0 y1 . . .ym ].
2.2. RACHUNEK PREDYKATÓW
147
Dla spójników dwuargumentowych ⇒, ∨, ∧, ⇔ rozważamy formuły zbudowane z φ i ψ. Dowody pomijamy ponieważ przebiegają, jak w wypadku negacji (¬), zgodnie z definicją prawdziwości zdania w modelu. (∀) Niech ϕ będzie postaci ∀vi : φ. Na podstawie definicji spełniania: M |= ∀vi : φ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy dla dowolnego x(∈ U , dla dowolnego indywiduum ze zbioru uniwersalnego): M |= φ[x0 x1 . . .xi−1 xxi+1 . . .xn ]. Korzystając z założenia indukcyjnego mamy, że dla dowolnego x(∈ U ): M |= φ[x0 x1 . . .xi−1 xxi+1 . . .xn ] wtedy i tylko wtedy, gdy M |= φ[y0 y1 . . .yi−1 xyi+1 . . .ym ]. Z tego wynika, że dla dowolnego x(∈ U) : M |= φ[x0 x1 . . .xi−1 xxi+1 . . .xn ] wtedy i tylko wtedy, gdy dla dowolnego y(∈ U) : M |= φ[y0 y1 . . .yi−1 yyi+1 . . .ym ]
14
.
Zatem: M |= ∀vi : φ[x0 x1 . . .xn ] wtedy i tylko wtedy, gdy M |= ∀vi : φ[y0 y1 . . .ym ]15 . Analogicznie przebiega dowód w wypadku kwantyfikatora szczegółowego (∃)16 . 14
Zauważmy, że skorzystaliśmy z prawa: ∀v : (ϕ ⇔ φ) ⇒ (∀v : ϕ ⇔ ∀v1 : φ[v ::= v1 ]),
15
jeżeli v1 nie występuje w formule φ. Korzystamy z tego, że ∀v1 : ϕ[v ::= v1 ] ⇔ ∀v : ϕ[v ::= v1 ][v1 ::= v].
16
W dowodzie korzystać będziemy z: ∀v : (ϕ ⇔ φ) ⇒ (∃v : ϕ ⇔ ∃v1 : φ[v ::= v1 ]),
148
ROZDZIAŁ 2. LOGIKA PREDYKATÓW Z powyższego twierdzenia wyprowadzamy następujący wniosek.
Wniosek 2.6. Niech ϕ będzie formułą, której wszystkie zmienne wolne znajdują się w ciągu v0 , v1 , . . ., vm zaś wszystkie zmienne wolne i związane znajdują się w ciągu v0 , v1 , . . ., vn . Ciąg przedmiotów: x0 , x1 , . . ., xm spełnia ϕ w modelu M, czyli: M |= ϕ[x0 x1 . . .xm ] wtedy i tylko wtedy, gdy dla jakiegoś ciągu xm+1 , . . ., xn lub — co na jedno wychodzi — dla dowolnego ciągu: xm+1 , . . ., xn : M |= ϕ[x0 x1 . . .xm xm+1 . . .xn ]. Definicja 2.27 (prawdziwości zdania w modelu). Zdanie ϕ jest prawdziwe w modelu M, wtedy i tylko wtedy, gdy M |= ϕ[x0 x1 . . .xn ] dla pewnego ciągu x0 , x1 . . ., xn lub — co w świetle twierdzenia 5 na jedno wychodzi — dla dowolnego ciągu x0 , x1 , . . ., xn przedmiotów z U (dowolnego ciągu indywiduów ze zbioru uniwersalnego). Definicja 2.28 (modelu zdania). M jest modelem zdania ϕ wtedy i tylko wtedy, gdy zdanie ϕ jest prawdziwe w modelu M. Zgodnie z powyższymi ustaleniami terminologicznymi następujące stwierdzenia są równoważne: zdanie ϕ jest prawdziwe w modelu M, zdanie ϕ jest spełnione w modelu M, M jest modelem zdania ϕ. Przytoczona definicja prawdy pochodzi od A. Tarskiego17 . jeżeli v1 nie występuje w formule φ, oraz z ∃v1 : ϕ[v ::= v1 ] ⇔ ∃v : ϕ[v : colon = v1 ][v1 ::= v]. 17
Po raz pierwszy była opublikowana w (Tarski 1933) r. Nieformalne przedstawienie wyników tej pracy oraz uzupełnienie nowymi wynikami zwłaszcza o charakterze filozoficznym i metodologicznym zawiera rozprawa (Tarski 1944).
2.2. RACHUNEK PREDYKATÓW
149
Definicja 2.29 (fałszywości zdania w modelu). Zdanie jest fałszywe w modelu M (lub: M jest modelem zdania ¬ ϕ) wtedy i tylko wtedy, gdy ϕ nie jest prawdziwe w modelu M. Definicja 2.30 (prawdziwości). Zdanie jest (logicznie) prawdziwe wtedy i tylko wtedy, gdy jest ono spełnione (prawdziwe) w dowolnym modelu. To, że zdanie ϕ jest (logicznie) prawdziwe oznaczamy: |= ϕ. Definicja 2.31 (modelu zbioru zdań). M jest modelem zbioru zdań Σ wtedy i tylko wtedy, gdy M jest modelem każdego zdania ze zbioru Σ. Zauważmy, że termin „model języka L” znaczy coś innego niż „model zbioru Σ zdań języka L”. By M było modelem zbioru Σ zdań języka L konieczne jest, aby M dało się opisać jako model języka L. M nie musi zaś być modelem jakiegoś zbioru Σ zdań języka L. Aby M nie było modelem Σ wystarczy, że przynajmniej jedno ze zdań z Σ nie jest prawdziwe w M (jest fałszywe w M). Zdanie ϕ wynika semantycznie ze zdania φ (symb.: φ |= ϕ) wtedy i tylko wtedy, gdy każdy model zdania φ jest modelem zdania ϕ; czyli: Definicja 2.32 (wynikania semantycznego ze zdania). φ |= ϕ wtedy i tylko wtedy, gdy dla każdego M: jeżeli M |= φ, to M |= ϕ. Zdanie ϕ wynika semantycznie ze zbioru zdań Σ (symb.: Σ |= ϕ) wtedy i tylko wtedy, gdy każdy model zbioru Σ zdań jest modelem zdania ϕ; czyli: Definicja 2.33 (wynikania semantycznego ze zbioru zdań). Σ |= ϕ wtedy i tylko wtedy, gdy dla każdego modelu M: jeżeli M |= Σ, to M |= ϕ. Można zauważyć, że Twierdzenie 2.7. Dla dowolnego zbioru Σ zdań oraz dowolnych zdań ϕ i φ:
150
ROZDZIAŁ 2. LOGIKA PREDYKATÓW Σ ∪ {ϕ} |= φ wtedy i tylko wtedy, gdy Σ |= ϕ ⇒ φ.
Dowód. Niech Σ ∪ {ϕ} |= φ oraz niech nie zachodzi Σ |= ϕ ⇒ φ. Zatem istnieje taki model M, że M |= Σ i nieprawda, że M |= ϕ ⇒ φ. Na to, aby nie zachodziło M |= ϕ ⇒ φ konieczne jest, żeby M |= ϕ oraz nieprawda, że M |= φ. Z tego wynika, że M |= Σ ∪ {ϕ} oraz nieprawda, że M |= φ. A to przeczy założeniu. Niech teraz Σ |= ϕ ⇒ φ oraz nieprawda, że Σ ∪ {ϕ} |= φ. Istnieje zatem taki model M, że M |= Σ ∪ {ϕ} oraz nieprawda, że M |= φ. Jest to więc model Σ oraz spełnione jest w nim ϕ, zatem nie jest spełnione w nim ϕ ⇒ φ, a to przeczy założeniu, które jest równoważne temu, że każdy model zbioru Σ zdań jest modelem zdania ϕ ⇒ φ. Na zbiór uniwersalny U oprócz założenia niepustości nie nałożyliśmy żadnego innego warunku. Zbiór ten może być skończony albo może być nieskończony. Celem lepszego zrozumienia definicji spełniania i większej intuicyjności znaczeń kwantyfikatorów załóżmy, że zbiór U jest skończony, że ma dokładnie n elementów. Niech a0 , a1 , . . ., an będą wszystkimi tymi elementami18 . Na podstawie definicji spełniania stwierdzamy, że 1.
(U, I) |= ∀v : φ wtedy i tylko wtedy, gdy (U, I) |= φ[v ::= a1 ] ∧ φ[v ::= a2 ] ∧ . . . ∧ φ[v ::= an ].
2.
(U, I) |= ∃v : φ wtedy i tylko wtedy, gdy (U, I) |= φ[v ::= a1 ] ∨ φ[v ::= a2 ] ∨ . . . ∨ φ[v ::= an ].
Korzystając z tych dwóch faktów, dla dowolnego zdania φ (formuły niezawierającej zmiennych wolnych) możemy skonstruować zdanie Φ nie zawierające kwantyfikatorów takie, że dla dowolnej interpretacji I: (U, I) |= φ wtedy i tylko wtedy, gdy (U, I) |= Φ. 18
Jeśli istnieje taka potrzeba wzbogacamy język o stosowne stałe indywiduowe.
2.2. RACHUNEK PREDYKATÓW
151
Φ nie zawiera żadnych zmiennych, ani wolnych ani związanych, i — oczywiście — kwantyfikatorów. Φ zbudowane jest ze zdań otrzymanych z formuł atomowych przez wpisanie stałych w miejsce zmiennych. Zdania te, zdania atomowe, uznajemy za różne jeżeli zbudowane są z różnych liter predykatowych lub różnych liter funkcyjnych, bądź w jednym zdaniu na i-tym miejscu występuje inna stała niż w drugim. Możemy przyjąć, że zdaniom atomowym interpretacja I przyporządkowuje bądź wartość T , bądź wartość F . Takich interpretacji różniących się tylko przyporządkowaniem tych wartości zdaniom atomowym jest nie więcej niż 2m , gdzie m jest liczbą różnych wyżej opisanych zdań. Możemy teraz stosować metody opracowane dla rachunku zdań. W zależności od tego, czy dla wszystkich 2m „interpretacji” nasze zdanie przyjmie wartość T , czy też choć raz przyjmie wartość F , będziemy mogli twierdzić, że zdanie to jest, odpowiednio, prawdziwe w dowolnej n-elementowej dziedzinie lub, że nie jest prawdziwe (jeżeli nie jest prawdziwe w n-elementowej dziedzinie, to tym samym nie jest prawdziwe). Przykład 2.28. Zdanie: (∀x : P x ⇒ ∀x : Qx) ⇒ ∀x : (P x ⇒ Qx) nie jest prawdziwe, bo nie jest ono prawdziwe w dziedzinie dwuelementowej. W tym celu wystarczy pokazać, że tautologią nie jest: [(P a ∧ P b) ⇒ (Qa ∧ Qb)] ⇒ [(P a ⇒ Qa) ∧ (P b ⇒ Qb)].
°
Przykład 2.29. Prawdziwe nie jest również zdanie: (∃x : P x ∧ ∃x : Qx) ⇒ ∃x : (P x ∧ Qx). Nie jest ono prawdziwe w dziedzinie, w której są przynajmniej dwa elementy. Pokazać bowiem można, że tautologią nie jest: [(P a ∨ P b) ∧ (Qa ∨ Qb)] ⇒ [(P a ∧ Qa) ∨ (P b ∧ Qb)].
°
Przykład 2.30. Prawdziwe nie jest zdanie: ∀x : ∃y : P xy ⇒ ∃y : ∀x : P xy. Nie jest ono prawdziwe w dziedzinie dwuelementowej. Tautologią nie jest bowiem: [(P aa ∨ P ab) ∧ (P ba ∨ P bb] ⇒ [(P aa ∧ P ba) ∨ (P ab ∧ P bb)].
°
152
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Zauważmy, że istnieją zdania, które nie są spełnione tylko w dziedzinie nieskończonej, czyli zdania warunkiem koniecznym fałszywości których jest nieskończoność dziedziny. Przykład 2.31. Zdanie: ∀x : xRf (x) ∧ ∀x : ¬ xRx ∧ ∀xyz : (xRy ∧ yRz ⇒ xRz) nie jest prawdziwe w żadnej dziedzinie skończonej. Niech a będzie jakimś elementem dziedziny. W tej dziedzinie określona jest funkcja f : elementy tej dziedziny są zarówno jej argumentami jak i wartościami. Niech f 0 (a) = a, f n (a) = f f n−1 (a), n ∈ N. Pokażemy, że wszystkie wyrazy ciągu: a, f (a), f f (a), . . . są parami różne. Przede wszystkim zauważmy, że jeżeli m < n, to f m (a)Rf n (a). Ponieważ ∀x : ¬ xRx, więc dla dowolnych m, n : (m 6= n) ⇒ f m (a) 6= f n (a). Oczywiście fakt, że zdanie może być prawdziwe tylko w wypadku, gdy dziedzina jest nieskończona nie pociąga za sobą prawdziwości tego zdania w dowolnym modelu z nieskończoną dziedziną. W wypadku rozważanego zdania wystarczy dobrać takie rozumienie litery predykatowej R, aby nie był spełniony przynajmniej jeden z członów koniunkcji. Może tak być, gdy R zinterpretujemy jako równość. Nieskończoność dziedziny jest warunkiem koniecznym prawdziwości naszego zdania. Skończoność dziedziny jest warunkiem wystarczającym jego fałszywości. W takim razie skończoność dziedziny jest warunkiem wystarczającym prawdziwości jego negacji, czyli wystarcza na to, aby prawdziwe było zdanie: ∃x : ¬ xRf (x) ∨ ∃x : xRx ∨ ∃xyz : (xRy ∧ yRz ∧ ¬ xRz). Warunkiem koniecznym fałszywości tego zdania jest nieskończoność dziedziny. °
2.2. RACHUNEK PREDYKATÓW
2.2.7
153
Pełność rachunku predykatów
Porównanie wynikania syntaktycznego z wynikaniem semantycznym pokazuje, że reguły rachunku logicznego zostały właściwie dobrane. Mówi o tym twierdzenie o pełności rachunku predykatów. Dowodzone jest ono z wykorzystaniem uogólnionego twierdzenia o niesprzeczności. Twierdzenie 2.8 (uogólnione twierdzenie o niesprzeczności). Niech Σ będzie dowolnym zbiorem zdań języka L. Σ jest niesprzeczne wtedy i tylko wtedy, gdy ma model. Twierdzenie to zwykle dowodzone jest metodą Henkina. Tu dowód opuszczamy. ϕ wynika semantycznie ze zbioru Σ wtedy i tylko wtedy, gdy wynika z tego zbioru syntaktycznie, czyli Twierdzenie 2.9 (Gödla o pełności19 ). Σ |= ϕ wtedy i tylko wtedy, gdy Σ ` ϕ. Dowód twierdzenia Gödla nie różni się od dowodu analogicznego twierdzenia dla rachunku zdań, czyli uogólnionego twierdzenia o pełności. Na podstawie twierdzenia Gödla, tak jak w wypadku rachunku zdań, nie ma potrzeby odróżniania pomiędzy wynikaniem syntaktyczym a semantycznym. Podobnie jak i tam, będziemy więc mówili po prostu o wynikaniu logicznym. Twierdzenie 2.10 (o zwartości). Zbiór zdań Σ ma model wtedy i tylko wtedy, gdy każdy jego skończony podzbiór ma model. Dowód. Twierdzenia dowodzi się podobnie jak w wypadku rachunku zdań. Zauważamy, że model zbioru formuł jest modelem każdego, w szczególności skończonego jego podzbioru. Aby dowieść, że model ma zbiór, którego każdy skończony podzbiór ma model skorzystamy z uogólnionego twierdzenia o niesprzeczności. Zakładamy, że każdy skończony podzbiór ma model, a sam zbiór nie ma modelu. W takim razie zbiór ten jest sprzeczny. Ze sprzecznego zbioru można dowieść dowolnego zdania, w szczególności wewnętrznie sprzecznego. Taki dowód ma jednak skończoną ilość założeń. Zbiór tych założeń jest zatem sprzeczny, a to stoi w sprzeczności z założeniem, że każdy skończony podzbiór ma model. 19
Twierdzenie o pełności udowodnił Gödel (1930).
154
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Na podstawie uogólnionego twierdzenia o pełności oraz twierdzenia o zwartości można udowodnić bardzo interesujące twierdzenia. Przytoczmy je tu bez dowodów. Wniosek 2.11. Teoria mająca dowolnie duży model skończony ma też model nieskończony. Wniosek 2.12 (Twierdzenie Löwenheima-Skolema-Tarskiego20 ). Jeżeli teoria T sformułowana w języku L ma nieskończone modele, to ma również modele dowolnej mocy większej bądź równej mocy zbioru formuł języka L. Każda teoria wyrażona w języku pierwszego rzędu, mającego przeliczalnie wiele formuł, jeśli ma model nieskończony, to ma model przeliczalny.
2.2.8
Problem rozstrzygalności
Ważnym problemem metamatematyki jest pytanie o rozstrzygalność systemu21 , czyli o istnienie efektywnej metody pozwalającej dać odpowiedź na każde pytanie, czy zdanie języka tego systemu jest, czy też nie jest twierdzeniem22 . Hilbert uznał kwestię rozstrzygalności za główny problem logiki matematycznej. Zagadnienie rozstrzygalności teorii to klasa pytań, z których każde jest pytaniem o to, czy dane zdanie jest czy też nie jest twierdzeniem tej teorii. Pojęcie rozstrzygalności stosuje się więc do klasy pytań. Kiedy mówi się o rozstrzygalności problemu, to ma się na uwadze klasę pytań. Te pytania to wystąpienia lub instancje tego problemu. Problem charakteryzowany jest przez swoje parametry. Instancja problemu to konkretna wartość tego problemu dla wszystkich parametrów. Problem (klasa pytań) jest rozstrzygalny wtedy i tylko wtedy, gdy istnieje metoda, która pozwala znaleźć pozytywną lub negatywną odpowiedź na każde pytanie z tej klasy. Metoda ta musi być efektywna. 20
Twierdzenie to było dowiedzione wcześniej niż twierdzenie o pełności. Dowiódł go Löwenheim (1915) i Skolem (1920), a w postaci ogólnej — Tarski. 21 W związku z tym, że historycznie problem ten zrodził się z programu Hilberta, w literaturze bywa określany oryginalnym terminem niemieckim: Entscheidungsproblem. Więcej na temat historii problemu, jego przesłanek filozoficznych oraz znaczenia dla rozwoju informatyki zob. (Trzęsicki 2006). 22 Elementarny wykład problematyki rozstrzygalności znajduje się w: Grzegorczyk (1957), zob. również R. Murawski (1990, 1999).
2.2. RACHUNEK PREDYKATÓW
155
Metoda efektywna powinna spełniać następujące warunki: 1. musi dać się jednoznacznie opisać za pomocą skończonego ciągu słów i/lub symboli, Metoda, której nie można w taki skończony sposób opisać, nie dałaby się przedstawić jako program dla jakiegokolwiek istniejącego lub tylko teoretycznie możliwego komputera (pewnego urządzenia technicznego). 2. jest metodą obliczania, Mówimy o metodzie efektywnej w wypadku poszukiwania odpowiedzi na drodze obliczania, a nie np. eksperymentowania. Sprawdzanie za pomocą papierka lakmusowego czy substancja jest kwasem, nie jest typem metody, który mamy tu na uwadze. Stwierdzenie, że jest efektywna metoda uzyskania wyniku zwykle wypowiadane jest jako zdanie o istnieniu efektywnej metody uzyskania wartości takiej to a takiej funkcji matematycznej. 3. prowadzi do odpowiedzi, Metoda efektywna to metoda, postępowanie zgodnie z którą prowadzi do uzyskania odpowiedzi. Brak jakiejkolwiek odpowiedzi choćby tylko w wypadku jednej instancji dyskwalifikuje daną metodę jako metodę efektywną dla rozstrzygania danego problemu. 4. jej zastosowanie wymaga wykonania co najwyżej skończonej liczby operacji, kroków; Metoda efektywna to metoda, która w wypadku każdego pytania z klasy — dla której jest ona efektywna — składa się ze skończonej ilości operacji, kroków. Przy czym, przez krok należy rozumieć jakieś proste, niezłożone postępowanie. Skończoność liczby kroków nie oznacza istnienia jakiejkolwiek bariery ich realizacji, np. fizycznej. Skończona liczba kroków to również taka liczba kroków, że ich wykonanie przekracza wszelkie możliwości fizyczne. Jest to skończoność liczbowa. Liczba może być skończona, choć dla jej zapisu nie starczyłoby materii wszechświata. 5. odpowiedź jest poprawna, Odpowiedź otrzymana w wyniku zastosowania metody efektywnej musi być odpowiedzią poprawną: jeżeli prawdą jest, że α, to odpowiedź na
156
ROZDZIAŁ 2. LOGIKA PREDYKATÓW pytanie, czy α powinna być TAK; zaś gdy fałszem jest, że α odpowiedź winna być NIE.
6. stosuje się do wszystkich bez wyjątku instancji danego problemu, Możliwość stosowania metody efektywnej do wszystkich instancji problemu oznacza, że nie stosuje się ona selektywnie. 7. daje się stosować precyzyjnie, To, czy w danej sytuacji należy wykonać taki, czy też inny krok oraz wynik wykonania każdego kroku muszą być jednoznacznie określone przez metodę. 8. jeżeli istnieje potrzeba wykonania jakiegoś kroku, to krok ten daje się wykonać; Wykonanie poszczególnego kroku nie podlega żadnym ograniczeniom. Jeżeli zastosowanie metody wymaga wykonania jakiegoś kroku, to nie może istnieć ograniczenie jakiejkolwiek natury uniemożliwiające jego wykonanie. 9. każdy krok jest „mechaniczny”, „Mechaniczność” kroku oznacza, że jego wykonanie nie wymaga wiązania jakichkolwiek treści z obiektami, na których jest wykonywana. „Mechaniczność” oznacza branie pod uwagę tylko „fizycznych” atrybutów obiektów, będących przedmiotem operacji. Jeżeli obiekty są napisami, to pod uwagę brane są ich budowa oraz kształty (wzorce). „Mechaniczność” metody oznacza, że jej stosowanie nie jest zależne od sposobu myślenia matematycznego tego, kto tę metodę stosuje. Tryb postępowania i wykonywania poszczególnych czynności jest niezależny od umiejętności matematycznych wykonawcy. Metoda jest efektywna bez względu na to, czy jest ona komukolwiek znana i czy jest przez kogokolwiek stosowana. Przed logikami stanęło trudne zadanie. Powiedzmy, że chcemy dowieść, że jakiś problem nie jest rozstrzygalny. Aby dowieść nierozstrzygalności, trzeba dowieść, że nie istnieje stosowna efektywna procedura „mechaniczna”. Z kolei jest to możliwe tylko wówczas, gdy pojęcie efektywnej procedury „mechanicznej” ma matematyczny sens. Problem nadania matematycznego sensu intuicji efektywnej procedury „mechanicznej” skutecznie podjął się Turing
2.2. RACHUNEK PREDYKATÓW
157
(1936–37), który tworząc maszynę (Turinga) potraktował dosłownie określenie „mechaniczna”. Przyjął, że procedura jest mechaniczna wtedy i tylko wtedy, gdy może zrealizować ją opisana przez niego jako teoretyczny twór maszyna (później nazwana maszyną Turinga). Niezależnie od Turinga „mechaniczność” definiuje Church. W jego wypadku „mechaniczne” to tyle — jest to teza Church — co dające się opisać za pomocą (ogólnej) funkcji rekurencyjnej. Szybko okazało się, że — choć na pierwszy rzut oka różne — koncepcje „mechaniczności” Turinga i Churcha — jeśli ograniczyć się do funkcji określonych na liczbach całkowitych dodatnich — są sobie równoważne. Church formułuje swoją tezę w związku z uwagą Posta, że identyfikacja efektywnej obliczalności z rekurencją jest „hipotezą roboczą”. Church proponuje tezę: funkcja określona na liczbach całkowitych dodatnich jest obliczalna, jeśli jest rekurencyjna. Implikacja do niej odwrotna, że każda funkcja rekurencyjna określona na liczbach całkowitych dodatnich jest efektywnie obliczalna, powszechnie określana jest jako odwrotna teza Churcha (sam Church nie dokonywał takiego odróżnienia). Teza Churcha-Turinga głosi, że intuicyjne pojęcie efektywnej procedury „mechanicznej” wyczerpuje się w pojęciu maszyny Turinga lub/i funkcji rekurencyjnej. Inaczej mówiąc, teza Churcha-Turinga stwierdza, że pojęcie funkcji obliczalnej wyczerpuje intuicyjną treść pojęcia metody efektywnej. Teza ta nie może zostać dowiedziona. Obalenie jej jest jednak możliwe, gdyby okazało się, że istnieje efektywna procedura „mechaniczna”, która nie daje się opisać za pomocą aparatury pojęciowej maszyny Turinga lub funkcji rekurencyjnych. Zaproponowano wiele definicji efektywnej procedury „mechanicznej”. Można wyróżnić zasadnicze trzy idee. Jedni dążyli do uściślenia pojęcia przepisu przez podanie reguł postępowania, z jakich przepisy mogą się składać. W ten sposób powstało pojęcie algorytmu 23 . Drudzy za punkt wyjścia brali pojęcie maszyny. Metoda rozstrzygania istnieje, gdy można skonstruować (teoretycznie) maszynę. Ideę takiej lo23
Słowo „algorytm”, po łacinie „algorithmus” wywodzi się z połączenia greckiego „arithmós” — liczba oraz „algorism” oznaczającego w średniowieczu sztukę rachowania przy zastosowaniu zapisu arabskiego. Słowo „algorism” miałoby zaś pochodzić od nazwiska perskiego matematyka Muhameda ibu-Musy al-Chorezmi, który opisał zasady takiego rachunku. Od słów al jabr zawartych w tytule jednego z jego dzieł miałby zaś pochodzić termin „algebra”.
158
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
gicznej maszyny oprócz maszyny Turinga realizują maszyna Posta, maszyny Rabina i Scota oraz inne, głównie nawiązujące do idei Turinga. Trzecie wreszcie pojęcie metody rozstrzygania chciano wyrazić za pomocą elementarnych operacji arytmetycznych na liczbach naturalnych. Działania arytmetyczne, np. dodawanie, są ściśle określone, pojęcie metody zostanie więc sprecyzowane. Z tych dążeń wyłoniły się dział arytmetyki liczb naturalnych zwany teorią funkcji rekurencyjnych oraz pojęcie funkcji obliczalnej. W związku z zagadnieniem rozstrzygalności (Entscheidungsproblem) postawionym przez Hilberta, Turing i Church podjęli problem nadania matematycznego sensu intuicyjnemu rozumieniu „mechanicznej” metody efektywnej. Dowiedli, że rachunek predykatów nie jest rozstrzygalny, jeśli założy się przyjętą przez nich definicję „mechanicznej” metody efektywnej. Church pokazał — przy założeniu jego tezy — że nie ma efektywnej metody rozwiązywania pewnej klasy problemów elementarnej teorii liczb. Był to pierwszy wynik tego rodzaju. Church formalnie dowiódł — jest to twierdzenie Churcha — korzystając z funkcji określonych na liczbach całkowitych dodatnich, których wartość daje się obliczyć w skończonym procesie podstawiania (λ-definiowalność), że problem rozstrzygania dla systemu logiki pierwszego rzędu Hilberta i Ackermanna jest rekurencyjnie nierozwiązywalny. Kilka miesięcy później, niezależnie od Churcha, Turing formalnie dowiódł, że nie istnieje maszyna (Turinga), która dla każdej formuły języka rachunku predykatów w skończonej liczbie kroków da poprawną odpowiedź na pytanie, czy formuła ta jest tezą rachunku predykatów. Kurt Gödel pokazał, że każda teoria zawierająca arytmetykę liczb naturalnych jest nierozstrzygalna. W szczególności nierozstrzygalna jest sama arytmetyka liczb naturalnych. Okazuje się, że nie można wskazać żadnego takiego sposobu, dzięki któremu w skończonej ilości kroków znajdowalibyśmy pozytywną lub negatywną poprawną odpowiedź na każde pytanie dotyczące liczb naturalnych. Rachunek predykatów okazuje się być półrozstrzygalny. Problem jest półrozstrzygalny wtedy i tylko wtedy, gdy istnieje efektywna procedura pozwalająca w skończonej liczbie kroków dać odpowiedź na każde pytanie, jeśli odpowiedź na to pytanie jest pozytywna (lub, symetrycznie, jeśli odpowiedź jest negatywna). Rachunek predykatów jest pełny, a więc każde zdanie prawdziwe ma dowód. Ponieważ każdy dowód jest skończony, zatem w skończonej ilości kroków można uzyskać pozytywną odpowiedź na pytanie, czy zdanie jest prawdziwe (pod warunkiem, że zdanie to jest prawdziwe). Gdyby zdanie nie było prawdziwe — ponieważ rachunek predykatów jest niesprzeczny
2.2. RACHUNEK PREDYKATÓW
159
— dowodu nie uzyskamy. Jednak fakt nieuzyskania dowodu po wykonaniu n-kroków nie przesądza tego, że w kolejnym (n + 1)-kroku dowodu nie uzyskamy, zatem tylko na podstawie tego, że po pewnej ilości kroków dowodu nie uzyskaliśmy, nie możemy dawać odpowiedzi negatywnej.
160
ROZDZIAŁ 2. LOGIKA PREDYKATÓW
Rozdział 3 Algebra zbiorów Teoria mnogości, czyli teoria zbiorów zawdzięcza swe powstanie matematykom XIX w., którzy dążyli do ugruntowania analizy matematycznej i zbadania jej podstawowych pojęć. Twórcą teorii mnogości jako odrębnej dyscypliny matematycznej był Georg Cantor (1845–1918). Należy podkreślić znaczenie teorii zbiorów w badaniach nad sztuczną inteligencją (AI — Artificial Intelligence), w szczególności nad rozumowaniami zdroworozsądkowymi. John McCarthy — pionier badań nad sztuczną inteligencją — podkreślał potrzebę badań podstawowych, dostrzegając, że AI potrzebuje teorii matematycznych i logicznych, prowadzących do innowacji pojęciowych. Kluczowym problemem jest formalizacja zdroworozsądkowej wiedzy i intuicyjnie poprawnych rozumowań. McCarthy podkreślał możliwości, jakie daje wykorzystanie teorii zbiorów w AI i zachęcał do skoncentrowania badań nad tym zagadnieniem. Jednym z powodów takiego postrzegania teorii mnogości jest i to, że pojęcia teorii mnogości są zgodne z intuicją. Tu głównie zajmiemy się fragmentem teorii mnogości, dającym się przedstawić w oparciu o intuicyjne pojęcia zbioru i elementu zbioru (czyli na gruncie «naiwnej» teorii mnogości), tak zwaną algebrą zbiorów (rachunkiem zbiorów). Badać będziemy operacje na zbiorach.
3.1
Zbiór i element zbioru
W języku potocznym słowo „zbiór” używane jest w znaczeniu dystrybutywnym, czyli abstrakcyjnym, zatem w tym znaczeniu, jakie ma ono w teorii mnogości, lub w znaczeniu kolektywnym, zwanym też mereologicznym. 161
162
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
W wypadku dystrybutywnego znaczenia słowa „zbiór”, przedmioty, które tworzą zbiór są jego elementami. W wypadku kolektywnego znaczenia słowa „zbiór”, przedmioty, które go tworzą są jego częściami. Zbiór w sensie kolektywnym to agregat lub konglomerat. Liczność zbioru (w sensie dystrybutywnym) jest określona przez to, ile elementów ma ten zbiór. Zbiór, którego elementami są wszystkie i tylko kamienie z pewnego stosu kamieni ma tyle elementów, ile kamieni składa się na ten stos kamieni. O liczności agregatu, jakim jest stos kamieni nawet trudno mówić: liczba jego części zależy od «głębokości» podziału. Mogą to być najprościej dające się wydzielić kamienie, ale mogą to też być części tych kamieni. Elementami jakiegoś zbioru (w sensie dystrybutywnym) A mogą być zbiory. Elementy tych zbiorów nie muszą być elementami zbioru A. Zbiór (w sensie dystrybutywnym) jest określony nie tylko przez swoje elementy, ale i przez sposób ich przynależności do zbioru. Istotne jest samo rozumienie bycia elementem. Zgodnie z najprostszą a zarazem dominującą koncepcją, przedmiot jest albo nie jest elementem danego zbioru. W związku z językiem naturalnym i pojawiającymi się możliwościami stosowania m.in. narzędzi informatycznych wynikła potrzeba opisu zakresów nazw nieostrych. Są to takie nazwy, co do których reguły języka nie przesądzają, czy pewne przedmioty są, czy też nie są ich desygnatami. Przykładem nazwy nieostrej jest „dziecko” 1 . Ktoś, kto kwestionowałby użycie tej nazwy do wskazania siedmiolatka naruszałby reguły języka polskiego. Podobnie narusza te reguły ktoś, kto tę nazwę zastosowałby do dwudziestolatka. Jednak reguły języka polskiego nie przesądzają, czy czternastolatek to dziecko, czy nie. W wypadku nazw nieostrych nie jest więc tak, że dowolny przedmiot jest albo nie jest ich desygnatem. Formalny opis ich zakresów jako zbiorów wymaga zatem nowego rozumienia samej przynależności elementu do zbioru. W wypadku zbioru rozmytego przynależność elementu do zbioru podlega gradacji, przyjmując wartości z przedziału [0, 1]. Szuka się też innych sposobów przełamania ograniczeń wynikłych z określenia zbioru. Możliwe jest to przez określenie zbioru przez jego przybliżenie dolne i górne. Bierze się podział logiczny zbioru uniwersalnego. Wszystkie człony tego podziału — mówiąc po prostu — mieszczące się w charakteryzowanym zbiorze tworzą jego przybliżenie dolne, a wszystkie te, które mają 1
Jako nazwa nierelatywna, a więc nazwa, która służy do wskazania elementu pewnej grupy wiekowej.
3.1. ZBIÓR I ELEMENT ZBIORU
163
jakąkolwiek część wspólną z charakteryzowanym zbiorem, tworzą jego przybliżenie górne. Zbiór przybliżony to zbiór, którego przybliżenie dolne różni się od przybliżenia górnego. Zbiór dokładny to zbiór, którego przybliżenia nie różnią się między sobą. Na tym opiera się koncepcja zbioru przybliżonego, opracowana przez Zdzisława Pawlaka i ogłoszona na początku lat osiemdziesiątych XX w. Teoria ta jest jedną z najszybciej rozwijających się metod sztucznej inteligencji. Znalazła zastosowanie m.in. w analizie danych, przybliżonej klasyfikacji i przetwarzaniu obrazów. W klasycznej teorii zbiorów, kantorowskiej — takiej, jaka tu jest rozwijana — przyjmuje się, że dowolny przedmiot jest albo nie jest elementem danego zbioru. Na rodzaj elementów zbiorów nie nakłada się żadnych ograniczeń. Inaczej mówiąc, można tworzyć zbiory z obiektów — w intuicyjnym sensie — niemających nic ze sobą wspólnego. Może też być i tak, że elementy zbioru należą do jakichś gatunków. W takiej sytuacji w praktyce może interesować nas to, ile jest „kopii” tych obiektów. Na przykład, mając jakiś zbiór warzyw może zwracać się uwagę na to, ile w tym zbiorze jest sztuk kalafiorów lub ile jest główek kapusty. Do charakterystyki tak rozumianych zbiorów nie tylko należy określenie ich elementów, lecz również liczności poszczególnych gatunków elementów. Te intuicje dają podstawę do utworzenia pojęcia wielozbioru (multizbioru). Na wielozbiór (A, f ) składa się więc zbiór jego elementów A oraz funkcja f , która dowolnemu przedmiotowi przypisuje liczbę naturalną, wskazującą, ile jest w zbiorze A elementów, które są tego samego gatunku, co ten przedmiot. Natura elementów zbioru może być dowolna. W szczególności same mogą być zbiorami. O takich elementach zbiorów, które same nie są zbiorami, można mówić jako o praelementach lub atomach. Stosowanie intuicyjnych pojęć zbioru oraz bycia elementem zbioru jest ograniczone i w wypadku bardziej zaawansowanych rozważań musi zostać zastąpione przez pojęcia ściśle określone. Tym samym dochodzi do zerwania ze zdroworozsądkowym ich pojmowaniem. Dokonuje się tego na gruncie aksjomatycznej teorii mnogości. Wielkich liter z początku alfabetu: A, B, C, . . ., w razie potrzeby z indeksami, używać będziemy jako zmiennych, których wartościami są zbiory. Wielkich liter z końca alfabetu: X, Y, Z, w razie potrzeby z indeksami, używać będziemy jak nazw pewnych wyróżnionych zbiorów (przestrzeni). Małych liter z początku alfabetu: a, b, c, . . ., w razie potrzeby z indeksami, używać będziemy jako nazw elementów zbiorów.
164
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
Małe litery z końca alfabetu: x, y, z, w razie potrzeby z indeksami, będą używane jako zmienne, których wartościami są elementy zbiorów. Przedmioty (indywidua), które tworzą zbiór to jego elementy. Fakt, że przedmiot a jest elementem (należy do) zbioru A zapisujemy: a∈A Użycie małej litery nie wyklucza tego, że obiekt, do którego odnosi się nie jest zbiorem. Elementami zbiorów mogą bowiem być również zbiory. Wskazuje jedynie na to, że jest to obiekt będący elementem aktualnie rozważanego zbioru (wskazywanego przez drugi argument ∈). Podobnie, użycie wielkiej litery nie wyklucza tego, że obiekt wskazywany przez tę literę nie jest elementem jakiegoś zbioru. „∈” jest dwuargumentową literą predykatową. Ze względu na to, że elementy jakiegoś zbioru mogą być zbiorami, a zbiory mogą być elementami zbiorów, mała lub wielka litera może wystąpić po każdej ze stron, prawej lub lewej, znaku ∈. To, że a nie jest elementem (nie należy do) zbioru A, ¬ (a ∈ A), możemy zapisać: a 6∈ A. Oczywiście, używać będziemy również nawiasów. Zasady korzystania z nich nie różnią się istotnie od zasad stosowanych w rachunku predykatów. Definicja 3.1 (ekstensjonalnej charakterystyki zbioru). Zbiór charakteryzowany jest ekstensjonalnie przez wymienienie (nazwanie) wszystkich i tylko jego elementów. Możliwości charakterystyki ekstensjonalnej zbioru zależą od zbioru termów stałych (nie zawierających zmiennych), w szczególności od jego liczności. Charakteryzowany ekstensjonalnie zbiór ma co najwyżej tyle elementów, ile elementów ma zbiór termów stałych. Na przykład, jeżeli dysponujemy tylko skończoną liczbą termów stałych, to ekstensjonalnie możemy charakteryzować tylko zbiory skończone. Nazwanie każdego i tylko elementu charakteryzowanego zbioru może dokonać się przez: 1. podanie nazw tych elementów lub
3.1. ZBIÓR I ELEMENT ZBIORU
165
2. podanie wzoru/wzorów nazw tych elementów. Zbiór, który daje się scharakteryzować przez podanie nazwy każdego swojego elementu musi być zbiorem skończonym. Zbiór, który daje się scharakteryzować przez podanie wzoru/wzorów nazwy każdego swojego elementu może być zbiorem nieskończonym. Niech Ai1 , . . . , Ain , 0 ≤ i ≤ m, będą podzbiorami zbioru stałych indywiduowych. Niech ti (vi1 , . . . , vin ), 0 ≤ i ≤ m, będą termami takimi, że wszystkimi zmiennymi występującymi w termie ti (vi1 , . . . , vin ) są vi1 , . . . , vin . Zbiór: {ti (vi1 , . . . , vin ) : vij ∈ Aij , 0 ≤ i ≤ m, 1 ≤ j ≤ n} to zbiór wszystkich i tylko przedmiotów, które są nazywane przez termy stałe otrzymane z ti (vi1 , . . . , vin ) przez wpisanie w miejsce wszystkich zmiennych vij , stałych indywiduowych lub termów stałych, będących nazwami elementów odpowiednich zbiorów Aij , 0 ≤ i ≤ m, 1 ≤ j ≤ n. W szczególnym wypadku ti (vi1 , . . . , vin ) mogą być termami stałymi: a0 , a1 , . . . , am . Wówczas charakteryzowany zbiór to: {a0 , a1 , . . . , am }. Warto tu zauważyć, że ilość termów stałych jest nie mniejsza niż ilość elementów zbioru, który te termy wyznaczają. O termach przyjmuje się, że mają dokładnie jeden desygnat. Nie zakłada się jednak, że różne termy mają różne desygnaty. Zauważmy również, że przedmiot (indywiduum) różni się od zbioru, którego jest on jedynym elementem: a jest jedynym elementem zbioru {a}. Zbiór, który ma dokładnie jeden element to singleton. Singleton jest najprostszym przykładem zbioru niepustego. Przykład 3.1. Zbiorami scharakteryzowanymi ekstensjonalnie są: {1, 2, 3}, {1, 3, . . . , 2i + 1, . . . : i ∈ N}.
°
Definicja 3.2 (charakterystyki intensjonalnej zbioru). Zbiór charakteryzowany jest intensjonalnie przez podanie formuły z jedną zmienną wolną (warunek), którą to formułę (warunek) spełniają wszystkie i tylko elementy tego zbioru. {x : φ(x)}
166
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
to zbiór wszystkich tych i tylko tych przedmiotów, dla których — jak to mówimy — prawdą jest, że są φ lub które mają własność φ). Znaków „{” oraz „}” używaliśmy jako znaków interpunkcyjnych. Teraz nawiasy te występują w roli operatora tworzącego nazwę zbioru. Operator ten nazywa się operatorem abstrakcji lub znakiem abstrakcji. Istnieje wiele odmian jego użycia. Pisze się też np.: {x | φ(x)}, Aby zapisać, że mamy na uwadze tylko przedmioty ze zbioru A, które spełniają φ piszemy: {x ∈ A : φ(x)}. Zapis: {x · y | x ∈ X ∧ y ∈ Y } oznacza zbiór, którego wszystkimi i tylko elementami są iloczyny z pierwszym czynnikiem, będącym elementem zbioru X i z drugim czynnikiem, będącym elementem zbioru Y . (ˆ x)φ(x) to zbiór taki, że y ∈ (ˆ x)φ(x) ⇔ φ(y), czyli (ˆ x)φ(x) = {x : φ(x)}. Zbiór scharakteryzowany ekstensjonalnie można scharakteryzować intensjonalnie. Taką wspólną „własnością” wszystkich i tylko tych przedmiotów, które są elementami zbioru A może być np. to, że są one elementami zbioru A. Zachodzi następująca równość: A = {x : x ∈ A}. Czasem zależy nam na charakterystyce ekstensjonalnej zbioru scharakteryzowanego intensjonalnie, np. równanie jest charakterystyką intensjonalną zbioru pierwiastków tego równania. Rozwiązać równanie to tyle, co scharakteryzować ekstensjonalnie ten zbiór pierwiastków. Definicja 3.3 (enumeracji zbioru). Enumeracją zbioru A jest ciąg wszystkich i tylko tych przedmiotów, które są elementami zbioru A.
3.2. RÓWNOŚĆ ZBIORÓW Przykład 3.2. Enumeracją zbioru {1, 2, 3} jest ciąg (1, 2, 3).
167 °
Definicja 3.4 (efektywnej enumeracji zbioru). Efektywną enumeracją zbioru A jest enumeracja, dla której istnieje efektywna metoda rozstrzygania, co jest n-tym wyrazem ciągu, stanowiącego enumerację A. Zbiory skończone mają efektywną enumerację. Zbiór wszystkich i tylko liczb naturalnych N ma efektywną enumerację.
3.2
Równość zbiorów
Zbiory A i B są ekstensjonalnie równe wtedy i tylko wtedy, gdy nie różnią się swoimi elementami. Zbiory, które są równe, są ekstensjonalnie równe. Jeżeli zbiory A i B są równe (=), to nie różnią się swoimi elementami, czyli: Twierdzenie 3.1. (A = B) ⇒ ∀x : (x ∈ A ⇔ x ∈ B). Dowód. 2 Z aksjomatu identyczności 3 na str. 107 mamy: 1. A = B ⇒ x ∈ A ⇒ x ∈ B. Podobnie: 2. B = A ⇒ x ∈ B ⇒ x ∈ A. Po dołączeniu dużego kwantyfikatora do 1 i 2, odpowiednio, otrzymujemy: 3. A = B ⇒ ∀x : (x ∈ A ⇒ x ∈ B), 2
Dowody twierdzeń rachunku zbiorów przeprowadzamy metodą dowodów założeniowych. Jako założenia dowodu mogą być brane tezy rachunku predykatów oraz definicje i wcześniej udowodnione twierdzenia rachunku zbiorów. Korzystamy nie tylko z reguł pierwotnych, lecz również z tych reguł, które są intuicyjnie oczywiste. Nie będziemy tych reguł nazywać. Zwykle wskazywane będą tylko wiersze dowodowe, do których reguły są stosowane. Odpowiedni komentarz będzie zamieszczany między wierszami dowodowymi (ze względów typograficznych).
168
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
4. B = A ⇒ ∀x : (x ∈ B ⇒ x ∈ A). Z 3 i 4 i z tego, że identyczność jest symetryczna mamy: 5. A = B ⇒ ∀x : (x ∈ A ⇔ x ∈ B). Powstaje pytanie, czy jeżeli zbiory są ekstensjonalnie równe, to są równe. Pozytywna odpowiedź na to pytanie nie wydaje się być intuicyjnie oczywista. Zbiór mieszkańców Warszawy jest ekstensjonalnie równy zbiorowi mieszkańców stolicy Polski. Czy jednak zbiory te są równe? Gdyby rozumieć zbiory w sposób intensjonalny, to ich równość zależałaby nie tylko od ich elementów (ekstensji), lecz również od sposobu określenia (intensji). Na gruncie rachunku predykatów z identycznością, z ekstensjonalnej równości zbiorów nie wynika ich równość. Teorię mnogości uprawia się przyjmując aksjomatycznie, że ekstensjonalna równość zbiorów pociąga za sobą równość zbiorów. Zasada ekstensjonalności 3 głosi, że jeżeli dwa zbiory są ekstensjonalnie równe, to są równe, czyli mają te same własności: ∀x : (x ∈ A ⇔ x ∈ B) ⇒ (A = B). Zbiory są równe wtedy i tylko wtedy, gdy nie różnią się swoimi elementami, czyli: Definicja 3.5 (równości zbiorów, =). (A = B) ⇔ ∀x : (x ∈ A ⇔ x ∈ B). Symbol „=” to dwuargumentowa litera predykatowa. Wprowadzamy skrót „6=”: A 6= B ⇔ ¬ (A = B). Przyjmujemy, że symbole „=” i „6=” wiążą słabiej niż symbole operacji na zbiorach4 . Dla dowolnych zbiorów A, B, C 5 : 3
Zob. aksjomat równości zbiorów na str. 187. O symbolach tych będzie mowa później. 5 Ściśle rzecz biorąc należałoby wskazać zbiór uniwersalny, którego podzbiorami są A, B i C. Ponieważ jednak omawiane tezy zachodzą w wypadku dowolnego zbioru uniwersalnego, pominięcie wskazania takiego zbioru jest zatem w pełni uprawnione i uzasadnione zasadą ekonomii, aby pisać tylko to, co jest konieczne do jednoznacznego zrozumienia. W ten sposób będziemy też postępować w innych wypadkach. 4
3.2. RÓWNOŚĆ ZBIORÓW
169
T 12 (zwrotność =). A = A. T 13 (symetryczność =). (A = B) ⇒ (B = A). T 14 (przechodniość =). [(A = B) ∧ (B = C)] ⇒ (A = C). czyli relacja równości zbiorów jest zwrotna, symetryczna i przechodnia. Udowodnimy tylko T14. Dowód. Z definicji równości zbiorów mamy: 1. (A = B) ⇔ ∀x : (x ∈ A ⇔ x ∈ B), 2. (B = C) ⇔ ∀x : (x ∈ B ⇔ x ∈ C). Z 1 i 2 dostajemy: 3. [(A = B)∧(B = C)] ⇔ [∀x : (x ∈ A ⇔ x ∈ B)∧∀x : (x ∈ B ⇔ x ∈ C)]. Tezą rachunku predykatów jest: 4. [∀x : (x ∈ A ⇔ x ∈ B) ∧ ∀x : (x ∈ B ⇔ x ∈ C)] ⇒ ∀x : (x ∈ A ⇔ x ∈ C), więc z 3 i 4: 5. [(A = B) ∧ (B = C)] ⇒ ∀x : (x ∈ A ⇔ x ∈ C). Ponieważ z definicji równości zbiorów: 6. (A = C) ⇔ ∀x : (x ∈ A ⇔ x ∈ C), więc ostatecznie: 7. [(A = B) ∧ (B = C)] ⇒ (A = C). Zbiór pusty, ∅, to zbiór, który nie ma żadnego elementu. Zbiór pusty możemy scharakteryzować intensjonalnie, korzystając z tego, że nie ma takiego przedmiotu, który różniłby się od samego siebie. Definicja 3.6 (zbioru pustego, ∅). ∅ = {x : ¬ x = x}.
170
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
Mając na uwadze to, że żaden przedmiot zarazem spełnia i nie spełnia jakiś warunek, zbiór pusty możemy scharakteryzować następująco: ∅ = {x : φ(x) ∧ ¬ φ(x)}. Symbol „∅” to stała indywiduowa. Zbiór pusty pełni w teorii mnogości rolę podobną do tej, którą 0 pełni w algebrze. W algebrze zbiorów przyjmuje się, że zbiory rozważane w ramach określonej dyscypliny — w której algebra zbiorów jest stosowana — są tego rodzaju, że wszystkie ich elementy są elementami pewnych zbiorów6 . Dla określonej klasy zbiorów taki zbiór jest tylko jeden. Zbiór ten, X, to przestrzeń (zbiór pełny lub zbiór uniwersalny). X możemy zdefiniować przez własność, którą posiadają wszystkie i tylko jego elementy. Definicja 3.7 (zbioru uniwersalnego, X). X = {x : φ(x) ∨ ¬ φ(x)}. Mając na uwadze to, że każdy przedmiot jest równy samemu sobie, zbiór uniwersalny to zbiór: {x : x = x}. Symbol „X” to stała indywiduowa. Czasem, w szczególności w rozważaniach nad relacjami i funkcjami, przyjmuje się istnienie więcej niż jednego zbioru uniwersalnego (każdy z nich jest jedynym zbiorem uniwersalnym, który oznacza dana stała indywiduowa). Na oznaczenie tych zbiorów, jak już była mowa, używa się wielkich liter z końca alfabetu: X, Y, Z (w razie potrzeby z indeksami).
3.3
Zawieranie się zbiorów
Zbiór A jest podzbiorem B, A ⊆ B, wtedy i tylko wtedy, gdy każdy element zbioru A jest elementem zbioru B Definicja 3.8 (podzbioru, ⊆). (A ⊆ B) ⇔ ∀x : (x ∈ A ⇒ x ∈ B). 6
Nie twierdzimy tym samym, że istnieje jakiś taki zbiór, że wszystkie elementy jakiegokolwiek zbioru byłyby elementami tego zbioru.
3.3. ZAWIERANIE SIĘ ZBIORÓW
171
Symbol „⊆” to dwuargumentowa litera predykatowa. Gdy A nie jest podzbiorem B, to piszemy: A 6⊆ B. Zbiór A zawiera się w zbiorze B wtedy i tylko wtedy, gdy zbiór A jest podzbiorem zbioru B. Relacja ⊆ to relacja zawierania się zbiorów lub inaczej relacja inkluzji. Zbiór A jest właściwym podzbiorem zbioru B wtedy i tylko wtedy, gdy każdy element A jest elementem B i są elementy B, które nie są elementami A. Definicja 3.9 (podzbioru właściwego, ⊂). (A ⊂ B) ⇔ ∀x : (x ∈ A ⇒ x ∈ B) ∧ ∃x : (x ∈ B ∧ x 6∈ A). Zauważmy, że A ⊂ B ⇔ [(A ⊆ B) ∧ (A 6= B)], czyli A jest właściwym podzbiorem B wtedy i tylko, gdy A jest podzbiorem B i A jest różne od B. Zbiór A jest nadzbiorem zbioru B wtedy i tylko wtedy, gdy każdy element zbioru B jest elementem zbioru A. Definicja 3.10 (nadzbioru, ⊇). (A ⊇ B) ⇔ ∀x : (x ∈ B ⇒ x ∈ A). Zauważmy, że A ⊇ B ⇔ B ⊆ A. Symbol „⊇” to dwuargumentowa litera predykatowa. Gdy A nie jest nadzbiorem B, to piszemy: A 6⊇ B. Zbiór A jest właściwym nadzbiorem zbioru B, A ⊃ B, wtedy i tylko wtedy, gdy każdy element B jest elementem A i są elementy A, które nie są elementami B. Definicja 3.11 (nadzbioru właściwego, ⊃). (A ⊃ B) ⇔ ∀x : (x ∈ B ⇒ x ∈ A) ∧ ∃x : (x ∈ A ∧ x 6∈ B).
172
ROZDZIAŁ 3. ALGEBRA ZBIORÓW Zauważmy, że A ⊃ B ⇔ [(A ⊇ B) ∧ (A 6= B)],
czyli A jest nadzbiorem B wtedy i tylko wtedy, gdy B jest podzbiorem A i A jest różne od B. Przyjmujemy, że symbole „⊆”, „6⊆”, „⊂”, „⊇”, „6⊇”, „⊃” wiążą słabiej niż wszystkie symbole operacji na zbiorach. Dla dowolnych zbiorów A, B, C: T 15 (zwrotność ⊆). A ⊆ A T 16 (antysymetryczność ⊆). [(A ⊆ B) ∧ (B ⊆ A)] ⇒ (A = B) T 17 (przechodniość ⊆). [(A ⊆ B) ∧ (B ⊆ C)] ⇒ (A ⊆ C) T 18. (A 6= B) ⇒ [A 6⊆ B) ∨ (B 6⊆ A)]. Dowód. Dowiedziemy tylko antysymetryczności ⊆. Na podstawie definicji ⊆: 1. A ⊆ B ⇔ ∀x : (x ∈ A ⇒ x ∈ B). Podobnie: 2. B ⊆ A ⇔ ∀x : (x ∈ B ⇒ x ∈ A). Z 1 i 2 otrzymujemy: 3. [(A ⊆ B)∧(B ⊆ A)] ⇔ [∀x : (x ∈ A ⇒ x ∈ B)∧∀x : (x ∈ B ⇒ x ∈ A)]. Tezą rachunku predykatów jest: 4. [∀x : (x ∈ A ⇒ x ∈ B) ∧ ∀x : (x ∈ B ⇒ x ∈ A)] ⇒ ∀x : (x ∈ A ⇔ x ∈ B). Z 3 i 4 dostajemy: 5. [(A ⊆ B) ∧ (B ⊆ A)] ⇒ ∀x : (x ∈ A ⇔ x ∈ B). Ponieważ z definicji równości zbiorów: 6. (A = B) ⇔ ∀x : (x ∈ A ⇔ x ∈ B), więc z 5 i 6 ostatecznie otrzymujemy:
3.4. OPERACJE NA ZBIORACH
173
7. [(A ⊆ B) ∧ (B ⊆ A)] ⇒ (A = B). Na podstawie definicji zbioru pustego i zawierania się zbiorów mamy: T 19. ∅ ⊆ A, czyli zbiór pusty jest podzbiorem każdego zbioru. Ponadto: T 20. A 6= ∅ ⇒ A 6⊆ ∅, czyli żaden zbiór w sposób właściwy nie zawiera się w zbiorze pustym. Zauważmy, że T 21. A ⊆ X, czyli każdy zbiór zawiera się w przestrzeni; oraz T 22. A 6= X ⇒ X 6⊆ A, czyli przestrzeń w sposób właściwy nie zawiera się w żadnym zbiorze.
3.4 3.4.1
Operacje na zbiorach Dopełnienie zbioru
Dopełnieniem (uzupełnieniem) zbioru A jest zbiór −A, którego elementami są wszystkie i tylko te elementy przestrzeni, które nie są elementami A. Definicja 3.12 (dopełnienia zbioru, −). −A = {x ∈ X : ¬ x ∈ A}. Możemy to też zapisać jako: −A = {x ∈ X : x 6∈ A}, lub ∀x : [x ∈ −A ⇔ ¬ x ∈ A]. Symbol „−” to jednoargumentowa litera funkcyjna. Przyjmujemy, że wiąże najmocniej ze wszystkich symboli operacji na zbiorach. Zamiast pisać: −(−A) piszemy też: − − A. Charakteryzując zbiór intensjonalnie mówimy o własności, którą posiadają wszystkie i tylko elementy tego zbioru. Następuje utożsamienie zbioru z własnością. Dopełnienie zbioru można więc utożsamiać z brakiem własności, która ten zbiór wyznacza.
174
ROZDZIAŁ 3. ALGEBRA ZBIORÓW Dla dowolnego zbioru A:
T 23. −(−A) = A T 24. −∅ = X T 25. −X = ∅ T 26. A ⊆ B ⇔ −B ⊆ −A. Dowiedźmy tylko T23. Nosi ono nazwę prawa podwójnego uzupełnienia. Dowód. Z definicji dopełnienia zbioru mamy: 1. ∀x : [(x ∈ −A) ⇔ ¬(x ∈ A)]. Podobnie: 2. ∀x : [(x ∈ −(−A)) ⇔ ¬(x ∈ −A)]. Teraz opuszczamy kwantyfikatory w 1 i 2. Dostajemy więc: 3. (x ∈ −A) ⇔ ¬(x ∈ A), 4. (x ∈ −(−A)) ⇔ ¬(x ∈ −A). Z 3 otrzymujemy: 5. (x ∈ A) ⇔ ¬ (x ∈ −A). Z 4 i 5 mamy: 6. (x ∈ A) ⇔ (x ∈ −(−A)). Dołączając w 6 duży kwantyfikator mamy: 7. ∀x : [(x ∈ A) ⇔ (x ∈ −(−A))]. Z definicji równości zbiorów: 8. A = −(−A) ⇔ ∀x : [(x ∈ A) ⇔ (x ∈ −(−A))]. Z 7 i 8 dostajemy więc 9. −(−A) = A.
3.4. OPERACJE NA ZBIORACH
3.4.2
175
Suma zbiorów
Sumą zbiorów A i B jest zbiór A∪B, którego elementami są wszystkie i tylko te przedmioty, które są elementami zbioru A lub są elementami zbioru B. Definicja 3.13 (sumy zbiorów, ∪). (A ∪ B) = {x ∈ X : x ∈ A ∨ x ∈ B}. W sposób równoważny możemy to wyrazić: ∀x : [x ∈ (A ∪ B) ⇔ (x ∈ A) ∨ (x ∈ B)]. Zauważmy, że x 6∈ (A ∪ B) ⇔ (x 6∈ A) ∧ (x 6∈ B). Operacją sumowania teoriomnogościowego rządzą następujące prawa. Dla dowolnych zbiorów A, B, C: T 27 (przemienność ∪). A ∪ B = B ∪ A T 28 (łączność ∪). A ∪ (B ∪ C) = (A ∪ B) ∪ C T 29 (element neutralny ∪). ∅ ∪ A = A T 30 (idempotencja ∪). A ∪ A = A T 31 (element jednostkowy ∪). A ∪ X = X. Udowodnimy tylko T28. Dowód. Z definicji sumy teoriomnogościowej zachodzą kolejne równoważności: 1. x ∈ [A ∪ (B ∪ C)] ⇔ [x ∈ A ∨ x ∈ (B ∪ C)], 2. [x ∈ (B ∪ C)] ⇔ (x ∈ B ∨ x ∈ C). Z 1 i 2 mamy: 3. x ∈ [A ∪ (B ∪ C)] ⇔ [x ∈ A ∨ (x ∈ B ∨ x ∈ C)]. Tezą rachunku logicznego jest:
176
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
4. [x ∈ A ∨ (x ∈ B ∨ x ∈ C)] ⇔ [(x ∈ A ∨ x ∈ B) ∨ x ∈ C]. Ponownie korzystając z definicji sumy teoriomnogościowej mamy: 5. (x ∈ A ∨ x ∈ B) ⇔ [x ∈ (A ∪ B)]. Z 5 dostajemy: 6. [(x ∈ A ∨ x ∈ B) ∨ x ∈ C] ⇔ [x ∈ (A ∪ B) ∨ x ∈ C]. Z definicji sumy: 7. [x ∈ (A ∪ B) ∨ x ∈ C] ⇔ x ∈ [(A ∪ B) ∪ C]. Korzystając z przechodniości ⇔ ostatecznie dostajemy: 8. x ∈ [A ∪ (B ∪ C)] ⇔ x ∈ [(A ∪ B) ∪ C]. W związku z łącznością ∪, zapisując sumę skończonej liczby zbiorów, możemy opuścić nawiasy. W jakiejkolwiek kolejności byśmy sumowali, to zawsze otrzymamy ten sam wynik. Ponadto, dla dowolnych zbiorów A, B, C, D: T 32. B ⊆ A ∪ B T 33. A ⊆ C ∧ B ⊆ C ⇒ A ∪ B ⊆ C T 34. A ⊆ B ∧ C ⊆ D ⇒ A ∪ C ⊆ B ∪ D T 35. A ⊆ B ⇔ A ∪ B = B. Dowiedźmy tylko T35. Dowód. Ograniczmy się do dowodu tego, że A ∪ B = B ⇒ A ⊆ B. Tezą rachunku predykatów jest: 1. (x ∈ A ∨ x ∈ B ⇔ x ∈ B) ⇒ (x ∈ A ⇒ x ∈ B). Korzystając z definicji sumy teoriomnogościowej dostajemy:
3.4. OPERACJE NA ZBIORACH
177
2. (x ∈ A ∪ B ⇔ x ∈ B) ⇒ (x ∈ A ⇒ x ∈ B). Stąd: 3. ∀x : (x ∈ A ∪ B ⇔ x ∈ B) ⇒ ∀x : (x ∈ A ⇒ x ∈ B). Z definicji równości zbiorów i definicji zawierania się zbiorów: 4. (A ∪ B = B) ⇒ (A ⊆ B).
3.4.3
Przecięcie zbiorów
Przecięciem (przekrojem, iloczynem) zbiorów A i B jest zbiór A ∩ B taki, którego elementami są wszystkie i tylko te przedmioty, które są elementami zbioru A i które są elementami zbioru B. Definicja 3.14 (przecięcia zbiorów, ∩). (A ∩ B) = {x ∈ X : x ∈ A ∧ x ∈ B}. W sposób równoważny możemy to wyrazić: ∀x : [x ∈ (A ∩ B) ⇔ (x ∈ A) ∧ (x ∈ B)]. Symbol „∩” to dwuargumentowa litera funkcyjna. Zauważmy, że x 6∈ (A ∩ B) ⇔ (x 6∈ A) ∨ (x 6∈ B). Operacją iloczynu zbiorów rządzą następujące prawa. Dla dowolnych zbiorów A, B, C: T 36 (przemienność ∩). A ∩ B = B ∩ A T 37 (łączność ∩). A ∩ (B ∩ C) = (A ∩ B) ∩ C T 38 (element jednostkowy ∩). ∅ ∩ A = ∅ T 39 (idempotencja ∩). A ∩ A = A T 40 (element neutralny ∩). A ∩ X = A.
178
ROZDZIAŁ 3. ALGEBRA ZBIORÓW Udowodnimy tylko T37.
Dowód. Na podstawie definicji przecięcia zbiorów zachodzą kolejne równoważności: 1. x ∈ [A ∩ (B ∩ C)] ⇔ [x ∈ A ∧ x ∈ (B ∩ C)], 2. [x ∈ A ∧ x ∈ (B ∩ C)] ⇔ [x ∈ A ∧ (x ∈ B ∧ x ∈ C)]. Tezą rachunku logicznego jest: 3. [x ∈ A ∧ (x ∈ B ∧ x ∈ C)] ⇔ [(x ∈ A ∧ x ∈ B) ∧ x ∈ C]. Ponownie korzystając z definicji przecięcia dostajemy: 4. [(x ∈ A ∧ x ∈ B) ∧ x ∈ C] ⇔ [x ∈ (A ∩ B) ∧ x ∈ C], 5. [x ∈ (A ∩ B) ∧ x ∈ C] ⇔ x ∈ [(A ∩ B) ∩ C]. Korzystając z przechodniości ⇔ ostatecznie mamy: 6. x ∈ [A ∩ (B ∩ C)] ⇔ x ∈ [(A ∩ B) ∩ C]. W związku z łącznością ∩, zapisując przecięcie skończonej liczby zbiorów możemy opuścić nawiasy. W jakiejkolwiek kolejności byśmy brali przecięcie, to zawsze otrzymamy ten sam wynik. Ponadto, dla dowolnych zbiorów A, B, C, D: T 41. A ∩ B ⊆ B T 42. A ⊆ B ∧ A ⊆ C ⇒ A ⊆ B ∩ C T 43. A ⊆ B ∧ C ⊆ D ⇒ A ∩ C ⊆ B ∩ D T 44. A ⊆ B ⇔ A ∩ B = A. Dowiedźmy tylko T44. Dowód. Ograniczmy się do dowodu tego, że A ∩ B = A ⇒ A ⊆ B.
3.4. OPERACJE NA ZBIORACH
179
Niech: 1. A ∩ B = A. Z 1 na podstawie definicji równości zbiorów: 2. x ∈ (A ∩ B) ⇔ x ∈ A. Z definicji przecięcia zbiorów: 3. x ∈ (A ∩ B) ⇔ (x ∈ A ∧ x ∈ B). Z 2 i 3 mamy: 4. (x ∈ A ∧ x ∈ B) ⇔ x ∈ A. Tezą rachunku logicznego jest: 5. [(x ∈ A ∧ x ∈ B) ⇔ x ∈ A] ⇒ (x ∈ A ⇒ x ∈ B). Z 4 i 5 dostajemy 6. x ∈ A ⇒ x ∈ B. Z definicji zawierania się zbiorów i 6 7. A ⊆ B. Zbiory A i B są rozłączne, A ⊇⊆ B, wtedy i tylko wtedy, gdy żaden element jednego ze zbiorów nie jest elementem drugiego, czyli Definicja 3.15 (rozłączności zbiorów, ⊇⊆). (A ⊇⊆ B) ⇔ ¬ ∃x : (x ∈ A ∧ x ∈ B). Zauważmy, że (A ⊇⊆ B) ⇔ (A ∩ B = ∅).
3.4.4
Różnica i różnica symetryczna zbiorów
Różnicą zbiorów A i B jest zbiór A \ B, którego elementami są wszystkie i tylko te elementy zbioru A, które nie są elementami zbioru B. Definicja 3.16 (różnicy zbiorów, \). (A \ B) = {x ∈ X : x ∈ A ∧ ¬ x ∈ B}. W sposób równoważny możemy to wyrazić: ∀x : [x ∈ (A \ B) ⇔ (x ∈ A) ∧ ¬ (x ∈ B)]. Symbol „\” to dwuargumentowa litera funkcyjna.
180
ROZDZIAŁ 3. ALGEBRA ZBIORÓW Dla dowolnych zbiorów A, B, C, D:
T 45. A \ B ⊆ A T 46. A ⊆ B ∧ C ⊆ D ⇒ A \ D ⊆ B \ C T 47. C ⊆ D ⇒ A \ D ⊆ A \ C T 48. A ⊆ B ⇔ A \ B = ∅. Różnicą symetryczną zbiorów A i B jest zbiór A . B, którego elementami są wszystkie i tylko te elementy zbioru A, które nie są elementami zbioru B oraz wszystkie i tylko te elementy zbioru B, które nie są elementami zbioru A. Definicja 3.17 (różnicy symetrycznej zbiorów, . ). . (A B) = [x ∈ X : (x ∈ A ∧ ¬ x ∈ B) ∨ (¬ x ∈ A ∧ x ∈ B)]. Równoważnie możemy to zapisać: . ∀x : [x ∈ (A B) ⇔ (x ∈ A ∧ ¬ x ∈ B) ∨ (¬ x ∈ A ∧ x ∈ B)]. Symbol „
.
” to dwuargumentowa litera funkcyjna.
Zauważmy, że (A
3.4.5
.
B) = (B
.
A).
Związki między działaniami teoriomnogościowymi
Operacja dopełnienia pozostaje w następujących związkach z innymi działaniami teoriomnogościowymi. Dla dowolnego zbioru A i przestrzeni X 7 : T 49. −A = X \ A T 50. A ∪ −A = X T 51. A ∩ −A = ∅. 7
Twierdzenia T2 i T3 można by nazwać, odpowiednio, teoriomnogościowym prawem wyłączonego środka i teoriomnogościowym prawem (nie)sprzeczności. Istnieje ścisły związek między tymi (i innymi) prawami rachunku zbiorów a odpowiednimi prawami rachunku zdań: odrzucenie tych drugich wiąże się z zakwestionowaniem tych pierwszych.
3.4. OPERACJE NA ZBIORACH
181
Dla dowolnych zbiorów A i B: T 52 (prawo De Morgana). −(A ∪ B) = −A ∩ −B T 53 (prawo De Morgana). −(A ∩ B) = −A ∪ −B T 54. A \ B = A ∩ −B T 55. A \ B = −(−A ∪ B). Dla dowolnych zbiorów A, B i przestrzeni X: T 56. A ⊆ B ⇔ A ∩ −B = ∅ T 57. A ⊆ B ⇔ −A ∪ B = X. Następujące prawa ustalają związki między dodawaniem a mnożeniem zbiorów. Dla dowolnych zbiorów A, B i C: T 58 (prawo absorpcji (pochłaniania)). A ∩ (A ∪ B) = A T 59 (prawo absorpcji (pochłaniania)). (A ∩ B) ∪ B = B T 60 (prawo rozdzielności sumy względem iloczynu). A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) T 61 (prawo rozdzielności iloczynu względem sumy). A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C). Związki między różnicą a sumą określają następujące prawa. Dla dowolnych zbiorów A i B: T 62. A ∪ (B \ A) = A ∪ B T 63. A ⊆ B ⇒ A ∪ (B \ A) = B. Kolejne prawo pozwala określić przecięcie za pomocą różnicy. Dla dowolnych zbiorów A i B: T 64. A \ (A \ B) = A ∩ B.
182
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
Między różnicą a dodawaniem i mnożeniem zbiorów zachodzą następujące związki. Dla dowolnych zbiorów A, B, C: T 65 (prawo De Morgana (dla różnicy)). A \ (B ∪ C) = (A \ B) ∩ (A \ C) T 66 (prawo De Morgana (dla różnicy)). A \ (B ∩ C) = (A \ B) ∪ (A \ C). Można postawić pytanie, ile daje się uzyskać wzajemnie różnych zbiorów z danych n zbiorów stosując do nich operacje dodawania, mnożenia i odejn mowania. Dowodzi się, że jest to liczba skończona i wynosi 22 . Algebra zbiorów ma wielorakie zastosowania, w szczególności z operacjami teoriomnogościowymi mamy do czynienia przy wyszukiwaniu informacji. Niech T (A) będzie zbiorem wszystkich i tylko tekstów (dokumentów), w których występuje słowo A. Dla znanych z wyszukiwarek internetowych spójników: OR, AND oraz AND NOT zachodzą następujące zależności: 1. T (A OR B) = T (A) ∪ T (B), 2. T (A AND B) = T (A) ∩ T (B), 3. T (A AND NOT B) = T (A) ∩ −T (B), lub, co na jedno wychodzi: 4. T (A AND NOT B) = T (A) \ T (B). Jeżeli chcemy znaleźć dokumenty, w których występuje słowo A i nie występuje ani słowo B ani słowo C, to piszemy: A AND NOT (B OR C) lub (A AND NOT B) AND (A AND NOT C). Równoważności tych sformułowań można dowieść korzystając z algebry zbiorów.
3.4. OPERACJE NA ZBIORACH
3.4.6
183
Uogólnione suma i przecięcie zbiorów
Dotychczas omawialiśmy działania teoriomnogościowe na skończonej liczbie zbiorów. Sumę i przecięcie można uogólnić na dowolną rodzinę zbiorów. Niech X będzie niepustą przestrzenią (X 6= ∅). Niech (At )t∈T będzie rodziną podzbiorów przestrzeni X, gdzie T jest zbiorem (indeksów). Przykład 3.3. Niech przestrzenią będzie zbiór liczb naturalnych N. Niech T będzie zbiorem {1, 2, 3, 4, 5}. Niech (At )t∈T = {n ∈ N : t < n}. Rodzinę zbiorów (At )t∈T tworzą następujące zbiory: A1 = {2, 3, . . .}; A2 = {3, 4, . . .}; A3 = {4, 5, . . .}; A4 = {5, 6, . . .}; A5 = {6, 7, . . .}. Gdybyśmy jako T wzięli zbiór liczb naturalnych, to rodzina (At )t∈T miałaby nieskończenie wiele elementów. Jej elementami byłyby wszystkie zbiory (dla każdego n ∈ N): An = {(n + 1), (n + 2), . . .}. ° S S Sumą uogólnioną zbiorów rodziny (At )t∈T jest zbiór t∈T At (lub: {At : t ∈ T }), którego elementami są wszystkie i tylko te przedmioty, które są elementem przynajmniej jednego ze zbiorów (At )t∈T . S Definicja 3.18 (uogólnionej sumy zbiorów, ). [ ∀x : {(x ∈ At ) ⇔ ∃t∈T (x ∈ At )}. t∈T
Przecięciem T uogólnionym zbiorów niepustej rodziny (At )t∈T jest zbiór A (lub: {At : t ∈ T }), którego elementami są wszystkie i tylko te przedt∈T t mioty, które są elementami każdego ze zbiorów rodziny (At )t∈T . T Definicja 3.19 (uogólnionego przecięcia zbiorów, ). \ ∀x : {(x ∈ At ) ⇔ ∀t∈T (x ∈ At )}. T
t∈T
W wypadku, gdy zbiór T jest skończony, T = {1, 2, . . . , n}, to [ At = A1 ∪ A2 ∪ . . . ∪ An , t∈T
184
ROZDZIAŁ 3. ALGEBRA ZBIORÓW \
At = A1 ∩ A2 ∩ . . . ∩ An .
t∈T
W wypadku, gdy T = N, czyli gdy T jest zbiorem liczb naturalnych piszemy: ∞ [
An
zamiast
n=1 ∞ \
[
An ,
n∈N
An
zamiast
n=1
\
An .
n∈N
Omówimy teraz niektóre własności uogólnionych sumy i przecięcia.
T T T T T T
Dla dowolnej rodziny zbiorów (At )t∈T , dla każdego t ∈ T : S 67. At ⊆ t∈T At T 68. t∈T At ⊆ At S 69. At ⊆ A ⇒ t∈T At ⊆ A T 70. A ⊆ At ⇒ A ⊆ t∈T At S S S 71. t∈T At ∪ t∈T Bt = t∈T (At ∪ Bt ) T T T 72. t∈T At ∩ t∈T Bt = t∈T (At ∩ Bt ). Udowodnijmy tylko własność T70.
Dowód. Przeprowadzimy dowód niewprost. Niech więc: 1. ∀t ∈ T : (A ⊆ At ), 2. A 6⊆
T t∈T
At .
Z definicji zawierania się zbiorów i z 2 mamy, że dla pewnego a: 3. a ∈ A ∧ ¬ a ∈ Z tego: 4. a ∈ A, oraz
T t∈T
At .
3.4. OPERACJE NA ZBIORACH 5. ¬ a ∈
T t∈T
185
At .
Z 5 i definicji uogólnionego przecięcia dostajemy: 6. ∃t ∈ T : ¬ a ∈ At . Z 1 mamy: 7. ∀t ∈ T : (a ∈ A ⇒ a ∈ At ). Z 4 i 7 zaś dostajemy 8. ∀t ∈ T : (a ∈ At ). Korzystając z prawa De Morgana stwierdzamy sprzeczność między wierszami 6 i 8. Związki między uogólnionymi sumą i przecięciem a relacją inkluzji ustalają następujące twierdzenia.
T T T T
Dla dowolnych rodzin zbiorów (At )t∈T i (Bt )t∈T oraz każdego t(∈ T ): S S 73. (At ⊆ Bt ) ⇒ t∈T At ⊆ t∈T Bt T T 74. (At ⊆ Bt ) ⇒ t∈T At ⊆ t∈T Bt S S S 75. t∈T (At ∩ Bt ) ⊆ t∈T At ∩ t∈T Bt T T T 76. t∈T At ∪ t∈T Bt ⊆ t∈T (At ∪ Bt ).
Kolejne twierdzenia określają związki między dodawaniem i przecięciem a uogólnionymi sumą oraz przecięciem.
T T T T
Dla dowolnej rodziny zbiorów (At )t∈T i dowolnego zbioru A: S S 77. A ∪ t∈T At = t∈T (A ∪ At ) S S 78. A ∩ t∈T At = t∈T (A ∩ At ) T T 79. A ∪ t∈T At = t∈T (A ∪ At ) T T 80. A ∩ t∈T At = t∈T (A ∩ At ). Udowodnijmy tylko własność T80, ograniczając się do: \ \ A∩ At ⊆ (A ∩ At ). t∈T
t∈T
186
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
Dowód. Niech 1. x ∈ (A ∩
T t∈T
At ).
Z 1 oraz definicji przecięcia i uogólnionego przecięcia: 2. x ∈ A ∧ ∀t ∈ T : x ∈ At . Z tego: 3. ∀t ∈ T : (x ∈ A ∧ x ∈ At ). Z definicji przecięcia więc: 4. ∀t ∈ T : x ∈ (A ∩ At ). Zatem z definicji uogólnionego przecięcia: 5. x ∈
T t∈T
(A ∩ At ),
co kończy dowód. Związki między różnicą a uogólnionymi sumą i przecięciem ustalają dwa pierwsze uogólnione prawa De Morgana (dla różnicy), zaś dla dopełnienia — dwa kolejne uogólnione prawa De Morgana (dla dopełnienia).
T T T T
Dla dowolnej rodziny (At )t∈T i dowolnego zbioru A: T S 81. A \ t∈T At = t∈T (A \ At ) T S 82. A \ t∈T At = t∈T (A \ At ) T S 83. − t∈T At = t∈T (−At ) T S 84. − t∈T At = t∈T (−At ). Twierdzenia T83 i T84 są konsekwencjami, odpowiednio, T81 i T82.
3.5
Aksjomaty algebry zbiorów
W powyższych rozważaniach dotyczących algebry zbiorów przyjmowano jako pewniki niektóre własności zbiorów i pewne rozumienie bycia elementem zbioru. Te założenia znajdują jawne sformułowanie w następujących czterech aksjomatach algebry zbiorów. Stanowią one system aksjomatów algebry zbiorów.
3.5. AKSJOMATY ALGEBRY ZBIORÓW
187
Aksjomat 1 (równości zbiorów (ekstensjonalności)8 ). Jeśli zbiory A i B nie różnią się swoimi elementami, to zbiory A i B są równe. Aksjomat 2 (sumy). Dla dowolnych zbiorów A i B istnieje zbiór, którego elementami są wszystkie i tylko te przedmioty, które są elementami zbioru A lub są elementami zbioru B. Aksjomat 3 (różnicy). Dla dowolnych zbiorów A i B istnieje zbiór, którego elementami są wszystkie i tylko te elementy zbioru A, które nie są elementami B. Aksjomat 4 (istnienia). Istnieje co najmniej jeden zbiór. Aksjomaty te nie obejmują wszystkiego tego, co dla potrzeb matematyki wystarczająco charakteryzowałoby pojęcie zbioru. Zwykle oprócz podanych wyżej czterech aksjomatów, przyjmuje się jeszcze kolejne trzy. Wszystkie te aksjomaty pochodzą od Ernesta Zermelo. Aksjomat 5 (podzbiorów, inaczej: wyróżniania). Dla każdego zbioru A i każdej formuły φ z jedną zmienną wolną, której zakresem jest zbiór A istnieje zbiór, którego elementami są wszystkie i tylko elementy zbioru A, które spełniają φ. Naiwna intuicja zbioru mogłaby nas skłaniać do przyjęcia aksjomatu mocniejszego, a mianowicie pewnika abstrakcji głoszącego, że dla dowolnej własności (formuły) φ istnieje zbiór wszystkich i tylko tych przedmiotów, które tę własność posiadają (lub, odpowiednio, zbiór przedmiotów spełniających tę formułę). Pewnik ten dopuszcza istnienie zbiorów przedmiotów o dowolnej cesze. Okazuje się jednak, że taki aksjomat prowadzi do sprzeczności (antynomii). Jest tak np. w wypadku antynomii Russella. φ(x) ⇔ (x jest zbiorem) ∧ (x 6∈ x). Niech: R = {x : φ(x)}, czyli R = {x : x jest zbiorem ∧ x 6∈ x}. 8
Por. z zasadą ekstensjonalności na str. 168.
188
ROZDZIAŁ 3. ALGEBRA ZBIORÓW
Jeśli przyjmiemy, że każda własność wyznacza zbiór, to R jest zbiorem. Zasadne staje się więc pytanie, czy R jest elementem R. Z definicji R mamy, że R ∈ R ⇔ R 6∈ R, co jest ewidentną sprzecznością. Zermelo wyeliminował antynomie, w miejsce pewnika abstrakcji przyjmując aksjomat wyróżniania. Zakłada się w nim istnienie zbiorów przedmiotów o dowolnej cesze φ, ale tylko tych przedmiotów, które są elementami jakiegoś zbioru. Aksjomat wyróżniania pozwala z każdego zbioru wyróżnić podzbiór jego elementów posiadających określoną własność. W szczególności przy założeniu istnienia jakiegoś zbioru zapewnia istnienie zbioru pustego. Zbiór ten zawiera się w każdym zbiorze, ponieważ można go wyróżnić z każdego zbioru, a mianowicie jako {x ∈ A : ¬ x = x}. Aksjomat 6 (zbioru potęgowego). Dla każdego zbioru A istnieje zbiór 2A , zwany zbiorem potęgowym zbioru A, którego elementami są wszystkie i tylko podzbiory zbioru A. Zbiór potęgowy bywa oznaczany „P (A)” — od angielskiego Power lub też „C(A)” — od Cantora. Aksjomat ten pozwala tworzyć dowolnie duże zbiory. Zbiór P (A) ma więcej9 elementów niż zbiór X. Ponieważ, mając zbiór P (A) możemy utworzyć jego zbiór potęgowy P (P (A)), to otrzymujemy jeszcze większy zbiór itd. Aksjomat 7 (wyboru, pewnik wyboru). Dla każdej rodziny zbiorów niepustych i rozłącznych istnieje zbiór, który z każdym ze zbiorów z tej rodziny ma jeden i tylko jeden wspólny element. Fakt przyjmowania pewnika wyboru jako aksjomatu jest zaznaczany w nazwie danego systemu aksjomatycznego. Na przykład, ZFC to system aksjomatyczny Zermelo-Fraenkla z aksjomatem wyboru (Choice — ang.: wybór). Aksjomat 8 (regularności, ufundowania). W każdym niepustym zbiorze A jest taki element, którego żaden element nie jest elementem zbioru A. 9
Odpowiedź na pytanie, co to znaczy, że jeden zbiór ma więcej elementów niż inny, damy rozważając problemy mocy zbiorów.
3.5. AKSJOMATY ALGEBRY ZBIORÓW
189
Konsekwencją tego aksjomatu jest wykluczenie istnienia zbioru A takiego, że A ∈ A a także wykluczona jest każda z możliwości: A ∈ A1 , A1 ∈ A2 , . . . An ∈ A. W teorii mnogości można zdefiniować zbiór liczb naturalnych N. Definiujemy indukcyjnie według wzoru: Succ(A) = A ∪ {A}. Korzystając z aksjomatu istnienia stwierdzamy istnienie jakiegoś zbioru A. Na podstawie aksjomatu wyróżniania stwierdzamy istnienie zbioru {x ∈ A : x 6= x}. Taki zbiór jest dokładnie jeden. Jest to zbiór pusty: ∅. Na podstawie aksjomatu zbioru potęgowego stwierdzamy istnienie zbioru P (∅). Na mocy aksjomatu wyróżniania mamy zbiór: {x ∈ P (∅) : x = ∅}. Stwierdzamy więc istnienie zbioru {∅}. Korzystając z aksjomatu sumy mamy zbiór ∅ ∪ {∅}(= {∅}). W kolejnym kroku definicji indukcyjnej zakładamy istnienie zbioru A. Na podstawie aksjomatu zbioru potęgowego stwierdzamy istnienie zbioru potęgowego P (A). Na mocy aksjomatu wyróżniania mamy, że istnieje zbiór {x ∈ P (A) : x = A}(= {A}). Z kolei z aksjomatu sumy mamy, że istnieje zbiór: A ∪ {A}. Zgodnie z tym mamy: Succ(∅) = ∅ ∪ {∅} = {∅}, Succ({∅}) = {∅} ∪ {{∅}} = {∅, {∅}}, Succ({∅, {∅}}) = {∅, {∅}} ∪ {{∅, {∅}}}, itd. Możemy teraz określić zbiór N jako najmniejszy zbiór, który spełnia następujące warunki: 1. ∅ ∈ N, 2. A ∈ N ⇒ Succ(A) ∈ N. Zauważmy, że zarówno A ⊂ Succ(A) jak i A ∈ Succ(A). Poszczególne elementy zbioru N są oznaczane jak następuje: 0 = ∅, 1 = {∅} = {0}, 2 = {∅, {∅}} = {0, 1}, .. . n = {0, 1, . . . , n − 1}, .. .. Zgodnie z tym mamy:
190
ROZDZIAŁ 3. ALGEBRA ZBIORÓW Succ(0) = 1, Succ(1) = 2, i ogólnie: Succ(n) = n + 1.
Rozdział 4 Relacje i funkcje 4.1
Iloczyn kartezjański zbiorów
Podstawowym pojęciem dalszych rozważań jest operacja tworzenia pary uporządkowanej przedmiotów. Twierdzenie 4.1. 1. ∀x, y : ∃z : (z = {{x}, {x, y}}), 2. ∀x, y, x1 , y1 : (x = x1 ∧ y = y1 ⇔ {{x}, {x, y}} = {{x1 }, {x1 , y1 }}), czyli dla dowolnych przedmiotów x i y (niekoniecznie różnych): 1. istnieje dokładnie jeden zbiór {{x}, {x, y}} oraz 2. zbiór ten jest przyporządkowany tylko tej parze przedmiotów. Dowód. Mając przedmiot x możemy utworzyć — korzystając chociażby z aksjomatu pary — zbiór {x}, którego jedynym elementem jest x. Mając przedmioty x i y (niekoniecznie różne) na podstawie aksjomatu pary możemy utworzyć zbiór {x, y}, którego elementami będą tylko x i y. Korzystając ponownie z aksjomatu pary ze zbiorów {x} i {x, y} możemy utworzyć zbiór {{x}, {x, y}}, którego elementami będą tylko {x} i {x, y}. Stwierdzamy więc istnienie zbioru {{x}, {x, y}}. Taki zbiór utworzony z przedmiotów x i y i jako swoich elementów zbiorów {x} i {x, y} jest dokładnie jeden, bowiem Z definicji równości zbiorów mamy: 1. {{x}, {x, y}} = {{x1 }, {x1 , y1 }} ⇔ [({x} = {x1 })∧({x, y} = {x1 , y1 })]∨ [({x} = {x1 , y1 }) ∧ ({x, y} = {y1 })], 191
192
ROZDZIAŁ 4. RELACJE I FUNKCJE
2. {x} = {x1 } ⇔ x = x1 , 3. {x, y} = {x1 , y1 } ⇔ (x = x1 ∧ y = y1 ) ∨ (x = y1 ∧ y = x1 ), Z 2 i 3 mamy: 4. ({x} = {x1 })∧({x, y} = {x1 , y1 }) ⇔ (x = x1 )∧[(x = x1 ∧y = y1 )∨(y = y1 ∧ y = x1 )]. Z własności identyczności dostajemy: 5. (x = x1 )∧[(x = x1 ∧y = y1 )∨(x = y1 ∧y = x1 )] ⇒ [(x = x1 )∧(y = y1 )]. Z 4 i 5 dostajemy: 6. ({x} = {x1 }) ∧ ({x, y} = {x1 , y1 }) ⇒ [(x = x1 ) ∧ (y = y1 )]. Z definicji równości zbiorów: 7. [({x} = {x1 , y1 }) ∧ ({x, y} = {x1 })] ⇔ (x = x1 = y1 ) ∧ (x = y = x1 ). Z własności identyczności: 8. (x = x1 = y1 ) ∧ (x = y = x1 ) ⇒ (x = x1 ) ∧ (y = y1 ). Z 7 i 8 mamy: 9. [({x} = {x1 , y1 }) ∧ ({x, y} = {x1 })] ⇒ (x = x1 ) ∧ (y = y1 ). Z 1, 6 i 9 dostajemy: 10. {{x}, {x, y}} = {{x1 }, {x1 , y1 }} ⇒ (x = x1 ) ∧ (y = y1 ). Z definicji równości zbiorów: 11. (x = x1 ) ∧ (y = y1 ) ⇒ {{x}, {x, y}} = {{x1 }, {x1 , y1 }}. Z 10 i 11 dostajemy: 12. {{x}, {x, y}} = {{x1 }, {x1 , y1 }} ⇔ (x = x1 ) ∧ (y = y1 ). Definicja 4.1 (pary uporządkowanej). (x, y) = {{x}, {x, y}}. (x, y) to para uporządkowana, której poprzednikiem jest x a której następnikiem jest y. Pary uporządkowane są równe wtedy i tylko wtedy, gdy równe są ich poprzedniki i równe są ich następniki.
4.1. ILOCZYN KARTEZJAŃSKI ZBIORÓW
193
Niech (x1 , x2 , . . . , xn1 , xn ) znaczy tyle, co ((x1 , x2 , . . . , xn−1 ), xn ). Definicja 4.2 (krotki (n-tki) uporządkowanej). N -tka uporządkowana (krotka) przedmiotów x1 , x2 , . . . , xn−1 , xn , (n ≥ 2) to: (x1 , x2 , . . . , xn−1 , xn ). x1 , x2 , . . . , xn−1 , xn . to współrzędne n-tki (x1 , x2 , . . . , xn−1 , xn ). Iloczynem kartezjańskim, inaczej produktem kartezjańskim zbiorów X i Y jest zbiór X×Y wszystkich i tylko par uporządkowanych (x, y) takich, że x ∈ X i y ∈ Y , czyli X×Y = {(x, y) : x ∈ X ∧ y ∈ Y }. Dla dowolnych zbiorów X i Y istnieje zbiór wszystkich par uporządkowanych, dających się utworzyć z elementów zbioru X jako poprzedników i elementów zbioru Y jako następników tych par: {(x, y) : x ∈ X ∧ y ∈ Y }. Zbiór ten jest jednoznacznie określony. Iloczynem kartezjańskim, inaczej produktem kartezjańskim zbiorów: X 1 , X2 , . . . , X n jest zbiór: X1 ×X2 × · · · ×Xn wszystkich i tylko n-tek uporządkowanych: (x1 , x2 , . . . , xn ) takich, że xi ∈ Xi , czyli Definicja 4.3 (iloczynu kartezjańskiego, ×). X1 ×X2 × · ×Xi × · ×Xn = {(x1 , x2 , . . . , xi . . . , xn ) : xi ∈ Xi , i ≤ n}. Dla dowolnych zbiorów X1 , X2 , . . . , Xn istnieje zbiór wszystkich i tylko n-tek uporządkowanych, dających się utworzyć z elementów zbiorów X1 , X2 , . . . , Xn , takich, że i-tym członem n-tki jest element zbioru Xi , i ≤ n. Zbiór ten jest też jednoznacznie określony. W matematyce, iloczyny kartezjańskie pełnią doniosłą rolę. Jest to jedno z podstawowych działań na zbiorach. Zbiór punktów płaszczyzny (zbiór liczb zespolonych) jest produktem kartezjańskim zbioru R liczb rzeczywistych przez siebie: R×R. Elementy zbioru X1 × X2 × · · · × Xn nazywamy punktami, zbiory X1 , X2 , . . . Xn osiami współrzędnych. W wypadku punktu (x, y), x to odcięta a y to rzędna. W wypadku, gdy Xi = R, 1 ≤ i ≤ n, to dla n = 1 mamy punkty na prostej, dla n = 2 — na płaszczyźnie, a w wypadku gdy n = 3, mamy do czynienia z punktami w przestrzeni 3-wymiarowej. Ogólnie możemy mówić o punktach w przestrzeni n-wymiarowej.
194
ROZDZIAŁ 4. RELACJE I FUNKCJE
Niektóre własności iloczynu kartezjańskiego są analogiczne do własności iloczynu arytmetycznego. Zachodzą np. prawa rozdzielności. Dla dowolnych zbiorów X1 , X2 , Y : T 85. (X1 ∪ X2 ) × Y = X1 × Y ∪ X2 × Y T 86. Y × (X1 ∪ X2 ) = Y × X1 ∪ Y × X2 T 87. (X1 \ X2 ) × Y = X1 × Y \ X2 × Y T 88. Y × (X1 \ X2 ) = Y × X1 \ Y × X2 . Spełnione są też prawa rozdzielności iloczynu kartezjańskiego względem przecięcia teoriomnogościowego. Dla dowolnych zbiorów X1 , X2 , Y : T 89. (X1 ∩ X2 ) × Y = (X1 × Y ) ∩ (X2 × Y ) T 90. Y × (X1 ∩ X2 ) = (Y × X1 ) ∩ (Y × X2 ). Iloczyn kartezjański jest operacją monotoniczną względem stosunku zawierania. Dla dowolnych zbiorów X1 , X2 , Y , jeśli Y 6= ∅, to: T 91. (X1 ⊆ X2 ) ⇔ (X1 × Y ⊆ X2 × Y ) ⇔ (Y × X1 ⊆ Y × X2 ). Iloczyn kartezjański nie jest przemienny. Przykład 4.1. A × B = B × A ⇔ A = B ∨ A = ∅ ∨ B = ∅. Udowodnimy tylko: A × B = B × A ⇒ A = B ∨ A = ∅ ∨ B = ∅. Dowód. Z definicji iloczynu kartezjańskiego mamy: 1. ∀x, y : [(x, y) ∈ A × B ⇔ x ∈ A ∧ y ∈ B], 2. ∀x, y : [(x, y) ∈ B × A ⇔ x ∈ B ∧ y ∈ A]. Z definicji równości zbiorów:
4.1. ILOCZYN KARTEZJAŃSKI ZBIORÓW
195
3. A × B = B × A ⇔ ∀x, y : [(x, y) ∈ A × B ⇔ (x, y) ∈ B × A]. Korzystając z twierdzenia o dedukcji, do założeń możemy dołączyć poprzednik implikacji, której dowodzimy (dowód zakończy się, gdy jako wiersz dowodowy uzyskamy następnik tej implikacji). Zatem jako założenie możemy przyjąć: 4. A × B = B × A. Z 3 i 4 dostajemy: 5. ∀x, y : [(x, y) ∈ A × B ⇔ (x, y) ∈ B × A]. Opuszczając kwantyfikator w 1, a następnie w 2 i 5 mamy: 6. (x, y) ∈ A × B ⇔ x ∈ A ∧ y ∈ B, 7. (x, y) ∈ B × A ⇔ x ∈ B ∧ y ∈ A, 8. (x, y) ∈ A × B ⇔ (x, y) ∈ B × A. Z 6, 7, 8 dostajemy: 9. x ∈ A ∧ y ∈ B ⇔ x ∈ B ∧ y ∈ A. Opuszczając w 9 równoważność mamy: 10. x ∈ A ∧ y ∈ B ⇒ x ∈ B ∧ y ∈ A. A z tego: 11. x ∈ A ∧ y ∈ B ⇒ x ∈ B, 12. x ∈ A ∧ y ∈ B ⇒ y ∈ A. Z 11 mamy, że 13. y ∈ B ⇒ (x ∈ A ⇒ x ∈ B) a z 12, że 14. x ∈ A ⇒ (y ∈ B ⇒ y ∈ A). W 13 podstawiając z w miejsce x dostajemy 15. y ∈ B ⇒ (z ∈ A ⇒ z ∈ B). W 14 podstawiając z w miejsce y dostajemy:
196
ROZDZIAŁ 4. RELACJE I FUNKCJE
16. x ∈ A ⇒ (z ∈ B ⇒ z ∈ A). Do 15 i 16 możemy dołączyć mały kwantyfikator. W wyniku dostajemy: 17. ∃y : y ∈ B ⇒ (z ∈ A ⇒ z ∈ B), 18. ∃x : x ∈ A ⇒ (z ∈ B ⇒ z ∈ A). Z 17 i 18 mamy: 19. ∃x : x ∈ A ∧ ∃y : y ∈ B ⇒ (z ∈ A ⇒ z ∈ B) ∧ (z ∈ B ⇒ z ∈ A). Z tego zaś: 20. ∃x : x ∈ A ∧ ∃y : y ∈ B ⇒ (z ∈ A ⇔ z ∈ B). Teraz do 20 dołączamy duży kwantyfikator i mamy: 21. ∃x : x ∈ A ∧ ∃y : y ∈ B ⇒ ∀z : (z ∈ A ⇔ z ∈ B). Ponieważ: 22. ¬ A = ∅ ⇔ ∃x : x ∈ A, 23. ¬ B = ∅ ⇔ ∃y : y ∈ A, a 24. A = B ⇔ ∀z : (z ∈ A ⇔ z ∈ B), więc: 25. ¬ A = ∅ ∧ ¬ B = ∅ ⇒ A = B. 25 jest równoważne: 26. A = B ∨ A = ∅ ∨ B = ∅.
4.2 4.2.1
Relacje Pojęcie relacji
Słów „stosunek” i „zależność”, „związek” i „relacja” używamy w podobnym znaczeniu. Mówimy np. o stosunku większości między liczbami, o zależności między objętością a ciśnieniem, o związku pracy z płacą. Tu pozycja terminu „relacja” będzie formalnie wyróżniona — definicje i twierdzenia będą mówić o relacji.
4.2. RELACJE
197
Definicja 4.4 (relacji dwuczłonowej). Relacją dwuczłonową w iloczynie X×Y , gdzie X i Y są zbiorami, jest każdy podzbiór zbioru X×Y . W wypadku, gdy relacja jest podzbiorem X×X, czyli gdy jest podzbiorem X będziemy mówili, że jest to relacja binarna w zbiorze X. Niech R będzie relacją dwuczłonową. Zamiast (x, y) ∈ R będziemy pisać xRy a czytać: x jest w relacji R z y. 2
Przykład 4.2. Niech N będzie zbiorem liczb naturalnych. Podzbiór W (⊆ N × N) jest relacją niewiększości w zbiorze liczb naturalnych wtedy i tylko wtedy, gdy: (n, m) ∈ W ⇔ (n ≤ m). Jest to relacja w zbiorze N.
°
Przykład 4.3. Niech X będzie przestrzenią. Zbiór In (⊆ X × X) taki, że dla dowolnych A, B(⊆ X): (A, B) ∈ In ⇔ A ⊆ B jest relacją inkluzji. Jest to relacja w zbiorze X.
°
Definicja 4.5 (relacji n-członowej). Relacją n-członową w iloczynie: X1 ×X2 × · · · ×Xn , gdzie Xi są zbiorami, i ≤ n, jest każdy podzbiór zbioru X1 ×X2 × · · · ×Xn . Napis: R ⊆ X1 ×X2 × · · · ×Xn to sygnatura relacji 1 . „R” to nazwa relacji, a X1 ×X2 × · · · ×Xn to typ relacji. Zbiór wszystkich i tylko i-tych członów n-członowej relacji R to i-ta dziedzina relacji R, czyli Definicja 4.6 (i-tej dziedziny relacji, Di (R)). Di (R) = {xi : (x1 , x2 , . . . , xi , . . . , xn ) ∈ R}. 1
Wcześniej termin „sygnatura” użyty był w innym znaczeniu. Mówiliśmy o sygnaturze języka.
198
ROZDZIAŁ 4. RELACJE I FUNKCJE
W wypadku relacji dwuczłonowej o 1-szej dziedzinie mówimy, że jest to dziedzina lub lewa dziedzina. Jest to zbiór D(R) poprzedników par uporządkowanych (x, y) należących do relacji R, czyli Definicja 4.7 (lewej dziedziny relacji, D(R)). D(R) = {x : (x, y) ∈ R}. W wypadku relacji dwuczłonowej o 2-giej dziedzinie mówimy, że jest to przeciwdziedzina lub prawa dziedzina. Jest to zbiór D∗ (R) następników par uporządkowanych (x, y) należących do relacji R, czyli Definicja 4.8 (prawej dziedziny relacji, D∗ (R)). D∗ (R) = {y : (x, y) ∈ R}. Polem relacji R, C(R), jest teoriomnogościowa suma wszystkich dziedzin relacji R, czyli zbiór: Definicja 4.9 (pola relacji, C(R)). C(R) = D1 (R) ∪ D2 (R) ∪ · · · ∪ Dn (R), gdzie n to liczba członów relacji R. Przykład 4.4. Niech l będzie prostą. M (⊆ l × l × l) jest relacją leżenia między wtedy i tylko wtedy, gdy dla dowolnych punktów A, B, C(∈ l): (A, B, C) ∈ M ⇔ A/B/C, czyli punkt B leży między punktami A i C. Relacja leżenia między jest relacją trójczłonową. Jest to relacja w zbiorze l. Zbiór ten jest jej pierwszą, drugą i trzecią dziedziną oraz polem. ° Przykład 4.5. Niech P (⊆ R×R×R×R) będzie relacją taką, że dla dowolnych x, y, z, t (∈ R): z x (x, y, z, t) ∈ P ⇔ = . y t Relacja P jest relacją czteroczłonową. Jej pierwszą i trzecią dziedziną jest zbiór R, a drugą i czwartą — R \ {0}. °
4.2. RELACJE
199
W opisie relacji nie należy pomijać wskazania iloczynu kartezjańskiego, którego jest ona podzbiorem. Na mocy zasady ekstensjonalności relacje, które nie różnią się swoimi elementami uznajemy za równe. W wypadku dziedziny poza matematycznej oznacza to, że np. związek małżeński, bez względu jak byśmy go określili, utożsamiamy ze zbiorem takich par ludzi, że poprzednik pary jest małżonkiem następnika tej pary. W dziedzinie matematycznej np. podzielność utożsamiamy ze zbiorem takich par liczb naturalnych, że następnik pary jest podzielny przez poprzednik pary: (2, 4), (3, 6), (4, 16), . . . . Podzielność jest relacją w zbiorze liczb naturalnych, czyli jest podzbiorem zbioru N×N. Bycie elementem zbioru, ∈, jest relacją. Jest to zbiór: {(x, A) : x ∈ A ∧ A ⊆ X}. Inaczej mówiąc, para (x, A) jest elementem tej relacji wtedy i tylko wtedy, gdy x ∈ A. Relacją jest też inkluzja, ⊆. Jest to zbiór: {(A, B) : A ⊆ B ∧ A ⊆ X ∧ B ⊆ X}. Inaczej mówiąc, para (A, B) jest elementem tej relacji wtedy i tylko wtedy, gdy A ⊆ B. Skończone dwuczłonowe relacje można przedstawiać w postaci grafu. Na rysunku podaje się nazwy przedmiotów pozostających w relacji. Fakt zachodzenia relacji między określonymi przedmiotami zaznaczany jest przez połączenie nazw tych przedmiotów strzałkami w taki sposób, że przedmioty x i y pozostają w relacji R wtedy i tylko wtedy, gdy poruszając się od x zgodnie z kierunkiem wskazywanym przez strzałkę dojdziemy do y. Na przykład, relacja {(1, 1), (2, 1), (3, 1), (1, 3), (2, 2), (3, 2), (4, 4)} ma następujący graf:
Relacje binarne można przedstawić też za pomocą tablicy (macierzy). Relacja z powyższego przykładu miałaby następującą tablicę:
200
ROZDZIAŁ 4. RELACJE I FUNKCJE
1 2 3 4
1 + + +
2
3 +
4
+ + +
Najogólniej rzecz biorąc opis skończonej relacji za pomocą tabeli, której wiersze i kolumny przyporządkowane są wzajemnie jednoznacznie elementom dziedziny i przeciwdziedziny tej relacji przeprowadza się w ten sposób, że w wypadku, gdy między xi a xj zachodzi relacja, oznaczeniu podlega pole tabeli wyznaczone przez wiersz xi i kolumnę xj .
4.2.2
Relacje zwrotna i przeciwzwrotna
Dwuczłonowa relacja R w zbiorze X[= C(R)] jest zwrotna, REF, wtedy i tylko wtedy, gdy każdy element zbioru X jest w tej relacji ze sobą, czyli Definicja 4.10 (relacji zwrotnej, REF). REF.
∀x ∈ X : (xRx).
Fakt, że R jest zwrotna zapisujemy: R ∈ REF. Dla każdego zbioru X istnieje i jest dokładnie jedna relacja: ∆X = {(x, x) : x ∈ X}, czyli (x, y) ∈ ∆X ⇔ x ∈ X ∧ y ∈ X}. ∆X to przekątna w zbiorze X × X. Można zauważyć, że relacja R jest zwrotna w X[= C(R)] wtedy i tylko wtedy, gdy ∆X ⊆ R.
4.2. RELACJE
201
W wypadku relacji zwrotnej każdy element x(∈ X) jest połączony ze sobą strzałką:
W tabelce relacji zwrotnej oznakowane są wszystkie miejsca na przekątnej. Na przykład, będzie to następująca tabelka:
1 2 3 4
1 + + +
2 + +
3 +
4
+ +
Dwuczłonowa relacja R w zbiorze X[= C(R)] jest przeciwzwrotna, IRREF, wtedy i tylko wtedy, gdy: Definicja 4.11 (relacji przeciwzwrotnej, IRREF). IRREF.
∀x ∈ X : ¬ (xRx).
To, że R jest przeciwzwrotna zapisujemy: R ∈ IRREF. Na grafie relacji przeciwzwrotnej żadna strzałka nie będzie łączyła jakiegoś elementu z nim samym. W wypadku relacji przeciwzwrotnej w tabelce żadne miejsce na przekątnej nie będzie zaznaczone. Na przykład, będzie to następująca tabelka:
1 2 3 4
1
2
+ +
+
3 +
4
202
ROZDZIAŁ 4. RELACJE I FUNKCJE
Zauważmy, że R ∈ REF ⇒ ¬ R ∈ IRREF, lub, co jest równoważne: R ∈ IRREF ⇒ ¬ R ∈ REF. Relacje mogą być zwrotne, przeciwzwrotne lub ani zwrotne i ani przeciwzwrotne. Przykład 4.6. Relacja ≤ w zbiorze liczb rzeczywistych R jest zwrotna: ∀x ∈ R : (x ≤ x).
°
Przykład 4.7. Relacja < w zbiorze liczb rzeczywistych R jest przeciwzwrotna: ∀x ∈ R : ¬(x < x).
°
Przykład 4.8. Niech R będzie relacją w zbiorze liczb naturalnych N taką, że xRy wtedy i tylko wtedy, gdy w systemie dziesiętnym nazwa liczby x ma dokładnie dwie takie same cyfry co nazwa liczby y. Relacja R nie jest zwrotna. Nie zawsze zachodzi między liczbą a nią samą — choćby liczby mające trzy lub więcej cyfr mają więcej cyfr wspólnych. Nie jest też przeciwzwrotna — w wypadku liczb dwucyfrowych zachodzi między liczbą a nią samą. °
4.2.3
Relacje symetryczna, przeciwsymetryczna i antysymetryczna
Dwuczłonowa relacja R w zbiorze X[= C(R)] jest symetryczna, SYM, wtedy i tylko wtedy, gdy Definicja 4.12 (relacji symetrycznej, SYM). SYM.
∀x, y ∈ X : (xRy ⇒ yRx).
Fakt, że R jest symetryczna zapisujemy: R ∈ SYM.
4.2. RELACJE
203
W wypadku relacji symetrycznej jeżeli na grafie jest strzałka łącząca x z y, to jest również strzałka łącząca y z x. W tabelce relacji symetrycznej przekątna jest osią symetrii. Jest tak np. w następującej tabelce:
1 2 3 4
1 + + +
2 + + +
3 + +
4
+
Dwuczłonowa relacja R w zbiorze X[= C(R)] jest przeciwsymetryczna, ASYM, wtedy i tylko wtedy, gdy Definicja 4.13 (relacji przeciwsymetrycznej, ASYM). ASYM.
∀x, y ∈ X : (xRy ⇒ ¬ yRx).
Fakt, że R jest przeciwsymetryczna zapisujemy: R ∈ ASYM. Przykładem tabelki relacji przeciwsymetrycznej może być: 1 1 2 3 4
2
3 +
4
+ +
Dwuczłonowa relacja R w zbiorze X[= C(R)] jest antysymetryczna, ANTYSYM, wtedy i tylko wtedy, gdy Definicja 4.14 (relacji antysymetrycznej, ANTYSYM). ANTYSYM.
∀x, y ∈ X : (xRy ∧ yRx ⇒ x = y).
Fakt, że R jest antysymetryczna zapisujemy:
204
ROZDZIAŁ 4. RELACJE I FUNKCJE R ∈ ANTYSYM. Przykładem tabelki relacji antysymetrycznej może być:
1 2 3 4
1 + +
2
3 +
4
+ +
Zauważmy, że jeżeli R 6= ∅, to 1. R ∈ SYM ⇒ ¬ R ∈ ASYM, lub równoważnie 2. R ∈ ASYM ⇒ ¬ R ∈ SYM, inaczej mówiąc: 3. SYM ∩ ASYM = ∅. 4. R ∈ ASYM ⇒ R ∈ ANTYSYM2 lub równoważnie: 5. ASYM ∩ ANTYSYM = ASYM. Zbiór relacji symetrycznych i antysymetrycznych zarazem jest niepusty: SY M ∩ AN T Y SY M 6= ∅. Do zbioru tego należy np. relacja identyczności Id: 6. Id ∈ SY M ∩ AN T Y SY M. Są relacje antysymetryczne, które nie są przeciwsymetryczne, jak np. relacja niewiększości w zbiorze liczb rzeczywistych ≤. Relacje mogą być symetryczne, przeciwsymteryczne, antysymetryczne i mogą nie być ani symetryczne, ani przeciwsymetryczne, ani antysymetryczne. 2
W wypadku relacji przeciwsymetrycznych warunek xRy ∧ yRx nie jest spełniony dla żadnego x i y, zatem prawdą jest, że dla każdego x i y zachodzi xRy ∧ yRx ⇒ x = y.
4.2. RELACJE
205
Przykład 4.9. Niech R będzie relacją w zbiorze liczb naturalnych taką, że xRy wtedy i tylko wtedy, gdy istnieje różna od 1 liczba naturalna będąca podzielnikiem liczby x i liczby y. Relacja R jest symetryczna. Relacja ta nie jest przeciwsymetryczna i nie jest antysymetryczna.
°
Przykład 4.10. Relacja < w zbiorze liczb naturalnych jest przeciwsymetryczna: ∀x, y : (x < y ⇒ ¬ y < x). Relacja ta nie jest symetryczna i nie jest antysymetryczna.
°
Przykład 4.11. Relacja ≤ w zbiorze liczb naturalnych nie jest ani symetryczna, ani nie jest przeciwsymetryczna. Nie jest symetryczna, bo gdy x 6= y i x ≤ y, to nieprawda, że y ≤ x. Nie jest też przeciwsymetryczna, bo xRx i ¬ x ≤ x. Relacja ta jest antysymetryczna. ° Przykład 4.12. Niech R będzie relacją w zbiorze liczb naturalnych taką, że nRm wtedy i tylko wtedy, gdy w zapisie dziesiętnym w n występuje cyfra „1” a w m cyfra „2”. Relacja ta nie jest symetryczna, np. 31R23 i nieprawda, że 23R31. R nie jest też przeciwsymetryczna i nie jest antysymetryczna: 21R12 i 12R21, a nieprawda, że 21 = 12. °
4.2.4
Relacja przechodnia
Dwuczłonowa relacja R w zbiorze X[= C(R)] jest przechodnia (TRANS) wtedy i tylko wtedy, gdy Definicja 4.15 (relacji przechodniej, TRANS). TRANS.
∀x, y, z ∈ X : (xRy ∧ yRz ⇒ xRz).
Fakt, że relacja R jest przechodnia zapisujemy: R ∈ TRANS. Przykładem tabelki relacji przechodniej może być:
206
ROZDZIAŁ 4. RELACJE I FUNKCJE
1 2 3 4
1 + + +
2 + + +
3 + + +
4
+
Przykład 4.13. Relacja inkluzji ⊆ jest przechodnia.
°
Zauważmy, że jeśli R jest przeciwzwrotna i przechodnia, to jest przeciwsymetryczna, czyli Twierdzenie 4.2. IRREF ∩ TRANS ⊆ ASYM. Dowód. Dowodzimy niewprost. Niech R będzie relacją przeciwzwrotną, przechodnią i niech nie będzie asymetryczna, czyli 1. ¬ xRx, 2. xRy ∧ yRz ⇒ xRz, 3. ¬ ∀x, y : (xRy ⇒ ¬ yRx). Z 3 na podstawie praw De Morgana mamy: 4. ∃x, y : (xRy ∧ yRx). Z tego dla pewnych a i b: 5. aRb ∧ bRa. Z 2 dostajemy: 6. aRb ∧ bRa ⇒ aRa Z 5 i 6 mamy: 7. aRa. Na podstawie 1 zaś: 8. ¬ aRa, co kończy dowód, ponieważ 7 i 8 są sprzeczne.
4.2. RELACJE
4.2.5
207
Relacja równoważności
Trudno przecenić znaczenie relacji równoważności w matematyce i nie tylko w matematyce. Na jej olbrzymią rolę w różnych dziedzinach matematycznych pierwszy zwrócił uwagę Frege. Relacja równoważności daje podstawę do tworzenia pojęć abstrakcyjnych3 . Relacja dwuczłonowa R jest relacją równoważności, EQ, w zbiorze X[= C(R)] wtedy i tylko wtedy, gdy jest to relacja taka, że: 1. ∀x ∈ X : (xRx) zwrotna, 2. ∀x, y ∈ X : [xRy ⇒ yRx] symetryczna, 3. ∀x, y, z ∈ X : [(xRy ∧ yRz) ⇒ xRz] przechodnia; czyli Definicja 4.16 (relacji równoważności, EQ). EQ.
EQ = REF ∩ SYM ∩ TRANS.
Fakt, że przedmioty x i y pozostają w relacji równoważności będziemy zapisywali: x≈y. Inaczej mówiąc, symbolu „≈” używać będziemy na oznaczenie jakiejkolwiek relacji równoważności. Zauważmy, że Id jest relacją równoważności. Id ∈ REF ∩ SYM ∩ TRANS, czyli Id ∈ EQ. Równość jest najmniejszą relacją równoważności, czyli jeżeli R ∈ EQ, to Id ⊆ R. Zauważmy, że Id = {(x, x) : x ∈ X}. Zatem Id jest najmniejszą relacją zwrotną. Ponieważ Id jest relacją równoważności, więc jest również najmniejszą taką relacją. Nie każda relacja równoważności jest relacją identyczności. Przykład 4.14. Relacją równoważności jest relacja w zbiorze liczb naturalnych taka, że liczby x i y pozostają w tej relacji wtedy i tylko wtedy, kiedy różnica x − y jest liczbą całkowitą. ° Przykład 4.15. Relacja równoległości prostych na płaszczyźnie euklidesowej jest relacją równoważności. ° 3
Terminu „równoważność” użyliśmy już zajmując się logiką zdań. Teraz występuje on w znaczeniu różnym od poprzedniego. Nie są to jednak wszystkie znaczenia tego słowa, w jakich występuje ono w tekstach logicznych i matematycznych.
208
ROZDZIAŁ 4. RELACJE I FUNKCJE
Niech ≈ będzie relacją równoważności w zbiorze X. Zbiór kxk≈ , którego wszystkimi i tylko elementami są te przedmioty ze zbioru X, które są w relacji ≈ z x to klasa równoważności (abstrakcji, ekwiwalencji) relacji ≈ wyznaczona przez x lub o reprezentancie x; czyli Definicja 4.17 (klasy abstrakcji, kxk≈ ). kxk≈ = {y ∈ X : x≈y}. Przestrzeń ilorazowa X/ ≈ to zbiór wszystkich i tylko klas abstrakcji relacji równoważności ≈, czyli Definicja 4.18 (przestrzeni ilorazowej, X/≈). X/≈ = {kxk≈ : x ∈ X}. Definicja 4.19 (zbioru reprezentantów równoważności). Zbiór reprezentantów relacji równoważności ≈ o polu C to każdy podzbiór C, który ma dokładnie jeden element wspólny z każdą klasą abstrakcji tej relacji równoważności. Istnienie zbioru reprezentantów wynika z aksjomatu wyboru. W wielu wypadkach bez odwołania się do niego nie umiemy tego dowieść. Przykład 4.16. Klasą abstrakcji relacji równoległości w zbiorze wszystkich prostych na płaszczyźnie euklidesowej wyznaczoną przez pewną prostą jest zbiór wszystkich i tylko prostych do niej równoległych. Fakt ten daje podstawę do utworzenia pojęcia równoległości. ° Przykład 4.17. Relacja posiadania tylu samo cyfr w nazwie w systemie dziesiętnym jest relacją równoważności w zbiorze liczb naturalnych. Klasą abstrakcji tej relacji wyznaczoną przez daną liczbę naturalną jest zbiór wszystkich i tylko tych liczb, których nazwy w systemie dziesiętnym mają tyle samo cyfr. Dzięki temu mamy pojęcie liczby n-cyfrowej. Np. klasą abstrakcji wyznaczoną przez liczbę 11 jest zbiór {10, 11, 12, . . . , 99}. Jest to klasa liczb dwucyfrowych. ° Można zauważyć, że Twierdzenie 4.3. Niech ≈ będzie relacją równoważności w niepustym zbiorze X. Klasa kxk≈ jest niepusta, czyli ∀x : ∃y : (y ∈ kxk≈ ).
4.2. RELACJE
209
Dowód. Z definicji kxk≈ : 1. y ∈ kxk≈ ⇔ x≈y. Z tego mamy: 2. x ∈ kxk≈ ⇔ x ≈ x. Z 2 dostajemy: 3. x ≈ x ⇒ x ∈ kxk≈ . Dołączając duży kwantyfikator mamy: 4. ∀x : [x ≈ x ⇒ x ∈ kxk≈ ]. Z tego dostajemy: 5. [∀x : (x ≈ x)] ⇒ [∀x : (x ∈ kxk≈ )]. Z założenia relacja ≈ jest zwrotna, czyli 6. ∀x : (x ≈ x) Z 5 i 6 mamy: 7. ∀x : [x ∈ kxk≈ ]. Z tego dostajemy: 8. ∃x : [x ∈ kxk≈ ]. Twierdzenie 4.4. Dwie klasy abstrakcji relacji równoważności ≈ są bądź równe, bądź rozłączne; czyli ∀x, y : (kxk≈ = kyk≈ ∨ kxk≈ ∩ kyk≈ = ∅). Dowód. Dowód przeprowadzimy metodą niewprost, czyli jako założenie przyjmiemy zaprzeczenie dowodzonej tezy. 1. ¬ ∀x, y : (kxk≈ = kyk≈ ∨ kxk≈ ∩ kyk≈ = ∅). Na podstawie prawa De Morgana mamy: 2. ∃x, y : ¬(kxk≈ = kyk≈ ∨ kxk≈ ∩ kyk≈ = ∅). Wykorzystując prawo De Morgana o zaprzeczaniu alternatywy dostajemy:
210
ROZDZIAŁ 4. RELACJE I FUNKCJE
3. ∃x, y : (¬ kxk≈ = kyk≈ ∧ ¬ kxk≈ ∩ kyk≈ = ∅). Opuszczając dwukrotnie mały kwantyfikator mamy: 4. ¬ kak≈ = kbk≈ ∧ ¬ kak≈ ∩ kbk≈ = ∅. Opuszczając koniunkcję dostajemy: 5. ¬ kak≈ = kbk≈ , oraz 6. ¬ kak≈ ∩ kbk≈ = ∅. Z definicji równości zbiorów: 7. (¬ kak≈ = kbk≈ ) ⇔ ∃x : [(x ∈ kak≈ ∧ ¬ x ∈ kbk≈ ) ∨ (¬ x ∈ kak≈ ∧ x ∈ kbk≈ )]. Z 5 i 7 mamy: 8. ∃x : [(x ∈ kak≈ ∧ ¬ x ∈ kbk≈ ) ∨ (¬ x ∈ kak≈ ∧ x ∈ kbk≈ )]. Opuszczając mały kwantyfikator stwierdzamy, że dla pewnego c: 9. (c ∈ kak≈ ∧ ¬ c ∈ kbk≈ ) ∨ (¬ c ∈ kak≈ ∧ c ∈ kbk≈ ). Z definicji zbioru pustego: 10. (¬ kak≈ ∩ kbk≈ = ∅) ⇔ ∃x : (x ∈ kak≈ ∧ x ∈ kbk≈ ). Z 10 i 6 mamy: 11. ∃x : (x ∈ kak≈ ∧ x ∈ kbk≈ ). Opuszczając w 11 mały kwantyfikator otrzymujemy: 12. d ∈ kak≈ ∧ d ∈ kbk≈ . Opuszczając w 12 koniunkcję mamy: 13. d ∈ kak≈ , oraz 14. d ∈ kbk≈ . Na podstawie definicji klas równoważności z 13 oraz 14 dostajemy, odpowiednio:
4.2. RELACJE 15. d ≈ a, oraz 16. d ≈ b. Z symetryczności relacji ≈ i 15 mamy: 17. a ≈ d. Z przechodniości relacji ≈ oraz 16 i 17: 18. a ≈ b. Z przechodniości ≈: 19. c ≈ a ∧ a ≈ b ⇒ c ≈ b. Tautologią jest: 20. a ≈ b ⇒ [(c ≈ a ∧ a ≈ b ⇒ c ≈ b) ⇒ ¬ (c ≈ a ∧ ¬ c ≈ b)]. Z 18, 19 i 20 mamy: 21. ¬ (c ≈ a ∧ ¬ c ≈ b). Z symetryczności ≈: 22. a ≈ b ⇒ b ≈ a. Z 18 i 22 23. b ≈ a Z przechodniości ≈: 24. c ≈ b ∧ b ≈ a ⇒ c ≈ a. Tautologią jest: 25. b ≈ a ⇒ [(c ≈ b ∧ b ≈ a ⇒ c ≈ a) ⇒ ¬ (¬ c ≈ a ∧ c ≈ b)]. Z 23, 24 i 25 mamy: 26. ¬ (¬ c ≈ a ∧ c ≈ b). Z 21 i 26 przez dołączanie koniunkcji: 27. ¬ (c ≈ a ∧ ¬ c ≈ b) ∧ ¬ (¬ c ≈ a ∧ c ≈ b). Z 27 na podstawie praw De Morgana:
211
212
ROZDZIAŁ 4. RELACJE I FUNKCJE
28. ¬ [(c ≈ a ∧ ¬ c ≈ b) ∨ (¬ c ≈ a ∧ c ≈ b)]. Z 9, korzystając z definicji klas równoważności mamy: 29. (c ≈ a ∧ ¬ c ≈ b) ∨ (¬ c ≈ a ∧ c ≈ b). Wiersze 28 i 29 są sprzeczne. Za pomocą relacji równoważności definiuje się pojęcia. Są to pojęcia abstrakcyjne. Takim pojęciem jest pojęcie liczby. Na drodze abstrakcji tworzone są też pojęcia w dziedzinach pozamatematycznych. Barwa to klasa abstrakcji relacji równobarwności, np. czerwień to klasa równobarwności wyznaczona przez przedmiot czerwony. Chwila to klasa zdarzeń równoczesnych. Twierdzenie 4.5. Niech ≈ będzie relacją równoważności w zbiorze X. Każdy element X należy do jakiejś klasy abstrakcji relacji ≈, czyli ∀x ∈ X : ∃y ∈ X : (x ∈ kyk≈ ). Dowód. Pokażemy, że każdy element zbioru X należy do klasy wyznaczonej przez ten element. Tym samym pokażemy, że dla każdego elementu zbioru X istnieje klasa abstrakcji, do której ten element należy. Z definicji klasy abstrakcji relacji ≈ 1. ∀x, y : (y ≈ x ⇔ y ∈ kxk). Z tego: 2. ∀x : (x ≈ x ⇔ x ∈ kxk). Z tego: 3. ∀x : (x ≈ x) ⇒ ∀x : (x ∈ kxk). Relacja ≈ jest zwrotna więc z założenia: 4. ∀x : (x ≈ x). Z 3 i 4 mamy: 5. ∀x : (x ∈ kxk). Podziałem logicznym zbioru X (zbiór dzielony) jest klasa zbiorów P taka, że każdy element P (człon podziału) jest niepusty (warunek niepustości ), elementy te są parami rozłączne (warunek rozłączności ) oraz każdy element zbioru X jest elementem przynajmniej jednego elementu P (warunek zupełności ); czyli
4.2. RELACJE
213
Definicja 4.20 (podziału logicznego). Podział logiczny zbioru X to klasa zbiorów P taka, że spełnione są łącznie następujące warunki: 1. 2. 3.
A ∈ P ⇒ A 6= ∅, niepustość A, B ∈ P ⇒ [(A = B) ∨ (A ∩ B = ∅)], rozłączność ∀x ∈ X : ∃A ∈ P : (x ∈ A). zupełność
Twierdzenie 4.6 (zasada abstrakcji). Zbiór klas abstrakcji relacji równoważności w zbiorze X jest podziałem logicznym zbioru X. Twierdzenie to jest bezpośrednią konsekwencją powyższych twierdzeń i definicji podziału logicznego. Przyporządkowanie każdemu elementowi zbioru klasy abstrakcji wyznaczonej przez ten element to przekształcenie kanoniczne. Z punktu widzenia teorii obiekty równoważne na gruncie tej teorii nie są w niej odróżnialne. Można więc zastąpić je klasami obiektów równoważnych. Przy przejściu od elementów zbioru do klas abstrakcji relacja równoważności zostaje zamieniona na relację równości. Ten sposób postępowania jest metodą stosowaną w matematyce szczególnie wtedy, gdy wprowadza się nowe obiekty matematyczne. Jest to metoda identyfikacji elementów równoważnych. Podamy przykłady takiego postępowania. Przykład 4.18. Niech R będzie relacją w zbiorze par liczb naturalnych, czyli R ⊆ [(N × N) × (N × N)] taką, że (m1 , n1 )R(m2 , n2 ) ⇔ [(m1 + n2 ) = (m2 + n1 )]. R jest relacją równoważności. R jest zwrotna. Prawem arytmetyki liczb naturalnych jest 1. (m1 + n1 ) = (m1 + n1 ). Zgodnie z definicją relacji R mamy więc: 2. (m1 , n1 )R(m1 , n1 ), co dowodzi zwrotności. R jest symetryczna.
214
ROZDZIAŁ 4. RELACJE I FUNKCJE Niech:
1. (m1 , n1 )R(m2 , n2 ). Z tego mamy, że 2. (m1 + n2 ) = (m2 + n1 ). Ponieważ = jest symetryczna, czyli zachodzi: 3. (m1 + n2 ) = (m2 + n1 ) ⇒ (m2 + n1 ) = (m1 + n2 ), więc mamy: 4. (m2 + n1 ) = (m1 + n2 ). To zaś oznacza, że zachodzi: 5. (m2 , n2 )R(m1 , n1 ). R jest przechodnia. Niech 1. (m1 , n1 )R(m2 , n2 ) i 2. (m2 , n2 )R(m3 , n3 ). Mamy zatem, że 3. (m1 + n2 ) = (m2 + n1 ) oraz 4. (m2 + n3 ) = (m3 + n2 ). Z własności sumowania mamy, że 5. [(m1 +n2 ) = (m2 +n1 )∧(m2 +n3 ) = (m3 +n2 )] ⇒ (m1 +n3 ) = (m3 +n1 ). Otrzymujemy więc: 6. (m1 + n3 ) = (m3 + n1 ), czyli
4.2. RELACJE
215
7. (m1 , n1 )R(m3 , n3 ), co dowodzi przechodniości R. Opisana relacja dzieli zbiór par liczb naturalnych na klasy abstrakcji. Te klasy abstrakcji nazywa się liczbami całkowitymi. Inaczej mówiąc, liczba całkowita to klasa abstrakcji powyżej opisanej relacji równoważności w zbiorze par liczb naturalnych. Elementami k(1, 1)k, klasy abstrakcji wyznaczonej przez parę (1, 1), są wszystkie pary (n, m) takie, że n = m, czyli (m, n) ∈ k(1, 1)k ⇔ m = n. Ta klasa abstrakcji wyznacza liczbę całkowitą 0. Klasy k(m, n)k takie, że m > n i m = n + k, k = 1, 2, . . . wyznaczają liczby całkowite dodatnie, odpowiednio, 1, 2, . . .. Gdy m < n i n = m + k, k = 1, 2, . . ., to klasy te wyznaczają liczby ujemne, odpowiednio: −1, −2, . . .. W zbiorze liczb całkowitych, czyli w zbiorze klas abstrakcji relacji R [⊆ ((N × N) × (N × N))] definiuje się różne działania. Dodawanie (+) definiuje się następująco: k(m1 , n1 )k + k(m2 , n2 )k = k(m1 + m2 , n1 + n2 )k. Zauważmy, że gdyby znak „+” po obu stronach równości (=) był użyty w tym samym znaczeniu, to mielibyśmy do czynienia z błędnym kołem bezpośrednim w definiowaniu. Tak nie jest. Znaczenie „+” użytego po lewej stronie równości różni się od znaczenia tego znaku użytego po stronie prawej. Po lewej stronie jest to znak definiowanej operacji dodawania liczb całkowitych. Po prawej stronie równości jest to znak dodawania liczb naturalnych, tak jak ta operacja określona jest w aksjomatyce Peano. Fakt użycia tego samego symbolu w różnych znaczeniach nie przeszkadza w rozumieniu definicji dlatego, że kontekst jego użycia jednoznacznie wskazuje znaczenie. Podobna uwaga odnosi się do definicji mnożenia. Mnożenie liczb całkowitych definiowane jest przez następującą równość: k(m1 , n1 )k·k(m2 , n2 )k = k(m1 ·m2 + n1 ·n2 , m1 ·n2 + n1 ·m2 )k. Dla wykazania poprawności definicji liter funkcyjnych „+” oraz „·” jako symboli, odpowiednio, dodawania i mnożenia liczb całkowitych, trzeba dowieść, że wynik operacji nie zależy od wyboru reprezentantów klas abstrakcji:
216
ROZDZIAŁ 4. RELACJE I FUNKCJE
bez względu na wybór reprezentantów każdy wynik wykonania operacji będzie reprezentantem tej samej klasy abstrakcji. Fakt ten pokażemy tylko dla „·”. Niech (m1 , n1 ) i (m01 , n01 ) będą reprezentantami tej samej klasy i niech (m2 , n2 ) i (m02 , n02 ) będą reprezentantami tej samej klasy. Musimy pokazać, że (m1 ·m2 +n1 ·n2 , m1 ·n2 +m2 ·n1 ) i (m01 ·m02 +n01 ·n02 , m01 ·n02 +m02 ·n01 ) reprezentują tę samą klasę. Na podstawie założenia, zgodnie z definicją mamy, że m1 + n01 = m01 + n1 , i m2 + n02 = m02 + n2 . Z tego otrzymujemy, odpowiednio: m1 − n1 = m01 − n01 , m2 − n2 = m02 − n02 . Mnożąc stronami powyższe dwie równości dostajemy: m1 · m2 − m1 · n2 − m2 · n1 + n1 · n2 = m01 · m02 − m01 · n02 − m02 · n01 + n01 · n02 . Po przekształceniu otrzymujemy: m1 · m2 + m01 · n02 + m02 · n01 + n1 · n2 = m01 · m02 + m1 · n2 + m2 · n1 + n01 · n02 . A to zgodnie z definicją znaczy, że (m1 ·m2 +n1 ·n2 , m1 ·n2 +m2 ·n1 ) i (m01 ·m02 + n01 ·n02 , m01 ·n02 + m02 ·n01 ) reprezentują tę samą klasę. Działania + i · w zbiorze liczb całkowitych mają te same własności jak odpowiednie działania w zbiorze liczb naturalnych. ° Przykład 4.19. Tą samą metodą, jaką zdefiniowane zostały liczby całkowite, definiuje się liczby wymierne. Są to również klasy abstrakcji relacji równoważności. Niech Z będzie zbiorem liczb całkowitych, a Z∗ niech będzie zbiorem liczb całkowitych bez 0, czyli Z∗ = Z \ {0}. Niech R będzie podzbiorem iloczynu kartezjańskiego (Z × Z∗ ) × (Z × Z∗ ) takim, że (c1 , d1 )R(c2 , d2 ) ⇔ c1 d2 = c2 d1 . Relacja R, jak wyżej zdefiniowana, jest relacją równoważności. Pokażemy tylko, że jest przechodnia.
4.2. RELACJE
217
R jest przechodnia. Niech 1. (c1 , d1 )R(c2 , d2 ) oraz 2. (c2 , d2 )R(c3 , d3 ). Z tego — odpowiednio — mamy, że 3. c1 d2 = c2 d1 oraz 4. c2 d3 = c3 d2 . Z praw mnożenia liczb całkowitych oraz z 3 i 4 mamy, odpowiednio: 5. c1 d2 d3 = c2 d1 d3 oraz 6. c2 d3 d1 = c3 d2 d1 . Z 5 i 6 otrzymujemy: 7. c1 d2 d3 = c3 d2 d1 . Ponieważ z założenia: 8. d2 6= 0, więc z 7 na podstawie praw mnożenia liczb całkowitych mamy: 9. c1 d3 = c3 d1 . Zgodnie z definicją R mamy zatem: 10. (c1 , d1 )R(c3 , d3 ), czyli R jest przechodnia. Opisana wyżej relacja dzieli zbiór par liczb całkowitych na klasy abstrakcji. Te klasy nazywa się liczbami wymiernymi. Inaczej mówiąc, liczba wymierna to klasa abstrakcji relacji równoważności R w zbiorze Z×Z∗ . Klasy kc1 , d1 k i kc2 , d2 k wyznaczają tę samą klasę abstrakcji wtedy i tylko wtedy, gdy c1 d2 = c2 d1 . Klasę abstrakcji wyznaczoną przez parę (c, d) oznacza się c/d.
218
ROZDZIAŁ 4. RELACJE I FUNKCJE
W zbiorze liczb wymiernych, czyli w zbiorze klas abstrakcji relacji R [⊆ ((Z × Z∗ ) × (Z × Z∗ ))] określa się różne działania. Dodawanie (+) definiuje się następująco: k(c1 , d1 )k + k(c2 , d2 )k = k(c1 d2 + c2 d1 , d1 d2 )k. Mnożenie liczb wymiernych definiowane jest przez następującą równość: k(c1 , d1 )k·k(c2 , d2 )k = k(c1 c2 , d1 d2 )k. Dowodzi się — dowody w istocie nie różnią się od odpowiednich dowodów dla liczb całkowitych — że wyniki dodawania i mnożenia liczb wymiernych nie zależą od wyboru reprezentantów klas abstrakcji: dla reprezentantów tych samych klas abstrakcji wynik jest reprezentantem tej samej klasy. Spełnione są więc warunki poprawności definicji liter funkcyjnych „+” i „·”. Działania te mają takie same własności jak odpowiednie działania w zbiorze liczb naturalnych (i całkowitych). Liczby rzeczywiste, tak jak całkowite i wymierne, też konstruowane są na drodze abstrakcji. °
4.3
Rachunek relacji
Relacje są zbiorami. Można więc wykonywać na nich operacje teoriomnogościowe. Relacje są zbiorami n-tek uporządkowanych. Możliwe jest więc również zdefiniowanie specyficznych operacji uwzględniających ten fakt4 . Relacja pusta w zbiorze X to relacja, która nie zachodzi między żadnymi elementami tego zbioru. Definicja 4.21 (relacji pustej w X). ∀x, y ∈ X : (¬ xRy). R jest pusta w X wtedy i tylko wtedy, gdy R ∩ X × X = ∅. Relacja pełna w zbiorze X to relacja, która zachodzi między wszystkimi elementami tego zbioru. 4
Mówić będziemy o rachunku dla relacji dwuczłonowych.
4.3. RACHUNEK RELACJI
219
Definicja 4.22 (relacji pełnej w X). ∀x, y ∈ X : (xRy). R jest pełna w X 5 wtedy i tylko wtedy, gdy R ∩ X × X = X × X. Relacje są zbiorami, zatem dla relacji określone są wszystkie operacje teoriomnogościowe. Sumą relacji R i R1 w zbiorze X jest relacja R2 taka, że x jest w relacji R2 z y wtedy i tylko wtedy, gdy x jest w relacji R z y lub gdy jest w relacji R1 z y, czyli R2 = R ∪ R1 . Definicja 4.23 (sumy relacji). ∀x, y ∈ X : [x(R ∪ R1 )y ⇔ (xRy ∨ xR1 y)]. Iloczynem relacji R i R1 w zbiorze X jest relacja R2 taka, że x jest w relacji R2 z y wtedy i tylko wtedy, gdy x jest w relacji R z y i gdy jest w relacji R1 z y, czyli R2 = R ∩ R1 . Definicja 4.24 (iloczynu relacji). ∀x, y ∈ X : [x(R ∩ R1 )y ⇔ (xRy ∧ xR1 y)]. Negacją relacji R w zbiorze X jest relacja R0 taka, że x jest w relacji R0 z y wtedy i tylko wtedy, gdy x nie jest w relacji R z y, czyli negacją relacji jest jej dopełnienie do relacji pełnej: R0 = (X × X) \ R. Definicja 4.25 (negacji relacji, 0 ). ∀x, y ∈ X : [xR0 y ⇔ ¬ xRy]. Dla relacji określone są nie tylko operacje teoriomnogościowe. Taką specyficzną operacją jest konwers relacji. Konwersem relacji (relacją odwrotną do) R w zbiorze X jest relacja R−1 taka, że x jest w relacji R−1 z y wtedy i tylko wtedy, gdy y jest w relacji R z x, czyli (x, y) ∈ R−1 ⇔ (y, x) ∈ R. Z definicji konwersu wynika, że dowolna relacja ma konwers i jest on dokładnie jeden. Możemy więc wprowadzić literę funkcyjną „ −1 ”. 5
Nie wprowadzamy specjalnego oznaczenia na relację pełną.
220
ROZDZIAŁ 4. RELACJE I FUNKCJE
Definicja 4.26 (konwersu relacji,
−1
).
∀x, y ∈ X : [xR−1 y ⇔ yRx]. Przykład 4.20. Konwersem relacji < jest > i na odwrót: konwersem > jest , a relacją odwrotną do > jest ℵ0 ∧ B ≤ ℵ0 ⇒ A \ B = A. Dowód. Niech A nie będzie zbiorem przeliczalnym, a B niech będzie przeliczalne. Nie tracąc na ogólności rozważań możemy przyjąć, że B ⊆ A. Zbiór przeliczalny może być skończony albo mocy ℵ0 . Rozważmy wpierw wypadek, gdy B = ℵ0 . Zbiór (A \ B) jest nieprzeliczalny. Zbiór przeliczalny daje się różnowartościowo odwzorować w zbiór nieprzeliczalny, więc istnieje różnowartościowe przekształcenie f : B → (A \ B) zbioru B w zbiór A \ B. Mamy zatem następujące zależności: f (B) ⊆ A \ B,
f (B) = ℵ0 ,
B ∩ f (B) = ∅.
Zbiór B ∪ f (B) jako suma zbiorów mocy ℵ0 jest mocy ℵ0 . Istnieje więc różnowartościowe przekształcenie g : B ∪ f (B) → f (B) odwzorowujące B ∪ f (B) na f (B). Ponieważ B ⊆ A, zbiór A jest sumą dwóch rozłącznych zbiorów: A \ (B ∪ f (B)) i (B ∪ f (B)), czyli A = [A \ (B ∪ f (B))] ∪ (B ∪ f (B)). Korzystając z tego określmy przekształcenie h : A → A w następujący sposób: ( x dla x ∈ A \ (B ∪ f (B)), h(x) = g(x) dla x ∈ B ∪ f (B). Przekształcenie h jest różnowartościowe. Niech x1 6= x2 . Jeśli x1 , x2 ∈ A \ (B ∪ f (B)), to h(x1 ) = x1 a h(x2 ) = x2 , więc h(x1 ) 6= h(x2 ). Jeśli x1 , x2 ∈ B ∪ f (B), to h(x1 ) = g(x1 ), h(x2 ) = g(x2 ) a g(x1 ) 6= g(x2 ), ponieważ g jest przekształceniem różnowartościowym. Dlatego też h(x1 ) 6= h(x2 ). Jeśli x1 ∈ A \ (B ∪ f (B)), a x2 ∈ B ∪ f (B), to h(x1 ) = x1 (∈ A \ (B ∪ f (B))), a h(x2 ) = g(x2 )(∈ f (B)). Zbiory A \ (B ∪ f (B)) i f (B) są rozłączne, zatem h(x1 ) 6= h(x2 ).
278
ROZDZIAŁ 5. MOCE ZBIORÓW
Przekształcenie h odwzorowuje zbiór A na zbiór A \ B. Zachodzą bowiem następujące równości: h(A) = h(A \ (B ∪ f (B))) ∪ h(B ∪ f (B)) = (A \ (B ∪ f (B))) ∪ g(B ∪ f (B)) = ((A \ B) ∩ (A \ f (B))) ∪ f (B) = = ((A \ B) ∪ f (B)) ∩ ((A \ f (B)) ∪ f (B)) = = (A \ B) ∩ A = A \ B. Przekształcenie h ustala więc równoliczność zbioru A ze zbiorem A \ B. Wynika stąd, że A \ B jest zbiorem tej samej mocy co A, czyli (A \ B) = A. Niech teraz B będzie skończonym podzbiorem nieprzeliczalnego zbioru A. Istnieje zatem przeliczalny nieskończony zbiór B1 taki, że B ⊆ B1 ⊆ A. Wówczas A \ B1 ⊆ A \ B ⊆ A. Ponieważ A \ B1 = A, więc na podstawie twierdzenia Cantora-Bernsteina mamy, że A \ B = A. Wniosek 5.34. Zbiór wszystkich liczb niewymiernych jest mocy continuum, czyli (R \ Q) = c. Dowód. Zbiór wszystkich liczb niewymiernych to zbiór R\Q, gdzie R to zbiór liczb rzeczywistych, a Q to zbiór liczb wymiernych. Zbiór Q jest zbiorem mocy ℵ0 . Zbiór R jest mocy c. Zatem zbiór wszystkich liczb niewymiernych jest mocy continuum. Wniosek 5.35. Zbiór wszystkich liczb niewymiernych dowolnego niepustego przedziału (a, b) (a < b; a, b ∈ R) jest mocy continuum. Dowód. Rozumujemy analogicznie jak w dowodzie wniosku 1. Zbiór wszystkich liczb rzeczywistych dowolnego niepustego przedziału jest mocy continuum, a zbiór wszystkich liczb wymiernych tego przedziału jest mocy ℵ0 , zatem zbiór wszystkich liczb niewymiernych tego przedziału jest mocy continuum. Twierdzenie 5.36. Zbiór wszystkich funkcji f : N → {0, 1}, czyli zbiór wszystkich ciągów (an )n∈N takich, że dla każdego n ∈ N : an ∈ {0, 1} jest zbiorem mocy continuum.
5.4. ZBIORY MOCY CONTINUUM
279
Dowód. Niech A będzie zbiorem wszystkich ciągów (an )n∈N o wyrazach należących do zbioru {0, 1}. Na zbiorze A określmy funkcję g : A → R w następujący sposób: ∞ P a n , gdy an = 0 dla nieskończenie wielu n, 2n n=1 ∞ g((an )n∈N ) = P a n 1 + , gdy an = 0 dla skończenie wielu n lub n=1 2n gdy an 6= 0 dla każdego n ∈ N. Funkcja g jest różnowartościowa. Tu zauważmy, że liczba będąca sumą naturalnych potęg liczby 2 jednoznacznie rozkłada się na tę sumę, czyli liczbę tę tylko w dokładnie jeden sposób można przedstawić jako sumę naturalnych potęg liczby 2. Z różnowartościowości g wynika, że A = g(A). Ponadto mamy, że {x ∈ R : 0 < x < 1} ⊆ g(A). Z tego wynika, że g(A) = c. A w konsekwencji A = c. Ponieważ zbiór wszystkich funkcji ze zbioru liczb naturalnych do zbioru dwuelementowego ma moc 2ℵ0 , więc mamy następujący wniosek. Wniosek 5.37. 2ℵ0 = c. Można zauważyć, że wzajemna jednoznaczność odwzorowania ciągów zer i jedynek oraz zbioru liczb rzeczywistych jest równoważna możliwości zapisu binarnego liczb rzeczywistych. Można pokazać, że dla c zachodzą następujące fakty: T 120. c = c + 1 = c + 2 = c + 3 = . . . c + ℵ0 = c + c T 121. c = 1 · c = 2 · c = 3 · c = . . . = ℵ0 · c = c · c T 122. c = c1 = c2 = c3 = . . . = cℵ0 T 123. c = 2ℵ0 = 3ℵ0 = 4ℵ0 = . . . ℵ0 ℵ0 = cℵ0 . Dla stwierdzenia prawdziwości T120 zauważmy, że jeżeli m ≤ c, to: c ≤ c + m ≤ c + c.
280
ROZDZIAŁ 5. MOCE ZBIORÓW
Zbiór wszystkich liczb rzeczywistych dodatnich jest mocy c, podobnie jest w wypadku wszystkich liczb rzeczywistych ujemnych. Ponieważ zbiór liczb rzeczywistych jest mocy c, więc jest jasne, że c + c = c. Korzystając z twierdzenia Cantora-Bernsteina mamy: m ≤ c ⇒ (c + m) = c. Dla stwierdzenia zachodzenia równości T121 zauważmy, że c · c = 2ℵ0 · 2ℵ0 , zaś: 2ℵ0 · 2ℵ0 = 2ℵ0 +ℵ0 . Ponieważ: ℵ0 + ℵ0 = ℵ0 , więc: c · c = 2ℵ0 , czyli c · c = c. Dla stwierdzenia równości T122 korzystamy ponownie z faktu, że 2ℵ0 = c. Mianowicie mamy, że cℵ0 = (2ℵ0 )ℵ0 . Ponieważ: (2ℵ0 )ℵ0 = 2ℵ0 ·ℵ0 , a ℵ0 · ℵ0 = ℵ0 , więc: cℵ0 = 2ℵ0 , czyli cℵ0 = c.
5.4. ZBIORY MOCY CONTINUUM
281
Dla wykazania równości T123 korzystamy z twierdzenia Cantora–Bernsteina. Wykorzystujemy mianowicie fakt, że ℵ0 ℵ0 ≤ cℵ0 . Zauważmy paradoksalny charakter równości: c·c=c i równości pochodnych (równości T122). Równość ta udowodniona już przez Cantora stwierdza — ujmując rzecz geometrycznie — równoliczność zbioru punktów płaszczyzny ze zbiorem punktów na prostej. Poszukiwania liczb kardynalnych będących mocami podzbiorów R zbioru liczb rzeczywistych zrodziły pytanie, zagadnienie continuum: czy każdy podzbiór zbioru R jest albo przeliczalny, albo mocy continuum? Jest to równoważne pytaniu o nieprzeliczalny podzbiór zbioru R nierównoliczny z tym zbiorem, czyli jest to pytanie o liczbę m taką, że ℵ0 < m < c. Inaczej mówiąc, przyjmując, że ℵ0 < ℵ1 oraz że dla dowolnej liczby m takiej, że ℵ0 ≤ m ≤ c zachodzi bądź: ℵ0 = m, bądź: m = ℵ1 , pytamy się, czy: ℵ1 = c.
282
5.5
ROZDZIAŁ 5. MOCE ZBIORÓW
Zbiór potęgowy
Definicja 5.13 (funkcji charakterystycznej podzbioru zbioru X). Niech A ⊆ X. Funkcja fA : X → {0, 1} określona wzorem: ( 1 dla x ∈ A, fA (x) = 0 dla x 6∈ A jest funkcją charakterystyczną podzbioru A zbioru X. Funkcja charakterystyczna to funkcja f : X → {0, 1} ze zbioru X do zbioru {0, 1}. Zbiór wszystkich funkcji charakterystycznych to {0, 1}X . Twierdzenie 5.38. Dla dowolnego X, zbiór wszystkich i tylko podzbiorów zbioru X jest równoliczny ze zbiorem {0, 1}X . Dowód. Niech fA będzie funkcją charakterystyczną zbioru A a g niech będzie odwzorowaniem takim, że dla dowolnego A(⊆ X) : g(A) = fA . Pokażemy, że g jest przekształceniem różnowartościowym zbioru wszystkich podzbiorów zbioru X na zbiór {0, 1}X , czyli na zbiór wszystkich funkcji charakterystycznych podzbiorów zbioru X. Niech f będzie dowolną funkcją należącą do {0, 1}X . Przeciwobrazem zbioru {1} wyznaczonym przez tę funkcję, czyli zbiorem wszystkich elementów zbioru X, dla których f przyjmuje wartość 1 jest zbiór A: A = {x ∈ X : f (x) = 1}. Można zauważyć, że f jest funkcją charakterystyczną zbioru A, czyli f = fA . Zatem g(A) = fA = f , co dowodzi, że g jest przekształceniem na zbiór {0, 1}X . W celu pokazania, że g jest przekształceniem różnowartościowym załóżmy, że A ⊆ X, B ⊆ X i A 6= B. Istnieje więc element x (∈ X) taki, że x ∈ A i x 6∈ B albo x 6∈ A i x ∈ B. Weźmy pod uwagę pierwszą z tych możliwości. Wówczas fA (x) = 1 a fB (x) = 0. Stąd fA 6= fB , czyli g(A) 6= g(B). Ostatecznie stwierdzamy zatem, że funkcja g ustala równoliczność rodziny wszystkich podzbiorów zbioru X i zbioru {0, 1}X .
5.5. ZBIÓR POTĘGOWY
283
Powyższe twierdzenie nasuwa ideę, aby zbiór wszystkich i tylko podzbiorów zbioru X oznaczać 2X . Zbiór 2X to zbiór potęgowy zbioru X. Udowodnione było, że zbiór {0, 1}N jest mocy continuum. Na podstawie powyższego twierdzenia mamy więc, że Wniosek 5.39. Zbiór wszystkich podzbiorów zbioru liczb naturalnych jest mocy continuum, czyli 2N = c. Wniosek 5.40. Jeśli zbiór X jest nieskończonym zbiorem przeliczalnym, to rodzina jego wszystkich podzbiorów jest zbiorem mocy continuum, czyli X = ℵ0 ⇒ 2X = c. Dowód. Niech X = ℵ0 . Istnieje więc funkcja różnowartościowa f : N → X przekształcająca N na X. Określmy funkcję g : 2N → X N przekształcającą 2N na X N , czyli funkcję przyporządkowującą podzbiorom zbioru liczb naturalnych funkcje ze zbioru liczb naturalnych do zbioru X. Przyjmijmy więc, że dla każdego A (⊆ N), g(A) = f (A) Funkcja f przekształca N na X, zatem każdy podzbiór zbioru X jest wyznaczonym przez funkcję f obrazem pewnego zbioru A (⊆ N). Teraz pokażemy, że funkcja g jest różnowartościowa. Niech A ⊆ N, B ⊆ N, i A 6= B. Istnieje więc takie n, które należy do tylko jednego z tych zbiorów. Niech n ∈ A, n 6∈ B. Wynika stąd, że f (n) ∈ f (A) i f (n) 6∈ f (B). Gdyby bowiem f (n) ∈ f (B), wówczas istniałaby liczba naturalna m (∈ B) taka, że f (n) = f (m). Stąd, wobec różnowartościowości f , mielibyśmy n = m, co jest niemożliwe, bo n 6∈ B, a m ∈ B. Udowodniliśmy więc, że f (A) 6= f (B), skąd wynika, że g(A) 6= g(B). Funkcja g jest bijekcją, ustala więc równoliczność zbiorów 2N i 2X . W wypadku nieskończonego zbioru przeliczalnego klasa wszystkich podzbiorów ma moc zbioru liczb rzeczywistych, czyli jest mocy c. Powstaje pytanie, jak to jest w wypadku innych zbiorów. Odpowiedzi na to pytanie udziela kolejne twierdzenie Cantora. Twierdzenie 5.41 (Cantora). Dla każdego zbioru X: X < 2X .
284
ROZDZIAŁ 5. MOCE ZBIORÓW
Dowód. 10 W celu uzyskania lepszej intuicji właściwego dowodu, dowiedziemy wpierw twierdzenia słabszego, a mianowicie, że zbiór liczb naturalnych nie jest równoliczny z klasą wszystkich i tylko podzbiorów zbioru liczb naturalnych: N < 2N . Załóżmy, że istnieje zbiór A(⊆ N) równoliczny z klasą wszystkich podzbiorów zbioru liczb naturalnych. Wzajemnie jednoznaczne przyporządkowanie f ( : A → 2N ) elementom zbioru A(= {n1 , n2 , . . . }) elementów zbioru 2N można opisać tabelką. Jeżeli w wierszu ni w kolumnie m znajduje się „tak” to znaczy, że liczba m jest elementem zbioru f (ni ), jeżeli zaś znajduje się „nie”, to znaczy, że liczba ta nie jest elementem tego zbioru.
n1 n2 n3 .. .
1 tak nie nie .. .
2 tak tak tak .. .
3 tak tak nie .. .
··· ··· ··· ··· .. .
m tak nie tak .. .
··· ··· ··· ··· .. .
ni .. .
tak .. .
tak .. .
nie .. .
··· .. .
nie .. .
··· .. .
Dokonane tu wpisy „tak” i „nie” są przykładowe. Niech Z = {ni ∈ A : ni 6∈ f (ni )}. Zbiór Z tworzymy zatem biorąc pod uwagę przekątną tabelki i – mówiąc poglądowo — zastępując w każdym miejscu tej przekątnej „tak” przez „nie”, a „nie” przez „tak”. W naszym przykładzie mielibyśmy zatem Z = {3, . . . m, . . . }. Liczby 1 oraz 2 zaś do tego zbioru nie należą. Zbiór Z nie jest wartością funkcji f dla żadnego elementu zbioru A. Dla dowolnego ni (∈ A), f (ni ) 6= Z, bowiem: ni ∈ f (ni ) ⇔ ni 6∈ Z. Ponieważ zaś Z ∈ 2N , więc A nie jest równoliczne z 2N . Mając na uwadze, że klasa zbiorów {{n} : n ∈ N} jest równoliczna z N oraz że jest podzbiorem 2N , mamy: N < 2N . 10
W dowodzie tego twierdzenia Cantor po raz pierwszy użył tzw. rozumowania przekątniowego.
5.5. ZBIÓR POTĘGOWY
285
Przystępujemy teraz do dowodu twierdzenia, że żaden zbiór nie jest równoliczny z klasą wszystkich i tylko swoich podzbiorów. Dowód ten będzie różnił się od powyższego tylko tym, że nie będziemy mogli korzystać z przeliczalności, co dało możliwość przedstawienia w postaci tabeli. W wypadku, gdy X = ∅ istnieje tylko jeden podzbiór zbioru X, a mianowicie zbiór ∅. Ponieważ 2∅ = 1, więc zachodzi dowodzona teza. Niech teraz X 6= ∅. Biorąc funkcję g : X → 2X określoną wzorem: g(x) = {x} mamy różnowartościowe odwzorowanie zbioru X na rodzinę jednoelementowych podzbiorów zbioru X. Zgodnie z definicją mocy zbiorów mamy więc, że X ≤ 2X . Niech dla pewnego zbioru X (6= ∅) istnieje niepusty podzbiór A (⊆ X) taki, że A ∼ 2X . Istnieje zatem różnowartościowa funkcja f : A → 2X przekształcająca A na 2X . Dla każdego x ∈ A, f (x) jest podzbiorem zbioru X, czyli elementem zbioru 2X , f (x) ∈ 2X . Niech Z = {x ∈ A : x 6∈ f (x)}. Z definicji zbioru Z mamy, że dla każdego x (∈ A): (x ∈ Z) ⇔ (x 6∈ f (x)). Wiemy ponadto, że Z ⊆ X. Ponieważ f przekształca A na 2X , każdy podzbiór zbioru X jest wartością funkcji f dla pewnego x (∈ A), w szczególności istnieje a (∈ A) takie, że Z = f (a). Pytamy teraz, czy a ∈ Z, czy też a 6∈ Z. Jeśli a ∈ Z, to a 6∈ f (a) (= Z). Jeżeli natomiast a 6∈ Z, to a ∈ f (a) (= Z). W każdym wypadku otrzymujemy sprzeczność. Zatem żaden niepusty podzbiór zbioru X nie jest równoliczny ze zbiorem 2X , w szczególności X nie jest równoliczny z 2X . Ostatecznie więc mamy, że X < 2X . Twierdzenie Cantora pozwala konstruować coraz większe liczby kardynalne. Biorąc zbiór potęgowy zbioru uzyskujemy zbiór większej mocy niż moc zbioru, którego zbiór potęgowy wzięliśmy. Procedura ta może być kontynuowana bez ograniczeń. Weźmy np. zbiór N liczb naturalnych. Kolejne N 2N zbiory są większej mocy niż zbiory je poprzedzające: N, 2N , 22 , 22 , . . .. Korzystając z twierdzenia Cantora mamy: ℵ0 = N < 2N = c < 22N < . . . .
286
ROZDZIAŁ 5. MOCE ZBIORÓW
Otrzymujemy w ten sposób nieskończenie wiele liczb kardynalnych. Z twierdzenia Cantora wynika, że nie istnieje zbiór Z wszystkich zbiorów. Gdyby istniał, to rodzina wszystkich podzbiorów zbioru Z byłaby jego podzbiorem, czyli 2Z ⊆ Z. Wynikałoby z tego, że zbiór 2Z byłby równoliczny z pewnym podzbiorem zbioru Z, a to w świetle twierdzenia Cantora nie jest możliwe. Fakt, że nie istnieje zbiór wszystkich zbiorów nie oznacza, że nie możemy mówić np. o prawach rachunku zbiorów, a więc czymś co odnosi się do wszystkich zbiorów. Po prostu możemy i musimy mówić o rodzinie wszystkich zbiorów, tyle tylko, że w świetle twierdzenia Cantora ta rodzina nie jest zbiorem. Wprowadzamy pojęcie klasy jako szersze niż pojęcie zbioru. Mianowicie, każdy zbiór jest klasą, lecz nie odwrotnie, nie każda klasa jest zbiorem. Dzięki temu możemy mówić o klasie wszystkich zbiorów, klasie wszystkich liczb kardynalnych. Te klasy nie są zbiorami. Mają one jednak pewne własności zbiorów. Dzięki temu rozróżnieniu unikamy sprzeczności.
Indeks łączność ∩, 177 łączność ∪, 175 łańcuch, 243 agregat, 162 aksjomat ekstensjonalności, 187 aksjomat istnienia, 187 aksjomat podzbiorów, 187 aksjomat różnicy, 187 aksjomat równości zbiorów, 187 aksjomat regularności, 188 aksjomat sumy, 187 aksjomat teorii identyczności, 106 aksjomat ufundowania, 188 aksjomat wyboru, 188 aksjomat wyróżniania, 187, 188 aksjomat zbioru potęgowego, 188 aksjomaty alternatywy, 79 aksjomaty implikacji, 79 aksjomaty koniunkcji, 79 aksjomaty negacji, 79 aksjomaty równoważności, 79 aksjomatyczny system rachunku zdań, 78 aksjomatyka Łukasiewicza, 80 alfabet, 14, 18, 19 alfabet gramatyki, 22 algebra zbiorów, 161 algorytm, 50, 157 algorytm działający w czasie wielomianowym, 51
alternatywa, 16–18 alternatywa rozłączna, 54 antyłańcuch, 243 antynomia Russella, 187 aparat logiczny, 23 argument predykatu, 100 argument spójnika, 15 atom, 16, 163 baza, 26 bijekcja zbiorów, 228 binegacja, 55 bramka AND, 62 bramka logiczna, 62 bramka NAND, 63 bramka NOR, 63 bramka NOT, 62 bramka OR, 63 bramka XNOR, 64 bramka XOR, 63 brzytwa Ockhama, 259 charakterystyka ekstensjonalna zbioru, 164 ciąg, 16, 19, 226 ciąg nieskończony, 226 continuum, 270 cudzysłów, 12 człon podziału, 212 długość dowodu, 65
287
288
INDEKS
długość słowa, 19 element neutralny ∩, 177 dedukcja naturalna, 81 element neutralny ∪, 175 definicja alternatywy, 80 element neutralny operacji konkatenacji, 19 definicja indukcyjna, 25 definicja koniunkcji, 80 elementy nieporównywalne, 242 definicja równoważności, 80 elementy porównywalne, 242 definicja rekurencyjna, 25 Entscheidungsproblem, 158 definicja zdania, 16 enumeracja zbioru, 166 dolna klasa przekroju, 246 fakt, 128 domknięcie relacji, 221 faktoryzacja klauzuli, 92 dopełnienie zbioru, 173 formuła, 101 dowód, 65, 79 formuła atomowa, 100 dowód założeniowy, 81 formuła otwarta, 104 dowód z klauzul, 92 funkcja, 222 drugie prawo addycji, 79 funkcja całkowicie określona, 223 drugie prawo De Morgana, 78 drugie prawo redukcji do absurdu, 78 funkcja całkowita, 223 funkcja charakterystyczna, 282 drugie prawo symplifikacji, 79 funkcja częściowa, 222 drzewo analityczne, 46 dwuargumentowy spójnik prawdziwo- funkcja częściowo określona, 222 funkcja Herbranda, 125 ściowy, 54 funkcja identycznościowa, 228 dysjunkcja elementarna, 59 dysjunkcyjna (alternatywna) postać nor-funkcja jednoargumentowa, 222 funkcja jednojednoznaczna, 227 malna, 59 funkcja obliczalna, 158 dziedzina, 96 funkcja odwrotna, 228 dziedzina relacji, 197, 198 funkcja różnowartościowa, 227 efektywna enumeracja zbioru, 167 funkcja rekurencyjna, 158 eksportacja, 77 funkcja rzeczywista, 226 ekstensjonalna równość zbiorów, 167 funkcja Skolema, 125 element idempotentny ∩, 177 funkcja wzajemnie jednoznaczna, 227 element idempotentny ∪, 175 funkcja zgodna z relacją, 225 element jednostkowy ∩, 177 funkcja zredukowana, 226 element jednostkowy ∪, 175 górna klasa przekroju, 246 element maksymalny, 239 gałąź, 41 element minimalny, 241 gałąź otwarta, 42 element najmniejszy, 241 element największy, 240 gałąź sprzeczna, 42
INDEKS
289
gałąź zamknięta, 42 gramatyka bezkontekstowa, 22 gramatyka formalna, 21
konglomerat, 162 koniunkcja, 16–18 koniunkcja elementarna, 59 koniunkcyjna postać normalna, 59 hilbertowski sposób dowodzenia, 78 konkatenacja, 19 konsekwencja, 65 I prawo De Morgana, 89 kontrtautologia, 33, 47 idempotencja ∪, 175 korzeń drzewa, 41 iloczyn kartezjański, 193, 236 kres dolny zbioru, 244 iloczyn liczb kardynalnych, 265 kres górny zbioru, 244 iloczyn zbiorów, 177 kreska Sheffera, 58 implikacja, 16–18 krotka, 193 implikacja odwrócona, 127 kwantyfikator duży, 101 importacja, 77 kwantyfikator mały, 101 indukcja, 26 kwantyfikator ogólny, 101 indywiduum, 96 kwantyfikator o ograniczonym zakreinjekcja, 227 sie, 102 inkluzja, 171 kwantyfikator szczegółowy, 101 instancja problemu, 154 kwantyfikatory a spójnik alternatywy, interpretacja, 28, 32, 139 115 inwariantny system rachunku zdań, 79 kwantyfikatory a spójnik implikacji, 114 język, 21 kwantyfikatory a spójnik koniunkcji, język formalny, 18 115 język pierwszego rzędu, 101 kwantyfikatory a spójnik negacji, 114 język przedmiotowy, 23 jednoargumentowy spójnik prawdzi- kwantyfikatory a spójnik równoważności, 115 wościowy, 54 klasa abstrakcji, 208 klasa ekwiwalencji, 208 klasa równoważności, 208 klasyczna koncepcja prawdy, 12 klasyczna logika zdań, 14 klauzula, 59, 126 klauzula Horna, 126 klauzula pusta, 127 klauzule uzgodnione, 90 komutacja, 77
lemat Kuratowskiego-Zorna, 244 lewa dziedzina, 198 liść, 41 liczba całkowita, 215 liczba kardynalna, 252 liczba wymierna, 217 litera funkcyjna, 97 litera predykatowa, 99 literał, 58, 126 literał czynny, 90
290 literał negatywny, 59, 126 literał pozytywny, 59, 126 literały komplementarne, 90 logiczny schemat wnioskowania, 74 logika zdań, 13 luka, 246
INDEKS
następstwo zdań, 71 nawias, 16 nawiasy, 102 nazwa cydzysłowowa, 23 nazwa funkcji, 223 negacja, 16–18 negatywna klauzula Horna, 126 maszyna Turinga, 157, 158 niesprzeczny zbiór formuł, 110 matryca formuły, 120 notacja łukasiewiczowska, 17 metajęzyk, 23 notacja Backusa-Naura, 22 metoda efektywna, 154 notacja polska, 18 metoda identyfikacji elementów rów- notacja prefiksowa, 18 noważnych, 213 metoda niewprost, 36 oś współrzędnych, 193 metoda sprawdzania wprost, 34 obcięcie funkcji, 226 metoda tablic semantycznych, 41, 50, obraz zbioru, 233 128 odwrotne prawo podwójnego przeczemetoda zero-jedynkowa, 35, 50 nia, 79 metoda zero-jedynkowa niewprost, 42 odwrotne prawo redukcji do absurdu, metoda zero-jedynkowa wprost, 42, 50 78 moc zbioru, 252 odwzorowanie, 222 model, 12, 14, 28, 139 ograniczenie dolne, 243 model języka, 139 ograniczenie górne, 243 model zbioru zdań, 71, 149 operacja, 222 model zdania, 148 operator, 222 modus ponens, 64 operator abstrakcji, 166 modus tollens, 88 półrozstrzygalność, 130, 158 monotoniczność, 194 para uporządkowana, 192 multizbiór, 163 permutacja zbioru, 228 n-argumentowa litera funkcyjna, 97 pewnik abstrakcji, 187 n-argumentowy predykat, 99 pewnik wyboru, 188 n-tka uporządkowana, 193 pień drzewa, 41 nadzbiór, 171 pierwotna, 84 następnik, 16 pierwsze prawo De Morgana, 78 następnik pary uporządkowanej, 192 pośrednie uzasadnianie, 13 następnik produkcji, 20 podsłowo, 20 następstwo, 13 podsłowo właściwe, 20
INDEKS podstawa potęgi liczby kardynalnej, 267 podstawialność termu, 105 podstawienie, 20 podzbiór, 170 podzbiór właściwy, 171 podział logiczny, 212 pojęcie dualne, 241 pojęcie logiki, 11 pojęcie prawdziwości zdania, 14 pojęcie zdania, 11 pole relacji, 198 Polish notation, 18 ponendo ponens, 77 poprzednik, 16 poprzednik pary uporządkowanej, 192 poprzednik produkcji, 20 porządek prefiksowy, 238 postać normalna dysjukcyjna (alternatywna), 58 potęga liczby kardynalnej, 267 pozytywna klauzula Horna, 126 praelement, 163 pragmatyka, 11 prawa De Morgana, 114 prawa De Morgana dla różnicy, 182 prawa De Morgana dla rachunku zbiorów, 181 prawa dziedzina, 198 prawa ekstensjonalności, 115 prawdziwość zdania w modelu, 148 prawo absorpcji (pochłaniania), 181 prawo addycji, 79 prawo Claviusa, 80 prawo dodawania poprzedników, 79 prawo Dunsa Szkota, 78, 80 prawo dylematu, 78 prawo Fregego, 79
291 prawo kontrapozycji, 77 prawo logiki, 76 prawo mnożenia następnika, 79 prawo podwójnego przeczenia, 78, 79 prawo podwójnego uzupełnienia, 174 prawo podwójnej negacji, 78 prawo poprzednika, 79 prawo redukcji do absurdu, 78 prawo rozdzielności, 194 prawo rozdzielności iloczynu względem sumy, 181 prawo rozdzielności sumy względem iloczynu, 181 prawo sylogizmu hipotetycznego, 80 prawo symplifikacji, 79 prawo transpozycji, 77, 79 predykat, 99 predykat identyczności, 107 prefiks, 17, 20 prefiks formuły, 120 prefiksowa postać normalna, 120 problem rozstrzygalności, 154 problem syntezy sieci logicznych, 64 produkcja, 20 produkt kartezjański, 193, 236 przecięcie zbiorów, 177 przeciwdziedzina, 198, 223 przeciwobraz zbioru, 234 przedłużenie funkcji, 226 przedrostek formuły, 120 przedrostkowa postać normalna, 120 przekątna, 200 przekrój właściwy, 246 przekrój zbiorów, 177 przekroju zbioru, 245 przekształcenie, 222 przekształcenie kanoniczne, 213 przemienność ∩, 177
292 przemienność ∪, 175 przesłanka, 13 przestrzeń, 96, 170 przestrzeń ilorazowa, 208 punkt, 193
INDEKS
reguła dołączania nowych wierszy dowodowych, 81, 84 reguła dołączania równoważności, 85 reguła jednokrotna, 128, 129 reguła lewostronna, 42 reguła odrywania, 65, 79, 85, 107 różnica symetryczna zbiorów, 180 reguła opuszczania alternatywy, 85 różnica zbiorów, 179 reguła opuszczania dużego kwantyfirówność funkcji, 224 katora, 107, 136 równoliczność zbiorów, 249 reguła opuszczania koniunkcji, 85 równoważność, 16–18 reguła opuszczania małego kwantyfirachunek logiczny, 11, 13 katora, 107, 136 rachunek predykatów, 14 reguła opuszczania równoważności, 85 rachunek zbiorów, 161 reguła pierwotna, 84 rachunek zdań, 14, 31, 61 reguła podstawiania, 80, 107 racja, 13 reguła prawostronna, 42 racja zdania, 71 reguła przepisywania, 20 reguła, 73, 128 reguła rezolucji, 89, 91 reguła ∃L, 128, 129 reguła strukturalna, 73 reguła ∃P , 128, 129 reguła tworzenia dowodu, 81 reguła ∀L, 129 reguła tworzenia dowodu niewprost, reguła ∀P , 129 83 reguła ∧L, 43 reguła tworzenia dowodu wprost, 83 reguła ∧P , 44 reguła wielokrotna, 129 reguła ⇔ L, 45 reguła wtórna, 84, 86 reguła ⇔ P , 46 reguła zastępowania, 80 reguła ¬L, 43 reguły gramatyczne, 14 reguła ¬P , 43 reguły konstrukcji wyrażeń, 18 reguła ∨L, 44 reguły semantyczne, 14 reguła ∨P , 44 reguły syntaktyczne, 14, 18 reguła ⇒ L, 45 reguły znaczeniowe, 14 reguła ⇒ P , 45 relacja, 96, 196 reguła dołączania alternatywy, 85 relacja antysymetryczna, 203 reguła dołączania dużego kwantyfika- relacja asymetryczna, 203 tora, 107, 136 relacja binarna, 197 reguła dołączania koniunkcji, 85 relacja dobrze porządkująca, 247 reguła dołączania małego kwantyfika- relacja dobrze ufundowana, 247 tora, 107, 136 relacja dwuczłonowa, 197
INDEKS relacja relacja relacja relacja
leżenia poniżej, 41 liniowo porządkująca, 244 n–członowa, 197 niewiększości dla liczb kardynalnych, 270 relacja poprzedzania, 238 relacja porządkująca, 237 relacja przechodnia, 205 relacja przeciwsymetryczna, 203 relacja przeciwzwrotna, 201 relacja równoważności, 207 relacja spójna, 244 relacja symetryczna, 202 relacja zredukowana, 221 relacja zwrotna, 200 reverse Polish notation, 18 rezolwenta, 90 rozłączność zbiorów, 179 rozgałęzienie, 41 rozstrzygalność, 33, 154 rozszerzenie funkcji, 226
293
skok, 246 skolemizacja, 124 spójnik, 15 spójnik dwuargumentowy, 15 spójnik główny, 17 spójnik jednoargumentowy, 15 spójnik prawdziwościowy, 14, 53 spójniki równoważne (ekstensjonalnie równe), 54 spełnianie, 141 sprawdzanie metodą niewprost, 35 sprzeczność, 128 sprzeczny zbiór formuł, 110 stała indywiduowa, 96 stała Skolema, 124 standardowa postać skolemowska, 124 stosunek, 196 sufiks, 17, 20 suma liczb kardynalnych, 264 suma zbiorów, 175 superpozycja funkcji, 231 supozycja materialna, 30 słownik, 14, 18 surjekcja, 225 słowo końcowe, 20 sygnatura funkcji, 223 słowo nad alfabetem, 19 sygnatura języka, 101 słowo początkowe, 20 sygnatura relacji, 197 słowo puste, 19 sylogizm hipotetyczny, 77 schemat wnioskowania, 73 sylogizm warunkowy, 87 schemat wnioskowania odpowiadający symbol końcowy (terminalny), 22 schematowi zdania, 76 symbol niekońcowy (nieterminalny), schemat zdania, 25 22 semantycznie niesprzeczny zbiór zdań, symbol początkowy (startowy) grama70 tyki, 22 semantyka, 11, 31 symetryczne domknięcie relacji, 222 semiotyka, 11 syntaktycznie niesprzeczny zbiór zdań, sieć logiczna, 62 70 sieć podstawowa, 64 syntaktyka, 11, 31 singleton, 165 system implikacyjno-negacyjny, 80
294 tablica binarna, 43 tablica otwarta, 42 tablica semantyczna, 41, 46 tablica semantyczna zamknięta, 130 tablica zakończona, 43 tablica zamknięta, 42 tautologia, 31, 33, 47 tautologia języka rachunku predykatów, 106 teoria dowodu, 23 teoria interpretacji, 23 teoria mnogości, 161 teoria modeli, 23 teoria wynikania syntaktycznego, 23 teoriomnogościowe prawo (nie)sprzeczności, 180 teoriomnogościowe prawo wyłączonego środka, 180 term, 99 teza Churcha, 157 teza Churcha-Turinga, 157 teza indukcyjna, 27 teza rachunku predykatów, 110 teza rachunku zdań, 80 tollendo tollens, 77 transformacja, 222 twierdzenie, 81 twierdzenie Cantora-Bernsteina, 271, 274 twierdzenie Gödla o pełności, 153 twierdzenie o dedukcji, 68, 115 twierdzenie o funkcjonalnej pełności, 57 twierdzenie o pełności, 52 twierdzenie o rozbiorze, 28 twierdzenie o zastępowaniu, 56 twierdzenie o zwartości, 153 typ funkcji, 223
INDEKS układ podstawowa, 64 unifikacja termów, 128 uniwersum, 96 uogólniona suma zbiorów, 183 uogólnione prawa De Morgana, 186 uogólnione przecięcie zbiorów, 183 uogólnione twierdzenie o niesprzeczności, 71, 153 uogólnione twierdzenie o pełności, 71 uogólniony iloczyn kartezjański, 236 uogólniony produkt kartezjański, 236 uzasadnianie, 13 uzupełnienie zbioru, 173 właściwy nadzbiór, 171 wartość funkcji, 223 wartość logiczna, 13, 32 wartość termu, 141 warunek bazowy, 26 warunek indukcyjny, 26 warunek końcowy, 26 warunek niepustości, 212 warunek początkowy, 26 warunek początkowy (bazowy), 27 warunek rozłączności, 212 warunek zupełności, 212 wielozbiór, 163 wiersz dowodowy, 82 wniosek, 13, 65 wnioskowanie, 13 wnioskowanie dedukcyjne, 13 wnioskowanie przez indukcję (matematyczną), 27 wtórna, 84 wykładnik potęgi liczby kardynalnej, 267 wykres funkcji, 224 wynikanie, 13
INDEKS wynikanie (logiczne), 13 wynikanie semantyczne, 71, 149 wynikanie syntaktyczne, 65 wyprowadzalność, 65 wyprowadzenie ze słowa, 20 wyraz ciągu, 19 wystąpienie problemu, 154
295
zastępowanie, 20 zawieranie się zbiorów, 171 zbiór dobrze ufundowany, 247 zbiór dobrze uporządkowany, 247 zbiór dokładny, 163 zbiór domknięty ze względu na reguły konstrukcji, 26 zbiór dualny, 242 x jest zawarte w y, 238 zbiór dzielony, 212 zbiór liniowo uporządkowany ciągły, złożenie sekwencyjne funkcji, 231 246 założenia dowodu założeniowego, 82 zbiór liniowo uporządkowany gęsto, 245 założenie, 65 zbiór nieprzeliczalny, 261 zakres predykatu, 99 zbiór nieskończony, 250 zakres zmienności, 96 zbiór obliczalny, 259 zależność, 196 zbiór pełny, 170 zamknięcie formuły, 104 zbiór potęgowy, 188 zanegowane pytanie, 128 zbiór przeliczalny, 253 zasada abstrakcji, 213 zbiór przybliżony, 163 zasada ciągłości Dedekinda, 246 zbiór pusty, 169 zasada dopisywania nowych wierszy zbiór refleksywny, 250 dowodowych, 82 zbiór regularny, 247 zasada dowodzenia reguł wtórnych, 86 zbiór rekurencyjnie przeliczalny, 259 zasada dwuwartościowości, 14 zbiór rekurencyjny, 259 zasada dwuwartościwości, 13 zbiór reprezentantów, 208 zasada ekonomii, 12 zbiór rozmyty, 162 zasada ekstensjonalności, 168 zbiór scharakteryzowany intensjonalzasada niesprzeczności, 77 nie, 165 zasada podwójnej negacji, 88 zbiór skończony, 249 zasada rekurencji strukturalnej, 28 zbiór uniwersalny, 96, 170 zasada tożsamości, 77 zbiór uporządkowany, 238 zasada wiązania na lewo, 24 zbiór w znaczeniu abstrakcyjnym, 161 zasada wyłączonego środka, 78 zbiór w znaczeniu dystrybutywnym, zasady indukcji strukturalnej dla ra161, 162 chunku zdań, 27 zbiór w znaczeniu kolektywnym, 161 zasady wiązania przez spójniki, 24 zbiór w znaczeniu mereologicznym, 161 zasięg działania kwantyfikatora, 103 zbiór zdań spełniony w modelu, 71 zasięg kwantyfikatora, 103 zdanie (logicznie) prawdziwe, 30, 149
296 zdanie zdanie zdanie zdanie zdanie
żywe, 42 atomowe, 13 fałszywe, 12 fałszywe w modelu, 29, 149 języka rachunku predykatów, 104 zdanie martwe, 42 zdanie prawdziwe, 12 zdanie prawdziwe w modelu, 28 zdanie proste, 13, 15 zdanie spełnione w modelu, 29 zdanie złożone, 15 zmienna gramatyki, 22 zmienna indywiduowa, 96 zmienna wolna, 104 zmienna wolna w formule, 104 zmienna związana, 103 znak abstrakcji, 166 znak interpunkcyjny, 16 związek, 196 zwrotne domknięcie relacji, 221
INDEKS
Bibliografia (1965), w: M. Davis, red., ‘The Undecidable: Basic Papers on Undecidable Propositions, Unsolvable Problems, and Computable Functions’, Raven Press, Hewlett, N.Y. Davis, M. & Putnam, H. (1960), ‘Computing procedure for quantification theory’, Journal of the ACM 7(3), 201–215. Gödel, K. (1930), ‘Die Vollständigkeit der Axiome des logischen Funktionskalküls’, Monatshefte für Mathematik und Physik 37, 349–360. (Gödel’s Dissertation, 1929) also with English transl. in Collected Works, S. Feferman et al., eds., vol. 1, Oxford University Press, Oxford, 1986, pp. 60–101. Grzegorczyk, A. (1957), Zagadnienia rozstrzygalności, Warszawa. Herbrand, J. (1929), Recherches sur la théorie de la démonstration, PhD thesis, Warszawa. Dysertacja doktorska dla Uniwersytetu Paryskiego, opublikowana w: Travaux de la Société des Sciences et des Lettres de Varsovie, Classe II, Sciences math. et phys., no. 33. Warszawa, s. 128; datowane: 14 IV 1929. Przedruk w: Herbrand, Écrits logiques, Presses Universitaires de France, Paris 1968, s. 35–153. Dowód twierdzenia o dedukcji w §2.4, rodz. 3 (s. 61 w oryginale, s. 90–91 w przedruku z r. 1968). Horn, A. (1951), ‘On sentences which are true of direct unions of algebra’, Journal of Symbolic Logic 16, 14–21. Kuratowski, K. (1922), ‘Une méthode d’élimination des nombres transfinis des raisonnements mathématiques’, Fundamenta Mathematicae 3, 76– 108. 297
298
BIBLIOGRAFIA
Löwenheim, L. (1915), ‘Über Möglichkeiten im Relativkalkül’, Mathematischen Annalen 76, 447–470. Przekład ang. w: (van Heijenoort 1967), s. 232–251. Morris, C. (1938), Foundations of the theory of signs, w: ‘International Encyclopedia of United Scince’, Vol. 1, Chicago University Press, Chicago. Murawski, R. (1990), Funkcje rekurencyjne i elementy metamatematyki. Problemy zupełności, rozstrzygalności, twierdzenie Gödla, Poznań. II wyd. 1991. Murawski, R. (1999), Recursive Functions and Metamathematics. Problems of Completeness and Decidability, Gödel’s Theorems, Kluwer Academic Publishers, Dordrecht-Boston-London. Robinson, J. A. (1965), ‘A machine-oriented logic based on the resolution principle’, Journal of the Association for Computing Machinery 12(1), 23–41. Skolem, T. A. (1920), Logisch-kombinatorische Untersuchungen über die Erfüllbarkeit oder Beweisbarkeit mathematischer Sätze nebst einem Theorem über dichte Mengen, I, Skrifter utgitt av Videnskapsselskapet i Kristiania, Mat. Naturv. Kl. 4. Tarski, A. (1933), Pojęcie prawdy w językach nauk dedukcyjnych, Prace Towarzystwa Naukowego Warszawskiego, Warszawa. Zob. (Tarski 1936 (za rok 1935)). Tłumaczenie angielskie: „The Concept of Truth in Formalized Languages”, w: Logic, Semantics, Metamatematics: Papers from 1923 to 1938, Oxford 1956. Tarski, A. (1936 (za rok 1935)), ‘Der Wahrheitsbegriff in der formalisierten Sprachen’, Studia Philosophica 41, 261–405. Uzupełniony przekład z wydania polskiego w 1933 r., (Tarski 1933). Tarski, A. (1944), ‘The semantic conception of truth and the foundation of semantics’, Philosophy and Phenomenological Research 4, 341–376. Trzęsicki, K. (2003), Logika i teoria mnogości. Ujęcie systematycznohistoryczne, Exit, Warszawa.
BIBLIOGRAFIA
299
Trzęsicki, K. (2006), ‘From the idea of decidability to the number Ω’, Studies in Grammar, Logic and Rethoric 9(22), 73–142. Turing, A. M. (1936–37), ‘On computable numbers, with an application to the Entscheidungsproblem’, Proceedings of the London Mathematical Society 42(Series 2), 230–265. Received May 25, 1936; Appendix added August 28; read November 12, 1936; corrections Ibid. vol. 43(1937), pp. 544–546. Turing’s paper appeared in Part 2 of vol. 42 which was issued in December 1936 (Reprint in M. Davis (ed.) 1965, pp.116–151, ( 1965); corr. ibid. pp. 151–154). Online version: http://www.abelard.org/turpap2/tp2-ie.asp. van Heijenoort, J., red. (1967), From Frege to Gödel. A source book in Mathematical Logic, Harvard University Press, Cambridge Mass. Zorn, M. (1935), ‘A remark on method in transfinite algebra’, Bulletin of the American Mathematical Society 41, 667–670.
View more...
Comments