Collegium Logicum
Short Description
Download Collegium Logicum...
Description
Collegium Logicum Logische Grundlagen der Philosophie und der Wissenschaften Godehard Link
Seminar für Philosophie, Logik und Wissenschaftstheorie Philosophie-Department Universität München September 2007
ii
Inhaltsverzeichnis Einleitung 0.1 Historisches zum Verhältnis von Logik und Philosophie 0.1.1 Die Erneuerung der Logik im 19. Jahrhundert . 0.1.2 Cantors Mengenlehre . . . . . . . . . . . . . . . 0.1.3 Die Logik des 20. Jahrhunderts . . . . . . . . . 0.2 Moderne Logik und Philosophie . . . . . . . . . . . . . 0.2.1 Existenz . . . . . . . . . . . . . . . . . . . . . . 0.2.2 Prädikation . . . . . . . . . . . . . . . . . . . . 0.2.3 Identität . . . . . . . . . . . . . . . . . . . . . . 0.2.4 Abstraktion . . . . . . . . . . . . . . . . . . . . 0.2.5 Teil/Ganzes und Nominalismus . . . . . . . . . 0.2.6 Wahrheit . . . . . . . . . . . . . . . . . . . . . 0.2.7 Modalität . . . . . . . . . . . . . . . . . . . . . 0.2.8 Wenn-dann-Verknüpfungen . . . . . . . . . . . 0.3 Logik als Metawissenschaft . . . . . . . . . . . . . . . 0.3.1 Logik in den formalen Wissenschaften . . . . . 0.3.2 Logik in den empirischen Wissenschaften . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
ix x xiii xxii xxv xxxi xxxii xxxvi xl xlvii li lv lxvii lxxx cvii cviii cviii
1 Elementares Handwerkszeug: Mengen, Funktionen, Zeichen 1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Operationen der Mengenbildung . . . . . . . . . . . . . 1.1.2 Geordnete Paare, Relationen, n-Tupel . . . . . . . . . . 1.2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Endliche und unendliche Mengen . . . . . . . . . . . . . . . . . 1.4 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Explizite Definitionen . . . . . . . . . . . . . . . . . . . 1.4.2 Induktive Definitionen und Beweise . . . . . . . . . . . 1.5 Zeichentheoretische Grundbegriffe . . . . . . . . . . . . . . . . 1.5.1 Bedeutung und Referenz . . . . . . . . . . . . . . . . . . 1.5.2 Die Namenrelation . . . . . . . . . . . . . . . . . . . . . 1.5.3 Deskriptive und logische Ausdrücke; Variablen . . . . . 1.5.4 Objekt- und Metasprache; Mitteilungszeichen . . . . . . 1.5.5 Gebrauch und Erwähnung . . . . . . . . . . . . . . . . . 1.5.6 Gebrauch und Erwähnung: Zusammenfassung . . . . . .
. . . . . . . . . . . . . . .
1 1 3 8 11 15 17 18 21 24 25 34 38 40 44 48
iii
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
iv
Inhaltsverzeichnis
2 Aussagenlogik 2.1 Logische Form I: Aussagenlogik . . . . . . . . . 2.1.1 Die logische Konjunktion . . . . . . . . 2.1.2 Die logische Disjunktion . . . . . . . . . 2.1.3 Die Negation . . . . . . . . . . . . . . . 2.1.4 Das Konditional . . . . . . . . . . . . . 2.1.5 Das Bikonditional . . . . . . . . . . . . 2.1.6 AL-Formalisierungen: Beispiele . . . . . 2.2 Syntax der Aussagenlogik . . . . . . . . . . . . 2.3 Semantik der Aussagenlogik . . . . . . . . . . . 2.3.1 Belegungen und Bewertungen . . . . . . 2.3.2 Die Q-Analyse: Schnelle Gültigkeitstests 2.3.3 Eine Liste von Tautologien . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
49 49 49 51 52 54 55 55 58 61 61 71 77
3 Strukturtheorie der Aussagenlogik 83 3.1 Zweistellige Junktoren . . . . . . . . . . . . . . . . . . . . . . . . 83 3.1.1 Der Diamant der Wahrheitsfunktionen . . . . . . . . . . . 87 3.1.2 Logische Folgerungen . . . . . . . . . . . . . . . . . . . . 96 3.1.3 Philosophische Anwendung: Die Dynamik von Überzeugungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 3.2 Weitere Strukturaussagen . . . . . . . . . . . . . . . . . . . . . . 99 3.2.1 Wahrheitsfunktional vollständige Systeme von Junktoren 99 3.2.2 Normalformen und Boolesche Expansionen . . . . . . . . 104 4 Prädikatenlogik mit Identität 4.1 Logische Form II: Prädikatenlogik . . . . . . . . . . . . . 4.1.1 PL1I-Formalisierungen: Erste Beispiele . . . . . . . 4.2 Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Substitution von Termen in Formeln . . . . . . . . 4.3 Prädikatenlogische Prinzipien . . . . . . . . . . . . . . . . 4.4 Identität . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Kennzeichnungen und Abstraktion . . . . . . . . . . . . . 4.6 Die Logik PL1IKA der Kennzeichnungen und Abstraktion 4.7 Prinzipien der Logik PL1IKA . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
109 109 114 115 119 124 128 131 136 138
5 Logische Form und Argument 5.1 Ein Übersetzungsmanual . . . . . . . . . . . . . . . . . . . . 5.1.1 Regeln zur Herstellung der Explizitfassung . . . . . 5.1.2 Übersetzung der Explizitfassung in die logische Form 5.2 Logische Argumente . . . . . . . . . . . . . . . . . . . . . . 5.3 Philosophische Argumente . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
145 145 145 148 154 156
6 Semantik der Prädikatenlogik 165 6.1 Die Bewertungssemantik für PL1I . . . . . . . . . . . . . . . . . 166 6.2 Die modelltheoretische Semantik für PL1I . . . . . . . . . . . . . 170 6.3 Semantik der Logik PL1IKA . . . . . . . . . . . . . . . . . . . . 183
v
Inhaltsverzeichnis 7 Kalkül des natürlichen Schließens: Aussagenlogik 7.1 Aussagenlogische Beweise . . . . . . . . . . . . . . 7.2 Der Kalish-Montague-Kalkül: Beschreibung . . . . 7.2.1 Schlußregeln . . . . . . . . . . . . . . . . . 7.2.2 Der Ableitungsbegriff . . . . . . . . . . . . 7.2.3 Hinweise zur Beweistechnik . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
185 187 203 203 208 210
8 Kalkül des natürlichen Schließens: Prädikatenlogik 8.1 Monadische Prädikatenlogik . . . . . . . . . . . . . . 8.1.1 Monadische Theoreme . . . . . . . . . . . . . 8.2 Volle Prädikatenlogik . . . . . . . . . . . . . . . . . . 8.3 Identitätslogik . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Identitätstheoreme . . . . . . . . . . . . . . . 8.4 Kennzeichnungslogik . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
215 218 220 230 234 238 239
9 Mengenlehre im Kalkül I: Axiome, Klassenalgebra 9.1 Die Axiome der Mengenlehre . . . . . . . . . . . . . 9.2 Der formale Rahmen für die freie Mengenlehre . . . 9.2.1 Die mengentheoretische Sprache . . . . . . . 9.2.2 Schließen im freien KM-Kalkül . . . . . . . . 9.3 Theoreme von Kph und Ext . . . . . . . . . . . . . . 9.4 Die Algebra der Klassen . . . . . . . . . . . . . . . . 9.4.1 Die Russell-Klasse . . . . . . . . . . . . . . . 9.5 Weitere Axiome . . . . . . . . . . . . . . . . . . . . . 9.5.1 Das Aussonderungsaxiom . . . . . . . . . . . 9.5.2 Paarmenge, Vereinigungsmenge, Potenzmenge 9.5.3 Geordnete Paare . . . . . . . . . . . . . . . . 9.5.4 Potenzmenge . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
243 245 250 250 252 254 262 276 277 277 278 279 282
10 Mengenlehre im Kalkül II: Relationen, Funktionen 10.1 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Ordnungsrelationen . . . . . . . . . . . . . . . . . . . . . . 10.3 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.1 Das Ersetzungsaxiom . . . . . . . . . . . . . . . . 10.3.2 Weitere Begriffe . . . . . . . . . . . . . . . . . . . 10.3.3 Der Satz von Cantor . . . . . . . . . . . . . . . . . 10.3.4 Unendliche Mengen; Ordinal- und Kardinalzahlen
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
285 285 289 302 302 305 309 312
11 Axiomatischer Aufbau: Aussagenlogik 11.1 Semantische Korrektheit . . . . . . . . . . . . . . . . . . . . . . . 11.2 Theoreme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Semantische Vollständigkeit . . . . . . . . . . . . . . . . . . . . .
319 322 324 337
12 Axiomatischer Aufbau: Prädikatenlogik 12.1 Prädikatenlogik mit Funktionszeichen . . . . 12.2 Theoreme . . . . . . . . . . . . . . . . . . . . 12.2.1 Abgeleitete Regeln . . . . . . . . . . . 12.2.2 Zur Technik axiomatischen Beweisens 12.2.3 Volle Prädikatenlogik . . . . . . . . . 12.2.4 Identitätslogik . . . . . . . . . . . . .
347 347 358 361 365 368 369
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
vi
Inhaltsverzeichnis 12.2.5 Logik mit Funktionssymbolen . . . . . . . . . . . . . . . . 12.3 Modelltheoretische Strukturen . . . . . . . . . . . . . . . . . . . . 12.4 Semantische Korrektheit des axiomatischen Kalküls . . . . . . . . 12.4.1 Die Gültigkeit der Axiome . . . . . . . . . . . . . . . . . . 12.4.2 Der Korrektheitsbeweis . . . . . . . . . . . . . . . . . . . 12.5 Semantische Vollständigkeit der Prädikatenlogik: der HenkinBeweis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.6 Folgerungen aus dem Vollständigkeitssatz . . . . . . . . . . . . . 12.6.1 Grenzen der Ausdruckskraft . . . . . . . . . . . . . . . . . 12.6.2 Die Löwenheim-Skolem-Theoreme: Erste Fassung . . . . . 12.6.3 Das Skolem-Paradox . . . . . . . . . . . . . . . . . . . . .
13 Theorien erster Stufe: Mereologie 13.1 Freie Logik . . . . . . . . . . . . . . . . . . . . . 13.1.1 Theoreme von FL . . . . . . . . . . . . . 13.1.2 Semantik der freien Logik . . . . . . . . . 13.2 Mereologie als Theorie der Überlappung . . . . . 13.2.1 Theoreme der mereologischen Theorie M1 13.2.2 Singuläre Terme in M1 . . . . . . . . . . . 13.2.3 Atomare Strukturen . . . . . . . . . . . . 13.3 Die Teilrelation als Grundzeichen . . . . . . . . .
370 371 376 376 386 387 397 398 399 402
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
405 407 408 412 416 421 427 434 437
14 Modallogik 14.1 Axiomatik der modalen Aussagenlogik . . . . . . . . . . 14.1.1 Theoreme des Systems K . . . . . . . . . . . . . 14.1.2 Theoreme des deontischen Systems KD . . . . . 14.1.3 Theoreme des Systems KT . . . . . . . . . . . . 14.1.4 Theoreme des Systems B . . . . . . . . . . . . . 14.1.5 Theoreme des Systems K4 . . . . . . . . . . . . . 14.1.6 Theoreme des Systems S4 . . . . . . . . . . . . . 14.1.7 Theoreme des Systems S5 . . . . . . . . . . . . . 14.2 Semantik der modalen Aussagenlogik: Kripke-Semantik 14.2.1 Semantische Graphen . . . . . . . . . . . . . . . 14.2.2 Semantische Charakterisierung der Axiome . . . 14.3 Propositionen als Mengen von möglichen Welten . . . . 14.4 Der Verband der normalen Modallogiken . . . . . . . . . 14.4.1 Überblick . . . . . . . . . . . . . . . . . . . . . . 14.4.2 Die Axiome G0 , ·3, L und 4c . . . . . . . . . . . 14.4.3 Die Axiome W und Z . . . . . . . . . . . . . . . 14.5 Kanonische Modelle . . . . . . . . . . . . . . . . . . . . 14.6 Modale Äquivalenz . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
441 441 442 445 446 447 448 449 452 455 460 463 464 467 467 474 477 481 481
. . . . . . . .
. . . . . . . .
. . . . . . . .
15 Modallogik II: Quantoren, Anwendungen 483 15.1 Modale Quantorenlogik . . . . . . . . . . . . . . . . . . . . . . . 483 15.2 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483
vii
Inhaltsverzeichnis 16 Grundbegriffe der Modelltheorie 16.1 Beziehungen zwischen Strukturen 16.2 Theorien und ihre Modelle . . . . 16.2.1 Modelle der Arithmetik . 16.2.2 Elementare Modellklassen
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
485 485 493 498 502
17 Theorien erster Stufe: Arithmetik 509 17.1 Peano-Arithmetik: Axiome und Theoreme . . . . . . . . . . . . . 509 17.2 Modelle der Arithmetik . . . . . . . . . . . . . . . . . . . . . . . 534 18 Rekursive Funktionen 18.1 Algorithmen . . . . . . . . . . . . . . . . . . . . . . . . . 18.1.1 Unendliche aufzählbare Mengen . . . . . . . . . . 18.2 Turingmaschinen . . . . . . . . . . . . . . . . . . . . . . 18.2.1 Die Produktivität einer Turingmaschine . . . . . 18.2.2 Elementare Strukturmaschinen . . . . . . . . . . 18.2.3 Turing-berechenbare Funktionen . . . . . . . . . 18.3 Primitiv-rekursive Funktionen . . . . . . . . . . . . . . . 18.3.1 Beispiele für primitiv-rekursive Funktionen . . . 18.4 µ-rekursive Funktionen und ihre Turing-Berechenbarkeit 18.5 Turing-berechenbare Funktionen sind µ-rekursiv . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
535 535 537 539 545 547 550 551 553 566 569
19 Die Gödelschen Theoreme 577 19.1 Arithmetisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . 577 20 Logik höherer Stufe
599
21 Mengentheorie
603
22 Interpretation und Reduktion
605
23 Die Logik der Wissenschaften: Wahrscheinlichkeit 23.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 23.1.1 Wahrscheinlichkeitsaussagen . . . . . . . . . . . . . 23.1.2 Objektive vs. epistemische Wahrscheinlichkeit . . . 23.1.3 Wahrscheinlichkeitsschlüsse als induktive Schlüsse 23.1.4 Die Algebra der Ereignisse . . . . . . . . . . . . . . 23.2 Laplace-Wahrscheinlichkeiten und Kombinatorik . . . . . 23.2.1 Das Urnenmodell . . . . . . . . . . . . . . . . . . . 23.2.2 Ein wenig Kombinatorik . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
607 607 607 609 610 612 614 614 617
24 Die Logik des Handelns: Entscheidungstheorie
621
Literaturverzeichnis
623
Personenregister
635
Sachregister
637
viii
Inhaltsverzeichnis
Einleitung Mein teurer Freund, ich rat’ Euch drum Zuerst Collegium Logicum. Da wird der Geist Euch wohl dressiert, In spanische Stiefeln eingeschnürt, Daß er bedächtiger so fortan Hinschleiche die Gedankenbahn, Und nicht etwa, die Kreuz und Quer, Irrlichteliere hin und her. Goethe, Faust I
Die Logik gilt üblicherweise als die Disziplin, in der man korrektes Argumentieren lernt und praktiziert. Argumente werden verwendet, um Überzeugungen, die man hat, zu begründen oder auf verläßliche Weise zu neuen Überzeugungen zu gelangen. Die logischen Argumente sind die verläßlichsten, weil sie einen vollständigen Wahrheitstransfer garantieren. Wenn ich z.B. den Satz A zu meinen Überzeugungen zähle und ferner den Bedingungssatz ‘wenn A so auch B ’, so kann ich mit logischer Sicherheit die Überzeugung B hinzunehmen; wenn A sowie jener Bedingungssatz (die Prämissen des Arguments) wahr sind, so ist auch B wahr, und ich bin berechtigt, von B im gleichen Maß überzeugt zu sein wie von meinen Prämissen. Dieses Argument vollzieht sich nach der bekannten logischen Schlußfigur des Modus Ponens. Nun ändern sich unsere Überzeugungen allerdings nicht allein aufgrund logischer Argumente; diese bilden in der Tat lediglich das Grundgerüst alltäglicher (wie auch wissenschaftlicher) Argumentationen. Angenommen, ich möchte im Winter mit dem Auto von München nach Italien fahren und habe folgende Information: (i) Wenn der Reschenpaß geschlossen ist, ist der Brennerpaß offen. Nun erfahre ich, daß (ii) der Brennerpaß geschlossen wurde. Aus (i) und (ii) — und dem Hintergrundwissen, daß (iii) ein Paß genau dann offen ist, wenn er nicht geschlossen ist — kann ich jetzt mit Hilfe der Figur des Modus Tollens logisch schließen, daß der Reschenpaß offen ist. So würde sich unweigerlich eine wissensbasierte “Inferenzmaschine” verhalten, ein schließfähiges Computerprogramm, welches in seiner Wissensbasis die Informationen (i), (ii) und (iii) hat und zu seinen Schluß- oder Inferenzregeln den Modus Tollens zählt. Ein mit den Schneeverhältnissen in den Alpen vertrauter Skifahrer wird vermutlich jedoch ganz anders reagieren: Wenn es wahr ist, daß starker Schneefall die Schließung des Brenners erzwungen hat, dann wird erst recht der noch höhere Reschenpaß unpassierbar sein; hier wird die Überzeugung (i) einfach aufgegeben. Dies ist zwar ein nicht-logischer Schluß, aber er erscheint viel rationaler als das erste ix
x
Einleitung
rein logische Argument. Es zeigt sich, daß der vollständige Wahrheitstransfer seinen Preis hat: weder im Alltag noch in den Wissenschaften kommt man mit der reinen Logik allein sehr weit. Die meisten Argumentationen setzen sich aus Mischargumenten zusammen, in denen sich mehr oder minder plausible Schlüsse zu den logisch gültigen gesellen. Man nennt die Schlüsse der reinen Logik deduktiv und alle anderen nicht-deduktiv . Der hauptsächliche Informationsgehalt eines Mischarguments wie das jenes Skifahrers liegt allerdings nicht bei der deduktiven Logik, sondern auf der nicht-deduktiven Seite, welche die lokale Wissenssituation spiegelt; ändert sich diese, müssen Schlüsse in der Regel revidiert werden. Die rein logischen Regeln sind dagegen streng gültig, vollkommen allgemein und unabhängig vom Informationsstand und Inhalt eines gegebenen Arguments. Diese Unabhängigkeit vom konkreten Gehalt von Argumenten macht die deduktive Logik als Disziplin zwar nicht “inhaltsleer” (ihre Ausdruckskraft ergibt sich in Kombination mit spezifischen Theorien zu einem speziellen Wissensgebiet); sie stellt jedoch eine Wissenschaft reiner Strukturen dar, deren Gesetze in den Einzelwissenschaften, sogar in der “reinen Mathematik”, stillschweigend vorausgesetzt werden. Man kann sagen. daß die Logik eine Metawissenschaft (siehe unten) ist, welche somit nicht einfach ein Teil einer dieser Einzelwissenschaften sein kann. Mehr an einen Gegenstandsbereich gebunden sind die Regelsysteme der nicht-deduktiven Logik, die sich dementsprechend in eine Vielzahl von Logiken (Plural) aufspalten. Wenn im folgenden ohne Spezifizierung von Logik die Rede ist, ist die deduktive Logik gemeint. Wir werden jedoch an geeigneten Stellen auch auf nicht-deduktive Systeme eingehen; für einen ersten Überblick siehe die Unterabschnitte 0.2.8 und 0.3.2.
0.1
Historisches zum Verhältnis von Logik und Philosophie
Ihr metawissenschaftlicher Charakter rückt die Logik in die Nähe der Philosophie, ohne allerdings dadurch automatisch zu einem Teilgebiet der Philosophie zu werden. Zwar lebt die Philosophie vom (möglichst) zwingenden Argument, aber auch hier sind nicht alle Argumente logisch gültig, und außerdem ist korrektes, nachprüfbares Argumentieren ein Kennzeichen aller wissenschaftlichen Tätigkeit. Dennoch war die Logik in der Geschichte der Wissenschaften traditionell in der Philosophie angesiedelt. In den antiken Wissenschaften schien dies vielleicht noch natürlich, da auch etwa die Physik (paradigmatisch hier die aristotelische Physik) als Naturphilosophie wesentlich von metaphysischem, also philosophischem Gedankengut geprägt war. Die Mathematik dagegen spielte bereits damals eine eigenständige Rolle, und man kann spekulieren, warum die Logik nicht mit der Mathematik zusammenging. Einer der durchaus kontingenten Gründe war sicherlich, daß das erste System der Logik von einem Philosophen, nämlich Aristoteles, entwickelt wurde, der zwar ein überragender Universalgelehrter, am wenigsten aber ein Mathematiker war. Ein mehr sachlicher Grund dürfte darin liegen, daß die Mathematik eines Euklid oder eines Archimedes sich mit Sätzen der Geometrie oder Arithmetik befaßte, und die Beweise solcher Sätze sich auf den mathematischen Inhalt und nicht auf die logische
Historisches
xi
Form der einzelnen Beweisschritte konzentrierte. Die Logik der mathematischen Beweise war vollkommen implizit und wirkte sozusagen “im Hintergrund”; sie fußte auf so etwas wie einer “intuitiven Logik”, welche dem semantischen Wissen der natürlichen Sprache entspringt und als solche nicht eigens thematisiert zu werden brauchte. Daß die in syllogistischen Schlußfiguren formalisierte Logik des Aristoteles ausgerechnet in der Disziplin nicht benötigt wurde, die am meisten dem korrekten Argumentieren verpflichtet ist, warf somit von Anfang an ein zwiespältiges Licht auf jene Logik. Sie war ein an der Grammatik und philosophischer Begrifflichkeit orientierter Kalkül, der zwar im wesentlichen die den Hierarchien solcher Begriffe innewohnende “Logik” beschrieb, aber nur einen kleinen und relativ einfachen Teil der natürlichen Logik der Sprache ausmachte, wie sie bis heute in den Wissenschaften Verwendung findet. Diese Situation bestand im wesentlichen die folgenden 2000 Jahre fort. Die Philosophie des Mittelalters trug eher zu einer Verschärfung des Gegensatzes zwischen natürlicher und formalisierter Logik bei, indem sie zwar eine große Anzahl von Logik-Traktaten hervorbrachte, in diesen sich aber zum Teil in immer subtileren sprachlichen und begrifflichen Spitzfindigkeiten verlor, die außerhalb von Metaphysik und Theologie wenig Bedeutung hatten. Zwar gab es aus heutiger Sicht durchaus Entwicklungen, die als Antizipation moderner LogikSysteme angesehen werden könnten. So hebt der Logik-Historiker Bocheński hervor, daß bereits die Stoiker eine Aussagenlogik im heutigen Sinne entwickelten, oder daß etwa dem Scholastiker Albert von Sachsen die heutige semantische Regel für die Allquantifikation bekannt war ([24]: 24,272). Bocheński schließt daraus, daß trotz der raschen Entwicklung der Logik in 20. Jahrhundert ein Fortschritt gegenüber der traditionellen Logik nicht so klar erkennbar sei. Allerdings verkennt eine solche Betrachtungsweise den diskontinuierlichen Charakter von Ideengeschichte, d.h. die Entstehung von etwas prinzipiell Neuem in einem scheinbar vertrauten Begriffsfeld. Um hier nur das Beispiel von der Wahrheitsregel des Albert von Sachsen aufzugreifen: Liest man nach, so sieht man, daß diese Regel die Verwendungsweise des Ausdrucks ‘jeder ’ betrifft, welche aber wenig Geheimnisvolles in sich birgt, sondern bereits Vorschulkindern zu Gebote steht, da sie mit dem Erlernen der Sprache eingeübt wird, also ein Bestandteil der natürlichen Logik ist. Zu Entwicklung der modernen Konzeption von Quantifikation oder einer Theorie der Semantik etwa im Sinne von Tarski war es dagegen noch ein langer Weg, der vor kaum mehr als 100 Jahren erst seine neue und entscheidende Richtung bekam. Wir kommen ausführlich darauf zurück. Historisch von größerer Bedeutung ist aber, daß auch was die Entwicklung der Wissenschaften betrifft, Neuerungen in der Logik gegenüber dem aristotelischen Paradigma, selbst wenn es sie bei den Stoikern und im Mittelalter bis zu einem gewissen Grad gegeben haben mag, unwirksam blieben. Als Galilei im 17. Jahrhundert die Idee einer mathematischen Physik entwickelte, da kam die Logik in seinem großen Symbol vom Buch der Natur ([86]: 232) nicht vor: die Grammatik des Buchs der Natur ist keine logische, sondern eine mathematische Grammatik, und ihre “Buchstaben” sind laut Galilei Dreiecke, Kreise, und andere geometrische Figuren. Der rein logische Zusammenhalt in den Argumenten dieser neuen Physik wird wiederum von der als schon verstanden vorausgesetzten natürlichen Logik geliefert. Gegen die “Logik der Philosophen” zieht Galilei vielmehr polemisch zu Felde. Zu Beginn seines Dialogs über die Weltsysteme persifliert er den Typ jener unfruchtbaren Argumentationen, der
xii
Einleitung
eineinhalb Jahrhunderte später auch Goethe in der Schülerszene von Faust I noch Anlaß zur Karikatur geben. Galilei läßt dort Simplicio, den Vertreter der aristotelischen Philosophie, folgende Argumente für die Dreidimensionalität des Raumes vorbringen (Simplicio beruft sich auf die Argumente des Aristoteles in der Schrift De Coelo): Was habt Ihr denn an den wunderschönen Beweisen auszusetzen, die im zweiten, dritten und vierten Paragraphen gleich auf die Definition der Stetigkeit folgen? Steht da nicht erstlich, daß es keine anderen als jene drei Ausdehnungen gibt, weil die Drei alles, die Dreiheit allseitig ist? Wird dies nicht durch die Autorität und die Lehre der Pythagoreer bekräftigt, wonach alles durch die Drei, nämlich durch Anfang, Mitte und Ende bestimmt ist, diese also anzusehen ist als die Zahl der Allheit? ... Im dritten [Paragraphen] liest man ad pleniorem scientiam, daß die Begriffe Jedes, All und Vollkommenes begrifflich identisch sind, daß also von den ausgedehnten Größen der Körper allein vollkommen ist, da nur er durch die Drei bestimmt ist, welche welche der Ausdruck der Allheit ist. ... Giebt er sodann für die in Rede stehende Behauptung im vierten Paragraphen, nach einigen anderen Lehrsätzen, nicht noch einen weiteren Grund an? Jeder Fortschritt, sagt er, hat einen bisher vorhandenen Mangel zur Voraussetzung — und daher ist es ein Forschritt, wenn man von der Linie zur Fläche übergeht, da jene der Breite ermangelt — das Vollkommene kann aber nicht mangelhaft sein, da es allseitig ist; man kann also unmöglich von den Körpern zu einem höheren Gebilde fortschreiten. ([87]: 10) Schon Galilei, und nicht erst uns, erschienen alle diese “Argumente” irrelevant. Würde man sich die Mühe machen, die logische Struktur dieser Argumente genauer anzuschauen, so zeigte sich, daß wenig an Schlußfolgerung herauskommt, was nicht schon als metaphysische Prämissen angenommen wird. Mit der Selbstverständlichkeit der aristotelischen Metaphysik war die Überzeugungskraft solcher Argumente dahingeschwunden. Aber diejenigen, die wie Galilei gegen die Erstarrung der Naturphilosophie Stellung bezogen, machten die Logik, die in ihren Diensten stand, mit haftbar. Zu diesem Personenkreis ist auch René Descartes zu zählen, der in vielen Fragen eine geistige Verwandschaft zu Galilei spürte. Obschon Philosoph und Mathematiker, tat er wenig für die Logik und setzte eher den “bon sens” gegen die formalisierte Sophistik der Tradition. Auch Newton, der anläßlich seiner physikalischen Entdeckungen nebenbei den Differentialkalkül zu deren Beschreibung entwickelte, sah trotz der diesem Kalkül innewohnenden logischen Schwierigkeiten keinen Anlaß, auch die vorhandene Logik zu reformieren. Erst Leibniz tat erste Schritte in Richtung auf eine Modernisierung der Logik, allerdings gerade nicht, um sie für die Differentialrechnung nutzbar zu machen. Dort führte er die mysteriösen Infinitesimalia ein, unendlich kleine Größen, deren logischer Status ungeklärt blieb. Russell sagt über Leibniz, daß auch er noch zu stark von der Autorität des Aristoteles beeinflußt war, um der Logik wirklich moderne Impulse geben zu können. Dieses Urteil ist aus heutiger Sicht nicht ganz gerecht, da der Rationalismus eines Leibniz (wie übrigens auch der des Descartes) in den mathematischen Untersuchungen zu einer Algebraisierung und Formalisierung führte, welche dem
Historisches
xiii
“formalen Standpunkt” der modernen Logik mit den Weg bereiteten. Zudem findet sich bei Leibniz die Idee der Übersetzung von verschiedenen Bezeichnungssystemen ineinander und damit einhergehend die Idee der Chiffrierung oder Kodierung; bekannt ist in diesem Zusammenhang seine Entwicklung der Dualzahlen. So erreichen wir denn Kant, der rundweg erklärte, daß die Logik seiner Zeit zwar nicht hinter Aristoteles zurückblieb, aber auch seitdem keine Fortschritte gemacht habe: “Merkwürdig ist noch an ihr, daß sie auch bis jetzt keinen Schritt vorwärts hat tun können, und also allem Ansehen nach geschlossen und vollendet zu sein scheint.” Jedenfalls lehnt Kant “Fortschritte” der folgenden Art ab: Denn, wenn einige Neuere sie dadurch zu erweitern dachten, daß sie teils psychologische Kapitel von den verschiedenen Erkenntniskräften ... teils metaphysische über den Ursprung der Erkenntnis ... teils anthropologische ... hineinschoben, so rührt dieses von ihrer Unkunde der eigentümlichen Natur dieser Wissenschaft her. Es ist nicht Vermehrung, sondern Verunstaltung der Wissenschaften, wenn man ihre Grenzen ineinander laufen läßt[.] ([135]: B viii) Diese Bemerkung Kants hätte man kurze Zeit später durchaus Hegel ins Stammbuch schreiben können, dessen Logik untrennbar mit seiner Metaphysik verwoben ist. Die babylonische Gefangenschaft der Logik durch die Metaphysik hatte ihren Höhepunkt erreicht, aber zugleich war die Zeit reif für einen grundlegenden Wandel im Verständnis von Logik, der sich ein halbes Jahrhundert später dann auch anbahnte.1
0.1.1
Die Erneuerung der Logik im 19. Jahrhundert
Der erste der bekannten Logiker des 19. Jahrhunderts war George Boole, dessen Hauptwerk An Investigation of the Laws of Thought 1854 erschien. Die wesentliche methodische Neuerung liegt in der mathematischen und nicht mehr erkenntnistheoretischen oder metaphysischen Sichtweise, mit der an die Logik herangegangen wird. Inhaltlich werden die Gesetze der Klassenalgebra entwickelt, deren Struktur heute den Namen “Boolesche Algebra” trägt. Formal aber werden diese Gesetze in der Gestalt eines mathematischen Kalküls angegeben und direkt den algebraischen Rechengesetzen der arithmetischen Operationen nachgebildet. In der Algebra z.B. kann man einen gemeinsamen Faktor in einer Summe “ausklammern”, d.h. es gilt das sogenannte Distributivgesetz : (1)
x · y + x · z = x · (y + z)
Die Gesetze des Denkens sind nun insofern “mathematisch”, als die Operation der Multiplikation (der Punkt) genauso gut auch als Durchschnitt zweier Begriffsumfänge gedeutet werden kann (ihr “logisches Produkt”), bei gleichzeitiger Umdeutung der Additionsoperation ‘+’ als Vereinigung der Umfänge (ihre 1 Um einem möglichen Mißverständnis vorzubeugen: Dies sind einige pointierte Bemerkungen zur Geschichte der Logik , die nichts über die Rolle oder den Wert der Metaphysik oder der Philosophie im allgemeinen aussagen. Es muß nicht erwähnt werden, daß es mehr unter der Sonne gibt als Logik. Das Hauptthema ist hier aber die Logik, und die Philosophie kommt nur insoweit ins Blickfeld, als ihre Erkenntnisse sich direkt aus logischen Quellen speisen.
xiv
Einleitung
“logische Summe”); dann bleibt das Gesetz (1) gültig. Völlig strukturgleich ist auch die Logik der Aussagen: wenn x, y und z für irgendwelche Aussagen stehen und ‘·’ als ‘und ’ sowie ‘+’ als ‘oder ’ gedeutet wird, dann gilt das Gesetz ebenfalls, mit ‘=’ im Sinn von ‘ist gleichbedeutend mit’. Nehmen wir etwa in unserem obigen Beispiel mit den Alpenpässen noch einen dritten Übergang nach Italien, etwa den Plöckenpaß, hinzu, und lassen x für “der Brennerpaß ist offen” stehen, y für “der Reschenpaß ist offen”, und z für “der Plöckenpaß ist offen”; dann gilt offenbar: (2)
a. b. c.
x · y + x · z = x · (y + z)
[x und y, oder x und z] ist gleichbedeutend mit [x und (entweder y oder z)]
(Die Aussage) [der Brennerpaß ist offen und der Reschenpaß ist offen, oder der Brennerpaß ist offen und der Plöckenpaß ist offen] ist gleichbedeutend mit (der Aussage) [der Brennerpaß ist offen, und (entweder ist der Reschenpaß offen oder der Plöckenpaß ist offen)]
Für die Logik gelten also algebraische Gesetze. Diese Ähnlichkeit hatte übrigens schon Leibniz festgestellt und entsprechende Gesetze für eine Begriffshierarchie formuliert. Natürlich kann das Plus der Addition nicht in allen Gleichungen als Vereinigung von Begriffen gedeutet werden; z.B. ist x + x = 2x, während die logische Summe eines Begriffsumfangs mit sich selbst wieder er selbst ist, formal also x + x = x. Die arithmetische Struktur und die Boolesche Algebra sind damit zwar verschiedene Strukturen, aber es sind beides algebraische, also mathematische Strukturen; das aber wollte Boole zeigen. Abgesehen von der Betonung des mathematischen Charakters der Logik blieb Boole jedoch weitgehend im Rahmen der Tradition, und Bocheński reklamiert mit einem gewissen Recht die Entdeckung mancher Booleschen Gesetze für die Scholastik oder sogar die Spätantike. Allerdings ist hier dennoch ein modernes Element zu beobachten: der schematische Charakter dieser Gesetze (für sich genommen noch nichts Neues; auch Aristoteles benutzte bereits Buchstabensymbole) und ihre mehrfache Deutbarkeit. Ein und dieselbe Form läßt mehrere Deutungen in verschiedenartigen Bereichen zu. Das Plus der arithmetischen Addition kann (unter Änderung gewisser Gesetze) uminterpretiert werden als logische Summe oder Vereinigung. Die Idee der Umdeutung symbolischer Formen ist ein wichtiger Bestandteil formalen Denkens. Es bedurfte jedoch einer anderen Entwicklungslinie, um das konzeptuelle Umfeld zu schaffen, in dem sich das radikal Neue der modernen Logik entfalten konnte. Diese Entwicklungslinie ergab sich daraus, daß am Ausgang des 18. Jahrhunderts vermehrt Diskussionen um die Grundlagen der Mathematik geführt wurden. Es seien hier zwei Problemkreise angesprochen: (i) die Frage nach den Axiomen der Geometrie und die Endeckung nicht-euklidischer Geometrien; (ii) die Frage der Reduktion der Zahlensysteme. Bekanntlich wurde die Geometrie von Euklid begründet. Euklid wählte einen axiomatischen Ansatz , der das historische Vorbild aller späteren Axiomensysteme bildete. Eines der Axiome, die Euklid verwendete, ist das berühmte Parallelenpostulat, das in moderner Formulierung lautet: Zu einer gegebenen Gerade g und einem Punkt P außerhalb von g gibt es (in der durch g und P
Historisches
xv
bestimmten Ebene) höchstens eine Gerade durch P , welche g nicht schneidet. In der genannten Zeit unternahm man nun zahlreiche und intensive Versuche, das Parallelenpostulat aus den anderen Axiomen der Geometrie zu beweisen; sie waren jedoch alle vergeblich. Diese Beweisversuche als Trugschlüsse nachzuweisen, erforderte logische Genauigkeit. Ein Mathematiker namens Klügel z.B. widerlegte in einer Schrift um 1800 nicht weniger als 30 solcher Versuche. Interessant ist seine Schlußfolgerung: “Daß das Parallelenaxiom erfüllt ist, wissen wir nicht infolge strenger Schlüsse oder vermöge deutlicher Begriffe von der geraden oder krummen Linie, vielmehr durch Erfahrung und das Urteil unserer Augen.” 2 Das heißt, daß die Mathematik sich hier nicht auf Beweise stützen kann, sondern sich auf die Anschauung verlassen muß. In moderner Sprechweise kann man dies so umformulieren, daß jenes Axiom auf jeden Fall mit den anderen euklidischen Axiomen verträglich ist, da die anschauliche Geometrie der Ebene zusammen mit den übrigen Axiomen auch das Parallelenpostulat erfüllt (sie ist ein Modell für diese Axiome). Verträglichkeit oder relative Konsistenz ist aber eine logische Eigenschaft, die entscheidend schwächer ist als Beweisbarkeit; sie läßt nämlich die Möglichkeit offen, daß auch das Gegenteil, d.h. die Negation, des Postulats mit den anderen Axiomen verträglich ist. Nicht-euklidische Geometrien sind genau von dieser Art: sie sind Modelle der Kernaxiome, die zugleich das Parallelenaxiom falsch machen. Zu Beginn des 19. Jahrhunderts wurden solche Geometrien gefunden. Sie beruhen auf einer radikalen Uminterpretation der anschaulichen Bedeutung geometrischer Begriffe. Dennoch kann man sich auch diese Geometrien veranschaulichen, indem man ihre Axiome mit Hilfe der derart umgedeuteten Begriffe in der klassischen ebenen Geometrie darstellt. Wiederum modern gesprochen, interpretiert man die nicht-euklidische Geometrie in der euklidischen Geometrie. Dieses Verfahren der Interpretation einer Theorie in einer anderen ist ein wesentlicher Bestandteil der modernen Logik und Wissenschaftstheorie und besitzt ebenfalls eine große philosophische Bedeutung: man kann eine Theorie mit Hilfe einer anderen, etwa schon bekannten Theorie durch eine derartige Interpretation “besser verstehen”. Diese Methodologie liegt etwa Versuchen zugrunde, eine Theorie des Geistes durch Interpretation in einer physikalistischen Theorie verstehbar zu machen; ob so etwas gelingen kann, ist eine der meistdiskutierten philosophischen Fragen der Gegenwart. Im Fall der Geometrie kann man das Verfahren der Interpretation etwa durch das sogenannte Kleinsche Modell der hyperbolischen Geometrie innerhalb einer euklidischen Ebene illustrieren: in diesem Modell zählen nur die Punkte innerhalb eines gegebenen Kreises als “Punkte” im Sinne der hyperbolischen Geometrie, und ihre “Geraden” sind alle Sekanten des Kreises, jedoch ohne die Schnittpunkte mit der Kreislinie.3 Dann zeigt das folgende Bild, daß es zu einer “Geraden” g und einem nicht auf ihr liegenden “Punkt” P mehr als eine “Gerade”, z.B. g1 und g2 , gibt, die g nicht schneidet. Was uns hier bereits begegnet, ist wie schon im Fall der Umdeutung des Additionssymbols der formale Standpunkt der modernen Logik. Wenn es um die Gültigkeit von Argumenten geht, ist er auch in der Philosophie von großem Nutzen. In einem philosophischen Argument kann er etwa dazu beitragen, implizite Annahmen, die ein Autor möglicherweise für evident hält und daher gar nicht erwähnt, aufzudecken und zu beurteilen. Nichts anderes ging in der Diskussion 2 Zitiert 3 Das
nach [143]: 274. Kleinsche Modell wird manchmal auch als “Bierdeckelgeometrie” bezeichnet.
xvi
Einleitung
g1
P
g2 g
Abbildung 1: Kleinsches Modell der hyperbolischen Geometrie
der Mathematiker um das Parallelenpostulat vonstatten. Der andere Fragenkomplex in der Mathematik des 19. Jahrhunderts, der für die Entwicklung der Logik von Bedeutung war, betraf das Verhältnis der verschiedenen Zahlensysteme zueinander. Bereits in der Antike setzte man die natürlichen Zahlen, die die Grundlage aller Zahlensysteme bilden, in Beziehung zu den rationalen Zahlen, welche nichts anderes sind als Verhältnisse von natürlichen Zahlen; sie spielten z.B. in der Harmonielehre der Pythagoreer eine große Rolle. Ebenfalls in der Antike stieß man auf die “inkommensurablen” Größen, die nicht als Verhältnisse von ganzen Zahlen darstellbar sind. √ Die wichtigsten Beispiele sind die Diagonale des Einheitsquadrats, deren Länge 2 beträgt, und der Flächeninhalt des Einheitskreises mit dem Wert π. Dies sind zwei Beispiele für irrationale Zahlen, die nur durch Näherung aus rationalen Zahlen gewonnen werden können. Die reellen Zahlen sind dann einfach die rationalen und die irrationalen Zahlen zusammengenommen. Damit waren bereits die wichtigsten Bestandteile einer schrittweisen Reduktion aller Zahlenarten auf die natürlichen Zahlen gegeben. Ein weiteres Ingredienz sind die negativen Zahlen, die im Vergleich mit den inkommensurablen Größen eigentlich keine besonderen begrifflichen Schwierigkeiten bieten, aber interessanterweise im antiken Griechenland, anders als in China und Indien, nicht entwickelt wurden. Sie bilden mit den natürlichen Zahlen das System der ganzen Zahlen und damit die Basis für die volle reelle Zahlenachse, die von Null aus nicht nur nach +∞, sondern auch, an der Null gespiegelt, nach −∞ reicht. Im 16. Jahrhundert schließlich traten noch die imaginären Zahlen hinzu; sie ergaben sich aus der Fragestellung, die Wurzel aus negativen Zahlen zu ziehen. Imaginäre Zahlen wurden zunächst nicht als Zahlobjekte, sondern als reine Symbole betrachtet, mit denen man Rechenmanipulationen durchführen konnte, welche der Arithmetik der reellen Zahlen eine größere formale Geschlossenheit verliehen. Die Erweiterung der Arithmetik um die imaginären Zahlen führte zu dem einheitlichen Begriff der komplexen Zahlen, die Summen der Gestalt x + √iy aus einem “Realteil” x und einem “Imaginärteil” y darstellen, wobei i = −1 das imaginäre Grundelement ist. Mit Gauß setzte sich dann die Interpretation der komplexen Zahlen als Punkte in der Ebene durch (Gaußsche Zahlenebene). Analytisch gesehen sind komplexe
Historisches
xvii
Zahlen damit nichts anderes als geordnete Paare von reellen Zahlen. Das Ergebnis dieser sukzessiven Rückführung der genannten Zahlensysteme auf die nächsteinfacheren war, daß man sie in eine Kette von Reduktionsbeziehungen anordnen konnte, an deren Ende die natürlichen Zahlen stehen: komplexe Zahlen → reelle Zahlen → rationale Zahlen → ganze Zahlen → natürliche Zahlen. Dies gab Gottlob Frege die Idee, eine Begründung der gesamten Mathematik auf rein logischer Basis zu versuchen. Die natürlichen Zahlen einschließlich der Null können nämlich als das aufgefaßt werden, was allen Begriffen gemein ist, welche die entsprechende Anzahl von Objekten subsumieren, wobei das Gemeinsame, etwa die Zahl n, durch den Begriff “zweiter Stufe” ausgedrückt wird, unter genau diejenigen Begriffe zu fallen, die gerade n Objekte subsumieren. Bezeichnen wir für den Augenblick einen Begriff mit dem Kunstwort n-mächtig,4 wenn er genau n Objekte subsumiert, so wäre danach zum Beispiel die Zahl 3 nichts anderes als der Begriff zweiter Stufe, auf drei-mächtige Begriffe zuzutreffen. Die Zahl Null ist dann der zweitstufige Begriff, auf null-mächtige oder leere Begriffe zuzutreffen, die gar keine Objekte subsumieren. Begriffe aber sind nach Frege etwas Logisches, und über diese Brücke wäre die Reduktion auf die Logik erreicht. Ein ähnliches Programm wurde von Bertrand Russell verfolgt; beide Programme tragen den Namen Logizismus. Der Logizismus ist philosophisch von Bedeutung, weil auf diese Weise die Mathematik denselben erkenntnistheoretischen Status wie die reine Logik erhält und somit neues Licht auf die Behauptung von Kant geworfen wird, die Sätze der Mathematik seien zwar a priori, d.h. nicht empirisch gewonnen, aber dennoch nicht analytisch, d.h. durch reine Begriffsanalyse herzuleiten. Wegen des überragenden Einflusses von Kant war und ist diese Frage von großem philosophischen Interesse. Der Logizismus wird heute zwar allgemein für falsch gehalten, ist aber in “logisch geläuterter Form” immer noch ein wichtiges Thema der Philosophie der Mathematik. Bevor Frege sein Programm in Angriff nehmen konnte, galt es jedoch, die Wissenschaft von der Logik zu modernisieren, um sie den Anforderungen anzupassen, die die Mathematik stellte. Die Logik der Aussagen, d.h. die Logik der Satzverknüpfungen wie ‘es ist nicht der Fall ’, ‘und ’, ‘oder ’, ‘wenn – dann’ lag zwar im wesentlichen vor, obwohl die logische Bedeutung von wenn-dann-Sätzen ein notorisches Problem darstellte; das alles entscheidende Mittel zur logischen Analyse mathematischer Aussagen ist aber die Quantifikation, d.h. die Verwendung und das Zusammenwirken von Quantorenausdrücken wie ‘alle’, ‘keiner ’, ‘mindestens einer ’. Auch diese Ausdrücke waren für sich genommen nichts Neues; in ihrer Grundverwendung bilden sie das Kernstück der aristotelischen Syllogistik. Allerdings entwickeln quantifizierte Aussagen ihre bis dahin unbeachtete logische Komplexität durch die Möglichkeit der Schachtelung mehrerer Quantorenausdrücke ineinander. Ein Beispiel aus der Mathematik der Grenzübergänge (Limesbildung), die im 19. Jahrhundert durch Cauchy und Weierstraß auf eine präzise Grundlage gestellt worden war, möge dies illustrieren. Beispiel 0.1 Zwei Begriffe von Konvergenz für reelle Funktionen. Man betrachte eine Schar oder Folge von reellen Funktionen f1 , f2 , f3 , . . . , fn , . . ., die gegen eine Funktion f als Grenzwert konvergieren. Dieser Konvergenzbegriff für 4 Es
gibt jedoch den Begriff gleichmächtig, der ein zentraler Terminus der Mengenlehre ist.
xviii
Einleitung
Funktionen ist erklärt mit Hilfe der Konvergenz für Punktefolgen, und zwar der Konvergenz der Folgen der Funktionswerte f1 (x), f2 (x), f3 (x), . . . , fn (x), . . . gegen den Grenzwert f (x) für die verschiedenen Argumente x. Eine solche Folge (fn (x)) konvergiert gegen f (x), wenn für jede noch so kleine reelle Zahl > 0 eine natürliche Zahl n existiert, so daß für alle m > n der Abstand zwischen f (x) und fm (x) kleiner als ist. Man sagt nun, daß die Folge (fn ) gegen f “punktweise” konvergiert, wenn für alle x die genannte Bedingung erfüllt ist, m.a.W. wenn (i) für alle x und für alle > 0 es ein n gibt, so daß für alle m > n der Abstand zwischen f (x) und fm (x) kleiner als ist. Schaut man diese Bedingung an, so sieht man, daß hier nicht weniger als vier Quantorenausdrücke ineinandergeschachtelt sind, und zwar in der Reihenfolge für alle – für alle – es gibt – für alle. Wird nun diese Reihenfolge verändert, z.B. dadurch, daß der Quantorenausdruck ‘für alle x’ von der ersten an die dritte Stelle gerückt wird, so nimmt die Bedingung (i) eine völlig andere Bedeutung an. Man definiert, daß die Folge (fn ) gegen f “gleichmäßig” konvergiert, wenn (ii) für alle > 0 es ein n gibt, so daß für alle x und für alle m > n der Abstand zwischen f (x) und fm (x) kleiner als ist. Nur im zweiten Fall der gleichmäßigen Konvergenz ist garantiert, daß die Graphen der Funktionen fn ab einem hinreichend großen n einen engen “Hof” um die Grenzfunktion f bilden; im ersten Fall dagegen hängt der Grad der Annäherung von dem gewählten Punkt x ab, und der genannte Effekt stellt sich nicht notwendig ein. Der mathematische Grenzwertbegriff verändert also seine Bedeutung mit der Anordnung der Quantorenausdrücke, mit deren Hilfe er definiert ist. Der mathematische Inhalt ist von der Logik wesentich mitbestimmt.
Für die logische Analyse derartiger Aussagen, wie sie nun in der Mathematik verwendet wurden, war die traditionelle Syllogistik nicht entwickelt worden; sie konnte sie auch nicht im Ansatz angemessen wiedergeben. Der Grund dafür ist darin zu suchen, daß die Syllogistik ein Kalkül nur für die einfachsten Beziehungen zwischen Begriffen war, dessen Ausdruckskraft in zweierlei Hinsicht begrenzt ist: die Schachtelung von Quantoren blieb unberücksichtigt, und es wurden keine relationalen Begriffe betrachtet. Diese beiden wesentlichen Komponenten der modernen Logik wurden erst in der Prädikatenlogik einer formalen Behandlung zugeführt, und ihr Begründer war Frege. Um dieses Ziel zu erreichen, setzte Frege einen deutlichen Schnitt zwischen der grammatischen Struktur von quantifizierenden Sätzen der Umgangssprache und ihrer logischen Struktur. Betrachten wir den Satz (3)
Ein Student löste alle Aufgaben.
Dies ist ein einfacher Satz mit Subjekt und Objekt, die durch das transitive Verb ‘löste’ verbunden sind. Die Subjekt- und die Objekt-Konstituente, d.h. ‘ein Student’ bzw. ‘alle Aufgaben’, sind aber nur grammatische Einheiten, keine logischen Einheiten. Um die logische Struktur des Satzes zum Vorschein zu bringen, müssen diese Konstituenten zerlegt werden. Die folgenden Paraphrasen sind Annäherungen an die logische Struktur: (4)
a.
Es gibt einen Studenten, der alle Aufgaben löste.
b.
Es gibt ein x so daß x ein Student ist und für alle y gilt: wenn y eine Aufgabe ist, dann löste x y.
Werden in (4b) die deutschen Ausdrücke durch geeignete logische Symbole ersetzt, so erhält man die logische Form des Satzes (3). Derartige logische Formen
xix
Historisches
Alle P sind Q
Kein P ist Q
kt di ch
is or
ko nt r
subaltern
kt
a-
i ad
r nt ko
subaltern
or is
ch
konträr
subkonträr Ein P ist Q
Nicht alle P sind Q
Abbildung 2: Das aristotelische Quadrat der Oppositionen
entwickelt Frege nach dem Vorbild mathematischer Aussagen; so liefert dasselbe Schema die logische Form (5b) für den folgenden mathematischen Satz (5a): (5)
a.
Jede positive reelle Zahl besitzt eine reelle Wurzel.
b.
Für alle x gilt: wenn x eine positive reelle Zahl ist, dann gibt es ein y so daß y reell ist und y die Wurzel von x ist.
Gegenüber dem vorigen Beispiel treten hier die Quantorenausdrücke ‘alle’ und ‘ein’ in umgekehrter Reihenfolge auf, mit entsprechend vertauschter logischer Abhängigkeit, doch ist die Struktur der Bildung solcher logischen Formen die gleiche. Derartige logische Formen wirken umständlich, aber sie lassen sich aus wenigen immer gleichen Grundelementen aufbauen und machen die relative Anordnung der logischen Ausdrücke deutlich. Diese Grundelemente sind Darstellungen der beiden genannten Quantorenausdrücke ‘alle’ und ‘ein’, ergänzt durch ihre Negationen ‘nicht alle’ und ‘kein’. Mit ihnen ergeben sich vier Grundtypen von Quantorenphrasen, wie sie auch bereits im sogenannten aristotelischen Quadrat der Oppositionen auftreten; siehe Abbildung 2. Die prädikatenlogische Darstellung der Quantorenausdrücke erlaubt jedoch ihre beliebige Schachtelung, so daß auch so komplexe Aussagen wie etwa die obige Definition der Konvergenz von Funktionenfolgen ausgedrückbar sind. Wenn wir das klassische Beispiel ‘alle Menschen sind sterblich’ variieren, dann lauten die vier Darstellungen wie in (6a–d). Dabei ist jeweils unter dem umgangssprachlichen Satz eine “Explizitfassung” EF angeben, die die logische Struktur klarer hervorhebt, und darunter im Vorgriff auf später die logische Form LF, mit ‘∀’ für ‘für alle’, ‘∃’ für ‘es gibt’, ‘¬’ für ‘es ist nicht der Fall, daß ’, ‘∧’ für
xx
Einleitung
‘und ’, ‘→’ für ‘wenn–dann’, ‘P (x)’ für ‘x ist ein Mensch’, und ‘Q(x)’ für ‘x ist sterblich’. (6)
a.
b.
c.
d.
alle: alle Menschen sind sterblich EF: für alle x gilt: wenn x ein Mensch ist, dann ist x sterblich. LF: ∀x(P (x) → Q(x))
nicht alle: nicht alle Menschen sind sterblich EF: es ist nicht der Fall, daß für alle x gilt: wenn x ein Mensch ist, dann ist x sterblich. LF: ¬∀x(P (x) → Q(x))
ein: ein Mensch ist sterblich EF: es gibt ein x so daß x ein Mensch ist und x sterblich ist. LF: ∃x(P (x) ∧ Q(x))
kein: kein Mensch ist sterblich EF: es ist nicht der Fall, daß es ein x gibt so daß x ein Mensch ist und x sterblich ist. LF: ¬∃x(P (x) ∧ Q(x))
Die Grundidee ist dabei, daß der Allausdruck ‘alle Menschen’ zerlegt wird in eine Kombination aus einer Allquantifikation (‘für alle x gilt’) und einer wenndann-Verknüpfung; der Existenzausdruck ‘ein Mensch’ dagegen wird zu einer Kombination aus einer Existenzquantifikation (‘es gibt ein x’) und einer und Verknüpfung. Variablensymbole wie ‘x’ werden eingeführt, um bei der Schachtelung von Quantorenausdrücken Übersicht über die zusammengehörenden Bestandteile zu behalten. Frege führt eine zweite Reform nach dem Muster der Mathematik durch: er faßt die logische Beziehung der elementaren Prädikation als Anwendung einer Funktion auf ein Argument auf. Zum Beispiel sagt oder “prädiziert” der Satz ‘Sokrates ist sterblich’ von Sokrates, daß er sterblich ist; seine logische Form hat dann die Gestalt f (x), wobei das Symbol f für die “Aussagenfunktion” genannte Form ‘. . . ist sterblich’ steht, welche auf das “Argument” ‘Sokrates’ angewendet wird und eine Aussage liefert. Ebenso werden intransitive Verben wie ‘schlafen’ als derartige (einstellige) Aussagenfunktionen dargestellt, während transitive Verben wie ‘lösen’ im obigen Beispiel zweistellige Funktionen sind: steht g für die Aussagenfunktion ‘. . . löst − − −’, x für eine Person und y für eine Aufgabe, so bedeutet g(x, y), daß g auf die Argumente x und y angewendet oder von ihnen prädiziert wird. Frege spricht auch von der “Sättigung” der mit drei Punkten bzw. Strichen markierten Leerstellen durch ein oder mehrere Objekte je nach Stelligkeit der Aussagenfunktion. Auf diese Weise führt Frege Logik und Mathematik zusammen und legt den Grundstein für die Mathematisierung der Logik . Entsprechend lautet der programmatische Titel seiner ersten großen Arbeit von 1879, in dem diese Ideen entwickelt werden: Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens [73]. Nachdem auf diese Weise eine formale Sprache geschaffen war, die die Formalisierung beliebig komplexer quantifizierter Aussagen gestattete, konnte das Programm der Grundlegung der Mathematik in Angriff genommen werden. Dazu galt es, die Gesetze der Logik nach dem Vorbild der axiomatischen Methode in der Geometrie in ein axiomatisches System zu fassen. Ein solches System
Historisches
xxi
besteht aus einer möglichst kleinen Anzahl von Grundgesetzen oder Axiomen, aus denen mit Hilfe einiger weniger Schlußregeln alle logischen Gesetze abgeleitet werden können. In der Begriffsschrift findet sich ein erstes solches System. In seinem Hauptwerk, Grundgesetze der Arithmetik. Begriffsschriftlich abgeleitet [77] unternimmt Frege dann den Versuch, die Arithmetik der natürlichen Zahlen aus der reinen Logik herzuleiten und damit das logizistische Programm zu realisieren. Die Rezeption der Fregeschen Schriften blieb trotz ihrer Bedeutung durch zwei Faktoren beschränkt. Zunächst war die formale Sprache der Begriffsschrift ein “zweidimensionaler” Symbolismus, der bereits bei Aussagen von nur mäßiger Komplexität kaum zu lesen war und damit durchaus abschreckend wirkte. Der zweite Grund war ein wissenschaftssoziologischer: Als formal arbeitender Philosoph saß er zwischen den Stühlen der Philosophengemeinde auf der einen und der Mathematikergemeinde auf der anderen Seite. Dementsprechend äußert er sich in der Einleitung der Grundgesetze von 1893 sehr pessimistisch über die mögliche Leserschaft des Buchs: “Jedenfalls müssen alle Mathematiker aufgegeben werden, die beim Aufstossen von logischen Ausdrücken wie ‘Begriff’, ‘Beziehung’, ‘Urtheil’ denken: metaphysica sunt, non leguntur! und ebenso die Philosophen, die beim Anblick einer Formel ausrufen: mathematica sunt, non leguntur! ” ([77], Bd. I: xii)5 Erfolgreicher als Frege war der italienische Mathematiker Guiseppe Peano, der zur gleichen Zeit einen logischen Symbolismus entwickelte, welcher sowohl von dem Philosophen Russell als auch von den an Grundlagenfragen arbeitenden Mathematikern übernommen wurde. Das charakteristische Quantorensymbol für den Existenzquantor, ‘∃’, geht z.B. auf Peano zurück. Wichtiger aber ist Peanos Formulierung der nach ihm benannten Axiome der Arithmetik ; sie sind bis heute im Gebrauch. Für Bertrand Russell war die Begegnung mit Peano auf dem Pariser Philosophenkongress im Jahr 1900 ein regelrechtes Erweckungserlebnis. In seiner Autobiographie beschreibt er das so: Der Kongreß war ein Wendepunkt in meinem intellektuellen Leben, weil ich dort Peano kennenlernte. Ich kannte ihn vorher schon vom Namen und hatte auch einige seiner Arbeiten gesehen, aber mir nicht die Mühe gemacht, seine Notation zu verstehen. Bei den Diskussionen auf dem Kongreß stellte ich fest, daß er stets präziser war als alle anderen, und daß er unweigerlich bei allen Disputen, auf die er sich einließ, die Oberhand behielt. Als die Tage verstrichen, gewann ich die Überzeugung, daß er dies seiner mathematischen Logik verdanke. Also bat ich ihn, mir alle seine Schriften zu geben. ... Mir wurde klar, daß sein Formalismus ein Instrument zur logischen Analyse lieferte, nach dem ich jahrelang gesucht hatte, und daß ich durch das Studium seiner Werke neue und machtvolle Techniken für schon lange geplante Arbeiten an die Hand bekam. ([218]: 147; Übersetzung G.L.) 5 Es ist eine interessante historische Tatsache, daß dieses Spannungverhältnis, zumindest was den mainstream sowohl auf der Seite der Philosophie wie der Mathematik betrifft, bis heute fortbesteht. Allerdings hat sich mit der analytischen Philosophie eine Tradition herausgebildet, die die Kluft zwischen den formalen Wissenschaften und der Philosophie zu überbrücken trachtet.
xxii
Einleitung
Dementsprechend fanden Peanos Formalismus und seine Methoden Eingang in Russells Schriften, vor allem in sein logisches Hauptwerk, die Principia Mathematica [262], die er zusammen mit Alfred Whitehead verfaßte. Bevor gesagt werden kann, worum es in diesem einflußreichen dreibändigen Werk ging, muß ein weiterer Entwicklungsstrang der modernen Logik erwähnt werden: die Mengenlehre.
0.1.2
Cantors Mengenlehre
Die Mengenlehre ist heute auch Nicht-Spezialisten bekannt, weil sie die Gestalt der Mathematik des 20. Jahrhunderts entscheidend prägte. Sie faßte die verschiedenen Disziplinen der Mathematik in einer einheitlichen Rahmentheorie zusammen und ist heute eine lingua franca für alle mit formalen Methoden arbeitenden Wissenschaften. Im 19. Jahrhundert jedoch war die mengentheoretische Begriffsbildung auch in der Mathematik so neu und ungewohnt, daß der Begründer der Mengenlehre, der Mathematiker Georg Cantor, selbst in seiner eigenen Zunft ins Abseits geriet. Die Objekte der Mathematik waren nach der Auffassung der meisten Mathematiker Zahlen und Funktionen, während Mengen für zu abstrakt und teilweise für widersprüchlich gehalten wurden. Die weithin bekannte Begriffsbestimmung der Mengen, die Cantor gab, lautet wie folgt: (7)
Unter einer “Menge” verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unsrer Anschauung oder unseres Denkens (welche die “Elemente” von M genannt werden) zu einem Ganzen. ([36]: 282)
Für die Beziehung der Elementschaft hat sich die bekannte Epsilon-Notation (8a) eingebürgert, zu lesen wie unter (8b): (8)
a. b.
m∈M
m ist ein Element von M
Jede derartige Zusammenfassung zu einem Ganzen, von dem Cantor spricht, benötigt ein Kriterium, das über die Mitgliedschaft in einer Menge entscheidet. Da die Cantorsche Bestimmung keinerlei Einschränkungen für ein solches Kriterium enthält, könnte man allgemein sagen, daß jede beliebige Eigenschaft von Objekten unserer Anschauung oder unseres Denkens zu einer Menge führt, und zwar gerade zu der Menge derjenigen Objekte, die diese Eigenschaft erfüllen. Cantor benutzte als Notation für Mengen geschweifte Klammern, die bis heute üblich sind: wenn das Symbol Φ für die gegebene Eigenschaft steht, so bezeichnen wir die Menge derjenigen Objekte x, die die Eigenschaft Φ besitzen, mit (9)
{ x | Φ[x] }
Man kann dann aus der Cantorschen Bestimmung das folgende allgemeine Prinzip für die Zugehörigkeit zu einer Menge der Gestalt (9) gewinnen: (10)
y ∈ { x | Φ[x] }
genau dann, wenn
y die Eigenschaft Φ hat
Historisches
xxiii
Das lateinische Wort für ‘zusammenfassen’ ist comprehendere, und so wird diese Bestimmung das Cantorsche Komprehensionsprinzip für Mengen genannt.6 Man spricht heute auch von einem “naiven” Komprehensionsprinzip, weil man es nicht ganz wörtlich nehmen kann, wie wir unten sehen werden. Beispiele für Mengen in der Mathematik sind natürlich in erster Linie die Zahlensysteme; natürliche oder reelle Zahlen sind “wohlunterschiedene” Objekte unseres Denkens, und also kann man die Menge der natürlichen Zahlen und die Menge der reellen Zahlen bilden. Beide Mengen sind unendliche Mengen; ihre aktuale Existenz nahm Cantor ohne Umschweife an und stellte sich damit gegen die traditionelle philosophische Auffassung von Unendlichkeit als etwas, was niemals in Wirklichkeit, sondern stets nur in seiner “Potentialität” gegeben ist. Diese Auffassung des potentiell Unendlichen, die auf Aristoteles zurückgeht, wurde auch von Mathematikern bis hin zu Gauß geteilt. Der Begriff des Aktual-Unendlichen erlaubte es Cantor jedoch, das Unendliche als einen Bereich aufzufassen, der der mathematischen Erforschung zugänglich ist, während die alte Auffassung das Unendliche vorwiegend entweder als etwas Negatives begriff, über das man wenig mehr sagen konnte, als daß es nicht endlich sei, oder aber es mit metaphysischen Begriffen wie Gott oder dem Absoluten identifizierte, dem unser endlicher Verstand nicht beikommen kann. Der Grundstein für die Strukturierung des Unendlichen wurde durch die Entdeckung Cantors gelegt, daß nach Festlegung eines geeigneten Größenbegriffs für unendliche Mengen (dem der Mächtigkeit) sich unendliche Mengen verschiedener Mächtigkeit ergeben. Während die Menge der natürlichen Zahlen die kleinste unendliche Mächtigkeit repräsentiert, besitzt die Menge der reellen Zahlen eine höhere Mächtigkeit; dies fand Cantor mit Hilfe seines berühmten Diagonalverfahrens heraus. Es zeigte sich schnell, daß es sogar unendlich viele verschiedene Mächtigkeiten gibt. Dazu betrachtete Cantor zu einer unendlichen Menge die Menge aller ihrer Teilmengen, Potenzmenge genannt; er bewies, daß die Potenzmenge eine höhere Mächtigkeit als die Ausgangsmenge haben muß. Ferner zeigte er, daß die Potenzmenge der Menge der natürlichen Zahlen dieselbe Mächtigkeit wie die der reellen Zahlen besitzt. Mächtigkeiten bezeichnete Cantor mit dem ersten Buchstaben des hebräischen Alphabets, Aleph: ℵ; die kleinste unendliche Mächtigkeit, also die der natürlichen Zahlen, nannte er ℵ0 . Er stellte sodann die einfache Frage, ob die Mächtigkeit der reellen Zahlen, da sie nicht gleich ℵ0 sein konnte, vielleicht die nächsthöhere Mächtigkeit ℵ1 sei, und vermutete, daß sich dies auch so verhält. Da die reellen Zahlen kollektiv auch das “Kontinuum” genannt werden, heißt diese Vermutung die Kontinuumhypothese, kurz CH . Cantor mußte einsehen, daß er keine Möglichkeit hatte, diese Vermutung zu beweisen, was er als schweren Schlag für das sonst so elegante und erfolgreiche mengentheoretische Programm ansah. Das Kontinuumproblem erlangte in der Folgezeit eine außerordentliche Berühmtheit. David Hilbert nannte es auf dem Pariser Mathematikerkongreß im Jahre 1900, dem weltweite Beachtung zuteil war, als erstes in einer Reihe von über zwanzig ungelösten Problemen der Mathematik. Erst Jahrzehnte später begriff man die besondere Natur dieses Problems: es verhielt sich nämlich zu den bis dahin kodifizierten Axiomen der Mengenlehre genauso wie das Parallelenpostulat zu den anderen Axiomen der euklidischen Geometrie. Man kann weder die 6 Diese Bezeichnung ist historisch nicht ganz korrekt, da sich ein solches Prinzip nicht bei Cantor findet und auch dem Geist seiner Mengenauffassung zuwiderläuft, wie etwa S. Lavine [154] argumentiert.
xxiv
Einleitung
Kontinuumhypothese noch ihre Negation aus den Axiomen beweisen; sie ist von diesen unabhängig. Bevor dieser Nachweis im Jahre 1963 schließlich gelang, hatte sich die mathematische Logik zu einer Wissenschaft von beträchtlicher Reife und Subtilität entwickelt. Das Kontinuumproblem warf zugleich tiefe philosophische Fragen zur Realität und zum Charakter des Universums aller Mengen auf: ist in diesem Universum die Kontinuumhypothese wahr oder falsch, oder gibt der Begriff der absoluten Wahrheit in der Mathematik möglicherweise gar keinen Sinn? Während Cantor mit dem Kontinuumproblem rang und über andere scheinbare Ungereimtheiten seiner Mengenlehre mit den traditionellen Mathematikern Dispute führte, entwickelte sich eher am Rande eine Problematik, die nun geradewegs eine Krise der Grundlagen der Mathematik herbeiführte. Cantor selbst hatte bereits gemerkt, daß er bei der Mengenbildung eine gewisse Vorsicht walten lassen mußte: die Annahme einer Menge aller Mengen etwa führt zu der Konsequenz, daß es eine echt größere Potenzmenge von ihr geben muß, sie damit aber entgegen ihrer Definition nicht alle Mengen enthält. Cantor sah dies jedoch als ein von der mathematischen Praxis weit entferntes und isoliertes Grenzproblem an. Es war nun Russell, der im Mai 1901 die Entdeckung machte, daß das oben erwähnte Komprehensionsprinzip ohne geeignete Beschränkungen nicht aufrecht erhalten werden kann. Von der Beobachtung ausgehend, daß im üblichen Mengenverständnis eine Menge nicht ein Element von sich selbst ist, isolierte Russell die Eigenschaft (11)
Φ[x]:
x ist kein Element von sich;
kurz:
x 6∈ x
Der Versuch, die Menge aller Mengen zu bilden, die sich selbst nicht als Element enthalten: (12)
{ x | x 6∈ x },
führt jetzt zusammen mit dem Komprehensionsprinzip (10) zu einem Widerspruch. Bezeichnen wir diese Russellsche Menge mit r und fragen danach, ob r selbst ein Element von r ist. Wird das bejaht, so besitzt r die definierende Eigenschaft der Menge in (12), d.h. r ist kein Element von r. Wenn aber umgekehrt die “Selbstelementschaft” von r verneint wird, so hat r gerade die definierende Eigenschaft der Menge r, und dann müßte r eines der Elemente von r sein. In Symbolen: (13)
r∈r
genau dann, wenn
r 6∈ r
Dies ist nun eine echte Antinomie, deren Kennzeichen es ist, daß aus unkontrovers erscheinenden Prämissen, wie hier dem naiven Komprehensionsprinzip, ein nicht auflösbarer Widerspruch abgeleitet werden kann. Die Tatsache, daß sie so leicht erklärt werden kann, ist ein Hinweis auf Schwierigkeiten grundsätzlicher Art, die mehr sind als ein Grenzproblem in der Mengenlehre wie das der Menge aller Mengen. Der größte Logiker des 20. Jahrhunderts, Kurt Gödel, sagte später zu der Russell-Paradoxie: [Russell] unterzog die Paradoxien, zu denen Cantors Mengenlehre geführt hatte, einer eingehenden Analyse und befreite sie von allen technischen Details; er förderte so das erstaunliche Faktum zu Tage, daß unsere logischen Intuitionen (d. h. Intuitionen zu Konzepten wie
Historisches
xxv
Wahrheit, Begriff, Sein, Klasse, usw.) Widersprüche in sich tragen. ([97]: 131; Übersetzung G.L.) Die Paradoxie stellte die als selbstverständlich angenommene Beziehung zwischen Begriff und Umfang in Frage, nämlich daß es zu jedem beliebigen Begriff einen Umfang gibt, der genau die Objekte enthält, die unter den Begriff fallen. Dies hatte auch Frege in seinen Grundgesetzen angenommen und mußte nun feststellen, daß sein System einen analogen Widerspruch enthielt. Mathematiker, die nichts von der neuen Logik hielten, fühlten sich in ihrer Abneigung bestärkt; so ist von dem berühmten Mathematiker Poincaré die Bemerkung überliefert: “Die Logik ist gar nicht mehr steril — sie zeugt jetzt Widersprüche!” Russell selbst faßte seine Entdeckung als persönliche Herausforderung auf, eine Lösung der Paradoxie sowie einer ganzen Reihe verwandter Paradoxien zu erarbeiten, welche in dieser Zeit sehr schnell entdeckt oder wiederentdeckt wurden. Zu den letzteren zählte auch die Jahrtausende alte Lügnerparadoxie: Wenn ich den Satz äußere: “ich lüge jetzt”, oder auch: “was ich jetzt gerade sage, ist falsch”, sage ich dann mit diesem Satz die Wahrheit oder die Unwahrheit? Beide Annahmen führen ähnlich wie bei der Russell-Paradoxie jeweils zu ihrem Gegenteil. Russell benötigte fast zehn Jahre, bevor er zusammen mit Whitehead die Principia Mathematica publizieren konnte, in der eine Lösung der Paradoxien präsentiert wird. Dazu entwickelten die Autoren eine Logik der Typen, welche Elementschaftszyklen der Form ‘x ∈ x’ oder auch ‘x 6∈ x’ von vornherein unterbindet und so die Russell-Paradoxie im Ansatz blockiert. Darüberhinaus liegt die Bedeutung dieses Werks vor allem in den folgenden Punkten: Erstens baut es mit Hilfe der Peano-Notation ein umfassendes System der Logik auf, welches als Vorbild späterer Systeme der mathematischen Logik diente und das System der modernen Prädikatenlogik der ersten Stufe, auch elementare Logik genannt, als Teilsystem enthält; zweitens wird hier das logizistische Programm der Zurückführung der Mathematik auf die Logik im Detail vorangetrieben, soweit dies möglich war; und schließlich findet sich drittens in dem Werk eine nach Inhalt, Methode und Präzision völlig neue Philosophie, welche richtungsweisende Beiträge zur Ontologie, Erkenntnistheorie, Sprachphilosophie sowie den Grundlagen von Logik und Mathematik lieferte. Wegen ihres kompromißlosen Formalismus sind die Principia Mathematica bis heute keine leichte Lektüre. Daß ihre logische Genauigkeit dennoch nicht mehr heutigen formalen Standards genügen kann, spricht nicht gegen ihre epochemachende Innovation an formaler Strenge, sondern lediglich für die beachtliche Schnelligkeit, mit der die Entwicklung der mathematischen Logik in den letzten hundert Jahren vonstatten ging.
0.1.3
Die Logik des 20. Jahrhunderts
Daß die Logik sich als mathematische Disziplin etablieren konnte, verdankt sie vor allem dem von seinen Fachkollegen anerkannten Mathematiker Hilbert, der oben bereits erwähnt wurde. Neben seinen im engeren Sinne mathematischen Arbeiten befaßte sich Hilbert um die Jahrhundertwende mit den Grundlagen der Geometrie, deren Axiomatisierung ja bereits der Gegenstand vieler Untersuchungen im 19. Jahrhundert gewesen war. Im Zusammenhang der Diskussionen um den Status der nicht-euklidischen Geometrien waren Fragen der Widerspruchsfreiheit von Axiomensystemen in den Vordergrund getreten. Hilbert
xxvi
Einleitung
und seine Schüler nahmen nun die Entdeckung der Widersprüche in der naiven Mengenlehre zum Anlaß, systematisch die Teilgebiete der Mathematik zu untersuchen, sie zu axiomatisieren und ihre Widerspruchsfreiheit nachzuweisen (Hilbertsches Programm). Sieht man von der Geometrie ab, so handelte es sich vor allem um drei zentrale, aufeinander aufbauende mathematische Disziplinen: (i) die Theorie der natürlichen Zahlen und ihrer Funktionen (Arithmetik ), (ii) die Theorie der reellen Zahlen und ihrer Funktionen (Analysis) sowie (iii) die Theorie der Mengen (Mengenlehre). Da hier mathematische Theorien selbst Gegenstand der Untersuchungen sind, spricht man von diesem Forschungsprogramm auch als der Metamathematik . Natürlich können die Methoden der Metamathematik keine anderen als mathematische sein; um nun einem “Methodenzirkel” zu entkommen, verlangte Hilbert, in der Metatheorie nur solche Mittel zu verwenden, die in einem gewissen Sinn als “unproblematisch” gelten können. Angesichts der unerwarteten Probleme mit den intuitiven Grundlagen der Mathematik einerseits und mit den zum Teil paradox anmutenden Phänomenen im Unendlichen versuchte er, auf inhaltliche, “semantische” Argumente zu verzichten wie auch auf “infinitäre”, auf unendliche Bereiche Bezug nehmende Methoden. Beweise wurden nur anerkannt, wenn sie rein formal nach fest vorgegebenen Regeln durchgeführt werden konnten. Diese Maxime trägt den Namen Formalismus. Der Verzicht auf infinitäre Argumente wird als Finitismus bezeichnet. Die Widerspruchsfreiheitsbeweise sollten also mit ausschließlich finiten Methoden erbracht werden, die rein kombinatorischer Natur sind und ohne Unendlichkeit auskommen. Bei der Axiomatisierung der genannten drei Theorien erwies es sich als zweckmäßig, genauer festzulegen, über welche Art von Objekten eine Theorie “spricht”: es sind dies die Objekte, über die mit Hilfe der gebundenen Variablen der Theorie quantifiziert wird. Der Quantifikationsbereich ist zwar eigentlich ein semantisches Konzept, das nicht explizit in der Theorie eine Rolle spielen durfte; aber man benutzte für die verschiedenen Bereiche verschiedene Typen von Variablen und “sagte dann dazu”, was der intendierte Bereich sein sollte. Die arithmetischen Quantoren z.B. variieren über Zahlen, die anders als bei Frege als Objekte der untersten Stufe, Individuen genannt, aufgefaßt werden. Wenn man neben der Quantifikation über Zahlen auch die Quantifikation über Mengen von Zahlen zuläßt, so spricht man von einer Theorie höherer, genauer: der zweiten Stufe. Freges System entspricht einer Theorie der zweiten Stufe, Russells Typentheorie sogar einer Theorie beliebiger endlicher Stufen. Wie oben bereits erwähnt, läßt die elementare Logik nur die Quantifikation über Individuen, also Objekte der ersten Stufe, zu. Die übliche, auf den Axiomen von Peano basierende Zahlentheorie ist eine Theorie der ersten Stufe und trägt den Namen Peano-Arithmetik . Die Analysis läßt sich als Zahlentheorie der zweiten Stufe entwickeln, weil die reellen Zahlen mit gewissen Mengen von natürlichen Zahlen identifiziert werden können; dies ergibt sich aus den Reduktionsbeziehungen zwischen den Zahlensystemen. Die Mengentheorie ist wiederum eine Theorie der ersten Stufe; ihre Objekte sind alles Individuen, welche Mengen genannt werden. Die Reduktion der Mathematik auf die Mengenlehre bedeutet, daß alle mathematischen Objekte gewisse Mengen sind, speziell die verschiedenen Arten von Zahlen und alle Relationen und Funktionen über ihnen. Auch können alle mathematischen Theorien in die Mengentheorie eingebettet werden; diese ist somit die umfassendste Theorie.
Historisches
xxvii
Was nun die Frage der Widerspruchsfreiheit betrifft, so geriet das Hilbertsche Programm schon bei dem schwächsten System, dem der Arithmetik, in unüberwindbare Schwierigkeiten. Zwar wurde für dieses System ein Widerspruchsfreiheitsbeweis geführt (durch Gerhard Gentzen im Jahre 1936), aber der Beweis benutzte wesentlich nicht-finite Mittel; und weit davon entfernt, schwächer zu sein, waren sie sogar erheblich stärker als die Beweismittel, die in der Arithmetik selbst zur Verfügung stehen. Dieses Resultat befindet sich im Einklang mit einer Entdeckung von Kurt Gödel wenige Jahre vorher: sie besagt, daß eine Theorie, die so stark ist wie die Peano-Arithmetik, ihre eigene Widerspruchsfreiheit nicht beweisen kann. Dies ist der Inhalt des sogenannten zweiten Gödelschen Unvollständigkeitssatzes. Der finite Standpunkt muß also in seiner strikten Form aufgegeben werden. Das mag für Mathematiker und Philosophen, die diese Position für unnötig restriktiv hielten, nicht besonders schlimm gewesen sein. Weit schwerer wog allerdings eine weitere Folgerung aus dem Gödelschen Satz: da die Mengenlehre die Arithmetik umfaßt, gilt dasselbe für sie, d.h. ihre Widerspruchsfreiheit kann nicht in der Mengenlehre selbst bewiesen werden. Nun umfaßt die Mengenlehre aber im wesentlichen die gesamte Mathematik; die Frage, ob die Mathematik als ganze widerspruchsfrei ist, muß also unbeantwortet bleiben. Der Optimismus Hilberts, der verkündet hatte, in der Mathematik gebe es kein Ignorabimus, erhielt hierdurch einen gewissen Dämpfer. Zur Unbeweisbarkeit der Widerspruchsfreiheit der Arithmetik innerhalb des Systems selbst gelangte Gödel mit Hilfe von Methoden, die er für seinen ersten Unvollständigkeitssatz entwickelt hatte. Dieser sagt aus, daß es in der Arithmetik Sätze gibt, die im Peanoschen Axiomensystem weder beweisbar noch widerlegbar sind, d.h. auch ihre Negation ist nicht beweisbar. Nun ist ein solcher Satz in der Sprache der Arithmetik formuliert und daher entweder eine wahre oder eine falsche Aussage über die natürlichen Zahlen; ist er falsch, so ist seine Negation wahr, die ebenfalls nicht beweisbar ist. Es gibt damit auf jeden Fall einen wahren arithmetischen Satz, welcher nicht beweisbar ist. Dies zeigt, daß die Begriffe der Wahrheit und der Beweisbarkeit auseinanderfallen. Zwar ist jeder beweisbare Satz auch wahr, da die Axiome wahr sind und der Kalkül korrekt ist, d.h. aus wahren Prämissen wahre Folgerungen zieht. Aber es gibt “mehr” arithmetische Wahrheiten als beweisbare Sätze: das Hauptinstrument des Mathematikers, der Beweis, greift schon im Fall der Arithmetik zu kurz. Dies ist ein Ergebnis von außerordentlicher Tragweite. Es wirft tiefliegende Fragen nach dem Status mathematischer Wahrheit auf, die außer für den an Grundlagenfragen arbeitenden Logiker auch für den Philosophen von höchstem Interesse sind. Die Gödelschen Resultate sind in seinem Aufsatz “Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme” von 1931 [96] veröffentlicht.7 Welches waren nun die Methoden, mit denen Gödel seine berühmten Unvollständigkeitssätze bewies? Das neuartige Verfahren, dessen Gödel sich bediente, bestand in einer Kodierung der logischen Syntax der Arithmetik in der Arithmetik selbst, heute auch Arithmetisierung oder Gödelisierung genannt. Es beruht auf der Beobachtung, daß arithmetische Formeln ebenso wie natürlichsprachliche Sätze, ganz allgemein also die sinnvollen Ausdrücke einer 7 Es ist von Interesse festzustellen, daß auch über zwanzig Jahren nach ihrem Erscheinen die Principia der Philosophen Whitehead und Russell noch das Referenzwerk der neuen mathematischen Logik war. Allerdings änderte sich das in dem dann beginnenden Jahrzehnt grundlegend: die Logik wurde durch die Arbeiten von Gödel, Gentzen, Turing, Tarski und anderen Logikern auf eine qualitativ andere Stufe gehoben.
xxviii
Einleitung
Sprache, endliche Ketten von gewissen Grundausdrücken sind (im ersten Fall z.B. sind die Grundausdrücke die Grundsymbole der arithmetischen Sprache, und im zweiten Fall Wörter einer gegebenen natürlichen Sprache). Den Grundausdrücken ordnet man nun gewisse natürliche Zahlen zu, und den Ketten von Grundausdrücken weitere Zahlencodes, aus denen die Bestandteile in eindeutiger Weise zurückgewonnen werden können. Die Kodierung geht zugleich so vor sich, daß den syntaktischen Operationen berechenbare Funktionen auf den Zahlencodes entsprechen; dadurch kann gewährleistet werden, daß die Kodierung überprüfbar und korrekt ist, d.h. daß die Kodierung eines syntaktischen Sachverhalts diesen in der Arithmetik auch “ausdrückt”. Insbesondere kann auf diese Weise der Beweisbegriff selbst auf adäquate Weise kodiert werden. Durch eine ingenuöse Verwendung der Selbstbezüglichkeit des Systems gelangt Gödel zu einem arithmetischen Satz, der seine eigene Unbeweisbarkeit ausdrückt. Wegen der Korrekheit der Arithmetisierung ist dieser Satz wahr, aber nicht beweisbar; er ist aber auch nicht widerlegbar, sondern “unentscheidbar”. Es ist nun leicht zu sehen, wie auch die Widerspruchsfreiheit im System ausdrückbar ist. Ein System heißt widerspruchsfrei oder konsistent, wenn nicht alle Aussagen beweisbar sind. Man nimmt nun eine einfache offensichtlich falsche Aussage, etwa ‘0 = 1’, und kodiert die Behauptung “‘ 0 = 1’ ist nicht beweisbar ”; dies ist eine mögliche Konsistenzaussage für das System. Gödel zeigt von ihr, daß sie ebenfalls unentscheidbar ist. Für die technische Durchführung der Arithmetisierung der Syntax war es wichtig, die einzelnen Kodierungsschritte in kontrollierbarer, oder wie man sagt: in effektiver bzw. berechenbarer Weise vorzunehmen. Da die syntaktischen Operationen, die es zu verschlüsseln galt, effektiv sind, kam es darauf an, die entsprechenden Operationen auf den Gödelschen Zahlencodes ebenfalls berechenbar zu halten. Gödel benutzte dazu die sogenannten primitiv rekursiven Funktionen, deren Theorie damals gerade entwickelt wurde. Dies sind Funktionen auf den natürlichen Zahlen, die zu jedem gegebenen Argument aufgrund einer expliziten Rechenvorschrift nach endlich vielen Rechenschritten ein eindeutiges Resultat liefern. Es sei bemerkt, daß nicht jede Funktion im Sinne der Cantorschen Mengenlehre von dieser Art ist: der moderne Funktionsbegriff ist wesentlich allgemeiner. Doch sind die üblichen arithmetischen Funktionen wie die Addition, die Multiplikation und die Exponentiation alle primitiv rekursiv. Es stellte sich nun die Frage, ob der allgemeine intuitive Begriff der Berechenbarkeit durch diese primitiv rekursiven Funktionen adäquat erfaßt wird. Allan Turing ersann das Konzept einer abstrakten Rechenmaschine, die die allgemeinsten berechenbaren Prozesse simuliert; dies ist die nach ihm benannte Turingmaschine. In der Rekursionstheorie zeigt man, daß es zu jeder primitiv rekursiven Funktion eine diese Funktion simulierende Turingmaschine gibt, d.h. daß alle primitiv rekursiven Funktionen “Turing-berechenbar” sind. Der Begriff der Turing-Berechenbarkeit erwies sich jedoch als allgemeiner, und die Churchsche These besagt, daß der allgemeine Begriff der Berechenbarkeit mit der Turing-Berechenbarkeit gleichzusetzen ist, da eine ganze Reihe weiterer und zunächst ganz verschiedenartiger Charakterisierungen der Berechenbarkeit sich mit dem Turingschen Begriff deckten. All diese Untersuchungen stammen ebenfalls aus den Dreißiger Jahren. Während dieser Zeit wurden in der Logik die theoretischen Grundlagen der modernen Computer- und Informationswissenschaften gelegt. Das Turingsche Konzept einer abstrakten Rechenmaschine erlangte in der
Historisches
xxix
Folgezeit auch eine beträchtliche philosophische Bedeutung. In dem Maße, wie versucht wurde, die kognitiven Prozesse des menschlichen Geistes zu verstehen, beschäftigten sich Kognitionswissenschaftler und Philosophen mit der Natur der Hirnprozesse, die bei der Verarbeitung externer und interner Reize und Informationen ablaufen. Ein vieldiskutiertes Hirnmodell ist das der Erstellung symbolischer Repräsentationen und ihrer Manipulationen: Denken als SymbolManipulation ganz analog zu einer Rechenmaschine oder einem Computer, also das Gehirn als Turingmaschine. Umgekehrt hatte schon Turing die Idee, die “Intelligenz” eines Computerprogramms daran zu messen, wie erfolgreich es kognitive Prozesse simulieren kann. Der bekannte Turingtest besagt, daß eine Maschine dann geistige Prozesse adäquat nachahmen kann, wenn eine menschliche Person, die mit der Maschine kommuniziert und ihr Fragen stellt, nach einer gewissen Zeit aufgrund der gegebenen Antworten nicht zu entscheiden vermag, ob sich auf der anderen Seite die Machine oder ein Mensch befindet. Die dadurch aufgeworfenen Probleme werden bis heute in den Kognitionswissenschaften und der Philosophie des Geistes diskutiert. Wir kehren zu den eigentlichen Fragen der Logik zurück. Eine weitere grundlegende Entwicklung jener Zeit war die Begündung der Theorie der Wahrheit und allgemeiner der Semantik als logische Disziplin durch Alfred Tarski. Der klassische Text ist Tarskis Schrift Der Wahrheitsbegriff in den formalisierten Sprachen von 1935, die bis heute auch in der Philosophie eine bedeutende Quelle darstellt. Ausgehend von der Lügner-Paradoxie, die wesentlich das Wahrheitsprädikat “... ist wahr ” enthält, analysiert Tarski die paradoxe Verwendung des Wahrheitsbegriffs in der Umgangsprache und gibt eine Lösung des Problems im Rahmen formaler Logik-Systeme, indem er die wesentliche Unterscheidung zwischen Objekt- und Metasprache trifft: Wahrheit ist ein Prädikat der Metasprache, das die Aussagen der Objektsprache in wahre und falsche einteilt; in diesen Aussagen selbst kommt aber das Wahrheitsprädikat nicht vor. Die in Tarskis Aufsatz entwickelte Semantik, heute Tarski-Semantik , modelltheoretische oder Interpretationssemantik genannt, ist ein zentrales Instrument der formalen Philosophie. In der mathematischen Logik hat sie sich in der Folgezeit zu der Teildisziplin der Modelltheorie weiterentwickelt, zu der Tarski selbst wesentliche Beiträge lieferte. Vor Tarski waren semantische Begriffe zwar implizit vorhanden, z.B. in Gödels Begriff der arithmetisch wahren, aber unentscheidbaren Aussage, aber im Rahmen des Hilbertschen Formalismus waren sie nicht wirklich “hoffähig”; sie galten als zu inhaltlich und philosophisch. Mit Hilfe der Tarski-Semantik konnte man nun den wesentlich semantischen Charakter einiger wichtiger früherer Ergebnisse der Logik klar herausarbeiten. Das trifft insbesondere auf ein anderes zentrales Resultat von Gödel zu, den Vollständigkeitssatz der Prädikatenlogik. Er besagt, daß jede widerspruchsfreie Menge von Aussagen ein Modell besitzt, d.h. eine Struktur, die alle Aussagen dieser Menge wahr macht. Geeignet umformuliert kann man den Inhalt des Vollständigkeitssatzes auch wie folgt ausdrücken. Der Satz stellt eine Verbindung her zwischen dem syntaktischen Begriff der Beweisbarkeit und dem semantischen Begriff der logischen Wahrheit, d.h. der Erfüllung in jeder möglichen Struktur; das Resultat ist, daß die beiden Begriffe deckungsgleich sind. Aus diesem wichtigen Metatheorem ergeben sich bedeutende Konsequenzen für die Grenzen der Ausdruckkraft der elementaren Logik : zum Beispiel läßt sich ein intuitiv so einfacher Begriff wie der der Endlichkeit eines Modells nicht in der Prädikatenlogik
xxx
Einleitung
der ersten Stufe charakterisieren. Diese und andere analoge Ergebnisse sind auch von hohem philosophischen und wissenschaftstheoretischen Interesse. Eine letzte philosophisch ebenfalls bedeutsame Entwicklung in der Logik der Dreißiger Jahre betraf die Mengenlehre; sie wurde wiederum maßgeblich von Gödel angestoßen. Zu jener Zeit war der Mengenbegriff längst auf einige wenige intuitiv plausible Axiome der Mengenexistenz und Mengenkonstruktion zurückgeführt; diese Axiomatisierung stammt von Ernst Zermelo und Abraham Fraenkel, der zu den Zermeloschen Axiomen ein wichtiges weiteres Axiom hinzufügte. Dieses System wird heute die Zermelo-Fraenkelsche Mengenlehre, kurz: ZF genannt. Aber von Anfang an entzog sich ein wichtiges mengentheoretisches Prinzip der Einordnung in dieses System: das sogenannte Auswahlaxiom (kurz: AC oder einfach C für engl. [axiom of ] choice). Es geht von der im Bereich des Endlichen plausiblen Vorstellung aus, daß man etwa aus einer Anzahl von mit Kugeln gefüllten Urnen jeweils eine Kugel herausgreifen kann, und erweitert sie zu dem Prinzip, daß es zu jeder Familie von nichtleeren Mengen eine Funktion gibt, die wie ein tausendarmiger Riese (oder besser ein Riese mit unendlich vielen Armen) aus jeder Menge dieser Familie ein Element herausgreift. Nicht alle Mathematiker erkannten das Auswahlaxiom als zulässig an, da es durchaus zu kontraintuitiven Konsequenzen führt; auf der anderen Seite sind viele wichtige mathematische Sätze ohne dieses Axiom nicht zu beweisen, so daß die meisten Mathematiker, insbesondere Zermelo selbst, nicht ohne auskommen wollen. Es stellte sich nun die Frage, ob das Axiom überhaupt mit den anderen ZFAxiomen verträglich ist, d.h. widerspruchsfrei zu den anderen dazugenommen werden kann. Wie oben erläutert, kann man zwar noch nicht einmal sagen, ob die Axiome von ZF für sich genommen widerspruchsfrei sind. Aber man kann das Problem in bedingter Form formulieren: angenommen, die ZF-Axiome seien widerspruchsfrei; ist dann auch ZFC , also ZF plus dem Auswahlaxiom, widerspruchsfrei? Diese Frage konnte von Gödel positiv beantwortet werden. Er benutzte dazu eine Konstruktion, deren Grundidee er nach eigenen Angaben bei Russell gefunden hatte. Auch hier entwickelte sich eine zunächst im philosophischen Kontext gewonnene Idee in den Händen eines genialen Mathematikers zu einem bedeutenden technischen Resultat. Gödel bewies ferner, daß dasselbe Modell, das die Verträglichkeit des Auswahlaxioms zeigte, auch die Cantorsche Kontinuumhypothese wahr macht; diese ist also ebenfalls zumindest verträglich mit den anderen Axiomen der Mengenlehre. Nach wie vor aber blieb die Frage offen, ob das Auswahlaxiom und die Kontinuumhypothese nicht doch vielleicht ableitbar sind. Diese Frage, die sich als noch schwieriger erwies, wurde erst im Jahre 1963 von Paul Cohen negativ beantwortet: man kann, ausgehend von einem Modell der ZF-Mengenlehre, Modelle konstruieren oder, wie Cohen sagt, “erzwingen”, in denen beide Aussagen falsch sind; damit sind AC und CH unabhänig von den übrigen Axiomen der Mengenlehre. Philosophisch bedeutet dieses Ergebnis, daß das auf plausiblen Annahmen über den Mengenbegriff basierende Axiomensystem ZF klar formulierte mathematische Aussagen unbeantwortet läßt, wie etwa die Frage nach der Mächtigkeit des Kontinuums. Wenn man sich nun analog zu der Struktur der natürlichen Zahlen, die die Peano-Axiome wahr macht, das Universum der Mengen vorstellt, welches die ZF-Axiome wahr macht: ist dann in diesem Universum, um die schon oben einmal gestellte Frage zu wiederholen, die Kontinuumhypothe-
Moderne Logik und Philosophie
xxxi
se wahr oder falsch? Für einen Realisten bezüglich mathematischer Objekte, auch mathematischer Platonist genannt, ist diese Frage vollkommen sinnvoll gestellt: im “platonischen Himmel” abstrakter Gegenstände existiert das Mengenuniversum, und dieses ist entweder so beschaffen, daß die Mächtigkeit des Kontinuums die nächsthöhere Mächtigkeit nach der der natürlichen Zahlen ist, oder eben nicht. Es scheint, daß Gödel selbst diesen Standpunkt vertrat. Die meisten Mengentheoretiker jedoch, so etwa Cohen, sind dagegen Formalisten und erklären diese Frage für sinnlos. Hier sind wir wieder bei einem typisch philosophischen Problem angelangt: es geht nicht mehr darum, ein mathematisches Theorem zu beweisen, sondern um begriffliche und durchaus ontologische Fragen, die sich vor allem aus dem Problem der Unendlichkeit ergeben. Philosophen, die zu dieser Thematik etwas beitragen wollen, kommen nicht umhin, auch ihre logisch-mathematische Seite zu studieren.
0.2
Moderne Logik und Philosophie
Nach diesem Streifzug durch die Geschichte der Logik und ihrem Verhältnis zur Philosophie stellt sich natürlich die Frage, ob die Logik sich nicht bereits mehr oder minder aus der Philosophie verabschiedet hat, da ihre Resultate nur noch mit mathematischen Kenntnissen gewürdigt werden können. Natürlich hat sich die Logik vollkommen von der Philosophie emanzipiert; sie ist gewiß keine ancilla metaphysicae in dem Sinne, wie einst die Theologen die Philosophie als ancilla theologiae in den Dienst zu nehmen versuchten. Auch spielen bei vielen logischen Problemen rein mathematische Aspekte eine Rolle. Dennoch erzeugen auch technisch fortgeschrittene Resultate immer wieder genuin philosophische Probleme, ebenso wie philosophische Fragestellungen Anlaß geben zu teilweise tiefen logischen Untersuchungen. Ein Beispiel dafür ist etwa die moderne formale Wahrheitstheorie der letzten dreißig Jahre, die über die klassische Theorie von Tarski hinausgeht und von Saul Kripke, einem Logiker-Philosophen, angestoßen wurde. Während sich große Bereiche der heutigen mathematischen Logik aus naheliegenden Gründen der Informatik nähern, bleibt weiterhin Raum für die philosophisch inspirierte Tradition der Metamathematik, wie sie von den oben erwähnten Philosophen und Logikern begründet wurde. Auch für einen Philosophen, der nicht speziell an der Philosophie der Mathematik interessiert ist, besteht Anlaß, sich ernsthaft mit der Logik zu beschäftigen. Immer wenn es in der Philosophie um die Form oder Struktur unseres Denkens oder Sprechens geht, werden logische Beziehungen thematisiert. Ich bezeichne den Teil der Metaphysik, in dem es um derartige Fragen geht, als formale Metaphysik , wobei die Ontologie hier subsumiert sei. Zu den Themen auf diesem Gebiet, die in der philosophischen Tradition vorgegeben wurden und damals wie heute eine wichtige Rolle spielen, zählen etwa die folgenden: • Existenz • Prädikation • Identität • Abstraktion • Teil/Ganzes und Nominalismus
xxxii
Einleitung
• Wahrheit • Modalität • Wenn-dann-Verknüpfungen Die Methoden der modernen Logik stellen ein präzises Instrumentarium zur Behandlung dieser und verwandter Problemfelder dar. Es gibt aber zugleich philosophisch relevante Themen von ganz neuartigem Charakter, deren seriöse Behandlung durch gründliche Kenntnisse in der Logik meist überhaupt erst möglich gemacht wird. Dazu gehören die folgenden Problemkreise aus der Philosophie der Logik und Mathematik: • Quantifikation • Beweisbarkeit vs. mathematische Wahrheit • Unendlichkeit und Philosophie der Mengenlehre • Selbstreferentialität • Probleme der Arithmetisierung und Kodierung • Philosophie der Berechenbarkeit • Grenzen der Ausdruckskraft von Sprachsystemen • Fragen der Interpretation, Representation, Übersetzung und Reduktion Ich werde nun der Reihe nach einige Bemerkungen zu den zuerst genannten Themen der formalen Metaphysik machen und dabei die heutige logische Perspektive hervorheben. Dabei sollen nur einige Problemzusammenhänge aufgezeigt werden, die aber hier natürlich nicht ausführlich diskutiert werden können. Die Fragen aus der zweiten Gruppe wurden zum großen Teil bereits im vorigen Abschnitt angesprochen; ihr genauerer Inhalt wird sich erst nach und nach erschließen, wenn die technischen Voraussetzungen erarbeitet sind.
0.2.1
Existenz
Was ist der logische Charakter von Aussagen wie ‘Gespenster existieren nicht’ ? Ihre grammatische Form ist vollkommen analog zu der von Sätzen wie ‘Pinguine fliegen nicht’. In letzterem Beispiel sprechen wir über Pinguine und verneinen, daß sie die Eigenschaft zu fliegen besitzen. Der erste Satz drückt aber gerade aus, daß es keine Gespenster gibt; wir können also schlecht von den Gespenstern reden und ihnen dann die Eigenschaft zu existieren absprechen. Das Verb ‘existieren’ scheint von anderer Qualität zu sein als gewöhnliche Prädikate. Ein weiteres Symptom für diesen Befund ist das berühmte Argument im Zusammenhang mit dem ontologischen Gottesbeweis, nach dem wir Gott als einem in jeder Hinsicht vollkommenen Wesen auch die Existenz als Bestandteil dieser Vollkommenheit zuschreiben müssen. Dieser noch von Descartes vorgebrachte Schluß wird von Kant ausführlich kritisiert, und zwar im wesentlichen gerade mit dem Argument, daß man einem Objekt nicht die Existenz wie irgendeine andere Beschaffenheit zuschreiben kann: “Wenn ich also ein Ding, durch welche
Moderne Logik und Philosophie
xxxiii
und wie viel Prädikate ich will, ... denke, so kommt dadurch, daß ich noch hinzusetze, dieses Ding ist, nicht das mindeste zu dem Dinge hinzu.” ([135]: B 628) Es war Frege, der als erster einen präzisen logischen Grund angab, warum sich Existenz anders verhält als gewöhnliche Prädikate. Den Kern der Fregeschen Vorstellung haben wir bereits oben im Zusammenhang mit der logizistischen Rekonstruktion der natürlichen Zahlen erwähnt. Nennen wir einen Begriff ≥ 1-mächtig, wenn mindestens ein Objekt unter ihn fällt, wenn er also nicht leer ist; dann ist Existenz offenbar derjenige Begriff zweiter Stufe, der alle ≥1mächtigen Begriffe subsumiert. Somit ist schon rein kategoriell klar, daß sich ein zweitstufiger Begriff nicht unter die gewöhnlichen erststufigen Begriffe mischen kann (siehe [74]: § 53 und ausführlich [79]). Die angedeutete Hierarchie von Begriffen oder ihrer syntaktischen Gegenstücke, der Prädikate, läßt sich so in der Standardlogik der ersten Stufe nicht wiedergeben. Stattdessen wird Existenz zu dem logischen Operator ‘∃’ und ist als solcher grundlegend verschieden von allen deskriptiven Prädikaten der logischen Sprache. Die unterschiedlichen logischen Formen der obigen Beispielsätze sehen dann so aus:8 (14)
a.
b.
Pinguine fliegen nicht. EF: Für alle x gilt: wenn x ein Pinguin ist, so fliegt x nicht. LF: ∀x (P (x) → ¬F (x))
Gespenster existieren nicht. EF: Es ist nicht der Fall, daß es ein x gibt, so daß gilt: x ist ein Gespenst. LF: ¬∃x G(x)
Die grammatische Oberflächenstruktur und die logische Tiefenstruktur von Aussagen sind also zu unterscheiden; was die gleiche grammatische Struktur besitzt, kann auf der Ebene der logischen Form sehr verschieden aussehen. Analoge Überlegungen gelten für reine Existenzsätze, in denen Objektnamen auftreten, wie in folgenden Beispielen: (15)
a.
Pegasus existiert nicht.
b.
Der König von Frankreich existiert nicht.
c.
Das runde Quadrat existiert nicht.
Wiederum hat es den Anschein, daß Pegasus in irgendeiner Form “Sein” besitzen müsse, weil sonst der Satz (15a) sinnlos wäre, was er aber offenbar nicht ist; sinnlos deshalb, weil wie selbstverständlich angenommen wird, daß jeder Name in Subjektposition etwas bezeichnen oder denotieren muß. Um das Problem zu lösen, nannte man Pegasus ein “mögliches Objekt”, was lediglich nicht aktualisiert sei, und sprach ihm die Seinsweise der Subsistenz zu, welcher zur vollen Existenz nur das aktuale Sein fehlt. Auf diese Weise meinte man sich mit dem Subjekt des Satzes (15a) immerhin auf etwas beziehen zu können. Dasselbe 8 Dabei wird der Pinguin-Satz als für alle Pinguine geltende Aussage interpretiert. Das ist nicht ganz korrekt, da es sich genau genommen um einen sogenannten generischen Satz handelt, der Ausnahmen zuläßt, wie etwa in dem Satz ‘Vögel fliegen’, bei dem gerade die Pinguine systematische Ausnahmen darstellen. Generische Aussagen sind also im Sinne des Zusatzes “normalerweise” zu verstehen. Der Ausdruck ‘normalerweise’ bezeichnet jedoch keinen rein logischen Operator und ist daher in der Prädikatenlogik nicht darstellbar.
xxxiv
Einleitung
gilt für den beschreibenden Namen ‘der König von Frankreich’ in (15b) (diese wichtige Klasse von Ausdrücken der Form ‘der/die/das F ’ heißen Kennzeichnungen): da es nur ein historischer Zufall ist, daß Frankreich eine Republik ist und keinen König hat, wird der König von Frankreich also ebenfalls zu einem möglichen Objekt, dem zur realen Existenz lediglich die Aktualisierung fehlt. Es war Russell, der anläßlich einer Auseinandersetzung mit dem Philosophen A. Meinong erkannte, daß die Nennung eines Namens noch nicht einmal die mögliche Existenz garantiert, wie die Kennzeichnung in (15c) zeigt: ein rundes Quadrat ist eine logische Unmöglichkeit. Da nun speziell Kennzeichnungen besonders anfällig gegen Bezeichnungslücken sind (so gab es etwa in Frankreich erst einen König, dann eine Republik, dann einen Kaiser, dann einen König, dann eine Republik und wieder einen Kaiser und dann wieder eine Republik ...), zog Russell den radikalen Schluß, daß diese Ausdrücke für sich genommen gar keine Bedeutung haben, sondern nur im Kontext eines ganzen Satzes. Die Bedeutung erhält man, wenn man einen Satz wie in (16a) durch den Satz (16b) paraphrasiert: (16)
a.
Der König von Frankreich ist weise.
b.
Es gibt ein Objekt x, das König von Frankreich ist (i), und alle Objekte y, die König von Frankreich sind, sind gleich x (ii), und dieses x ist weise.
Im b-Satz tritt die Kennzeichnung gar nicht mehr auf: sie wird durch die Paraphrase eliminiert. Trotzdem wird durch den ganzen Satz, sofern er wahr ist, genau ein Objekt herausgegriffen, weil dann die charakteristischen Bedingungen der Existenz (i) und Eindeutigkeit (ii) erfüllt sind. Dies ist der Kern der Russellschen Kennzeichnungstheorie.9 Sie behandelt den obigen Satz (15b) somit einfach als die Negation der Behauptung, daß es ein eindeutiges Objekt gibt mit der Eigenschaft, König von Frankreich zu sein, und diese Aussage ist nicht nur nicht sinnlos, sondern wahr. Gleiches gilt für den Satz (15c), der sogar aus logischen Gründen wahr ist. Einer der einflußreichsten analytischen Philosophen des 20. Jahrhunderts, der Logiker-Philosoph Willard Van Quine, behandelt die ontologischen Irrwege, die in mißverstandenen Existenzaussagen gründen, auf exemplarische Weise in seinem Aufsatz On what there is [199]. Er schließt an Russells logische Analyse an und dehnt sie sogar auf Eigennamen wie ‘Pegasus’ aus, indem er (15a) liest als ‘dasjenige x, welches die Eigenschaft hat, gleich Pegasus zu sein, existiert nicht’, oder mit Hilfe des künstlichen Prädikats ‘pegasieren’: ‘der Pegasierer existiert nicht’. Auf diese Weise werden Namen zu speziellen Kennzeichnungen,10 und das Eliminationsverfahren der Kennzeichnungstheorie liefert eine einheitliche Lösung für das Existenzproblem. Zudem verlagert Quine deutlicher als Russell das Problem auf die Ebene des gegebenen Individuenbereichs, d.h. auf die Objekte, über die gesprochen wird: grundlegender als die Namenbeziehung ist die Erfüllungsrelation, die zwischen den Objekten des Individuenbereichs und Aussageformen der Art ‘x ist König von Frankreich’ besteht. Jene läßt sich aus dieser gewinnen, aber nur diese sagt verläßlich etwas über Existenz aus. So ge9 Engl.
theory of definite descriptions; siehe [214] und ausführlicher [262]: I*14. Grenzen sind ohnehin fließend: ‘der Morgenstern’ ist der Form nach eine Kennzeichnung, wird aber wie ein Name gebraucht; umgekehrt ist ‘Phosphorus’ ein Name, dessen Bedeutung (“der Lichtträger”) eine Kennzeichnung ist. 10 Die
Moderne Logik und Philosophie
xxxv
langt Quine zu seinem bekannten logischen Existenzkriterium: To be is to be the value of a (bound) variable.11 Es mag nach dem Obigen als philosophischer Rückschritt erscheinen, wenn in neueren logischen Darstellungen der Existenzproblematik doch wieder ein “Existenzprädikat” auftritt. Dies geschieht auf zweierlei Weise. Im Rahmen der modalen Quantorenlogik wird üblicherweise unterschieden zwischen einem Bereich von realen Objekten und weiteren Bereichen von nicht aktualisierten, möglichen Dingen. Hier dient ein Existenzprädikat erster Stufe dazu, gerade den Bereich der realen Objekte auszuzeichnen. Die hinter diesem modalen Formalismus stehende philosophische Perspektive muß sich allerdings mit dem Vorwurf auseinandersetzen, die Existenz/Subsistenz-Unterscheidung gewissermaßen durch die Hintertür doch wieder zuzulassen. Quine blieb sich in diesem Punkte treu und lehnte die Verbindung von Modalität und Quantifikation als philosophisch unbrauchbar ab (siehe Unterabschnitt 0.2.7). Der andere Zusammenhang, in dem das Existenzprädikat wieder auftritt, ist die Kennzeichnungstheorie. Ein technisch wie philosophisch befriedigendes Verfahren besteht darin, bei der semantischen Interpretation einer Sprache einen “Überhang” von nicht-denotierenden Termen zuzulassen und denjenigen Individuenausdrücken, die bei einer gegebenen Interpretation auch wirklich ein Objekt bezeichnen, das Existenzprädikat zuzusprechen. Derartige Logiksysteme heißen freie Logiken (siehe Kapitel 13). Ein solches Existenzprädikat steht jedoch für keine Eigenschaft, die einem Ding zuwachsen kann: es ist rein syntaktischer Natur und drückt — angewandt auf etwa auf einen Kennzeichnungsterm — lediglich aus, daß dieser ein Denotat besitzt. Es gilt hier also zu unterscheiden zwischen der Ebene der Sprache und der Ebene der “Welt”: das Existenzprädikat ist auf der Sprachebene angesiedelt und besitzt keine Entsprechung als Eigenschaft oder Qualität von Dingen auf der ontologischen Ebene. In [199] bezeichnet Quine die Lehre von den nicht-aktualisierten Possibilia als “Platons Bart”, der es in seinem Wildwuchs über die Jahrhunderte immer wieder geschafft habe, die Klinge des Ockhamschen Rasiermessers stumpf zu machen. Mit dem Rasiermesser wird traditionell die nominalistische Maxime bezeichnet, nach der Entitäten nicht ohne Not vermehrt werden sollen: Entia non sunt multiplicanda praeter necessitatem. Der Nominalismus, der im mittelalterlichen Streit um den ontologischen Status der Begriffe oder Universalien die Position vertrat, Begriffe seien keine realen Entitäten, sondern lediglich flatus vocis, erfuhr eine bedeutende Renaissance in der logischen Philosophie des 20. Jahrhunderts. Ein formaler Individuenkalkül wurde entwickelt, der der philosophischen Position eine logische Basis verleiht. Seine Objekte sind Einzeldinge, welche jedoch Teile besitzen und selbst Teil von größeren Einzeldingen sein können. Die Subsumtionsrelation zwischen Individuum und Begriff wird umgedeutet in die Teil-Ganzes-Beziehung zwischen einem kleineren und einem umfassenderen Einzelding. Begriffe werden so zu Individuen derselben Art wie die Dinge, die sie in der üblichen Sprechweise subsumieren. Nach dem griechischen Wort (meros) für ‘Teil’ werden derartige nominalistische Systeme auch Mereo11 “Existieren bedeutet, Wert einer (gebundenen) Variable zu sein.” ([199]:15; gebundene Variablen sind Platzhalter in quantifizierten Aussagen, siehe Kapitel 4.) — Hier wurde ein wenig vereinfacht: genau genommen sagt dieses Kriterium nach Quine nur etwas darüber aus, welche ontologischen Verpflichtungen (engl. ontological commitments) jemand mit seinen Aussagen oder seiner Theorie eingeht.
xxxvi
Einleitung
logien genannt; ihnen ist das Kapitel 13 gewidmet (siehe zur Einführung auch Unterabschnitt 0.2.5). Ein Sonderfall des modernen Universalienstreits wird in der Philosophie der Logik und Mathematik ausgetragen. Was die Logik betrifft, so dokumentiert sich eine Ablehnung des Begriffsrealismus, wie er etwa noch von Frege vertreten wurde, durch die Festlegung auf die Logik erster Stufe, die nur über Individuen quantifiziert. In der Logik höherer Stufe treten dagegen Begriffe oder ihre extensionalen Gegenstücke, die Mengen, als Werte gebundener Variablen auf, was nach dem Quineschen Kriterium der ontologischen Verpflichtung auf Begriffe bzw. Mengen gleichkommt. Die Mathematik hat es in der Standarddeutung ausschließlich mit abstrakten Objekten zu tun, mit Zahlen, Funktionen und Mengen. Der mathematische Platonismus geht von der “realen” Existenz all dieser Objekte aus. Dagegen tritt der mathematische Nominalismus auf, und zwar in einer gemäßigten und einer radikalen Form: jener bestreitet lediglich die Existenz von Mengen; dieser lehnt alle abstrakten Objekte ab und versucht, Mathematik und sogar die Wissenschaft ohne abstrakte Objekte, d.h. also auch ohne Zahlen zu begründen; einschlägige Quellen sind der Überblick [225] sowie [167], [116] und [69].
0.2.2
Prädikation
Einfache Behauptungssätze wie ‘Sokrates ist ein Mensch’ oder ‘Sokrates ist älter als Platon’ stellen singuläre Urteile dar; wir wollen sie elementare Prädikationen nennen. Mit der Behauptung eines derartigen Satzes wird einem Objekt, zum Beispiel Sokrates, eine Eigenschaft zugeschrieben, oder man sagt, das Objekt exemplifiziere die Eigenschaft, oder in noch anderer Sprechweise: das Objekt wird unter einen Begriff subsumiert; dies ist der Spezialfall einer “einstelligen” Prädikation. Wird dagegen in dem Satz ausgesagt, daß zwei oder mehrere Objekte in einer Relation zueinander stehen, zum Beispiel in der Relation ‘. . . ist älter als − − −’, so handelt es sich um eine “zweistellige” oder “mehrstellige” Prädikation. Im einstelligen Fall wird das Subsumtionsverhältnis im Deutschen typischerweise durch die Kopula ‘ist’ wiedergegeben, aber auch nur dann, wenn es sich um eine Konstruktion mit Prädikatsnomen oder prädikativem Adjektiv handelt, und nicht um das ‘ist’ der Gleichheit (siehe unten) oder um intransitive Konstruktionen wie ‘Sokrates spricht’. In diesem Fall, wie auch generell in mehrstelligen Prädikationen, ist die Subsumtionsbeziehung gar nicht lexikalisiert; Subjekt und Prädikatausdruck werden einfach nebeneinandergestellt oder juxtaponiert.12 Logisch gesehen handelt es sich bei der Prädikation dennoch um eine Operation, die die Basis aller Urteile über die Welt bildet. Wir hatten schon erwähnt, daß Frege die Analogie zum Funktionsbegriff in der Mathematik zog; der Subsumtionsoperation entspricht dort die Operation der Anwendung oder Auswertung einer Funktion auf ein oder mehrere Argumente. Es besteht jedoch ein wichtiger syntaktischer Unterschied zum mathematischen Fall: dort sind Argument und Ergebnis (Input und Output) der Anwendung der Funktion typischerweise von der gleichen Art, etwa reelle Zahlen wie bei der Quadratfunktion x 7→ x2 ; in der natursprachlichen wie in der logischen Grammatik dagegen sind die Argumente ein oder mehrere Individuenterme (im einfachsten Fall Namen), 12 In vielen Sprachen der Welt gibt es auch keine Kopula, und Prädikationen werden ausschließlich durch Juxtaposition bewerkstelligt.
Moderne Logik und Philosophie
xxxvii
und das Ergebnis ist ein Satz . Ein Satz aber gehört zu einer anderen syntaktischen Kategorie als ein Name; er bezeichnet keine Objekte, sondern ist der Träger von Wahrheit oder Falschheit: bei einem vollständigen Satz fragt man danach, ob er als Aussage in einer gegebenen Situation wahr oder falsch ist. Die ergänzungsbedürftigen Prädikate vor der Auswertung, wie ‘. . . ist ein Mensch’ und ‘. . . ist älter als − − −’, kann man entsprechend “Satzfunktionen” nennen; verbreiteter ist der Ausdruck Aussagefunktion (engl. propositional function). 13 Neben den Kategorien Name und Satz ist Prädikat die dritte syntaktische Grundkategorie. Es stellt sich die Frage, ob Prädikate auch als Namen auftreten können; wenn das zugelassen wird, so könnte ein Prädikat, etwa P , im Prinzip auch auf sich selbst angewendet werden, in der Form P (P ). In einer berühmten Passage des Dialogs Parmenides diskutiert Platon genau diese Frage, die sich als ein logisches Problem für die Ideenlehre darstellt. Wenn man nämlich zum Beispiel neben den guten Dingen oder Taten noch ein Objekt wie den Begriff oder die Idee des Guten, also “das Gute”, in die Ontologie einführt, dann könnte man sinnvoll fragen, ob das Gute gut sei; ein solcher Satz hätte gerade die Form P (P ). Ebenso könnte das Große groß genannt werden, usw. Nun führt die Annahme, daß die Idee zu den Dingen gehört, die sie subsumiert, zu einem unendlichen Regreß, wie Platon zeigt. Dieses Argument werden wir in Kapitel 5 logisch rekonstruieren. Seit Aristoteles wird das Argument auch der Dritte Mensch genannt;14 es läßt sich natürlich sofort blockieren, wenn man das Prinzip der Selbstanwendung für ungültig erklärt. Die Idee einer Pfeife ist offensichtlich ebenso wenig eine Pfeife wie das Bild einer Pfeife eine Pfeife ist;15 man kann sie (die Idee) zum Beispiel nicht mit Tabak vollstopfen. Genauso wenig ist der Begriff des Pferdes ein Pferd: der Begriff des Pferdes wiehert nicht. Andererseits scheint es auf den ersten Blick Prädikate zu geben, die auf sich selbst zutreffen: das Prädikat dreisilbig ist offenbar dreisilbig. Hier lauert allerdings ein anderes Paradox, das nach K. Grelling benannt ist. Nennen wir ein Prädikat autolog, wenn es die Eigenschaft besitzt, die es ausdrückt, anderenfalls heterolog. Offensichtlich ist dreisilbig autolog, zweisilbig dagegen heterolog. Was aber ist mit dem Prädikat heterolog selbst? Es ist entweder autolog oder heterolog. Angenommen, es sei autolog; dann besitzt es die Eigenschaft, die es ausdrückt, also ist es heterolog. Umgekehrt besagt die Annahme, es sei heterolog, daß es diese Eigenschaft nicht hat; das ist aber gerade die Bedeutung von heterolog, also ist das Prädikat autolog. Das ist ein Widerspruch, da kein Prädikat zugleich autolog und heterolog sein kann. Wir haben es hier mit einer der sogenannten semantischen Paradoxien zu tun, von denen die bekannteste die oben erwähnte Lügner-Paradoxie ist. Wir werden später darauf zurückkommen. Hier wollen wir vorerst nur eine offensichtliche Schwierigkeit mit dieser Art von Beispielen ansprechen, nämlich ihre 13 Es
gibt allerdings eine Diskussion um den genauen ontologischen Status von Aussagefunktionen; in den Principia Mathematica [263] scheinen Russell und Whitehead der Auffassung zu sein, daß propositionale Funktionen Abstraktionen aus Propositionen, also Sachverhalten, sind und nicht Abstraktionen aus Aussagen als sprachlichen Gebilden. Eine Quelle von Verwirrung, von der auch Russell selbst nicht frei war, liegt in dem Umstand, daß im Englischen ‘proposition’ zunächst ´Aussage’ bedeutet, im philosophischen Kontext aber eben auch ‘Proposition’ meinen kann. 14 In der Zweiten Analytik , 83a, benützt Aristoteles das Beispiel Mensch; dort wird der Schluß gezogen, daß die Ideenlehre aufgegeben werden muß. 15 Man denke an das bekannte Bild von Magritte: Ce n’est pas une pipe.
xxxviii
Einleitung
grammatische Ungenauigkeit. Es war Frege, der darauf hinwies, daß das Wort ‘Pferd ’, als Prädikat gebraucht, für einen “ungesättigten” Begriff erster Ordnung steht; ein solcher Begriff verlangt aber zu seiner “Sättigung” ein Individuum und keinen weiteren Begriff. Folglich ist die Selbstanwendung ein Kategorienfehler und von vornherein unzulässig. Prädikate können also nicht als Namen auftreten, da Prädikate für Begriffe und Namen für Individuen stehen. Ebenso wie Begriff und Individuum von verschiedenem logischem Typ sind, sind Prädikat und (Individuen-)Name von verschiedenem syntaktischem Typ (auf der syntaktischen Ebene werden wir statt von Typ von Kategorie sprechen). Nun haben wir oben bereits einen Beispielsatz gebildet, in denen der Begriff des Pferdes als Subjekt und nicht als Prädikat auftritt. Syntaktisch gesehen ist damit der Ausdruck ‘der Begriff des Pferdes’ offenbar ein Individuenname, und sein Gegenstand scheint ein Begriff zu sein. Frege sah dieses Problem und behauptete kühn, daß trotz einer “freilich unvermeidbaren sprachlichen Härte” der Begriff Pferd kein Begriff sei, “während doch z. B. die Stadt Berlin eine Stadt und der Vulkan Vesuv ein Vulkan ist.” ([75]: 71) Stattdessen ist ‘der Begriff Pferd ’ ein Name für ein Individuum, welches lediglich ein “Korrelat” des Begriffs des Pferdes darstellt. Man kann den hier intendierten Unterschied im logischen Typ durch einen Vergleich mit dem syntaktischen Prozeß der Nominalisierung klarmachen. Betrachten wir das folgende Satzpaar. (17)
a.
Troja wurde zerstört.
b.
Die Zerstörung Trojas ist das Thema von Homers Ilias.
In Satz (17a) tritt ‘zerstört werden’ als Prädikat auf und steht für den entsprechenden Begriff, der durch ein Individuum (Troja) gesättigt werden muß. Der Ausdruck ‘die Zerstörung Trojas’ in (17b) dagegen ist ein Name für den Gegenstand, der das Korrelat des Begriffs, zerstört zu werden, bildet, und der selbst wieder unter einen Begriff erster Ordnung fällt, nämlich Thema von Homers Ilias zu sein. Trotz dieser beträchtlichen begrifflichen Sorgfalt war Frege den Gefahren der Selbstprädikation noch nicht gänzlich entkommen. Ein im Gesamtkontext seines Hauptwerks [77] harmlos erscheinendes Prinzip macht das System der Fregeschen Logik anfällig für eine Spielart der Russell-Paradoxie. Nach diesem Prinzip kann man von jedem Begriff zu seinem Umfang oder “Wertverlauf”, wie Frege sagt, übergehen und damit zu einem neuen Individuum, das typenmäßig eine Art Begriffskorrelat darstellt. Auf diese Weise wird die Selbstanwendung quasi durch die Hintertür wieder möglich. Im Juni 1902 schreibt nun Russell in seinem berühmten Brief an Frege (er nennt “Prädicat”, was Frege mit “Begriff” meint): Nur in einem Punkt ist mir eine Schwierigkeit begegnet. ... Sei w das Prädicat, ein Prädicat zu sein welches von sich selbst nicht prädicirt werden kann. Kann man w von sich selbst prädiciren? Aus jeder Antwort folgt das Gegenteil. Deshalb muß man schliessen, dass w kein Prädicat ist. Ebenso giebt es keine Klasse (als Ganzes) derjenigen Klassen die als Ganze sich selber nicht angehören. Daraus schliesse ich dass unter gewissen Umständen eine definierbare Menge kein Ganzes bildet. ([219]: 59)
Die sicherste Strategie besteht also darin, an einer strikte Trennung der logischen Typen festzuhalten. Danach sind gewöhnliche Gegenstände oder Individuen vom
Moderne Logik und Philosophie
xxxix
Typ 0, Begriffe (erster Stufe) vom Typ 1 und, wenn man solche Objekte zulassen will, Begriffe, welche Begriffe erster Stufe subsumieren, vom Typ 2, usw. Dies ist gerade der Kern der Russellschen Typentheorie. Operationen wie die Bildung von Begriffskorrelaten haben dagegen den Effekt, Objekte höheren Typs in einen niederen Typ “hineinzuprojizieren”, was zu Widersprüchen führen kann.16 Typentheoretisch gesprochen drückt also die Prädikation die Subsumtion eines Objekts eines gewissen Typs n unter einen Begriff des Typs n + 1 aus (in der normalen Prädikatenlogik erster Stufe ist n = 0). Wenn wir nun die Beziehung der Prädikation selbst in den Blick nehmen (und sie hier etwa ‘Π’ nennen), so ist sie damit eine irreflexive Relation: für kein Objekt x gilt xΠx. Die Elementschaftsrelation in der Mengenlehre ist ebenfalls irreflexiv (für keine Menge x gilt x ∈ x). Das ist ein Grund dafür, daß in der Tarski-Semantik die Prädikation durch die ∈-Relation wiedergegeben oder “modelliert” wird. Nach dem Bekanntwerden der Paradoxien lokalisierten einige Logiker und Philosophen die Schwierigkeiten in der Prädikationsrelation selbst und versuchten sie dadurch zu entschärfen, daß sie die irreflexive Subsumtionsbeziehung durch eine reflexive Teilbeziehung ersetzten. Danach ist etwa das elementare Urteil ‘der Taj Mahal ist weiß ’ eine Aussage von dem Verhältnis eines Teiles zu seinem Ganzen: das Weiß des Taj Mahal ist ein Teil des “Weißen in der Welt”, d.h. der Summe alles Weißen. Teil und Ganzes sind jetzt Objekte gleichen Typs, nämlich Individuen, und die Subsumtion ist mitsamt den Begriffen eliminiert. Philosophisch bedeutet das zugleich das Optieren für eine nominalistische Ontologie, in der Universalien, also Begriffe oder Ideen, nicht mehr auftreten. Bei dieser Deutung der Struktur elementarer Urteile wird die reflexive Selbstanwendung möglich und sogar zu einer trivialen Wahrheit: ‘das Weiße ist weiß ’ etwa bedeutet jetzt nichts anderes als daß die Summe alles Weißen ein (unechter) Teil von sich selbst ist, so wie jedes Raumgebiet ein unechter Teil von sich selbst ist. Aufgabe der Logik ist es nun, die verschiedenartigen formalen Prinzipien herauszuarbeiten, denen die Prädikationsrelation Π gegenüber der Teilrelation (nennen wir sie T ) gehorcht. Während jene wesentlich irreflexiv ist, ist diese reflexiv , d.h. für alle möglichen Relata x gilt xT x. Im Gegensatz zu Π ist T ferner transitiv , d.h. für alle Objekte x, y, z mit xT y und yT z gilt auch xT z: der Teil eines Teils eines Objekts ist selbst ein Teil dieses Objekts. Die Logik der Teilrelation ist gemessen an der Mengentheorie relativ einfach; ihre Theorie wird in Kapitel 13 behandelt (siehe auch Unterabschnitt 0.2.5). Wir wollen noch eine letzte philosophische Schwierigkeit im Zusammenhang mit der Prädikation ansprechen, deren Kern ebenfalls genuin logischer Natur ist; sie ist unter dem Namen “Bradleys Regreß ” bekannt (siehe [30]). Wenn nämlich die Subsumtionsbeziehung Π eine Relation ist, die Objekte x und Eigenschaften P in der Form xΠP miteinander verbindet, so existiert sie offenbar unabhängig von ihren Relata. Dann muß es aber, so das Argument, eine weitere Relation Π0 geben, welche die Entitäten x, P und Π miteinander verbindet. Diese neue Verbindung wird dann ihrerseits von einer weiteren Relation Π00 gestiftet, und so fort ad infinitum. Nun stellt dieses Argument für einen Philosophen, der Relationen als “Bürger erster Klasse” in seiner Ontologie etablieren möchte, durchaus 16 ... aber nicht muß; in der mathematischen Logik und der Informatik sind wichtige typenfreie Systeme entwickelt worden, welche Selbstanwendung zulassen und dennoch widerspruchsfrei sind.
xl
Einleitung
ein ernstes Problem dar. Jedes sprachliche In-Verbindung-setzen von gegebenen Objekten erzeugt danach eine Relation, welche die Relata wie ein Klebstoff zusammenfügt; dann benötigen wir aber offenbar einen neuen “Klebstoff”, der die Ausgangsrelata mit der Relation verbindet, usw. Es war kein geringerer als Russell, der mit seinem neuen ontologischen Realismus (speziell auch in Bezug auf Relationen) den neo-hegelianischen Idealismus eines Bradley überwunden zu haben glaubte, sich dennoch mit dem Regreßproblem jahrelang herumschlug und es eigentlich nie wirklich los wurde. Ein Grund ist darin zu suchen, daß Russell ein Universalienrealist war und Relationen wie Eigenschaften und Individuen zu den in der Welt existierenden Entitäten rechnete; ein Nominalist könnte den Regreß gleich im ersten Schritt stoppen. Ohne hier eine endgültige Antwort geben zu können, verweisen wir auf die Modellierung von Relationen in der modernen Mengenlehre als Klassen von geordneten Paaren der Gestalt hx, yi; die Prädikationsrelation wäre dann etwa die Klasse aller Paare hx, yi mit x ∈ y. Nun ist diese Klasse allerdings so groß, dass sie selbst nicht wieder als Komponente in einem derartigen geordneten Paar auftreten kann. Sie gehört zu den Objekten in der Mengenlehre (den sogenannten echten Klassen), die nicht als Element von irgendetwas auftreten können. Sie kann lediglich nach Art der Zusammenfügung von Teilen zu etwas anderem hinzukommen; hierbei handelt es sich aber nicht mehr um Subsumtion.
0.2.3
Identität Hamlet: But come; for England! Farewell, dear mother. King: Thy loving father, Hamlet. Hamlet: My mother: father and mother is man and wife; man and wife is one flesh; and so, my mother. Shakespeare, Hamlet
Wie bereits erwähnt erfüllt die Kopula ‘ist’ neben der Prädikation noch eine zweite Funktion: sie wird für Identitätsaussagen gebraucht. Hier sind einige Beispiele. (18)
a.
Zwei plus Drei ist (gleich) Fünf.
b.
π ist die Maßzahl für den Flächeninhalt des Einheitskreises.
c.
Marcus Tullius ist Cicero.
d.
Der 18. Brumaire des Jahres VIII ist der 9. November 1799.
e.
Sirius ist der Herbststern der Ilias.
f.
Der Morgenstern ist der Abendstern.
Es liegt daher nahe, das aus der Mathematik bekannte Relationssymbol ‘=’ für die Gleichheit zwischen Individuentermen der angegebenen Art zu verwenden. Danach drückt das Gleichheitszeichen eine Relation aus, welche zwischen zwei Objekten genau dann besteht, wenn sie identisch sind. Diese Ausdrucksweise ist zugegebenermaßen fragwürdig, aber dennoch gang und gäbe. So hört man häufig die folgende Formulierung eines Gleichheitsgesetzes: “Sind zwei Größen einer dritten gleich, so sind sie auch untereinander
Moderne Logik und Philosophie
xli
gleich.” Sie nährt das Mißtrauen des Philosophen in die Existenz einer Relation der Gleichheit. So schreibt L. Wittgenstein in seinem Tractatus logicophilosophicus: “Von zwei Dingen zu sagen, sie seien identisch, ist ein Unsinn, und von Einem zu sagen, es sei identisch mit sich selbst, sagt gar nichts.” ([266]: 5.5303) Er schließt daraus, daß die Identität überhaupt keine echte Relation zwischen Gegenständen sein kann, und möchte das Gleichheitssymbol aus einer idealen logischen Begriffsschrift verbannen ([266]: 5.533). Nun sollte man die Logik vielleicht nicht zu leichtfertig zu reformieren versuchen angesichts der Tatsache, daß die exakteste aller Wissenschaften, die Mathematik, seit je mit der Gleichheit nicht nur problemlos umgeht, sondern diese für sie offenbar auch unverzichtbar ist; und eigentlich verhält es sich mit der Kopula der Gleichheit in der Umgangsprache nicht anders. Allerdings hat Wittgenstein recht, wenn er die Laxheit jener Formulierung anprangert. Nun ist es zwar unsinnig, von zwei (verschiedenen) Dingen zu sagen, sie seien identisch, aber nicht, zwei (verschiedene) Namen zu benutzen um auszudrücken, daß sie sich auf denselben Gegenstand beziehen (in diesem Fall sagen wir, die Namen seien koreferentiell ). Dies ist aber genau der Sinn der obigen Beispielsätze. So hat z.B. jede Zahl mehrere (sogar unendlich viele) Namen, etwa die Zahl Fünf die Namen ‘5’, ‘2+3’, ‘8−3’, usw.; die irrationale Zahl, die den Namen ‘π’ trägt, kann auch durch den Ausdruck ‘die Maßzahl für den Flächeninhalt des Einheitskreises’ gekennzeichnet werden; der berühmte römische Konsul und Gegner des Catilina mit dem Namen ‘Marcus Tullius’ ist bekannter unter dem Namen ‘Cicero’; der Tag mit dem Namen ‘18. Brumaire des Jahres VIII ’ im französischen Revolutionskalender wird im gregorianischen Kalender ‘9. November 1799 ’ genannt; der Hauptstern im Sternbild Canis Major trägt den Namen ‘Sirius’ und heißt in Homers Ilias ‘der Herbststern’; und die Venus schließlich hat mindestens die beiden Namen ‘der Morgenstern’ und ‘der Abendstern’. Die Identitätsaussagen in (18) behaupten also einfach in jedem Fall, daß die Individuenterme, die das Gleichheitszeichen flankieren, ein und denselben Gegenstand bezeichnen. Derlei Aussagen sind zugleich insofern informativ , als die Namensgebung auch anders hätte verlaufen können. Das macht sie zu einem wichtigen Instrument sprachlicher Kommunikation. Die vielen Anführungszeichen im letzten Absatz machen augenfällig, daß wir es bei der Identitätsproblematik mit einer zweiten Relation zu tun haben, die nicht immer von der Gleichheitsrelation sauber unterschieden wird; sie besteht nicht zwischen den Gegenständen selbst, sondern zwischen sprachlichen Ausdrücken, die sich auf Gegenstände beziehen. Um aber nun über Ausdrücke sprechen zu können, benötigen wir Namen für die Ausdrücke selbst und nicht für die Objekte, auf die sich die Ausdrücke beziehen; sie werden am einfachsten durch (einfache) Anführungsstriche erzeugt. Die neue Relation zwischen den Ausdrücken ist aber gerade die der Koreferentialität. Da man Ausdrücke gebraucht (engl. use), wenn man sich auf die Objekte bezieht, und sie erwähnt (engl. mention), wenn man sie in Anführungsstriche setzt und damit über sie selbst spricht, wollen wir die Vermengung dieser Ebenen einen Gebrauch/Erwähnungs-Fehler nennen (engl. use/mention slur-over ).17 G. W. Leibniz hat ein berühmtes Kriterium für die Identität formuliert. Im lateinischen Original lautet es ([155]: 156): Eadem sunt quorum unum potest 17 Zu der für die Logik wesentlichen Unterscheidung von Gebrauch und Erwähnung siehe Kapitel 1.
xlii
Einleitung
substitui alteri salva veritate (Zwei Dinge sind gleich, wenn eines für das andere unter Erhaltung der Wahrheit ersetzt werden kann). Leider findet sich hier genau die Vermengung von Ausdrücken und Bezugsobjekten, die Wittgenstein kritisiert: Es sind Ausdrücke, die in einem Satz füreinander ersetzt werden können, und nicht Gegenstände. Allerdings läßt sich dieser Gebrauch/ErwähnungsFehler korrigieren, ohne die Existenz der Gleichheitsrelation in Frage zu stellen. Dazu beginnen wir damit, aus dem Leibniz-Zitat ein Prinzip im Sinne der modernen Logik zu extrahieren, und ignorieren zunächst die Objekt/NamenProblematik. Die Bedingung der Ersetzbarkeit ist so zu interpretieren, daß sie ausnahmslos und stets gelten soll, d.h. das eine Ding kann das andere jederzeit in allen Kontexten ersetzen, ohne daß die Wahrheitswert tangiert wird. Statt von Kontexten wollen wir “ontologischer” von Eigenschaften sprechen; dann sagt die Identitätsbedingung, daß das eine Objekt in einer jeden Instanz der Subsumtionsbeziehung mit einer Eigenschaft an die Stelle des anderen Objekts treten kann, ohne die Subsumtion zu stören. Kurz gesagt lautet jetzt das Kriterium: (19)
Stimmen zwei Objekte in allen ihren Eigenschaften überein, so sind sie gleich.
Dies ist die bekannte identitas indiscernibilium, die Gleichheit des Ununterscheidbaren. Sie ist ein Korollar der metaphysischen Überzeugung, daß zwei Substanzen als identisch anzusehen sind, wenn sie durch keine Eigenschaft voneinander “getrennt”, d.h. unterschieden werden können. Hierin drückt sich ein Ökonomie-Prinzip aus: eine Welt mit zwei verschiedenen Dingen, die sich jedoch in ihren Eigenschaften vollkommen gleichen, entspränge einem redundanten Schöpfungsplan, der nach Leibniz auszuschließen ist. Wir paraphrasieren nun (19) in einer Explizitfassung (20a), die zwar noch umgangsprachlich formuliert ist, aber die logische Struktur deutlich macht; diese ist unter (20b) angefügt. Ferner kürzen wir das Kriterium der Ununterscheidbarkeit im Vorderglied von (20b), nämlich das Zutreffen derselben Eigenschaften, durch die Relation Indisc(x, y) ab und erhalten so die übersichtliche Version (20c). (20)
a.
Für alle Objekte x und y gilt: wenn für alle Eigenschaften F gilt, daß F auf x dann und nur dann zutrifft, wenn F auf y zutrifft, so ist x gleich y.18
b.
∀x∀y (∀F (F x ↔ F y) → x = y)
c.
∀x∀y (Indisc(x, y) → x = y)
Wir stellen fest, daß sich die Vermengung von Gebrauch und Erwähnung beim Übergang zur Explizitfassung verflüchtigt hat: wir müssen gar nicht mehr von zwei Objekten reden, sondern benötigen lediglich zwei verschiedene (variable) Namen ‘x’ und ‘y’ zur Formulierung des Prinzips. Die beiden Variablen durchlaufen denselben Individuenbereich; keine begriffliche Beschränkung hindert sie daran, auch denselben Wert anzunehmen, d.h., koreferentiell zu werden. 18 Wenn eine gegebene Eigenschaft als ein beliebiger, aber “fester” Parameter betrachtet wird, wie das in der Prädikatenlogik der ersten Stufe ausschließlich der Fall ist, benutzen wir zu ihrer Mitteilung die Buchstaben ‘P ’, ‘Q’, usw.; hier benötigen wir dagegen eine Eigenschaftsvariable für eine generelle Aussage über alle Eigenschaften, mit dem zweitstufigen Variablensymbol ‘F ’ (siehe Kapitel 20.)
Moderne Logik und Philosophie
xliii
Das Problem mit dem Kriterium der Ununterscheidbarkeit Indisc(x, y) liegt darin, daß es in der elementaren Logik, d.h. in der Quantorenlogik der ersten Stufe, gar nicht formulierbar ist. Es benutzt wesentlich eine Quantifikation über Eigenschaftsvariablen oder Variablen zweiter Stufe. Geht man jedoch zur Logik der zweiten Stufe über, so kann das Kriterium als Definition der Identität hergenommen werden; so verfährt etwa Russell in der Typenlogik der Principia Mathematica, die die Logik zweiter Stufe umfaßt. Nun gibt es viele gewichtige theoretische Gründe, an der elementaren Logik festzuhalten. In ihr ist zwar das Ununterscheidbarkeitskriterium nicht formulierbar, aber eine Art Umkehrung davon, die Ununterscheidbarkeit des Gleichen; sie wird von Leibniz in der erwähnten Schrift ebenfalls angesprochen, wenn er schreibt ([155]: 156): et contra si Eadem etiam sint A et B, procedet substitutio quam dixi. Das heißt, daß bei Gleichheit von x und y die Substitution von x durch y in jeder der Aussagen F x erlaubt ist und umgekehrt. Natürlich würden wir in der Frage der erststufigen Ausdrückbarkeit nichts gewinnen, wenn wir wiederum einen Quantor über ‘P ’ einführen. Da aber bei dieser Richtung die Eigenschaftsquantifikation “nach außen” gezogen werden kann, können wir das Prinzip “fallweise” auffassen und schematisch formulieren; dies ist in der ersten Stufe möglich. Zugleich gehen wir zur nicht-ontologischen, rein sprachlichen Version über; Eigenschaften werden dann wieder zu “Kontexten”, d.h. zu Formeln in der Sprache der ersten Stufe, die wir mit dem Symbol ‘φ[∗]’ wiedergeben (anstelle des Sterns kann ‘x’ bzw. ‘y’ treten). In (21a) findet sich die Explizitfassung der Umkehrung, und unter b) ihre logische Form. (21)
a.
Sei φ[∗] ein beliebiger Kontext in der Sprache der elementaren Logik; dann gilt für alle Objekte x und y: ist x gleich y, so gilt φ[x] genau dann, wenn φ[y] gilt.
b.
∀x∀y (x = y → (φ[x] ↔ φ[y]))
Auf diese Weise sind wir zu dem zentralen Axiomenschema der Identitätslogik der ersten Stufe gelangt, welches Leibnizsches Substitutionsprinzip oder einfach Leibniz-Prinzip (engl. Leibniz’ law ), genannt wird; wir verwenden im folgenden meist das Kürzel “(Lb)”. Sind nun zwei koreferentielle Ausdrücke gegeben, so kann man in (21b) die Variablen x und y auf sie spezialisieren. Eine wahre Aussage über den bezeichneten Gegenstand bleibt dann wahr, wenn der eine durch den anderen ersetzt wird. Danach gilt z.B. wegen 2+3 = 5 auch 22+3 = 25 . Oder hat man erkannt, daß der Abendstern gleich dem Morgenstern ist, so folgt aus der wahren Aussage der Abenstern ist der zweitinnerste Planet des Sonnensystems auch die Wahrheit der Aussage der Morgenstern ist der zweitinnerste Planet des Sonnensystems. Die Ersetzung ist damit auch im folgenden Beispiel (22a,b) gültig: (22)
a.
Der Abendstern steht heute am Abendhimmel.
b.
Der Morgenstern steht heute am Abendhimmel.
c.
Venus steht heute am Abendhimmel.
Dies wird deutlich, wenn man für beide Namen den zugehörigen Planetennamen ‘Venus’ einsetzt; siehe (22c). Läßt man dagegen das temporale Adverb ‘heute’ weg, so drängt sich neben der bisherigen Lesart eine weitere in den Vordergrund, die die Ersetzbarkeit zweifelhaft und die Version c) sogar falsch erscheinen läßt:
xliv (23)
Einleitung a.
Der Abendstern steht am Abendhimmel.
b.
Der Morgenstern steht am Abendhimmel.
c.
Venus steht am Abendhimmel.
Die neue Lesart vermittelt den Eindruck eines “analytischen”, d.h. rein sprachlichen Zusammenhangs zwischen dem Individuenterm ‘der Abenstern’ und dem Prädikat ‘steht am Abendhimmel ’, welcher beim Übergang zu einem zwar koreferentiellen, aber mit einem anderen sprachlichen Gehalt versehenen Term wie ‘Morgenstern’ oder ‘Venus’ verloren geht. Dieses Beispiel zeigt, daß das Substitutionsprinzip nur für solche Kontexte gedacht ist, in denen es lediglich darauf ankommt, welches Objekt die beiden Terme bezeichnen, ganz unabhängig von ihrem deskriptiven Gehalt. Derartige Kontexte heißen extensionale Kontexte. Dadurch, daß die Identitätslogik das Prinzip zum Axiom erhebt, wird sie zu einer extensionalen Logik , wie sie der Mathematik zugrunde liegt. Die Verbindung zur Mathematik, d.h. hier: zur Mengenlehre, ist dabei die folgende: wie oben kurz erwähnt, werden die Begriffe in der Mathematik grundsätzlich mit ihren Umfängen identifiziert. Ein Umfang, auch Extension des Begriffs genannt, ist aber eine Menge von Objekten, die nicht von der Art und Weise ihrer Charakterisierung abhängt. In einer extensionalen Begriffslogik ist demnach der Begriff Lebewesen mit Herz identisch mit dem Begriff Lebewesen mit Niere, da ihre Umfänge übereinstimmen. Für zwei Mengen A und B gilt nämlich das Extensionalitätsprinzip, welches besagt, daß A gleich B ist, wenn A und B dieselben Elemente enthalten. Dieses Prinzip ist gewissermaßen ein Identitätskriterium “von unten”, im Gegensatz zu dem Leibnizschen Prinzip der Gleichheit des Ununterscheidbaren, welches auf die höhertypigen Eigenschaften von Objekten rekurriert und daher ein Kriterium “von oben” ist. Als Extensionalitätsaxiom ist es eines der Axiome der ZF-Mengenlehre und lautet formal: ∀x (x ∈ A ↔ x ∈ B) → A = B
(24)
In der natürlichen Sprache gibt es jedoch auch nicht-extensionale Kontexte, in denen der deskriptive Gehalt von Ausdrücken für die Wahrheit der Aussage eine Rolle spielt. Russell gibt folgendes Beispiel, welches sich auf den Autor des zunächst unter einem Pseudonym veröffentlichten Romans Waverley bezieht. (25)
a.
Georg IV. wollte wissen, ob Scott der Autor von Waverley ist.
b.
Georg IV. wollte wissen, ob Scott Scott ist.
Wie sich herausstellte, war Walter Scott der Autor des anonym veröffentlichten Romans Waverley; dies ist die Information, die den englischen König interessierte, aber nicht die triviale Aussage Scott ist Scott. Hier zeigt sich, daß in sogenannten epistemischen Kontexten des Wissens oder Glaubens das Leibniz-Prinzip ungültig wird. Schreibt man einer Person a eine Überzeugung in der Form a glaubt daß S zu, so hängt die Wahrheit der gesamten Aussage nicht nur von den Denotaten der in S auftretenden Individuenterme ab, sondern von dem, wie Frege sagt, Sinn des Satzes S, in den die Art der gewählten Beschreibungen der Objekte Eingang finden. Das Gebiet der intensionalen Logik befaßt sich mit derartigen Phänomenen. Doch zurück zur Trivialität von Selbstidentitäten wie Scott ist Scott oder allgemeiner a = a; ihre mangelnde Informativität ist der andere Kritikpunkt,
Moderne Logik und Philosophie
xlv
den Wittgenstein im obigen Zitat gegen die Gleichheitsrelation vorbringt. Aber selbst wenn solche Aussagen trivial und uninformativ sind, so sind sie damit noch nicht sinnlos. Das Schema der Selbstidentität zählt im allgemeinen zu den offensichtlichsten logischen Gewißheiten und ist auf jeden Fall, anders als etwa die Selbstprädikation P (P ) oder die Selbstelementschaft x ∈ x, im Hinblick auf mögliche Widersprüche völlig ungefährlich. Es stellt neben dem Substitutionsprinzip das zweite Axiom der klassischen Identitätslogik dar. Wenn wir nun darauf bestehen, daß Identitätsaussagen (über die Brücke der Koreferentialität) von der logischen Relation der Gleichheit selbst handeln, dann scheint es philosophisch gesehen irreführend, etwa zu sagen, es hätte sein können, daß der Morgenstern (also die Venus) nicht der Abendstern (also die Venus) ist. Gleichheit ist keine kontingente Relation, sondern vielmehr eine logisch und metaphysisch notwendige Beziehung, welche genau zwischen jedem Objekt und sich selbst besteht. Was kontingent ist, sind Zuschreibungen wie Aristoteles war der Lehrer Alexanders im Sinne von Aristoteles unterrichtete Alexander . Das hätte auch anders kommen können, d.h. Alexander zu unterrichten ist keine notwendige Eigenschaft von Aristoteles oder sonst jemanden; so entsteht der Eindruck der Kontingenz von Identitätsaussagen. Hier wird allerdings eine neue begriffliche Dimension eingeführt, die der Modalitäten notwendig, möglich, kontingent. Diese erzeugen eine weitere Gruppe von intensionalen Kontexten, die einer gesonderten Behandlung bedarf; siehe unten. Wir erwähnen noch eine weitere wichtige Funktion der Identitätsbeziehung. Will man von einer Eigenschaft P sagen, daß sie nicht-leer ist, also auf mindestens ein Objekt zutrifft, so formuliert man einen einfachen Existenzsatz der Form ∃xP x. Für die weitergehende Bedingung, daß es auch nicht mehr als ein Objekt, also höchstens ein x mit P x gibt, benötigt man das Identitätssymbol. Diese Eindeutigkeitsbedingung lautet, wiederum zunächst lax formuliert: Haben zwei Objekte die Eigenschaft P , so sind sie gleich. Diese Sprechweise kann jedoch auf die gleiche Weise wie oben reformiert werden, indem man zwei Variablen x und y zu Hilfe nimmt; die Bedingung lautet dann: Für alle x und alle y gilt: wenn P x und P y, dann x = y; symbolisch: (26)
∀x∀y (P x ∧ P y → x = y)
Zusammen mit der Existenzbedingung ∃xP x ergibt sich die Einzigkeitsbedingung (= Existenz und Eindeutigkeit) der Russellschen Kennzeichnungstheorie; damit ein Satz wie der gegenwärtige König von Frankreich ist weise überhaupt die “Chance” hat wahr zu sein, muß die Existenz und Eindeutigkeit des Königs von Frankreich zu allererst erfüllt sein. Ist dies der Fall, dann wird der Satz wahr, wenn diese Person gerade die Eigenschaft besitzt, weise zu sein. Dagegen kann der Satz auf dreierlei Weise falsch werden: Entweder es gibt keinen König von Frankreich, oder es gibt zwei davon, oder es gibt zwar genau einen, aber der ist nicht weise. Wie bereits erwähnt, war Russell überzeugt davon, daß Kennzeichnungen wie ‘der gegenwärtige König von Frankreich’, aber auch denotierende wie ‘der Präsident der französischen Republik ’ Scheinkonstituenten in einem Satz darstellen, die in keiner direkten Denotationsbeziehung zu einem Gegenstand stehen; er eliminierte daher Kennzeichnungsterme generell durch die obige Paraphrase und gestand ihrer syntaktischen Gestalt nur einen “virtuellen” Charakter zu. Ist die Einzigkeitsbedingung nicht erüllt, so wird ein elementarer
xlvi
Einleitung
(nicht-negierter) Satz, in dem ein solcher Term auftritt, nach der Elimination einfach falsch. Die freie Logik dagegen ist ein Theorierahmen, in dem Kennzeichnungen nicht eliminiert, sondern syntaktisch ernst genommen und als Individuenterme in der logischen Form beibehalten werden. Die zugehörige Semantik weicht von der klassischen Semantik dadurch ab, indem sie Denotationslücken zuläßt. Die Bedingung, daß ein solcher Individuenausdruck t denotiert, kann man dann durch die Selbstidentität t = t wiedergeben. Diese wird jetzt informativ, allerdings verliert sie dadurch den Status eines stets gültigen Satzes. In der freien Logik ist sie zu dem Existenzprädikat äquivalent. Wir verweisen auf den Abschnitt über freie Logik in Kapitel 13. Wie oben schon erwähnt heißt eine Relation R reflexiv , wenn für jedes Relatum x von R gilt, daß xRx, also daß x mit sich selbst in der Relation R steht. Ferner heißt R symmetrisch, wenn mit xRy auch yRx gilt, und transitiv , wenn aus xRy und yRz die Beziehung xRz folgt. Besitzt R alle drei Eigenschaften, so ist R eine Äquivalenzrelation. Wegen des Prinzips der Selbstidentität ist die Gleichheitsrelation reflexiv. Sie ist ferner symmetrisch und transitiv ; diese Gesetze lassen sich mit dem Leibniz-Prinzip herleiten. Äquivalenzrelationen sind allgegenwärtig; sie treten immer dann auf, wenn eine Anzahl von Objekten sich in einer fest vorgegebenen Eigenschaft gleichen, z.B. wenn Personen die gleiche Körpergröße haben. Die Relation zwischen Ausdrücken, koreferentiell zu sein, ist ebenfalls eine Äquivalenzrelation. Wir kommen im nächsten Unterabschnitt darauf zurück. Ähnlichkeit In dem Umkreis der Identitätsproblematik gehört auch der Begriff der Ähnlichkeit. Man kann das Verhältnis zur Gleichheit am besten durch Abwandlung des Ununterscheidbarkeitskriteriums erläutern: zwei Objekte sind gleich,19 wenn sie in allen ihren Eigenschaften übereinstimmen; zwei Objekte sind einander ähnlich, wenn sie in mindestens einer Eigenschaft übereinstimmen. Zum Beispiel waren sich Mozart und Schubert darin ähnlich, daß sie beide in jungen Jahren starben. Es ist klar, daß jedes Objekt zu sich selbst ähnlich ist; das folgt aus dem Ununterscheidbarkeitskriterium der Selbstidentität.20 Ist ferner a zu b ähnlich, so ist auch b zu a ähnlich. Die Ähnlichkeitsrelation ist damit reflexiv und symmetrisch. Anders als die Gleichheit ist sie jedoch nicht mehr transitiv: die gemeinsame Eigenschaft kann nämlich von einem Ähnlichkeitspaar zum anderen wechseln. Das ist so wie der Freund eines Freundes, der kein Freund mehr zu sein braucht. Anders als bei der Gleichheit und bei der Äquivalenzrelation gibt es keine stabilen Ähnlichkeitsketten. In einem philosophischen Werk des 20. Jahrhunderts spielt eine Ähnlichkeitsbeziehung eine zentrale Rolle. Es handelt sich um Rudolf Carnaps Buch Der logische Aufbau der Welt [38], in dem der Versuch unternommen wird, aus einer einzigen empirischen Relation der Ähnlichkeitserinnerung, genannt ‘Er ’, die Gegenstände der Welt nach dem Vorbild der Principia Mathematica Stufe 19 Wir
wissen jetzt, daß diese Sprechweise harmlos ist. genommen müssen wir dazu voraussetzen, daß jedes Objekt mindestens eine Eigenschaft hat; aber selbst der Mann ohne Eigenschaften hat die Eigenschaft, ein Mann zu sein. 20 Streng
Moderne Logik und Philosophie
xlvii
für Stufe logisch zu konstruieren und damit ein ganzes Konstitutionssystem auf psychischer Basis, also auf der Grundlage unmittelbarer Erlebnisinhalte zu errichten. (Die Wahl der psychischen Basis ist für Carnap allerdings nicht mit einer metaphysischen Prioritätsbehauptung verbunden, sondern hat einen rein methodologischen Charakter). Für uns ist der formale Aspekt wichtig, daß Eigenschaften wie etwa Farbmerkmale Rot, Gelb, Blau als sogenannte Ähnlichkeitskreise auf der Grundlage der Relation Er konstruiert werden, wobei nur die Annahmen der Reflexivität und Symmetrie für Er gemacht werden. Dieses für den Aufbau zentrale Verfahren der Quasianalyse wird in der Theorie der Relationen in Kapitel 10 in seinen Grundzügen dargestellt.
0.2.4
Abstraktion
Abstraktion wird allgemein das Verfahren genannt, aus einer Reihe von Beobachtungen von ähnlichen Einzelobjekten ein gemeinsames Merkmal zu extrahieren und zu einer dieses Merkmal ausdrückenden “Idee” bzw. einem Begriff überzugehen, welcher gerade diejenigen Gegenstände subsumiert, die in den Ausgangsbeobachtungen auftraten. Mit der Abstraktion geht also stets eine Klassenbildung einher: hat man den Begriff sprachlich durch eine Eigenschaft P isoliert, so kann man die Klasse aller x mit P x bilden, etwa die Klasse aller Menschen oder die Klasse aller Vögel. Ursprünglich strebte die Abstraktionsbildung danach, vom Einzelen und Besonderen zum Allgemeinen überzugehen, das sich in einem sprachlichen Konzept niederschlägt. Dieses ist im allgemeinen “feinkörniger” als die reine Klassenbildung; so können wir dieselbe Klasse von Objekten einmal unter dem Begriff Lebewesen mit Herz subsumieren und das andere Mal unter Lebewesen mit Niere. Traditionell unterscheidet man zwischen verschiedenen Inhalten (Intensionen) von Begriffen, welche denselben Umfang (dieselbe Extension) haben können. Der Umfang oder die Extension eines Begriffs ist wie schon erwähnt gerade die Klasse der Objekte, die unter ihn fallen. Der gedanklichen Operation der Abstraktion entspricht in der Logik ein Operator , welcher alle Instanzen x einer Prädikation P x mit ein und derselben Eigenschaft P zu einer Klasse oder Menge zusammenfaßt. Der extensionale Charakter der klassischen Logik drückt sich nun gerade darin aus, daß dieser Abstraktions- oder (wie wir das oben nannten) Komprehensionsprozeß umfangsgleiche Begriffe identifiziert; ihre Semantik ordnet dem Begriff Lebewesen mit Herz dieselbe Menge von Objekten zu wie dem Begriff Lebewesen mit Niere, und dies deshalb, weil für alle Objekte x gilt: x ist genau dann ein Lebewesen mit Herz, wenn x ein Lebewesen mit Niere ist. Es ist klar, daß damit die “Individualität” von Begiffen verloren geht. Der Begriff Lebewesen mit Herz enthält den Bestandteil Herz , mit dem wir ein anderes Körpergebilde und eine andere Funktion verbinden als mit der Komponente Niere. Die extensionale Logik entledigt sich auf diese Weise jedoch einer philosophischen Schwierigkeit, welche bei heute kontrovers diskutiert wird: Was genau sind die Identitätskriterien für Begriffe? Gleichheit des sprachlichen Ausdrucks kann es nicht sein, weil wir sicher sagen möchten, daß der Begriff, auf den ich mich im Deutschen mit ‘Lebewesen mit Herz ’ beziehe, derselbe ist wie der, welcher im Englischen durch ‘creature with a heart’ mitgeteilt wird. Wann aber genau zwei Ausdrücke verschiedener Sprachen synonym sind, ist eine schwierige Frage; außerdem macht die Redeweise von Begriffen die metaphysische Voraussetzung, daß Begriffe eine außersprachliche Realität besitzen, was von den
xlviii
Einleitung
Nominalisten bestritten wird. Dagegen haben Klassen oder Mengen ein präzises Kriterium für ihre Identität: sie sind gleich, wenn sie dieselben Elemente enthalten. Dies ist der Inhalt des Extensionalitätsaxioms der Mengenlehre (siehe (24) sowie Kapitel 9). Das macht sie den intensional verstandenen Begriffen ohne klares Identitätskriterium überlegen. Nun gab es Versuche, ein solches Kriterium auch für intensionale Objekte, zu denen neben Begriffen oder Eigenschaften auch “mehrstellige” Begriffe (= intensionale Relationen, engl. relations-in-intension) und Sachverhalte (= Propositionen) zählen, zu entwickeln. Die intensionale Logik verwendet den Begriff der möglichen Welt, um die Identitätsrelation feinkörniger zu gestalten. Danach sind zwei Begriffe erst dann identisch, wenn sie nicht nur in der realen Welt, sondern in jeder möglichen Welt den gleichen Umfang haben. Die üblichen Beispiele lauten hier, daß der Begriff Mensch zwar dieselbe Extension wie der Begriff federloser Zweifüßler besitzt, aber diese Umfangsgleichheit nicht notwendig, d.h. in anderen möglichen Welten verletzt ist. Also sind diese Begriffe nicht identisch. Anders verhält es sich mit dem Begriffspaar Mensch und vernunftbegabtes Wesen: hier liegt Gleichheit vor, da die Vernunftbegabtheit als wesentliches Merkmal des Menschseins gilt und daher zur Extensionsgleichheit in allen Welten führt. Mit den möglichen Welten beschäftigen wir uns im Unterabschnitt 0.2.7 und ausführlich in den Kapiteln 14 und 15 zur Modallogik. Dort wird sich zeigen, daß sich mit dem hier geschilderten Übergang zu den sogenannten Intensionsfunktionen nicht alle Probleme der Intensionalität lösen lassen. Kehren wir zurück zur extensionalen Auffassung von Abstraktion und zur Bildung von Klassen oder Mengen statt (intensionalen) Begriffen. Ein Nominalist könnte auch mit der Klassenbildung unzufrieden sein. Zwar werden jetzt, so könnte er sagen, vielleicht keine Allgemeinbegriffe mehr erzeugt, aber immer noch abstrakte Objekte, und auch diese seien abzulehnen. Da andererseits die Klassenbildung für die Wissenschaft unverzichtbar ist, könnte er die folgende nominalistische Umdeutung des Abstraktionsprozesses vorschlagen: es sei eine beliebige Eigenschaft gegeben, welche durch eine Satzform der Gestalt φ[x] bezeichnet sei; die Abstraktion von den einzelnen Objekten x, für die φ[x] gilt, zur Klasse der x mit φ[x] besteht lediglich in einer sprachlichen Figur, etwa ‘ˆ xφ[x]’ genannt; diesem Ausdruck entspricht aber in der Ontologie kein abstraktes Objekt. Nehmen wir zum Beispiel die angeblich abstrakte Zahl Fünf. Ein Standardname sei das fettgedruckte Zahlzeichen (die “Ziffer”) ‘5’; nun betrachten wir alle Paare von Zahlausdrücken s, t, so daß die Gleichheit ‘s = t’ in der Arithmetik wahr ist (z.B. die Zahlenterme ‘2 + 3’, ‘8 · 3’). Diese Bedingung führt zu einer Äquivalenzrelation auf den arithmetischen Termen, die wir mit ∼ bezeichnen; sie teilt die Terme in eine Gesamtheit von paarweise fremden und die Menge der Terme ausschöpfenden Teilmengen ein, die die Äquivalenzklassen zu ∼ heißen. Damit liegt jeder Term in genau einer dieser Klassen. Zum Beispiel ist die Menge der zur Ziffer ‘5’ äquivalenten Terme gerade die, ontologisch gesprochen, Koreferentialitätsklasse von ‘5’. Sei ψ[∗] eine beliebige zahlentheoretische Aussageform; aufgrund des Leibniz-Prinzips können wir sicher sein, daß, wenn ψ[s] und s ∼ t wahr sind, dann auch ψ[t] gilt. Damit hängt die Wahrheit von ψ[∗] gar nicht von dem, wie man sagt, gewählten Repräsentanten der betref-
Moderne Logik und Philosophie
xlix
ˆ durch fenden Äquivalenzklasse ab. Wir führen jetzt das “abstrakte Objekt” 5 ˆ all die arithmetiden sprachlichen Ausdruck ‘ˆ x(x ∼ 5)’ ein. Dann besitzt 5 schen Eigenschaften ψ , die man der Zahl Fünf intuitiv zuschreibt, vermöge der Eliminationsregel (27)
ˆ ] ↔ ∀x (x ∼ 5 → ψ[x]) ψ[ 5
Auf diese Weise kann die Rede über abstrakte Objekte als eine façon de parler aufgefaßt werden; der Nominalist braucht nur über Zahlzeichen zu sprechen. Das technische Hilfsmittel bei dieser Überlegung war die Bildung von Äquivalenzklassen zu einer gegebenen Äquivalenzrelation. Sie ist ein formales Instrument, das in der Mathematik allgegenwärtig ist und natürlich nicht von einem nominalistischen Programm abhängt (siehe Kapitel 10). Das Beispiel zeigt jedoch seine Nützlichkeit auch für das philosophische Argument. Zum Beispiel kann man auf ähnliche Weise auch das generische Sprechen über natürliche Arten rechtfertigen. Ein Satz wie Der Tiger ist eine Raubkatze kann und wird auch verstanden im Sinne von Alle Tiger sind Raubkatzen.21 Dabei können nur solche Eigenschaften in generischen Sätzen auftreten, die invariant sind gegenüber den verschiedenen Manifestationen der Art durch konkrete Exemplare; daß es weiße Tiger gibt, rechtfertigt nicht die generische Aussage Der Tiger ist weiß . Wir kehren zu den formalen Aspekten der Abstraktionsoperation zurück. Wir werden im folgenden unterscheiden zwischen einem Klassenterm der Gestalt ‘{ x | φ[x] }’, der zur Sprache der Mengenlehre gehört, und einem Abstraktionsoder Lambda-Term 22 der Gestalt ‘λxφ[x]’, welcher die Sprache der reinen Prädikatenlogik erweitert. Der Klassenterm steht typischerweise23 für eine Menge, die in der Mengentheorie ein Objekt der ersten Stufe, ein Individuum, darstellt. Mengen sind hier Elemente von anderen Mengen, aber das heißt nicht, daß die Menge rechts vom ∈-Symbol “höheren Typs” wäre; der logische Typenunterschied ist eingeebnet, es gibt nur eine Kategorie von Objekten, nämlich Mengen. Im Kontext der Prädikatenlogik tritt die Mengenlehre nur in der semantischen Metasprache auf; dort sind dann Mengen von Individuen die Extensionen der Prädikate und entsprechen insofern (in der extensionalen Deutung) Eigenschaften, also Objekten höheren Typs. Es sei nun D eine Menge von Individuen, die der Gegenstandsbereich in einer gegebenen Interpretation einer prädikatenlogischen Sprache L ist. Einige Teilmengen von D sind die Extensionen der Prädikatsymbole P , Q, usw., die Grundausdrücke von L sind; diese Mengen haben einen “Namen” in der Sprache. Nun gibt es sehr viel mehr Teilmengen von D als Prädikatsymbole, deren Umfang sie sein könnten. Sei P etwa das Prädikat ‘. . . ist weise’ und Ext(P ) die Menge der weisen Personen in D; dann ist die Menge aller Individuen in D, die nicht weise sind, eine Menge ohne Namen in der Sprache. Um auch ihr einen Namen zu geben, bilden wir den objektsprachlichen Abstraktionsterm 21 Allerdings gibt es Prädikate in der natürliche Sprache, die ausschließlich bei Arten einen Sinn ergeben, wie Das Mammut ist ausgestorben. Dies ist ein Problem für die linguistische Semantik. 22 Lambda-Terme treten auch in der Informatik als (komplexe) Namen von Funktionen auf. Sie beruhen auf einem ähnlichen Abstraktionsprozeß, welcher die einzelnen Werte einer Funktion, etwa der Quadratfunktion x2 für alle reellen Zahlen x, zu der Funktion selbst zusammenfaßt. Danach bezeichnet der Lambda-Term λx.x2 genau die Funktion, die üblicherweise durch die Vorschrift f (x) = x2 mitgeteilt wird. 23 Wenn er nicht gerade eine echte Klasse bezeichnet.
l
Einleitung
λx ¬P x; er drückt die Eigenschaft aus, nicht weise zu sein. Oder nehmen wir die Eigenschaft, allwissend zu sein; ein Subjekt x ist allwissend, wenn x alles weiß oder kennt. Sei W (x, y) ein zweistelliges Prädikatsymbol, das als “x weiß/kennt y” interpretiert werde; dann können wir die komplexe Formel bilden: ∀yW (x, y), die jetzt soviel bedeutet wie “x weiß/kennt alles”. Nun können wir der Eigenschaft, allwissend zu sein, einen Namen geben, nämlich gerade den Abstraktionsterm λx ∀yW (x, y). Auf ähnliche Weise sind wir imstande, beliebig komplexe Prädikate aufzubauen. Wir können diese neuen Prädikate wie jedes andere Prädikat natürlich wieder auf Individuenterme anwenden und erhalten einen Ausdruck, der logisch äquivalent ist zu einer Formel ohne Lambda-Operator. Ist t ein solcher Individuenterm und λxφ[x] ein Lambda-Ausdruck, so kann die Äquivalenz geschrieben werden als λxφ[x](t) ↔ φ[t]. Dies ist das Prinzip der λ-Konversion; es zeigt, daß Prädikation und Abstraktion zueinander inverse Operationen darstellen. Wir werden den Abstraktionsoperator in den Kapiteln 4 und 15 dazu verwenden, gewisse logische Schwierigkeiten im Zusammenhang mit Kennzeichnungen und Modalitäten zu behandeln. Die Lambda-Abstraktion kann aber noch in einer anderen Weise für philosophische Zwecke verwendet werden. Gehen wir für einen Moment zur Logik der zweiten Stufe über; dann haben wir außer Individuenvariablen ‘x’, ‘y’, usw. auch Prädikatvariablen ‘F ’, ‘G’, etc. zur Verfügung. Betrachten wir jetzt die elementare Aussage-Form F x und abstrahieren nicht bezüglich der Variablen x, sondern bezüglich F ; der Lambda-Term λF F x steht dann für so etwas wie die Menge aller Eigenschaften, die auf x zutreffen. Wenn wir nun das Leibnizsche Prinzip der Gleichheit des Ununterscheidbaren zugrunde legen, dann wird jedes Individuum a durch die Menge aller seiner Eigenschaften λF F a eindeutig bestimmt. Dies ist der logische Kern der sogenannten Bündeltheorie von Individuen: Individuen werden ersetzt durch das Bündel ihrer Eigenschaften (siehe z.B. [7], Kap. 4). Hat man zweitstufige Variablen zur Verfügung, so kann man eine weitere interessante Gruppe von Lambda-Termen bilden, die sich Frege zunutze machte: die Menge aller Eigenschaften F , die auf kein Objekt zutreffen; die Menge aller Eigenschaften, die auf genau ein Objekt zutreffen, auf genau zwei Objekte zutreffen, usw. Frege spricht von Begriffen statt Eigenschaften und von Begriffen zweiter Stufe statt Mengen von Begriffen; die formale Gestalt bleibt davon unberührt. Also bekommen wir den Begriff zweiter Stufe, der genau die leeren Begriffe (erster Stufe) subsumiert, unter die kein Objekt fällt; den Begriff zweiter Stufe, der diejenigen Begriffe (erster Stufe) subsumiert, welche auf genau ein Objekt zutreffen; den Begriff zweiter Stufe, der diejenigen Begriffe (erster Stufe) subsumiert, welche auf genau zwei Objekt zutreffen; etc. Als im wesentlichen derartige Gebilde rekonstruiert Frege die natürlichen Zahlen, welche er auf diese Weise auf die reine Logik zurückführt; dies ist die Grundidee seines logizistischen Programms, der Reduktion der Mathematik auf die Logik. Die betreffenden Ausdrücke kann man als Lambda-Terme darstellen und die entsprechenden Begriffe zweiter Stufe mit den Zahlen 0, 1, 2, . . . identifizieren, etwa folgendermaßen: (28)
a.
0
= ˆ
b.
1
= ˆ
c.
2
= ˆ
λF ¬∃xF x
λF (∃xF x ∧ ∀y(F y → y = x))
λF ∃x∃y(F x ∧ F y ∧ x 6= y ∧ ∀z(F z → z = x ∨ z = y))
li
Moderne Logik und Philosophie ...
0.2.5
Teil/Ganzes und Nominalismus Du nennst dich einen Teil, und stehst doch ganz vor mir? Goethe, Faust I
Wir hatten schon die begriffliche Transformation angedeutet, welche darin besteht, daß die rein logische Subsumtionsbeziehung als explizite zweistellige Relation Π behandelt wird. Dann eröffnet sich nämlich die Möglichkeit, vom ursprünglichen Typenunterschied zwischen den Relata, also zwischen Begriff und subsumiertem Einzelding, gänzlich abzusehen und die Prädikation als Teilbeziehung zu deuten. Diesen Schritt illustrierten wir oben mit dem Beispiel ‘der Taj Mahal ist weiß ’, wo das weiße Objekt Taj Mahal als Teil des “Weißen in der Welt” aufgefaßt wird. Nach diesem Muster versucht der nominalistisch gesinnte Philosoph, nicht nur die Universalien als reale Entitäten zu umgehen, sondern auch die logischen Paradoxien der Prädikation zu vermeiden. Man muß allerdings nicht unbedingt die Prädikation als Grundrelation aufgeben, um von der Wichtigkeit einer Theorie der Teilbeziehung überzeugt zu sein. Diese Relation, die in der Mengenlehre durch die Inklusionsbeziehung modelliert wird, ist eine Grundbeziehung im konzeptuellen Gefüge unseres Denkens und nimmt dort einen eigenen Platz ein. Wie erwähnt werden Theorien von Individuen und ihren Teilen Mereologien genannt. Da die Relata der Teilrelation ontologisch gesehen auf der gleichen untersten Stufe der Typenhierarchie stehen, nämlich auf der der Individuen, sind Mereologien das logische Hauptinstrument des modernen Nominalismus. Eine Mereologie kann formal im Rahmen der Prädikatenlogik der ersten Stufe entwickelt werden. Die zentrale Beziehung ist die Teilrelation, die wir hier mit ‘v’ bezeichnen; sie ersetzt nicht die Prädikationsbeziehung, sondern ist vielmehr ein Spezialfall einer solchen, welche zwischen der zweistelligen Relation v und Paaren von Individuen besteht, von denen das eine Teil des anderen ist. Diese Relation gehorcht gewissen Axiomen, die es zu beschreiben gilt. In der Philosophie spricht man häufig von der Teil-Ganzes-Beziehung. Wir wollen sofort feststellen, daß diese Bezeichnung insofern irreführend ist, als sie einen absoluten Unterschied zwischen der Eigenschaft, Teil zu sein, und der, ein Ganzes zu sein, suggeriert; aber natürlich ist in der Regel ein aus Teilen bestehendes Ganzes wieder Teil eines größeren Ganzen, und so fort. Ob es ein “größtes Ganzes” gibt, ist nicht von vornherein ausgemacht, sondern Gegenstand möglicher Postulate der mereologischen Theorie. Die einfachste intuitive Vorstellung von der Mereologie gewinnt man, wenn man sie als einen Kalkül für Objekte nach Art von Gebieten in der Ebene auffaßt, deren typische Vertreter, wie in Abbildung 3 zu sehen, begrenzt und zusammenhängend sind. Aber auch nicht zusammenhängende Gebiete, etwa die Oberfläche des Starnberger Sees und des Ammersees zusammengenommen, zählen als einzelne mereologische Objekte. Jedenfalls können derartige Gebiete, ob zusammenhängend oder nicht, einander enthalten oder “überlappen”, d.h. einen gemeinsamen Teil enthalten; so überlappt etwa die Alpenregion das französische
lii
Einleitung
Abbildung 3: Teilbeziehung und Überlappung
oder das deutsche Staatsgebiet, ohne daß das eine Gebiet das andere vollständig enthält. Die Teil-Ganzes-Beziehung zwischen Gebieten ist also die Relation des (echten oder unechten) Enthaltenseins, und die Relation der Überlappung die ist gerade die Bedingung, ein gemeinsames Teilgebiet zu enthalten; siehe Abbildung 3. Die heute übliche “Arithmetisierung der Geometrie” macht aus geometrischen Figuren Mengen von Punkten. In dieser Interpretation ist die Relation des Enthaltenseins zwischen Gebieten in der euklidischen Ebene die Inklusionsbeziehung zwischen den zugehörigen Punktemengen (genauer: zwischen Mengen von Paaren von reellen Zahlen), und die Überlappungsrelation bedeutet soviel wie daß die Punktemengen einen nicht-leeren Durchschnitt besitzen. Die Teilrelation wird hier über die Teilmengenrelation von der Elementschaftsbeziehung induziert. Dies liefert eine Reduktion der Mereologie von Gebieten auf die mengentheoretischen Inklusionsbeziehungen zwischen Punktemengen. Die Mereologie abstrahiert nun von der mengentheoretischen Interpretation (und von der Reduktion auf die reellen Zahlen). Damit “reinigt” sie die TeilGanzes-Beziehung von den Problemen der mengentheoretischen Komprehension. Teilbeziehung und Überlappung sind Grundbegriffe, deren Kalküle in den mereologischen Theorien entwickelt werden. Diese Kalküle sind durch ziemlich einfache Gesetze bestimmt, die keine “vertikale” Unterscheidung mehr zwischen Element und Menge kennen, sondern eine “horizontale” Relation zwischen Objekten ein und derselben Stufe charakterisieren. Die mereologischen Relationen der Teilbeziehung und der Überlappung sind allerdings, wie man leicht sieht, nicht unabhängig voneinander, sondern durcheinander ausdrückbar. Zwei Objekte überlappen sich, wenn sie einen gemeinsamen Teil besitzen, und umgekehrt ist ein Objekt ein Teil eines anderen, wenn alles, was das erste Objekt überlappt, auch das zweite überlappt. Man hat also die Wahl zwischen einem teilbasierten oder einem überlappungsbasierten Kalkül. Wir werden in Kapitel 13 zunächst mit einem Kalkül beginnen, der auf der Relation der Überlappung (engl. overlap) aufbaut, mitgeteilt durch das Symbol ‘◦’. Die Motivation für diese Wahl findet sich in einer gewissen formalen Analogie, die wir sogleich erläutern werden, zur mengentheoretischen Elementschaftsrelation, wenngleich die Bedeutung sowohl als auch die formalen Konsequenzen ganz unterschiedlich sind.24 In einem späteren Abschnitt werden wir 24 Diese Analogie bestimmte auch die Wahl der Überlappung als Grundrelation in den ersten mereologischen Systemen, darunter das historisch wichtige von Nelson Goodman in seinem Buch [103].
Moderne Logik und Philosophie
liii
dann umgekehrt die Teilrelation als Grundsymbol wählen und in groben Zügen skizzieren, wie die Theorie auf dieser Basis entwickelt werden kann. Obwohl wir die Mereologie als ein Beispiel für eine Theorie der ersten Stufe behandeln, wird der logische Rahmen nicht genau die klassische Prädikatenlogik sein, sondern die freie Logik . Das Hauptmotiv ist eine intuitive Disanalogie zwischen Mereologie und Mengenlehre: während es zu je zwei beliebigen Mengen stets einen Durchschnitt gibt, der bei Fehlen eines gemeinsamen Elements die leere Menge ist, scheint es wenig Sinn zu geben, bei zwei Objekten, die eigentlich keinen gemeinsamen Teil haben, dennoch von einem gemeinsamen “leeren Teil” zu sprechen. Salopp gesagt kann das Nichts nicht etwas sein.25 Die Mereologie wird hauptsächlich zur Strukturbeschreibung konkreter raum-zeitlicher Gegenstände oder auch qualitativer Merkmale verwendet; “leere” Gegenstände und “leere” Merkmale sind aber keine sinnvollen Objekte. Daraus ergibt sich jedoch, daß die Operation der Bildung des gemeinsamen Teils zweier Objekte nicht überall definiert ist und sich damit Denotationslücken ergeben. Eine Theorie mit Kennzeichnungen auf der Basis der freien Logik ist hierfür der geeignete Rahmen. Die Axiome und Theoreme dieser Logik, die am Anfang von Kapitel 13 vorgestellt werden, gelten dann auch für die folgenden mereologischen Systeme. Die moderne Mereologie ist als logisch-philosophische Reaktion auf zwei Strömungen zu verstehen: die Mengenlehre Cantors und eine damit einhergehende platonistische Ontologie. Einer Grundintuition ontologischer Sparsamkeit entspricht die Auffassung, daß man nicht mit demselben “Material” zwei verschiedene Objekte erzeugen kann. In der Mengenlehre wird diese Intuition jedoch grob verletzt: aus einem einzigen Objekt, etwa a, erzeugt die Iteration der Einermengenbildung unendlich viele verschiedene Objekte {a}, {{a}}, {{{a}}}, usw. Dies soll in einer nominalistischen Ontologie nicht möglich sein. Ein Identitätskriterium für mereologische Objekte wäre also, daß zwei Objekte identisch sind, wenn sie dieselben “Bestandteile” haben. Dabei zählen die Mengenklammern natürlich nicht zu den Bestandteilen, sondern sind lediglich objektsprachlicher Ausdruck eines nicht intendierten Abstraktionsprozesses. Die Teile und das Ganze sollen nicht durch eine Komprehensionsstufe getrennt sein, wie das bei einer Menge und ihren Elementen der Fall ist, sondern beide sind von derselben Art und befinden sich auf der gleichen ontologischen Stufe. Mit Hilfe der Überlappungsrelation kann man das Identitätskriterium dann so ausdrücken: Zwei Objekte x und y sind identisch, wenn jedes “Testobjekt” z, welches einen Bestandteil mit x gemein hat, also x überlappt, auch y überlappt und umgekehrt. Formal: ∀z(z ◦ x ↔ z ◦ y) → x=y
(29)
Die formale Analogie zum Extensionalitätsaxiom (24) der Mengenlehre (hier mit anderen Buchzstaben wiederholt) ist augenfällig: ∀z(z ∈ x ↔ z ∈ y) → x=y
(30)
25 Ganz wie es in Shakespeares King Lear heißt, Fool : Can you make no use of nothing, nuncle? Lear : Why, no, boy. Nothing can be made out of nothing. — Dagegen ist in der Mengenlehre die sogenannte leere Menge keineswegs ein Nichts; sie kann als ein beliebiges, durchaus substantielles Urelement gedacht werden, welches lediglich selbst keine Mengen mehr als Elemente enthält.
liv
Einleitung
Genau wie dort die Identität eines mengentheoretischen Objekts durch seine Elemente bestimmt ist, ist die Identität eines mereologischen Objekts durch seine “Überlapper” bestimmt. Natürlich aber werden Überlappung und Elementschaft ganz anders gedeutet, was sich in den verschiedenartigen Axiomen für die beiden Relationen niederschlägt. Es sei jetzt noch ein mereologisches Axiom formuliert, das ein Gegenstück zum mengentheoretischen Komprehensionsprinzip darstellt. Mit letzterem Prinzip bildet man aus einer gegebenen Formel φ die Menge der Objekte x mit der Eigenschaft φ[x]. Wir wissen schon, daß dieses Verfahren nicht bei allen Formeln zu einer Menge führen kann (vgl. die Russell-Paradoxie), aber dort, wo es funktioniert, bekommen wir eine Formel, die besagt, daß eine Menge y existiert, die aus genau denjenigen Elementen x besteht, die die Eigenschaft φ haben; formal: ∃y∀x(x ∈ y ↔ φ[x])
(31)
Nun ist im Kontext der Mereologie das Wort ‘Komprehension’ nicht im technischen mengentheoretischen Sinn, sondern in seiner ursprünglichen Bedeutung als “Zusammenfassung” von mereologischen Objekten zu verstehen, die alle eine gewisse Eigenschaft φ haben; φ ist dabei eine Formel in der Sprache der Mereologie. Mereologische Zusammenfassung heißt aber soviel wie die “Verschmelzung” oder Fusion mehrerer Objekte zu einem größeren Ganzen. Die prototypische Vorstellung ist in diesem Zusammenhang das Zusammengießen zweier Flüssigkeiten. Man kann aber auch zwei Objekte als ein zusammengesetztes neues Objekt betrachten und dabei die Fusion nur “in Gedanken vornehmen”; dabei können die Objekte weiterhin möglicherweise räumlich oder auch zeitlich getrennt sein. So kann man gedanklich etwa die Fusion aller weißen Gegenstände bilden, die, obzwar riesig und über die Welt verstreut, ein konkretes Individuum darstellt. Unser Beispiel aufgreifend können wir dann sagen, daß die Aussage ‘der Taj Mahal ist weiß ’ für den Nominalisten bedeutet, daß das Objekt Taj Mahal ein Teil der Fusion aller weißen Dinge ist. Daß es zu jeder Eigenschaft φ eine solche Fusion gibt, muß durch ein Axiom gefordert werden. Sei y die Fusion aller φ-Objekte; dann sollte ein Testobjekt z, wenn es ein x mit der Eigenschaft φ[x] überlappt, auch y überlappen. Umgekehrt sollte verhindert werden, daß y “zu groß” genommen wird, was der Fall ist, wenn es Testobjekte gibt, die y überlappen, aber keines der φ-Objekte. Schließlich muß es überhaupt etwas zum Überlappen geben, d.h. die Eigenschaft φ darf nicht leer sein. Alle Bedingungen zusammengenommen ergeben das folgende allgemeine Fusionsaxiom (F) der Mereologie: (32)
a. b.
∃xφ[x] → ∃y∀z(z ◦ y ↔ ∃x(φ[x] ∧ z ◦ x))
(F)
Gibt es mindestens ein x mit der Eigenschaft φ[x], so existiert ein y, welches von allen z genau dann überlappt wird, wenn z mindestens ein x mit φ[x] überlappt.
Siehe auch Abbildung 4. Dort soll der mit ‘φ’ bezeichnete Rahmen um die Gebiete x1 , . . . , x5 andeuten, daß gilt: φ[x1 ], . . . , φ[x5 ]. Es gibt also mindestens ein Objekt x mit φ[x]. Dann existiert mit dem Axiom (F) ein y, nämlich das Gebiet, das aus den xi zusammengenommen besteht (die Fusion der xi ), mit folgender Eigenschaft: ein Testgebiet z überlappt y genau dann, wenn es mindestens ein φ-Objekt x gibt, das von z überlappt wird. Dabei ist die Abbildung so zu verstehen, daß das Fusionsgebiet y ein einzelnes neues (wenn auch nicht mehr
lv
Moderne Logik und Philosophie φ
x1
x2
x3
x4
x5
z
Abbildung 4: Fusion der φ-Objekte xi , mit Testobjekt z
zusammenhängendes) Gebiet ist, das exakt aus der Vereinigung der einzelnen Gebiete xi und nicht mehr besteht.
0.2.6
Wahrheit Spricht Pilatus zu ihm: Was ist Wahrheit? Joh. 18.38 Truth’s a dog must to kennel. Shakespeare, King Lear Shí shì qiú shì. Die Wahrheit in den Tatsachen suchen. Chinesisch
Wahrheit und Realismus In der philosophischen Tradition wurde Wahrheit aufgefaßt als eine spezifische Korrespondenzbeziehung zwischen unseren Überzeugungen und der Wirklichkeit. Diese metaphysisch zu denkende Relation wird allgemein bereits Aristoteles zugeschrieben, drückt sich jedoch am deutlichsten in der scholastischen Bestimmung aus, nach der Wahrheit die Angleichung von Realität und Verstand sei (veritas est adaequatio rei et intellectus).26 Unsere Überzeugungen sind also wahr, wenn sie von den Fakten oder Tatsachen “gedeckt” sind. Demnach wären Überzeugungen (oder besser ihre Inhalte) die Träger der Wahrheit, und die Fakten der Welt ihre “Wahrmacher” (engl. truth maker ). Diese Korrespondenztheorie der Wahrheit geht in ihrer einfachen Version davon aus, daß die Wirklichkeit als vollkommen unabhängig von unseren Begriffen 26 Thomas
von Aquin, Questiones disputatae de veritate, 1.2.
lvi
Einleitung
und Urteilen ist. Das Wahrheitsproblem ist somit direkt mit dem metaphysischen Problem des Realismus verbunden. Ist uns aber die Wirklichkeit überhaupt zugänglich, oder wird unser Bild von ihr wesentlich geprägt von unseren eigenen Konzeptualisierungen? Sollte dies der Fall sein, und, wie Kant meinte, sogar unhintergehbar, dann scheint die Korrespondenztheorie der Wahrheit prinzipiell unentscheidbare Fragen zu stellen; der Wahrheitsbegriff wäre unerforschlich. Die Annahme einer autarken, in ihrer Eigengesetzlichkeit und Beschaffenheit anthropologisch nicht affizierten Wirklichkeit bezieht ihre prima facie Plausibilität von der simplen Vorstellung, daß die Welt ohne die Herausbildung sprachund urteilsfähiger Lebewesen “genauso” existiert hätte. Aber schon die einfache Frage, wie eine solche Welt denn aussähe, verlangt nach einer konkreten Begrifflichkeit, wie sie sich etwa in der Evolution des Menschengeschlechts herausgebildet hat. Denn selbst wenn wir im Einklang mit dem common sense unterstellen, dass es die Welt vor und unabhängig von derartigen Lebewesen gab bzw. geben könnte, so war bzw. wäre das doch eine Welt ohne urteilende Individuen; die Frage der Wahrheit würde sich gar nicht stellen. So scheinen die Chancen für den Realismus und die korrespondenztheoretische Auffassung von Wahrheit nicht gut zu stehen. Daß der Realismus dennoch weiterhin eine ernst zu nehmende philosophische Position darstellt, liegt an einem veränderten nachkantischem Verständnis von Wirklichkeit, welches entscheidend von den modernen Wissenschaften mitgeprägt ist ist. Es findet seinen Niederschlag in einem wissenschaftlichen Realismus, der unseren Theorien einen entscheidenden Anteil an unserem Weltbild einräumt. Zunächst gilt es Abschied zu nehmen vom “Mythos des Gegebenen” (Sellars), nach dem die Welt säuberlich portioniert in raum-zeitliche Objekte und ihre Beziehungen zueinander ausgebreitet da lag, bevor der Mensch anfing sie zu untersuchen. Bereits der Objektbegriff muß als theoretisch angesehen werden (siehe Elektronen, Nukleonen, Quarks ...) und durchaus species-relativ (man überlege, welche Objekte ein Lebewesen in einer ganz anderen Öko-Nische als der unsrigen, etwa am Meeresgrund, zu unterscheiden vermag). Das bedeutet aber nicht, dass “die Welt, sie war nicht, eh’ ich sie erschuf”. Der Mensch hat in Lebenswelt und Wissenschaft Kategorien entwickelt, mit denen er die Regularitäten der Welt in Begriffe und Theorien faßt; das “Sagen” hat aber dennoch die Natur, wie der Schneider von Ulm schmerzlich erfuhr und worauf die Wissenschaftler zurecht pochen. Nun ist hier nicht der Ort einer weitergehenden philosophischen Erörterung der Realismusproblematik. Wir wollen zunächst einfach einmal ein robustes Verständnis einer wie auch immer strukturierten Außenwelt voraussetzen und uns der logischen Seite der Korrespondenzbeziehung zuwenden. Dazu gilt es, die Natur der Relata der so verstandenen Wahrheitsbeziehung zu bestimmen: der Tatsachen auf der “Wirklichkeitsseite” und der (Inhalte von) Überzeugungen auf der Seite der urteilenden Person. Tatsachen sind Ausschnitte aus der Wirklichkeit; besitzen sie eine Struktur, und wenn ja, wie kann man sie beschreiben? Russell etwa war der Meinung, daß ein Satz wie (33)
Der Montblanc ist höher als die Zugspitze.
eine Tatsache wiedergibt, welches aus drei Konstituenten aufgebaut ist: aus zwei Bergen in den Alpen mit den Namen ‘Montblanc’ und ‘Zugspitze’ sowie der Relation Ist-höher-als. Während man sich die beiden Berge als konkrete
Moderne Logik und Philosophie
lvii
Ausschnitte der Wirklichkeit einigermaßen gut vorstellen kann (obwohl vage bleibt, wo ihr Fuß beginnt), zwingt die Annahme einer Relation als der dritten Konstituente einer solchen Tatsache bereits zu einer voraussetzungsreichen Ontologie, welche neben Einzeldingen auch Universalien enthält. Und wenn man Tatsachen in Teile oder Konstituenten zerlegen kann, stellt sich die Frage, ob es so etwas gibt wie kleinste Teile, gewissermaßen ontologische Atome von Tatsachen. Berge zum Beispiel sind Gesteinsmassive; macht das die Kalksteinbrocken der Zugspitze zu Konstituenten der Tatsache, daß der Montblanc höher ist als die Zugspitze? Das kann allein schon aus dem Grund nicht stimmen, weil Steine Objekte sind und keine Tatsachen. Wenn wir schon Tatsachen in unsere Ontologie aufnehmen, so möchten wir sie doch von gewöhnlichen konkreten Dingen wie Steine, Bäume und Tische es sind, unterscheiden; auf diese kann man zeigen, und anders als jene können diese nicht die Rolle von Wahrmachern für Sätze spielen. Das Problem, die Relata der korrespondenztheoretischen Wahrheitsrelation zu charakterisieren, wurde bisher nur anhand logisch elementarer Aussagen wie Satz (33) diskutiert; die Situation wird jedoch noch unübersichtlicher, wenn man sich fragt, welche Tatsache der Wahrmacher eines komplexen Satzes der folgenden Art ist: (34)
Jeder Mitgliedsstaat der Vereinten Nationen entsendet eine Delegation an den Sitz der UNO-Vollversammlung, die aus mindestens drei Diplomaten besteht.
Handelt es sich bei diesem Satz um eine einzige Tatsache, die ihn wahr macht, oder nicht vielmehr um eine Menge von Tatsachen? Oder kann man eine Menge von Tatsachen zu einer einzigen großen Tatsache “fusionieren”? Läßt man all das zu, so umfaßt unsere immer reicher werdende Ontologie neben den normalen raumzeitlichen Individuen gewisse Grundtatsachen (wobei die Frage der Atomizität ungeklärt ist) sowie Mengen bzw. Klassen von Entitäten, oder auch deren Fusionen, was immer das sein mag; in jedem Fall entfernt man sich mehr und mehr von der ontologischen Position eines Nominalismus, nach der es ausschließlich Einzeldinge gibt. Sofern nun die Frage nach der Wahrheit eine logische Frage ist, wäre es methodisch ungeschickt, im Zuge ihrer Beantwortung Annahmen zu machen, die eine bestimmte metaphysische Position präjudizieren, nämlich einen Tatsachen- und/oder Universalienrealismus. Es kommt erschwerend dazu, daß die Beziehung zwischen den Tatsachen und den Überzeugungen von Personen nicht immer so direkt sein kann wie im Fall einer wahren Überzeugung, in dem wir von der Existenz einer wahrmachenden Tatsache ausgehen. Was geschieht mit der großen Anzahl unserer Überzeugungen, die mehr oder weniger fern von der Realität sind? Die Annahme “falscher Tatsachen”, die sie wahr machen, erscheint wenig überzeugend. Russell diskutierte diese Problematik in verschärfter Form, wenn nämlich die Zuschreibung von Überzeugungen selbst sprachlich ausgedrückt wird. Betrachten wir den Beispielsatz (der Kontext ist das Shakespeare-Stück Othello): (35)
Iago glaubt, daß Othello eifersüchtig ist.
Wir nehmen in naheliegender Erweiterung des obigen Ansatzes an, daß der Wahrmacher der Überzeugung Iagos, daß Othello eifersüchtig ist, zu einer Konstituente einer komplexeren Tatsache wird, welche den Satz (35) wahr macht;
lviii
Einleitung
diese Tatsache enthält dann als Konstituenten die Person Iago, die Relation Glaubt und die Tatsache der Eifersucht Othellos. Das führt jedoch zu Schwierigkeiten im Fall falscher Überzeugungen; Russells Beispiel lautet: (36)
Othello glaubt, daß Desdemona Cassio liebt.
Es gibt aber (gemäß der Geschichte) keine Tatsache, die Othellos Eifersuchtsphantasie erfüllt, und somit fehlt der Gesamttatsache, die Othellos Überzeugung, ausgedrückt durch (36), wahr macht, eine Konstituente. Die Inhalte von Überzeugungen können also nicht die Tatsachen selbst sein, sondern es sind, wie häufig angenommen wird, Sachverhalte oder Propositionen, abstrakte Entitäten also, welche zwischen die sprachliche Ebene und die Ebene der Tatsachen eingeschaltet werden. Propositionen haben nun aber wie die Tatsachen eine Struktur, die der Struktur ihrer sprachlichen Gegenstücke auffällig ähnlich sehen: es sind offenbar die Sätze, die diese Strukturen induzieren. Es stellt sich die Frage, ob hier nicht Strukturen und Entitäten unnötig verdoppelt werden; dies käme einem Verstoß gegen den Grundsatz der ontologischen Ökonomie gleich, dem Ockhamschen Rasiermesser : in Erweiterung der Maxime Entia non sunt multiplicanda praeter necessitatem könnte man ergänzen: Entia et structurae non sunt multiplicanda. So werden wir dahin geführt, als Träger der Wahrheit gar nicht (Inhalte von) Überzeugungen, also Propositionen, anzunehmen, sondern die Sätze der Sprache selbst. Denn wenn man darauf schaut, wie das Wort ‘Wahrheit’ oder das zugehörige Adjektiv ‘wahr ’ in der Sprache verwendet wird, so sind es zunächst sprachliche Gebilde, Aussagen, denen man Wahrheit zuschreibt. Zwar sprechen wir bisweilen von einem “wahren Freund” oder der “wahren Ursache” einer Krankheit oder einer politischen Entwicklung, aber in derartigen Äußerungen kann meist das Wort ‘wahr ’ etwa durch ‘wirklich’ ersetzt werden, wodurch die Intention der Äußerung klar wird, daß wir nicht nur von einem scheinbaren Freund reden oder von Symptomen, die mit der Ursache verwechselt werden. So liegt es also auch sprachanalytisch nahe zu sagen, daß Wahrheit sich auf Aussagen, genauer Aussagesätze, bezieht und somit eine Eigenschaft von Sätzen darstellt. Es gibt von seiten der Sachverhaltstheoretiker jedoch ein ernst zu nehmendes Argument gegen Sätze als Wahrheitsträger. Zum Beispiel lautet eine gängige Charakterisierung von Wissen, daß Wissen gerechtfertigte wahre Überzeugung sei (engl. knowledge is justified true belief ). Die Sprechweise von wahren und falschen Überzeugungen hat den Vorteil erklären zu können, daß wir Überzeugungen meist unabhängig von der Art und Weise hegen, wie und in welcher Sprache sie ausgedrückt werden; bin ich davon überzeugt, daß Rom die Hauptstadt Italiens ist, dann ändert sich meine Einstellung gegenüber diesem Sachverhalt nicht dadurch, daß er mit dem Satz “Roma è la capitale d‘Italia” wiedergegeben wird (wenn ich des Italienischen nicht mächtig bin, mag ich zwar meine Überzeugung bezüglich der Stadt Rom in diesem sprachlichen Gewand nicht wiedererkennen, aber das spielt keine Rolle). Was nun intuitiv invariant gegenüber Paraphrase oder Übersetzung ist, so lautet das Argument, das sind gerade die Sachverhalte oder Propositionen. Hier würde das Argument an Stärke gewinnen, wenn es eine sprachunabhängige Charakterisierung von Propositionen gäbe. Aber gerade das ist zweifelhaft. Zwar gibt es verschiedene Ansätze zur Modellierung von Propositionen, die sich
Moderne Logik und Philosophie
lix
nicht auf eine gegebene Sprache beziehen; eine der bekanntesten Explikationen benutzt den Begriff der “möglichen Welt” und identifiziert Propositionen mit Mengen von möglichen Welten (siehe den nächsten Abschnitt). Allerdings können mögliche Welten selbst kaum anders als sprachlich individuiert werden. Der Logiker tut also gut daran, sich auf Sätze als Träger der Wahrheit zurückzuziehen; dem Invarianzargument wäre dann philosophisch zu begegnen, was durchaus möglich ist. Was syntaktische Gebilde wie Sätze sind, wollen wir erst einmal als unproblematisch betrachten.27 Wahrheit wird somit zu einer Eigenschaft von Sätzen, und das logische Projekt besteht dann darin, ein Wahrheitsprädikat zu definieren, welches diese Eigenschaft charakterisiert. Dieser Plan schafft natürlich die Korrespondenzbeziehung selbst und damit die Frage nach der Natur der Wahrmacher noch nicht aus der Welt. Zwei grundverschiedene Gruppen von Reaktionen auf diese Frage sind in der Literatur zu beobachten. Die eine Gruppe hält an dem metaphysischen Projekt eines substantiellen Wahrheitsbegriffs fest, während die andere sich gerade davon verabschiedet. Da diese Gruppe gewissermaßen die “metaphysische Luft” aus dem Problem läßt, firmiert sie unter der Sammelbezeichnung Deflationismus. Die erste Gruppe gliedert sich in zwei Hauptströmungen, je nach einer realistischen oder anti-realistischen Grundposition. Die Realisten, die die Korrespondenztheorie verteidigen, haben daher die Aufgabe, den Begriff des Wahrmachers philosophisch befriedigend zu explizieren. Es gibt allerdings auch eine agnostische Version in dieser realistischen Untergruppe, die für die Logik besonders wichtig ist: die weiter oben bereits kurz erwähnte, auf Tarski zurückgehende semantische Theorie der Wahrheit. Sie lehnt das korrespondenztheoretische Bild nicht ab, sagt aber zu der Korrespondenzbeziehung wenig mehr als was schon Tarski selbst formulierte: (37)
[E]ine wahre Aussage ist eine Aussage, welche besagt, dass die Sachen sich so und so verhalten, und die Sachen verhalten sich eben so und so. ([250]: 268)
Hier wird offen gelassen, was es gerade bedeutet, daß “die Sachen sich so und so verhalten”; das Gewicht der semantischen Wahrheitstheorie liegt auf rein logischem Gebiet (siehe unten). Antirealistische Alternativen Es seien hier kurz die wichtigsten antirealistischen Alternativen angeführt, da man Spielarten von ihnen sowohl in der Philosophie der Mathematik als auch in der Wissenschaftsphilosophie antrifft. Die Kohärenztheorie macht die Wahrheit einer Überzeugung davon abhängig, ob sie sich in ein möglichst großes und optimal strukturiertes Netz von wechelseitig miteinander verträglichen anderen Überzeugungen einordnen läßt. Es ist leicht, eine Karikatur dieser Auffassung zu zeichnen, als ob sie etwa dem Prinzip “millions can’t be wrong” folgen würde. Sie nimmt aber vielmehr den Bruch mit der metaphysischen Wahrheitskonzeption ernst und zieht sich auf einen einzig für möglich gehaltenen internen epistemischen Standpunkt zurück. Dahinter steht eine holistische Konzeption, nach 27 Auch bei den Sätzen gibt es genau genommen eine philosophische Komplikation, nämlich ob man Sätze als sogenannte Token auffassen soll, d.h. als konkrete Einzeldinge, etwa Inschriften auf einer Tafel oder im Exemplar eines Buches, oder aber als Typen von Vorkommnissen gleicher oder hinreichend ähnlicher Gestalt. Vgl. Kapitel 1.
lx
Einleitung
der nicht einzelne isolierte Überzeugungen überprüft werden können, sondern, wenn überhaupt, immer ganze Systeme solcher Überzeugungen einen Wahrheitsanspruch anzumelden imstande sind. Dieser erwächst nicht einfach aus einer Konfrontation mit Fakten, da die Fakten interpretationsbedürftig und von dem kohärenten Netzwerk abhängig sind. Unser gesamtes wissenschaftliches Theoriengefüge stellt ein solches Netzwerk dar. Und so könnte ein Kohärentist behaupten, daß es auch in der Wissenschaft für eine Überzeugung mehr auf interne Kriterien wie Verträglichkeit mit den gegebenen Theorien und ihre erklärende Kraft ankommt als eine Übereinstimmung mit einer ohnehin unerforschlichen “Wirklichkeit”. Der wissenschaftliche Realismus hält allerdings dagegen, daß, selbst wenn viele hochtheoretische Sachverhalte nicht direkt getestet werden können, die Kontrolle im Experiment unseren Überzeugungen dennoch hinreichend harte und unverzichtbare Beschränkungen auferlegt, daß man Objektivität und Wahrheit sprechen kann. Es gibt jedoch in der Philosophie der Mathematik einen Bereich, in dem kohärentistische Ideen mit Gewinn eingesetzt werden können; gemeint ist die Mengentheorie. Während zum Beispiel noch einigermaßen Klarheit über den Begriff der Wahrheit in der Arithmetik besteht, ist der Wahrheitsbegriff in der Mengenlehre entweder sinnlos, wie viele behaupten, oder aber wegen mangelnder “Testbarkeit” allein durch theorie-interne Kriterien bestimmbar. Tiefliegende mengentheoretische Resultate aus der jüngsten Zeit legen nahe, daß man mit einem kohärentistischen Wahrheitsverständnis durchaus davon sprechen kann, daß sogar die Kontinuum-Hypothese CH einen Wahrheitswert besitzt (wie sich herausstellt, ist sie falsch). Natürlich widerspricht dieses Ergebnis nicht der oben geschilderten Unabhängigkeit von CH von den üblichen Axiomen der ZF Mengenlehre; vielmehr sorgt ein Zusatzaxiom, dessen Wahrheit kohärentistisch begründet werden kann, für die Entscheidbarkeit von CH . Der pragmatische Wahrheitsbegriff ist die andere der beiden substantiellen Alternativen zur Korrespondenztheorie. Der amerikanische Psychologe und Philosoph William James gilt im allgemeinen als der Begründer der pragmatischen Theorie der Wahrheit. Als entsprechende “Definition” der Wahrheit wird häufig angeführt: Ein Satz S ist wahr, wenn es nützlich ist zu glauben, daß S (so z.B. in [222]:78). Dies ist allerdings eine Verkürzung, die sich so gar nicht bei James findet und sich eher eignet für literarische Anschlüsse wie die der Figur Naphta in den Mund gelegte Formulierung in Thomas Manns Zauberberg: “Wahr ist, was dem Menschen frommt. ... Er ist das Maß der Dinge und sein Heil ist das Kriterium der Wahrheit.” James’ Zeitgenosse Russell ließ es sich nicht nehmen, die absurden Konsequenzen einer solchen “Wahrheitstheorie” genüßlich auszumalen ([217]:771), was wiederum in unseren Tagen Hilary Putnam zu einer ausführlichen Ehrenrettung seines Landsmannes James veranlaßte [196]. Zwar widersteht der Stilist James nicht effektvollen Formulierungen wie “You can say of it then either that ‘it is useful because it is true’ or that ‘it is true because it is useful.’ Both these phrases mean exactly the same thing[.]” ([129]:575) Dennoch läuft die Jamessche Position bei genauerer Lektüre auf so etwas hinaus wie Wahrheit als ideale Verifizierbarkeit, oder als das, was uns eine vollständig bestätigte, ideale Theorie von der Welt in historischer Extrapolation sagen würde. Dies scheint immerhin eine diskutierbare Auffassung zu sein. In der Tat finden sich bei James durchaus Passagen, die einen korrespondenztheoretischen Anstrich haben. Es ist vernünftig und nützlich, unseren besten Theorien zu ver-
Moderne Logik und Philosophie
lxi
trauen, weil sie zwar in jedem historischen Moment widerlegbar sind, aber in immer größerem Maße eine Beschreibung der Welt liefern, wie sie wirklich ist. Allerdings stellt sich die Frage, ob nicht dieser Rest an Realismus, da unerreichbar, in einem modernen wissenschaftlichen Weltbild ohne Verlust aufgegeben werden kann. Für genau diesen Schritt argumentiert der Wissenschaftsphilosoph Bas van Fraassen in seiner einflußreichen Schrift The Scientific Image. Die Wissenschaft zielt nicht darauf, wie der Realismus behauptet, ein wahres Bild der Welt zu liefern, und die Annahme einer wissenschaftlichen Theorie bedeutet nicht, von ihrer Wahrheit überzeugt zu sein. Vielmehr geht es der Wissenschaft, so van Fraassen, lediglich um die empirische Adäquatheit ihrer Theorien, und diese ist auch das Hauptkriterium für das Akzeptieren einer Theorie. Empirische Adäquatheit stellt sich bereits ein, wenn die Theorien bestehende empirische Regularitäten erfassen, auch wenn damit kein Wahrheitsanspruch verbunden ist. Hier rückt die Position van Fraassens in die Nähe eines Instrumentalismus, der im letzten Jahrhundert durch die sogenannte Kopenhagener Deutung der Quantenphysik neue Nahrung erhielt. Wiederum sind wir zu dem philosophischen Realismusproblem zurückgekehrt, bei dem der Wahrheitsbegriff zwar eine entscheidende Rolle spielt, das durch die Logik allein aber nicht vollständig ausdiskutiert werden kann. Eine rein logische Beobachtung ist aber die folgende: es trägt nicht zur begrifflichen Klarheit bei, wenn das Wort ‘wahr ’ einfach für Zwecke umgedeutet wird, die mit seinen üblichen Verwendungsregeln nicht verträglich sind. Zu diesen Regeln zählt etwa die Wahrheitsbedingung für Konjunktionen, welche besagt, daß eine Konjunktion (S und S 0 ) von zwei Sätzen S, S 0 genau dann wahr ist, wenn sowohl S als auch S 0 wahr sind. Ist Wahrheit aber Nützlichkeit, so kann es sein, daß nur die Verbindung von S und S 0 nützlich ist, während jeder Bestandteil für sich genommen nicht weiter hilft. Auch Wahrheit im Sinne der epistemischen Interpretation mit Verifizierbarkeit oder Beweisbarkeit gleichzusetzen, verändert die Bedeutung. Das Tertium non datur der Logik: S oder non S, ein Drittes gibt es nicht, ist ein analytisch zu nennender Bestandteil des Wahrheitsprädikats; dagegen kann es sehr wohl sein, daß weder S noch non S verifizierbar ist. Die semantische Theorie der Wahrheit Es ist nicht klar, ob man Tarskis Wahrheitstheorie deflationistisch nennen soll. Fest steht aber, daß ihre Entstehung von dem Bemühen gekennzeichnet war, viel metaphysisches Gepäck abzuwerfen, das traditionell mit der Wahrheitsproblematik verbunden war, ohne allerdings den Wahrheitsbegriff im Sinne von von Verifizierbarkeit oder Beweisbarkeit positivistisch umzudeuten oder ihn gänzlich aufzugeben. Die Bezeichnung “semantisch” ist nicht so zu verstehen, daß hier eine eine umfassende Theorie zentraler semantischer Begriffe wie Bedeutung und Referenz geliefert wird;28 Sie besagt lediglich, daß der logische Charakter der Verwendungsregeln des Wahrheitsprädikats, dessen Kennzeichen gerade das Tertium non datur und das funktionale Zusammenwirken mit den anderen logischen Strukturausdrücken wie ‘und ’ und ‘oder ’ sind, nicht epistemisch relativiert werden soll. 28 Insofern geht die ein wenig überbordende Polemik H. Putnams gegen die Bezeichnung “semantisch” in Zusammenhang mit Tarskis Theorie an der Sache vorbei, wenn er in [194] (= [195]:332) schreibt: “If I had to name the [i.e., Tarski’s] theory, I would call it the ‘Look No Semantics! Conception of Truth’.”
lxii
Einleitung
Verwendungsregeln für einen Begriff sind aber, formal gefaßt, nichts anderes als Axiome. Dennoch hat Tarski keine Axiomatisierung des Wahrheitsbegriffs angestrebt; er spricht vielmehr von einer Definition auf der Basis von Logik und nicht-semantischer, “physikalistischer” Begriffe. Vermutlich versuchte er auf diese Weise, den Wahrheitsbegriff respektabler zu machen angesichts des antimetaphysischen Geistes der positivistischen Philosophie seiner Zeit.29 Eine reine Axiomatik dagegen könnte sich dem Vorwurf eines bloßen Spiels aussetzen, wenn der fragliche Begriff als ohnehin leer oder unbrauchbar betrachtet wird.30 Tarski will keinen sprachübergreifenden Begriff von Wahrheit entwickeln, sondern beschränkt sich von vornherein auf die Explikation eines Prädikats ‘... ist wahr ’ in einer gegebenen Sprache L. Die Sprache soll zugleich in formalisierter Form vorliegen; dennoch wollen wir hier die wesentlichen Merkmale der Theorie anhand der Umgangsprache erläutern. Kategoriell gesehen wird Wahrheit im Einklang mit den obigen Überlegungen nunmehr Sätzen zugesprochen. Damit benötigt man ein Mittel in der Sprache, Namen von Sätzen zu bilden; denn genau wie über die Person Napoleons unter Verwendung seines Namens gesprochen wird, benötigt man Namen für Sätze, auch wenn sie selbst schon sprachliche Gebilde sind. Dafür kann man z.B. Beschreibungen von Sätzen hernehmen. Angenommen etwa, der erste Satz, den Tarski an seinem 50. Geburtstag äußerte, sei der Satz “Schnee ist weiß ” gewesen. Dann ist der folgende Satz syntaktisch korrekt gebildet und inhaltlich zutreffend: (38)
Der erste Satz, den Tarski an seinem 50. Geburtstag äußerte, ist wahr.
Nach dem informellen Kriterium (37) trifft dieser Satz zu, weil die “Dinge sich eben so verhalten”, wie der Satz besagt, d.h. weil Schnee weiß ist. Dies kann man allerdings nicht aus seiner Formulierung ablesen, da es völlig kontingent ist, was Tarski bei jener Gelegenheit äußerte (mit hoher Wahrscheinlichkeit alles andere, als daß Schnee weiß ist). Man nennt daher solche Aussagen wie (38) oder auch einfach ‘das ist wahr ’, ‘alles was er sagt ist wahr ’, usw. blinde (Wahrheits-)Zuschreibungen (engl. blind (truth) ascriptions). Um dem abzuhelfen, ist es üblich, jedem Satz oder sprachlichen Ausdruck (und übrigens auch sinnlosen Folgen von Wörtern oder Symbolen) einen uniformen Standardnamen zu geben, und zwar durch das Mittel der Anführung (engl. quotation). Wir vereinbaren, daß ein solcher Anführungsname entsteht, indem der betreffende Ausdruck zwischen einfache Anführungszeichen gesetzt wird.31 Wenn ich etwa von dem Namen des zweitinnersten Planeten des Sonnensystems sagen will, er habe fünf Buchstaben, so muß ich folgende Aussage bilden: (39)
‘Venus’ hat fünf Buchstaben.
Bei einem Anführungsnamen erscheint der erwähnte Ausdruck in seiner 29 Es
sei bemerkt, daß auch Gödel, der seine Unvollständigkeitsresultate vor Tarski erzielte, den Begriff der Wahrheit, um dessen Differenz zur Beweisbarkeit es gerade geht, eher hinter der Terminologie der Entscheidbarkeit versteckt. 30 So dürften etwa bei jemanden wie Russell, der mit seiner No-classes-Theorie Mengen als fiktiv ablehnte, Axiomatisierungen des Mengenbegriffs auf wenig Interesse stoßen. 31 Bei Autoren findet sich ebenso häufig die Konvention der doppelten Anführungszeichen für Anführungsnamen (zum Beispiel bei Tarski selbst); diese werden hier jedoch reserviert für Zitate und metaphorische Verwendung von Ausdrücken.
Moderne Logik und Philosophie
lxiii
sprachlichen Gestalt selbst und gibt daher sofort Aufschluß über das, was er benennt. So besagt der Satz (38) inhaltlich dasselbe wie (40)
‘Schnee ist weiß’ ist wahr.
Eine Wahrheitstheorie sollte nun nur solche Sätze wahr nennen, die im Sinne von (37) ein Stück Wirklichkeit beschreiben; ist dies umgekehrt der Fall, so sollte das Wahrheitsprädikat auch auf den Satz zutreffen. Wir bekommen damit das folgende Bikonditional, d.h. eine notwendige und hinreichende Bedingung dafür, dem Satz ‘Schnee ist weiß ’ das Prädikat ‘wahr ’ zuzusprechen: (41)
‘Schnee ist weiß’ ist wahr dann und nur dann, wenn Schnee weiß ist.
Dies kann auf alle Sätze verallgemeinert werden, die das Wahrheitsprädikat selbst nicht enthalten (für diese Einschränkung siehe unten). Damit erhalten wir das abstrakte Schema (42)
Der Satz ‘. . .’ ist wahr dann und nur dann, wenn . . .
Dabei kann anstelle der Punkte ein beliebiger deutscher Satz ohne Wahrheitsprädikat gesetzt werden. Alle so entstehenden konkreten Bikonditionale müssen gewissermaßen als Minimalbedingung alle gelten, damit das Wahrheitsprädikat seinen Namen auch wirklich verdient. Dies ist die Tarskische Konvention T ,32 auch das T-Schema genannt. Tarski nennt das Schema eine Bedingung für die materiale Adäquatheit des Wahrheitsprädikats, welche mit allen ihren Instanzen aus der Wahrheitsdefinition logisch folgen muß. Ohne die PunkteNotation kann das T-Schema wie folgt ausgedrückt werden kann: (43)
α(S) ist wahr dann und nur dann, wenn S
(T)
Hier ist ‘α(S)’ der Anführungsname des Satzes, den das Symbol ‘S’ jeweils im konkreten Fall abkürzt.33 Anführungsnamen haben gegenüber Namen in blinden Zuschreibungen den offensichtlichen Vorteil, daß man den Ausdruck, den sie bezeichnen, auf die einfachste Weise extrahieren kann, indem man die Anführungszeichen streicht; diese Operation heißt Disquotation. Das T-Schema ist damit zugleich ein Disquotationsschema: links ist der jeweilige Satz in angeführter Form gegeben, rechts in disquotierter Form. Deflationistisch gesinnte Philosophen haben nun diese Eigenschaft des TSchemas zum Anlaß genommen, Wahrheit für gänzlich redundant zu erklären: alles, was man mit dem Wahrheitsprädikat sagen kann, könne man per Disquotation auch ohne es sagen. Diese Position heißt Redundanztheorie der Wahrheit und geht auf den Logiker und Philosophen Frank P. Ramsey zurück. Andere Deflationisten wie z.B. Quine gehen nicht ganz so weit, daß sie dem Gebrauch des Wahrheitsprädikats lediglich eine stilistische Funktion zugestehen; sie halten seine Verwendung für unverzichtbar in blinden Zuschreibungen, vor allem 32 Engl.
Convention T ; im deutschen Original heißt sie die Konvention W . findet man in der philosophischen Literatur das T -Schema in der folgenden Form wiedergegeben: 33 Häufig
(∗)
‘S’ ist wahr dann und nur dann, wenn S
Das ist jedoch genau genommen nicht korrekt, weil ‘ ‘S’ ’ nicht der Anführungsname des Satzes ist, den ‘S’ mitteilt, sondern der des Symbols ‘S’ selbst. Zu diesem subtilen bezeichnungstheoretischen Unterschied siehe den Abschnitt zu Gebrauch und Erwähnung im folgenden Kapitel.
lxiv
Einleitung
aber in Generalisierungen etwa der Form “alle Sätze der Gestalt ‘wenn p dann p’ sind wahr ”. Dennoch enthält auch für sie das T-Schema mit der Operation der Disquotation den Kern des Wahrheitsproblematik; trotz mancher interner Unterschiede wird ihre Position daher Disquotationalismus genannt. Wir können hier nicht die Argumente für und gegen diese Familie von disquotationalistischen Theorien ausbreiten (siehe dazu z.B. [141], [109]). Stattdessen kehren wir zu Tarskis Projekt zurück, und zu den im eigentlichen Sinne logischen Aspekten der Wahrheit. Zwei Begriffe spielen hier eine zentrale Rolle: (i) Rekursion und (ii) die Unterscheidung von Objekt- und Metasprache. Betrachtet man die Sätze einer Sprache wie des Deutschen, erst recht aber einer formalen Sprache, so haben wir es mit einer unendlichen Gesamtheit zu tun, da es (selbst bei endlichem Vokabular) keine Obergrenze für die Länge der Sätze gibt: stets kann man zwei Sätze mit einer Konjunktion zu einem längeren Satz verknüpfen. Mit der Idee der rekursiven Bestimmung der wahren Sätze bringt Tarski Ordnung in die unendlich vielen T-Äquivalenzen, indem die Wahrheit der logisch komplexen Sätze (d.h. Zusammensetzungen aus kürzeren Sätzen mit Hilfe der logischen Konstanten ‘nicht’, ‘und ’, ‘oder ’, ‘für alle’, ‘es gibt’ usw.) sich errechnen läßt aus der Wahrheit der Teilsätze. Die Objekt-MetasprachenUnterscheidung hingegen führt zu einer Lösung der semantischen Paradoxien im Umfeld der oben erwähnten Lügner-Paradoxie. Der Grundgedanke bei der Rekursion ist der folgende. Betrachten wir den Satz ‘Napoleon siegte bei Waterloo’; der zugehörige T-Satz lautet: (44)
‘Napoleon siegte bei Waterloo’ ist wahr dann und nur dann, wenn Napoleon bei Waterloo siegte.
Da dies aber nicht den historischen Tatsachen entspricht, ist unser Beispielsatz falsch. Dann sollte aber seine Negation, nämlich ‘Napoleon siegte nicht bei Waterloo’, wahr sein. Anstatt nun logisch beliebig komplexe Zusammensetzungen von Sätzen als Instanzen des T-Schemas zu betrachten, reicht es, logisch elementare Sätze wie den Napoleon-Satz in das Schema einzusetzen; die Bedingung für die Wahrheit bestimmt sich dann aus einer kurzen Liste von rekursiven Wahrheitsregeln, eine für jede logische Konstante. Wenn ‘S’ für einen beliebigen Satz steht und ‘S 0 ’ für die Negation von S, dann lautet die allgemeine Wahrheitsregel für die Verneinung einfach: (45)
α(S 0 ) ist wahr dann und nur dann, wenn es gilt nicht: α(S) ist wahr.
Dabei ist ‘α(S 0 )’ der Anführungsname der Verneinung von S und ‘α(S)’ wie oben der Anführungsname von S selbst. Das T-Bikonditional für S 0 wird nun wie folgt “berechnet” (‘gdw’ sei eine Abkürzung für ‘genau dann wenn’, d.h. ‘dann und nur dann wenn’): (46)
‘Napoleon siegte nicht bei Waterloo’ ist wahr gdw [ mit (45) ] es gilt nicht: ‘Napoleon siegte bei Waterloo’ ist wahr gdw [ mit (44) ] es gilt nicht: Napoleon siegte bei Waterloo, d.h. Napoleon siegte nicht bei Waterloo.
Wir gelangen somit zur gewünschten Disquotation des negierten Satzes. Analoge Berechnungen gelten für die Regeln der anderen logischen Konstanten; und
Moderne Logik und Philosophie
lxv
was das Entscheidende ist: die Regeln können wiederholt zum Einsatz kommen, und zwar solange, bis am Ende keine in einem Satz S auftretende logische Konstante mehr innerhalb von Anführungsstrichen steht und die Disquotation nur noch auf die elementaren Teilsätze von S anzuwenden ist. Dieses rekursive Verfahren löst auf der Ebene der Sätze das Komplexitätsproblem, welches wir oben bereits im Zusammenhang mit möglichen komplexen Tatsachen ansprachen. Wie man dann allerdings feststellt, ob die “Dinge sich so und so verhalten”, wie die disquotierte Form des betrachteten Satzes es besagt, dazu nimmt die semantische Wahrheitstheorie nicht Stellung. Sie reduziert lediglich die WahrmacherFrage auf elementare Sätze. Die Theorie leistet dagegen einen definitiven Beitrag zur Lösung der semantischen Paradoxien. Betrachten wir den ursprünglichen Lügner-Satz (47)
Dieser Satz ist nicht wahr.
wobei das Demonstrativpronomen gerade auf den Satz (47) verweist, in dem es auftritt. Disquotation zusammen mit der Negationsregel liefern aber einen unauflösbaren Widerspruch, also eine echte Antinomie: Angenommen, Satz (47) sei wahr; mit Disquotation verhalten sich dann die Dinge so, wie der Satz sagt, d.h. (47) ist nicht wahr. Wenn wir umgekehrt annehmen, (47) sei nicht wahr, dann ist das gerade das, was der Satz besagt, und (47) ist wahr. Das Problem liegt darin, daß in Sätzen wie (47) das Wahrheitsprädikat auf Sätze angewendet wird, die es bereits enthalten; diese Situation hatten wir vorher nicht betrachten. Man könnte nun einfach den Lügner-Satz als logische Spitzfindigkeit verbieten und Wahrheitstheorie für den Rest der Sprache betreiben. Allerdings durchziehen die Paradoxien auf beinahe unmerkliche Weise die gesamte Sprache. Von logischer Seite kann man etwa wenig gegen blinde Zuschreibungen unternehmen, die zufällig den Lügner-Satz zum Gegenstand haben. So könnte es sein, daß Tarski an seinem 50. Geburtstag als erstes ausgerechnet den Lügner-Satz geäußert hat. Dann wird der obige Satz (38) paradox. Oder der vorlaute Platon, der seinen Lehrer Sokrates unbedingt widerlegen möchte (wir nehmen an, daß Platon noch sehr jung war), äußert den Satz: “Sokrates wird jetzt die Unwahrheit sagen”, worauf Sokrates weise antwortet: “Platon hat wahr gesprochen”. Hier liegt eine Lügner-Schleife der Länge 2 vor, die durch kompliziertere Beispiele jederzeit beliebig verlängert werden könnte. Die Isolierung der paradoxen Wahrheitszuschreibungen kann so einfach also nicht gelingen. Hier greift nun Tarskis Unterscheidung von Objekt- und Metasprache: die Ausgangssprache L der Stufe 1, die Objektsprache, enthält das Wahrheitsprädikat nicht (und auch keine sonstigen semantischen Begriffe). Eine Sprache L∗ der Stufe 2, die Metasprache von L, enthalte die Namen aller Sätze der Objektsprache sowie ein Wahrheitsprädikat für L; dann kann man in L∗ über die Sätze von L sprechen und speziell Bedingungen für die Wahrheit von L-Sätzen formulieren. Die Lügner-Antinomie kann nun aber gar nicht mehr formuliert werden. Denn da der Lügner-Satz das Wahrheitsprädikat enthält, müßte er der Metasprache L∗ angehören; die Frage nach der Wahrheit stellt sich aber nur für L-Sätze. Die Idee, Syntax und Semantik auf zwei verschiedenen Sprachstufen anzusiedeln, ist zum wesentlichen Merkmal der modernen Logik geworden. Typischerweise ist die Objektsprache die Prädikatenlogik erster Stufe, in der Theorien über verschiedene Bereiche wissenschaftlicher Tätigkeit formuliert werden (z.B.
lxvi
Einleitung
Arithmetik und Mengentheorie, aber auch Theorien von vornehmlich philosophischem Interesse wie die Mereologie, siehe unten). Die Metasprache ist in der Regel die (informelle) Mengenlehre. In ihr wird der Begriff des Modells oder der semantischen Struktur entwickelt, relativ zu dem der Begriff der Wahrheit eines objektsprachlichen Satzes oder auch ganzer Theorien definiert wird. Zu einer solchen Struktur gehören die Objekte, über die in der Theorie gesprochen werden kann, sowie eine Anzahl von Relationen zwischen und Operationen auf den Objekten. Bildet die Theorie die Verhältnisse in der Struktur korrekt ab, so ist die Struktur ein Modell der Theorie. Zum Beispiel ist die Menge der natürlichen Zahlen zusammen mit den üblichen arithmetischen Operationen ein Modell (das Standardmodell ) der Peano-Arithmetik. Die Relativierung der Wahrheit von Theorien auf Strukturen, in denen sie interpretiert werden, ist eine Entwicklung der mathematischen Logik, die sich so weder bei Frege noch bei Russell findet; diese Autoren waren davon überzeugt, daß ihre logischen Systeme universell gültige Gesetze des Denkens formalisieren und keiner Interpretation in wechselnden Strukturen bedürfen (diese Frage stellte sich gar nicht für sie). Was nun die Tarskische Lösung der semantischen Antinomien betrifft, so stellt sie, eigentlich ähnlich wie Russells Theorie der Typen für die RussellParadoxie, eine Radikalkur dar: durch das Einziehen syntaktischer Trennwände werden die Paradoxien gar nicht mehr formulierbar. Dadurch verschwindet allerdings auch der philosophisch interessante Grundgedanke der Reflexivität des Lügner-Phänomens, der zugleich eine technische Herausforderung darstellt und zum Beispiel von Gödel in seinen Unvollständigkeitsresultaten gerade fruchtbar gemacht wurde. Zeitgenössische Autoren haben sich darangemacht, diese Spur weiter zu verfolgen und Theorien selbst-reflexiver Wahrheit zu entwerfen, welche auf verschiedene Weisen die Klippe der Antinomien umschiffen. So hat sich das moderne Forschungsfeld formaler Wahrheitstheorien herausgebildet, an dessen Anfang vor allem Saul Kripkes Theory of Truth [151] stand.34 In welchem Verhältnis zueinander stehen nun der philosophische und der logische Wahrheitsbegriff? Als Philosoph kann man ja in den Paradoxien ein wenn auch lästiges Randproblem sehen, welches keinen Einfluß auf eine rein philosophische Wahrheitstheorie hat. Dieser Ansicht scheint etwa der Philosoph Paul Horwich zu sein, dessen Minimale Theorie der Wahrheit einflußreich wurde. Nun ist die moderne Wissenschaft einschließlich der Philosophie auf unverzichtbare Arbeitsteilung angelegt, und es versteht sich von selbst, daß für jemanden, der sich etwa hauptsächlich mit dem Realismus-Problem beschäftigt, die logischen Fragen nicht im Mittelpunkt stehen müssen. Das heißt aber nicht, daß der Gegenstand selbst, also die Wahrheitsproblematik, sich überlappungsfrei auf die verschiedenen Disziplinen verteilen ließe. Schon allein die Tatsache, daß es sich bei den Relata der Wahrheitsrelation, seien es nun Tatsachen, Propositionen oder einfache Sätze, um unendliche Gesamtheiten handelt, ruft logische Fragestellungen auf. Und bei dem erwähnten reflexiven Verständnis von Wahrheit in sicherem Abstand von den drohenden Paradoxien zu navigieren, verlangt definitiv nach fortgeschrittener technischer Ausstattung auf dem Gebiet der Logik.35
34 Siehe die in [175] gesammelten Aufsätze. Neuere wichtige Arbeiten und Ansätze finden sich in [22], [23], [12], [177] sowie in [109] und der dort zitierten Literatur. 35 Siehe hierzu [109], speziell S. 162ff.
lxvii
Moderne Logik und Philosophie
0.2.7
Modalität Paris: That may be must be, love, on Thursday next. Juliet: What must be shall be. Friar Laurence: That’s a certain text. Shakespeare, Romeo and Juliet
Die Modallogik bildet den Kern des weiten Gebiets der sogenannten philosophischen Logiken. Sie untersucht die Gesetzmäßigkeiten der Modalitäten wie Möglichkeit, Notwendigkeit und Kontingenz. Diese Begriffe treten in der Sprache typischerweise als Satzadverbien oder als satzeinbettende Wendungen auf, wie in (48)
a.
Die Planeten bewegen sich notwendigerweise auf Ellipsenbahnen.
b.
Es ist notwendig, daß die Planeten sich auf Ellipsenbahnen bewegen.
Es liegt also nahe, Modalitäten in der Logik als Operatoren auf Sätzen aufzufassen, d.h. als Symbole, die aus einem gegebenen Satz einen neuen machen.36 Danach verhält sich ein Modaloperator syntaktisch wie die Negation. Das einfachste Format für die Modallogik ist damit die Aussagenlogik, welche lediglich durch den Satzoperator ‘’ ergänzt wird. Ist φ ein beliebiger Satz, so steht ‘φ’ für “es ist notwendig, daß φ ”, kurz zu lesen als “Box φ ”. Möglichkeit kann dann durch Notwendigkeit definiert werden. Wenn es möglich ist, daß es regnet, dann ist es nicht notwendig, daß es nicht regnet, und umgekehrt. Kontingenz läßt sich ebenfalls definieren; z.B. sind Wettererscheinungen kontingente, d.h. mögliche, aber durch keine Gesetzmäßigkeiten erzwungene Sachverhalte, d.h. es ist möglich, daß es regnet, und es ist nicht notwendig, daß es regnet (oder was dasselbe ist, es ist möglich, daß es nicht regnet). Das Symbol für den Möglichkeitsoperator ist ‘♦’ (lies: “Raute”; engl. diamond ). Für die Kontingenz gibt es kein allgemein übliches logisches Zeichen, und auch wir werden kaum Verwendung dafür haben; für die folgende formale Definition wählen wir willkürlich das Symbol ‘’ und setzen dann: (49)
a.
♦φ
:↔
b.
φ
:↔
¬¬φ
♦φ ∧ ♦¬φ
(es ist möglich daß φ) (es ist kontingent daß φ)
Die Modalität der Notwendigkeit drückt aus, daß ein Sachverhalt oder ein Zusammenhang zwingend gegeben ist. In den frühen modallogischen Ansätzen war vor allem der Begriff des notwendigen Zusammenhangs zentral. Man sagte nicht nur, daß alle Menschen vernunftbegabte Wesen sind, sondern daß es zum Wesen des Menschen gehört, vernunftbegabt zu sein, daß also dieser Zusammenhang zwischen Menschsein und Vernunftbegabung zwingend oder notwendig ist. Gleiches gilt für alle nicht rein kontingenten, sondern gesetzesartigen Regelmäßigkeiten, wie etwa, daß die Straße naß wird, wenn es regnet. In der Modallogik 36 Es gibt eine zweite Möglichkeit der syntaktischen Bestimmung von Modalitäten, nämlich als Prädikat von Sätzen. Dazu müssen aber die Sätze als Individuen aufgefaßt und mit Namen versehen werden, was einen gewissen Aufwand an geeigneter Kodierung nach sich zieht. Darauf kann an dieser Stelle nicht eingegangen werden.
lxviii
Einleitung
kann diese Beziehung durch ein Konditional “wenn φ dann ψ” wiedergegeben werden, welches mit einer Box versehen ist: (φ → ψ) Man nennt ein solches notwendiges Konditional strikte Implikation. Sie drückt aus, daß es nicht denkbar oder nicht möglich ist, daß φ gilt, aber nicht ψ. Diese Formulierung ist aber modallogisch äquivalent zur strikten Implikation: “nicht möglich” (¬♦) heißt so viel wie “notwendig nicht” (¬), und aussagenlogisch folgt: ¬♦(φ ∧ ¬ψ) gdw ¬♦¬(φ → ψ) gdw (φ → ψ)
Wie wir im nächsten Unterabschnitt (0.2.8) und in Kapitel 2 sehen werden, kann die reine wenn-dann-Verknüpfung der Aussagenlogik, das logische Konditional (auch “materiale Implikation” genannt), den Gedanken eines regelhaften Zusammenhangs nicht adäquat wiedergeben. Der Begriff der Notwendigkeit läßt verschiede Deutungen zu, je nachdem welche Art von Gesetzmäßigkeit einer Notwendigkeitsaussage zugrundegelegt wird. So erzwingen etwa die physikalischen Gesetze, daß sich ein Körper in einem Zentralkraftfeld entlang einer Kegelschnittbahn bewegt, und ist die Bahn (annähernd) geschlossen wie bei den Planeten des Sonnensystems, so beschreiben die Planeten eben notwendigerweise eine Ellipse im Raum. Dies ist ein Fall von physikalischer oder nomologischer Notwendigkeit (von griech. nomos, das Gesetz). Die folgende Liste stellt einige wichtige Notwendigkeitsbegriffe zusammen. (50)
a.
Es ist logisch notwendig daß φ;
b.
es ist analytisch notwendig daß φ;
c.
es ist physikalisch/nomologisch notwendig daß φ;
d.
es ist metaphysisch notwendig daß φ;
e.
es ist zeitlogisch notwendig daß φ;
f.
es ist epistemisch notwendig daß φ;
g.
es ist deontisch notwendig daß φ;
h.
es ist beweisbar (notwendig) daß φ.
Logische Notwendigkeit ist eigentlich ein metasprachliches Prädikat, aber in der Modallogik wird diese Modalität “in die Objektsprache gedrückt”, um die logischen Gesetze zu isolieren, denen der Begriff genügt, und ihre Folgerungen zu untersuchen. Zum Beispiel gilt die Regel, daß, wenn ein Satz φ logisch notwendig ist, er auch gilt. Damit haben wir ein erstes logisches Prinzip für die Box, das sogenannte T-Axiom: (51)
φ → φ
(T)
Das T-Prinzip ist das einfachste und bekannteste modallogische Axiom, welches intuitiv nicht nur für die logische Deutung der Notwendigkeit gilt, sondern auch für viele andere Deutungen, so die analytische (das ist die begriffliche Notwendigkeit wie z.B. die, daß Junggesellen unverheiratet sind), die physikalische und die metaphysische Notwendigkeit. Letztere wurde vor allem von Leibniz
Moderne Logik und Philosophie
lxix
systematisiert und mit der bekannten Deutung von Notwendigkeit als Wahrheit in allen möglichen Welten versehen. Wenn man mit Leibniz annimmt, daß die von Gott erschaffene Welt eine von den vielen anderen möglichen Welten ist (er sagte sogar, die beste aller möglichen Welten), dann ist die Gültigkeit von (T) offensichtlich: φ bedeutet dann, daß φ in allen möglichen Welten, speziell also auch in der wirklichen Welt gilt. Die Leibnizsche Interpretation der Notwendigkeit stößt auf formale Schwierigkeiten in modallogischen Systemen, in denen das T-Axiom nicht gilt. In solchen Systemen kann Notwendigkeit als Wahrheit in allen möglichen Welten nur dann weiter als ein Deutungsmuster fungieren, wenn die wirkliche Welt nicht automatisch in die Menge der möglichen Welten einbezogen wird, von denen die Rede ist. Man kann aber die Regel dahingehend verallgemeinern, daß die Notwendigkeit einer Aussage nur noch von möglichen Welten abhängig gemacht wird, die einer gewissen Bedingung unterliegen. S. Kripke verlieh diesem verallgemeinerten Leibnizschen Schema die folgende formale Gestalt: die Rede von der Quantifikation über mögliche Welten als Kriterium der Wahrheit von Notwendigkeitsaussagen wird beibehalten. Das heißt zunächst, daß der Wahrheitsbegriff in der Modallogik relativiert wird auf eine gegebene “Ausgangswelt”. Was mit “alle Welten” gemeint ist, wird jedoch eingeschränkt auf sogenannte zulässige oder zugängliche Welten. Dabei kann der Begriff “zugänglich” in verschiedenen Interpretationen der Notwendigkeit verschieden festgelegt werden. Die Wahrheitsregel für die Box lautet dann: (52)
φ ist wahr in einer Ausgangswelt w0 , wenn φ in allen Welten wahr ist, die von w0 aus zugänglich sind.
Dies ist die Grundidee der Kripke-Semantik , die der semantischen Interpretation modallogischer Systeme zugrundeliegt und die die Flexibilität liefert, den verschiedenen inhaltlichen Deutungen der Modalitäten auch formal Rechnung zu tragen. Von einem System ohne T-Prinzip zum Beispiel kann dann einfach gesagt werden, daß die Ausgangswelt w0 (die “wirkliche” Welt) selbst nicht zugänglich ist. Dann kann φ gelten (in allen von w0 aus zugänglichen Welten), ohne daß φ in w0 gilt. Daß das T-Prinzip nicht als stets gültiges Axiom festgeschrieben werden sollte, sieht man am besten an der deontischen Deutung von Notwendigkeit. In diesen Fall ist die Box zu lesen als “es ist geboten daß φ”, und die Raute “es ist erlaubt daß φ”. Bekanntermaën folgt nämlich aus dem Sollen kein Sein, so daß also Sachverhalte, deren Realisierung einer Person als Verpflichtung auferlegt sind, von diesem keineswegs automatisch verwirklicht werden. An Stelle des TAxioms gilt aber als Forderung minimaler deontischer Kohärenz, daß alles, was geboten ist, wenigstens erlaubt sein muß: (53)
φ → ♦φ
(D)
Dies ist das Grundaxiom der deontischen Logik. Das T-Prinzip gilt wiederum für die Deutung der Box als zeitlogische oder temporale Notwendigkeit. Diese ist etwa zu lesen als “es ist immer/jederzeit der Fall daß φ ”, und offensichtlich akzeptieren wir die Regel, daß, wenn φ jederzeit gilt, auch (jetzt) gilt. Geben wir dagegen der Box die Bedeutung “fortan gilt (stets)” oder “bisher galt (stets)”, dann ist das T-Axiom auch in der temporalen Lesart nicht garantiert, wenn man den Jetzt-Zeitpunkt dabei ausschließt.
lxx
Einleitung
In der temporalen Lesart ist ein weiteres Axiom intuitiv besonders plausibel, welches jedoch auch in den vorangehenden Deutungen der Notwendigkeit gilt: wenn φ notwendig gilt, so ist dieser Sachverhalt selbst notwendig; wenn es also notwendig ist, daß φ, dann ist es notwendig, daß es notwendig ist, daß φ. Zeitlogisch ausgedrückt sagt das Prinzip, daß, wenn φ immer gilt, dies “gleichmäßig” über die ganze Zeitskala erfüllt ist, d.h. daß es immer gilt, daß φ immer gilt. Hier tritt eine iterierte Modalität auf, und es wird besonders deutlich, daß die Notwendigkeitsaussage selbst ein Satz der Objektsprache sein muß, damit die wiederholte Anwendung des Operators sinnvoll ist. Dies hatten wir aber mit der syntaktischen Wiedergabe der Notwendigkeit als Satzoperator so angenommen. Das genannte Prinzip tritt als charakteristisches Axiom in einem System von C. I. Lewis, eines Pioniers der Modallogik, auf (siehe [156]); da jenes System den Namen ‘S4’ trägt, heißt das Prinzip heute einfach ‘4’. Es lautet formal: (54)
φ → φ
(4)
Bei der epistemischen Notwendigkeit akzeptieren wir das T-Axiom ebenfalls, wenn die Box gelesen wird als der Wissensoperator bezüglich eines gegebenen (beliebigen, aber festen) epistemischen Subjekts a. Statt der Box schreibt man häufig ‘K’ für engl. know und liest ‘Kφ’ als “a weiß daß φ ”. Dann gilt, da man nur dann von Wissen spricht, wenn der gegebene Sachverhalt auch besteht: (55)
a. b.
Kφ → φ
Wenn a weiß daß φ, dann φ.
Handelt es sich dagegen nicht um Wissen, sondern um bloßes Für-wahrHalten oder Glauben, so wird man das T-Axiom nicht annehmen wollen. Das Axiom 4 dagegen ist sowohl für Wissen wie für Glauben plausibel. Wenn man weiß daß φ, dann weiß man, daß man weiß, daß φ; und wenn man glaubt, daß φ, dann glaubt man, daß man glaubt, daß φ. Es ist schließlich eine interessante metamathematische Fragestellung, Axiome für die Box zu untersuchen, wenn sie gelesen wird als “... ist beweisbar (in der Peano-Arithmetik)”. Der Kontext ist die von Gödel entdeckte Möglichkeit der Kodierung des Beweisbarkeitsprädikats in der Arithmetik selbst. Dies führt zu der sogenannten Beweisbarkeitslogik , welche wie eine Modallogik entwickelt werden kann. Sie teilt mit den üblichen Modallogiken z.B. die grundlegende Struktureigenschaft der “Box-Distribution”, d.h. der Verteilung der Box über das Konditional; dies ist ein Reflex des allquantifizierenden Charakters von Notwendigkeit in der semantischen Metasprache und ist daher ein Reflex des analogen Prinzips der Quantorendistribution, welches das Zusammenwirken von Allquantor und Konditional in der Prädikatenlogik beschreibt: (56)
a. b.
∀x(φ → ψ) → ∀xφ → ∀xψ) (φ → ψ) → (φ → ψ)
Ferner gilt das Axiom (4), aber nicht, wie sich zeigt, das Axiom (T). Mit Hilfe der Beweisbarkeitsinterpretation der Notwendigkeit läßt sich der Kern des 2. Gödelschen Unvollständigkeitssatzes darstellen.
lxxi
Moderne Logik und Philosophie Modale Prädikatenlogik
Herr Bertolt Brecht behauptet: Mann ist Mann. Und das ist etwas, was jeder behaupten kann. Aber Herr Bertolt Brecht beweist auch dann Daß man mit einem Menschen beliebig viel machen kann. Hier wird heute abend ein Mensch wie ein Auto ummontiert Ohne daß er irgend etwas dabei verliert. . . . Man kann, wenn wir nicht über ihn wachen Ihn uns über Nacht auch zum Schlächter machen. B. Brecht Mann ist Mann
Fügt man zu einem System der modalen Aussagenlogik den Apparat der Prädikation und Quantifikation hinzu, so können Modaloperatoren und Quantoren interagieren, was zu verschiedenen Möglichkeiten ihrer Reihung führt. Betrachten wir das folgende Satzpaar. (57)
a.
Es ist möglich, daß Einstein einen Bruder hatte.
b.
Es gibt jemanden, der möglicherweise Einsteins Bruder war.
Den a-Satz würden wir ohne Zögern unterschreiben: es ist durchaus denkbar, daß Einstein außer seiner Schwester Maja auch noch einen Bruder hatte. Wie aber muß die Welt beschaffen sein, damit der b-Satz wahr wird? Es scheint, daß nicht weniger gefordert ist als die “Existenz” eines jener nicht-aktualisierten möglichen Objekte, welche Quine aus unserer Ontologie verbannt sehen wollte. Wir die logischen Formen der beiden Sätze betrachten, so wird deutlich, daß der Möglichkeitsoperator und der Existenzquantor lediglich ihre Plätze getauscht haben (‘B(x, a)’ stehe für ‘x war ein Bruder von Einstein’): (58)
a. b.
♦ ∃x B(x, a)
∃x ♦ B(x, a)
Formal gesehen sind beide Fügungen in der modalen Prädikatenlogik zulässig. Dennoch stehen sie für zwei unterschiedliche philosophische Konzeptionen von Modalität. Im ersten Fall handelt es sich um eine Modalität de dicto, da ein ganzer Satz, ein dictum, einen möglichen Zustand der Welt beschreibt. Die Formel (58b) enthält dagegen eine Modalität de re: es wird die Existenz eines Objekts x behauptet, dem eine mögliche Eigenschaft zugeschrieben wird, nämlich ein möglicher Bruder von Einstein zu sein. Ob dieser Sprechweise ein philosophischer Sinn verliehen werden kann, ist ohne eine ausführliche Theorie von de-re-Modalitäten nicht auszumachen. Der Logiker ist allerdings lediglich aufgerufen, eine präzise formale Begrifflichkeit zu entwickeln, welche die beiden Typen von Modalität zu modellieren gestattet. Es wurden verschiedenen Systeme der quantifizierten Modallogik mit den passenden Semantiken entwickelt, die das leisten. Dazu werden die möglichen Welten zu vollen Strukturen für erststufige Formeln ausgebaut, mit einem Bereich Du von Individuen, die “in der Welt u existieren”, für alle Welten u. Versuchen wir, in einer derartigen modalen Struktur die Formel (58a) mit der angegebenen Bedeutung auszuwerten. Dann ist die Formel in einer Ausgangswelt w0 wahr, wenn es eine von w0 aus zugängliche Welt v gibt, in der ein Bruder
lxxii
Einleitung
von Einstein existiert. Die Wahrheit von (58b) in w0 bedeutet dagegen, daß es ein Objekt x in w0 gibt, das in einer anderen Welt u Einsteins Bruder war. Um dem Problem der nicht-aktualisierten Possibilia die Schärfe zu nehmen, könnte man verabreden, daß es in allen Welten dieselbe Menge D von Individuen gibt, die lediglich von Welt zu Welt ihre veräußerlichen Eigenschaften wechseln können. So können wir etwa von ein und derselben Person sagen, daß sie in dieser Welt arm ist, in einer anderen möglichen Welt aber Millionär wäre, oder von der Figur Galy Gay in jenem Brechtschen Theaterstück, daß sie in der einen Welt ein einfacher Packer ist, in einer anderen aber jederzeit zum Schlächter in der Kolonialarmee werden kann. Allerdings hilft diese Einschränkung in unserem obigen Beispiel nur weiter, wenn wir einer konkreten Person die Eigenschaft zuschreiben, “möglicherweise” Einsteins Bruder zu sein. Hier werden wir aber mit dem traditionelllen Problem wesentlicher Eigenschaften konfrontiert: ist es überhaupt möglich, daß eine Person in einer anderen Welt das Kind anderer Eltern sein könnte? In seiner Schrift [150], die gewissermaßen die Philosophie zu seiner formalen Semantik liefert, argumentiert Kripke, daß dies unmöglich ist: Gen-Identität ist eine wesentliche Eigenschaft von Menschen.37 In einer Semantik mit einem festen Individuenbereich für alle Welten ist die freie Vertauschung von Quantor und zugehöriger Modalität (d.h. von ‘∀’ und ‘’ sowie von ‘∃’ und ‘♦’) ein gültiges Theorem. Die eine Richtung dieses Prinzips (59)
∀x φ → ∀xφ
(BF)
trägt den Namen Barcan-Formel .38 Wenn also alle Menschen die notwendige Eigenschaft der Gen-Identität besitzen, dann ist es notwendig, daß alle Menschen gen-identisch sind. Das ist solange in Ordnung, wie nicht in irgendeiner weitentfernten, aber zugänglichen Welt Menschen existieren, die in der Ausgangswelt nicht auftreten und dort die Eigenschaft vermissen lassen. Eine solche modale Struktur verletzt die Barcan-Formel, wenn alle “hier” existierenden Menschen nur dann in anderen Welten auftauchen, wenn sie dort ihre Eigenschaften behalten. In Semantiken mit wechselnden Bereichen ist die Gültigkeit der Barcan-Formel also nicht mehr garantiert. Die Barcan-Formel ist übrigens äquivalent zu der Vertauschung von Raute und Existenzquantor in der anderen Richtung, was dem Übergang von (58a) nach (58b) entspricht: (60)
♦ ∃xφ → ∃x ♦φ
(BF0 )
Weniger metaphysische Beispiele, die die Barcan-Formel und damit auch (BF0 ) verletzen, finden sich bei der temporalen Deutung der Raute. Dies ist der temporale Vergangenheitsoperator ‘P’, zu lesen als “es war (einmal) der Fall daß ”; denn ebenso wie ♦φ die Existenz einer Welt mit der Eigenschaft φ bedeutet, beinhaltet Pφ die Existenz eines früheren Zeitpunkts, zu dem φ galt. (Dagegen entspricht der starke Vergangenheitsoperator ‘H’: “es war immer der Fall daß ” der Box.) Das Prinzip (BF0 ) nimmt dann die Gestalt an: (61)
P ∃xφ → ∃x Pφ
(BF0 -t)
Betrachten wir nun den Satz bricht hier mit dem Tabu, welches Quine über die de-re-Modalitäten verhängt hatte. 38 Nach der Logikerin Ruth Barcan Marcus. 37 Kripke
Moderne Logik und Philosophie (62)
lxxiii
Früher war der Papst ein Kunstmäzen.
Dies kann auf zweierlei Weise verstanden werden. Es gab einen Zeitpunkt in der Vergangenheit, so daß der damalige Papst ein Kunstmäzen war; also gab es damals jemanden, der Papst und Kunstmäzen war (man denke etwa an Julius II., der geniale Künstler wie Raffael und Bramante an seinem Hof versammelte). Das hat die logische Form P ∃xφ und kann als wahr gelten.39 Die andere Lesart besagt, daß es jetzt jemanden gibt, der früher (in seinem Leben) Papst und Kunstmäzen war. Dies entspricht der Formel ∃x Pφ und dürfte falsch sein. Damit haben wir ein Gegenbeispiel zu (61). Die temporale Deutung der Modalitäten läßt es ganz natürlich erscheinen, daß Objekte über die Zeit hin entstehen und vergehen; die Barcan-Formel und die Konstanz des Individuenbereichs passen daher nicht zu dieser Interpretation. Eine zusätzliche Komplikation entsteht, wenn wir modale Prädikatenlogik mit Identität betrachten. In Unterabschnitt 0.2.3 hatten wir uns darauf festgelegt, daß die Selbstidentität eine notwendige Wahrheit ist. Das erzeugt jedoch ein Problem, wie der folgende Schluß mit dem Leibniz-Prinzip zeigt. (63)
a.
Notwendigerweise ist der Morgenstern gleich dem Morgenstern.
b.
Der Morgenstern ist gleich dem Abendstern.
c.
Also ist notwendigerweise der Morgenstern gleich dem Abendstern.
Während wir aber (63a) und (63b) für wahr halten, ist (63c) nach gängigem Verständnis falsch. Ebenso ist dies kein gültiger Schluß ([200]:143): (64)
a.
Notwendigerweise ist 9 größer als 7.
b.
Die Anzahl der Planeten ist 9.
c.
Also ist notwendigerweise die Anzahl der Planeten größer als 7.
Analoge Beispiele lassen sich mit ‘möglicherweise’ konstruieren. Das zeigt, daß modale Kontexte ebenso wie epistemische Kontexte nicht-extensional oder intensional sind: in ihnen ist die Leibniz-Ersetzbarkeit verletzt, die (zusammen mit der uneingeschränkten Spezialisierung eines Allsatzes auf eine Instanz) das Kennzeichen von Extensionalität ist. Quine [200] nennt sie auch referentiell opak , da die Wahrheit von Aussagen, in denen solche Kontexte vorkommen, von der Art der Bezugnahme (Referenz) auf die Objekte abhängt, von denen die Aussagen handeln. Wie kann nun die Modallogik der erwähnten metaphysischen Intuition Rechnung tragen, daß die Gleichheit doch eine notwendige Relation ist? Die Diagnose lautet, daß der Anschein der Kontingenz von Identitätsaussagen durch die Verwendung von Individuenausdrücken (Namen, Kennzeichnungen) entsteht, da die Namensgebung oder das Zutreffen einer Kennzeichnung und damit Koreferentialität von kontingenten Umständen abhängt. Die formale Lösung der Schwierigkeit besteht darin, innerhalb des intensionalen Kontextes nur Variablen zuzulassen und “weltensensitive” Ausdrücke und Aussagen aus dem Kontext “herauszuziehen”. (64c) ist dann folgendermaßen zu paraphrasieren (die Formel unter b. ist die logische Form): 39 Wir
ignorieren hier die Eindeutigkeit der Kennzeichnung ‘der Papst’.
lxxiv (65)
Einleitung a.
Notwendigerweise ist die Anzahl der Planeten größer als 7.
b.
∃x ( x = die Anzahl der Planeten ∧ (x > 7) )
Denn (65b) sagt nun nicht mehr, als daß (i) eine gewisse Zahl x größer als 7 ist (und da arithmetische Aussagen als notwendig gelten, kann die Box gesetzt werden) und ferner, daß (ii) dieses x kontingenterweise gleich der Anzahl der Planeten ist (kontingenterweise deshalb, weil Aussagen außerhalb der Box immer nur bezüglich der gegebenen Welt behauptet werden). Eine analoge Analyse kann für das Beispiel (63) gegeben werden. Wir hatten schon gesehen. daß das Denotationsverhalten von Kennzeichnungen besonders “labil” ist: die Welt braucht sich nur leicht zu verändern, und schon ist die Einzigkeitsbedingung verletzt. Entsprechendes gilt auch, wenn man die Veränderung der Welt als den Übergang zu einer anderen möglichen Welt auffaßt; diese Sprechweise liegt besonders nahe, wenn man sich kontrafaktische Situationen vorstellt. Beim 100m-Lauf oder beim Formel-I-Rennen entscheiden Bruchteile von Sekunden darüber, wer zum Sieger erklärt wird; die Kennzeichnung ‘der Sieger des Rennens’ wird zwar in verschiedenen alternativen Szenarien zum Ausgang des Rennens jeweils denotieren, aber sie wechselt leicht ihr Denotat von Welt zu Welt. Eigennamen dagegen sind in ihrem Denotationsverhalten stabiler, und es ist argumentiert worden, daß sie überhaupt bei einem Wechsel der Welt ihr Denotat beibehalten, zumindest in den möglichen Welten, in denen das Denotat der Ausgangswelt ebenfalls existiert. Betrachten wir zum Beispiel den ältesten Sohn des Handschuhmachers John Shakespeare und der Mary Arden in Stratford-uponAvon, William, geboren 1564 und gestorben 1616 (hier kurz ‘WS’ genannt). Er gilt als der Verfasser der Werke Shakespeares in der wirklichen Welt w0 , aber es gibt auch andere Kandidaten für die Autorschaft, etwa Francis Bacon40 oder Edward de Vere, siebzehnter Earl of Oxford (kurz EV). Nehmen wir einmal an, der Letztgenannte sei der wahre Autor (= Welt w1 ). In w1 ist der Satz ‘Edward de Vere schrieb den “Hamlet” ’ wahr, aber nicht ‘Mary Arden ist die Mutter von Edward de Vere’. Die Autorschaft macht den 17. Earl of Oxford nicht zu einem Shakespeare (Pech also in dieser Welt für die Touristen in Stratford-uponAvon). Jener Adlige EV aus Oxford erwirbt zwar beim Übergang von w0 in die vorgestellte Welt w1 einige Eigenschaften, aber nicht die, mit WS identisch zu sein. Eine sprachphilosophische Analyse zeigt, daß die akzeptierten Konventionen unserer sprachlichen Bezugnahme (der Referenz) so nicht funktionieren. In beiden Welten existieren diese beiden Personen, aber der Name ‘WS’ wechselt von w0 nach w1 nicht seine Referenz. Man sagt, ‘WS’ sei wie alle anderen Eigennamen ein starrer Designator (eng. rigid designator ): er bezeichnet in jeder Welt (sofern er überhaupt etwas bezeichnet) dasselbe Objekt. Insofern nun die Ausdrücke ‘der Morgenstern’ und ‘der Abendstern’ als Eigennamen aufgefaßt werden und damit starre Designatoren sind (etwa a bzw. b), kann sogar auf die Extraktion nach dem Muster (65) verzichtet werden. Dann bedeutet (64c) einfach, daß ein gewisses Objekt, nämlich der Planet Venus, mit sich selbst identisch ist, und das notwendigerweise; in Symbolen: (a = b). Allerdings bleibt das schon von Russell in seinem Waverley-Beispiel angesprochene Problem bestehen, daß der Anlaß zu einer Äußerung des Satzes (64c) selten aus dem Bedürfnis entstehen dürfte, eine metaphysische Trivialität mitzuteilen, sondern eine Information über die Koreferenz zweier Namen. 40 Dieser
im 19. Jahrhundert populären “Bacon-Hypothese” hing auch Georg Cantor an.
Moderne Logik und Philosophie
lxxv
Die Theorie starrer Designatoren wird in [150] entwickelt und dort anhand vieler Beispiele erläutert. Mögliche-Welten-Semantik Die Logik der Modalitäten wurde oben als eine Erweiterung der Aussagenbzw. Prädikatenlogik vorgestellt, d.h. als ein formales System mit objektsprachlichen Gesetzen (T-Axiom, Barcan-Formel, etc.) und einer semantischen Interpretation, deren neue Bestandteile eine Menge von "moglichen Welten und die Relation der Zugänglichkeit sind (Kripke-Semantik). Viele philosophische Abhandlungen zu modalen Fragen benutzen als formales Instrument jedoch lediglich die möglichen Welten. Dahinter stehen zwei Vereinfachungen. Man betrachtet statt verschiedener Axiome nur ein festes System (in der Regel die sogenannten S5-Axiome41 ) und ein festes intendiertes Modell für die Interpretation der deskriptiven Konstanten, die in ihren semantischen Werten nur noch über die verschiedenen möglichen Welten hinweg variieren (z.B. bedeutet ‘der Sieger ’ stets das, was wir üblicherweise unter dem Gewinner in einem Wettbewerb oder einer Auseinandersetzung verstehen, nur kann von Welt zu Welt der Ausgang und damit auch der Wert für ‘der Sieger ’ ein anderer sein). Ferner wird die Relation der Zugänglichkeit als total angenommen, d.h., alle Welten sind von allen Welten aus zugänglich; dann kann man sie auch weglassen. Es sei jetzt also eine Menge W als die Menge aller möglichen Welten fest vorgegeben. Dann kann man die Teilmengen von W zur Modellierung des intensionalen Begriffs der Proposition verwenden, und zwar aufgrund der folgenden Überlegung. Eine Proposition oder ein Sachverhalt ist das, was ein Satz im Unterschied zu seinem bloßen Wahrheitswert bedeutet bzw. ausdrückt, oder, in Freges Terminologie, sein Sinn. Zum Beispiel haben die Sätze ‘es regnet’ und ‘it is raining’ denselben Sinn, unabhängig davon, ob sie in einer gegebenen Situation wahr oder falsch sind. Aber der eine Satz ist genau dann, d.h. unter denselben Umständen oder in denselben möglichen Welten, wahr, wenn der andere wahr ist. Also gleichen die beiden Sätze sich genau in denjenigen Welten, in denen sie wahr sind. Dieses Gemeinsame, die Menge der “Wahrmacher-Welten” der Sätze, identifizieren wir mit der ausgedrückten Proposition; denn man kann davon sprechen, daß jemand den Sinn eines Satzes S kennt, wenn er einen Überblick über die Menge seiner Wahrmacher hat, d.h. wenn er für jede mögliche Welt w sagen kann, ob S in w wahr ist. Die durch S ausgedrückte Proposition sei also definiert als die Menge derjenigen möglichen Welten, in denen S wahr ist (Bezeichnung: ‘[S]’). Wir nennen nun umgekehrt jede Teilmenge von W eine Proposition und bezeichnen sie mit ‘p’, ‘q’, ‘r’, etc. Es kann sein, daß es nicht zu jeder Teilmenge von W einen Satz gibt, dessen Sinn sie darstellt (z.B. wenn die Menge W unendlich ist), aber das stört den Formalismus nicht. So können wir z.B. die Wahrheit einer Proposition p auch ohne Bezug auf einen sie ausdrückenden Satz definieren; danach heißt p einfach wahr in einer Welt w, wenn w ∈ p, d.h. wenn w zu der Menge der Welten gehört, die die Proposition charakterisieren. Mögliche Welten sind vollständige Modelle alternativer Weltbeschreibungen. Kein Satz und sein Gegenteil können daher in ein und derselben Welt wahr sein; ist also S ein Satz und ¬S seine Negation, und drückt S die Proposition p aus, 41 Nach
dem Lewis-System S5; siehe [156].
lxxvi
Einleitung
so besteht die von ¬S ausgedrückte Proposition [¬S] gerade aus den Welten, die nicht in p liegen, d.h. sie ist gleich dem mengentheoretischen Komplement von p in W , in Zeichen: W \ p. Analog wird die von einer Konjunktion S ∧ S 0 ausgedrückte Proposition zum Durchschnitt der Teilpropositionen p = [S] und q = [S 0 ]; formal: [S ∧ S 0 ] = p ∩ q. Auf diese Weise kann die aussagenlogische Struktur der Sätze simuliert werden durch die Mengenalgebra der Propositionen. Der intensionale Begriff der Proposition wird so einer extensionalen Behandlung in der Standard-Mengenlehre zugänglich gemacht. Diese zeigt zugleich, daß man eine Proposition p alternativ auffassen kann als eine Funktion von der Menge der möglichen Welten in Wahrheitswerte, welche für eine Welt w genau dann den Wahrheitswert Wahr liefert, wenn w ∈ p. Analoge mengentheoretische Modellierungen lassen sich für Eigenschaften oder Begriffe sowie (mehrstellige) intensionale Relationen finden. Das Schema ist stets das gleiche: ein Begriff wie Verheiratet etwa legt in jeder möglichen Welt w die Extension des Begriffs in w fest, d.h. die Menge der in w verheirateten Personen; er kann also modelliert werden durch eine Funktion von der Menge der möglichen Welten in Begriffsextensionen. Derartige Funktionen heißen Intensionsfunktionen oder kurz Intensionen, wenn der technische Kontext klar ist. Der locus classicus für diese philosophisch nicht unkontroverse, aber technisch elegante Lösung des Problems intensionaler Entitäten ist R. Montagues [181]; für einen alternativen, “algebraischen” Ansatz siehe [15], [16]. Philosophisch aktuelle Anwendungen der Mögliche-Welten-Semantik liegen auf dem Gebiet der Sprachphilosophie indexikalischer Ausdrücke und deren Rolle in der Philosophie des Geistes. Das übliche Mögliche-Welten-Format wird dabei zu einer mehrdimensionalen Semantik erweitert. Betrachten wir zur Illustration den Auftakt zu der stürmischen Szene im dritten Akt von Shakespeares Hamlet zwischen Hamlet und seiner Mutter. Hamlet: Now, mother, what’s the matter? Queen: Hamlet, thou hast thy father much offended. Hamlet: Mother, you have my father much offended. Queen: Come, come, you answer with an idle tongue. Hamlet: Go, go, you question with a wicked tongue. Queen: Why, how now, Hamlet? Hamlet: What’s the matter now? Queen: Have you forgot me? Hamlet: No, by the Rood, not so! You are the Queen, your husband’s brother’s wife, And, would it were not so, you are my mother.
Nehmen wir den Vorwurf der Königin, Hamlet habe seinen Vater sehr verletzt. Wir können annehmen, daß der Inhalt dieses Vorwurfs, ‘Hamlet hat seinen Vater sehr verletzt’, dieselbe Proposition (etwa p) ausdrückt wie die (englische) Äußerung der Königin. p ist wahr in der Welt des Stücks, nennen wir sie w0 , in der Hamlets leiblicher Vater tot ist und sein Onkel Claudius durch die Heirat von Hamlets Mutter nach der Konvention zu seinem Vater wird. Hamlet spricht aber mit scharfer Zunge von einer anderen Welt w1 , in der sein wirklicher Vater quasi noch präsent ist, nämlich als Geist, wenn auch die Königin davon keine Ahnung hat, jedenfalls so, daß sie ihm (durch die schnelle Heirat mit seinem Bruder) die Treue brechen und ihn dadurch verletzen kann. In der Welt w0 ist
Moderne Logik und Philosophie
lxxvii
also das Denotat von ‘Hamlets Vater ’ der neue König Claudius, in w1 dagegen nach wie vor der alte König Hamlet. Danach ist p in w0 wahr und falsch in w1 . Nun bezieht Hamlet die Welt w1 aber gar nicht auf die Proposition p, sondern auf eine andere Proposition, etwa q, in der nicht Hamlet verletzend ist, sondern seine Mutter, und er reklamiert in seiner Entgegnung die Wahrheit von q für w1 . Schließlich sei noch angemerkt, daß Hamlet in der letzten Gegenrede mit der Kennzeichnung ‘your husband’s brother’s wife’ auf widersprüchliche Weise die Welten w0 und w1 effektvoll vermischt, um seine Mutter zu treffen. Wir sehen also, daß eine Proposition auf jeden Fall in einer gegebenen Welt ausgewertet werden muß, um ihre Wahrheit oder Falschheit festzustellen. Diese Welten, auch einfach Indizes genannt, machen die eine Dimension des erweiterten Ansatzes aus. Nun haben wir oben stillschweigend einen Schritt überschlagen und den Inhalt der Propositionen p und q schon festgelegt, indem wir den Bezug der indexikalischen Ausdrücke ‘thou’ (bzw. ‘you’), ‘thy’ und ‘my’ gemäß der Anweisungen des Stücks aufgelöst haben. Deren Bezug oder Referenz ergibt sich aus dem Kontext der Äußerung, aus dem hervorgeht, wer der Sprecher und wer der Adressat ist. Dies ist die andere Dimension von Abhängigkeit, welche bei der Auswertung einer Äußerung beachtet werden muß. Äußert also jemand einen Satz, der indexikalische Ausdrücke wie ‘ich’, ‘du’, ‘hier ’ oder ‘jetzt’ enthält, so sagt zunächst der Kontext der Äußerung, welche Proposition überhaupt ausgedrückt wird, d.h. wer der Sprecher ist und wer der Adressat, wo die Äußerung stattfindent und wann, und in welcher Relation die entsprechenden Bezugsobjekte gemäß der Aussage zueinander stehen. Die Auswertung bei einem Index liefert dann den Wahrheitswert. Somit ist ganz allgemein die Interpretation sprachlicher Ausdrücke (nicht nur die von Sätzen) von zwei Parametern abhängig, von dem Kontext der Äußerung und dem Index der Auswertung. Nach wie vor legt ein Index über die Intensionsfunktion den Bezug oder die Referenz eines Ausdrucks fest, aber erst, wenn der Kontext fixiert ist, in dem der Ausdruck geäußert wird. Diese neue Zuordnung von Intensionen zu Kontexten wird in [136] Charakter des Ausdrucks genannt. Dort wird eine Theorie des Zusammenspiels von Kontext und Index bei der Festlegung der Referenz entwickelt. Das Bild verkompliziert sich durch die Betrachtung der referentiellen Mechanismen in kontrafaktischen Aussagen, die eine wichtige Rolle bei der Explikation von Begriffen spielen. Was meinen wir etwa mit dem Begriff Wasser? Gefragt ist eine theoretische Identifikation, d.h. eine Erklärung der manifesten Eigenschaften von Wasser durch eine chemisch-physikalische Explikation. Wasser erscheint uns als farblose trinkbare Flüssigkeit in unseren Flüssen, Seen und Meeren, welche beim Erhitzen verdampft und in kalten Wintern gefriert. Nennen wir mit D. Chalmers [42] alles, was diese manifesten Eigenschaften aufweist, summarisch den wässerigen Stoff in unserer Welt. Die chemische Analyse hat nun gezeigt, daß Wasser H2 O ist; hätte Wasser auch eine andere chemische Zusammensetzung, etwa XYZ, haben können? Folgende Antwort ist naheliegend: Ja, natürlich; denn daß Wasser H2 O ist, war ja eine Entdeckung, die nicht notwendigerweise so ausgehen mußte. Nun haben aber Kripke [150] und Putnam [192] dafür argumentiert, daß so die Mechanismen der Referenz (des sprachlichen Bezugs) nicht funktionieren. Vielmehr haben wir den wässerigen Stoff hier in unserer Welt Wasser getauft, und das macht diesen Namen zu einem starren Designator, der uns in alle kontrafaktisch vorgestellten Welten begleitet. Wir können also zwar sagen, daß in einer solchen Welt, der Putnamschen Zwillingserde, der wässerige Stoff dort XYZ ist, aber nicht, daß dort Wasser XYZ ist.
lxxviii
Einleitung
Begriffe für natürliche Substanzen und Arten wie ‘Wasser ’ beinhalten also eine versteckte Indexikalität [107], die notwendige Beziehungen a posteriori erzeugt: Wasser ist notwendigerweise H2 O (d.h. überall genauso, wie die durchaus kontingenten Verhältnisse sich am Index der wirklichen Welt darstellen), während diese Identifizierung vom erkenntnistheoretischen Standpunkt aus keine Wahrheit a priori ist. Der Kantische Zusammenhang zwischen dem A priori und metaphysischer Notwendigkeit wird hier aufgelöst. Wir können nun mit [42] zwei Typen von funktionalen Beziehungen zwischen Welten und Extensionen von Begriffen unterscheiden: wiederum am Beispiel Wasser illustriert, ordnet die primäre Intension des Begriffs Wasser jeder Welt w den wässerigen Stoff in w zu, also z.B. H2 O in der wirklichen Welt w0 , XYZ auf der Zwillingserde w1 , usw. Dagegen greift die sekundäre Intension von Wasser das Wasser hier , also am Index w0 , heraus, und zwar gleichmäßig in allen kontrafaktischen Welten. Chalmers benutzt in [42] die primären und sekundären Intensionen als technische Hilfsmittel, um für die Hauptthese seines Buches zu argumentieren, daß der Begriff des phänomenalen Bewußtseins, d.h. der subjektiven bewußten Empfindungen oder Qualia, nicht auf physikalische Fakten zurückgeführt werden kann.42 Damit gibt Chalmers eine spezifische dualistische Antwort auf zentrale Problematik des Reduktionismus in der Philosophie des Geistes, ob und in welcher Form geistige Zustände auf physikalische Zustände reduziert werden können. Wir werden später den Reduktionsbegriff logisch genauer analysieren. Hier möge die Bemerkung genügen, daß es jedenfalls ziemlich aussichtslos erscheint, mentale Begriffe durch physikalische Begriffe definieren zu wollen. Stattdessen widmet man sich in der Literatur der bescheideneren Fragestellung, ob nicht wenigstens die mentalen Fakten durch die zugrunde liegenden physikalischen Fakten (auf irgendeine Weise, die offen gelassen wird) vollständig bestimmt oder determiniert sind; anders formuliert: wenn alle physikalischen Eigenschaften vollständig über die Dinge der Welt verteilt sind, liegt damit bereits auch die Verteilung der mentalen Eigenschaften fest; oder kürzer: keine Varianz auf mentaler Ebene ohne Varianz auf physikalischer Ebene. Für diesen Sachverhalt hat sich der Begriff der Supervenienz eingebürgert: ist dieses Determinationsverhältnis gegeben, so sagt man, daß die mentalen Eigenschaften auf den physikalischen Eigenschaften supervenieren. Bei der genaueren Formulierung dieses Kriteriums kommt wieder die modale Dimension ins Spiel. Das Determinationsverhältnis soll nämlich nicht nur zufälligerweise gelten, sondern mit Notwendigkeit. Unter Zuhilfenahme der obigen Ununterscheidbarkeitsrelation Indisc könnte eine erste Formulierung lauten: (66)
a.
b.
Notwendigerweise gilt: sind zwei Objekte x, y ununterscheidbar bezüglich aller physikalischen Eigenschaften, so sind sie auch ununterscheidbar bezüglich aller mentalen Eigenschaften. ∀x, y( Indisc(x, y, P) → Indisc(x, y, M) ) (schwache oder lokale Supervenienz )
Hier wurde die Relation Indisc ergänzt durch einen Parameter, der die Eigenschaften in zwei (disjunkte) Klassen einteilt: ‘P’ für die physikalischen 42 Es ist hier nicht der Ort, eine philosophische Würdigung der komplexen Argumentation zu geben. Unser Ziel ist es vielmehr nach wie vor, formale Begriffsbildungen vorzustellen, die zur philosophischen Analyse herangezogen werden, auch wenn, wie im vorliegenden Ansatz, Anlaß zu Skepsis gegeben ist.
Moderne Logik und Philosophie
lxxix
und ‘M’ für die mentalen Eigenschaften. Wir werden kurz von P- bzw. MUnunterscheidbarkeit sprechen, wenn die Eigenschaften auf die Klasse P bzw. M eingeschränkt werden. ‘Indisc(x, y, P)’ kürzt dann die Formel ∀F ∈ P(F x ↔ F y) ab und Indisc(x, y, M) die Formel ∀F ∈ M(F x ↔ F y). Wir sehen, daß (66b) damit zu einer Formel der modalen Logik nicht nur der ersten, sondern sogar der zweiten Stufe wird. Trotz dieser logischen Komplexität gilt diese schwache oder lokale Supervenienz genannte Beziehung als inadäquat: so verbietet sie zwar in jeder einzelnen Welt physikalisch identische Kopien von Lebewesen, welche nicht auch in all ihren mentalen Eigenschaften identisch sind, aber es ist zugelassen, daß es eine Welt gibt, die physikalisch gesehen von der unsrigen ununterscheidbar ist, in der aber zum Beispiel alle Menschen Zombies sind, d.h. keinerlei mentale Eigenschaften, also erst recht kein Bewußtsein besitzen. Ein Physikalist, der die nomologisch notwendige Determination aller mentalen Eigenschaften durch physikalische Eigenschaften behauptet, wäre mit diesem Kriterium sicher nicht einverstanden. Die Welt ist “alles, was der Fall ist” [266], und eine mögliche Welt ist alles, was möglicherweise der Fall ist; sie umfaßt daher in vollständiger Beschreibung die Eigenschaften und Relationen nicht nur einzelner, sondern aller Objekte (in jener Welt). Es entsteht eine sehr viel stärkere Supervenienz-Beziehung, wenn man die Ununterscheidbarkeitsrelation für ganze Welten statt für Objekte in diesen Welten formuliert. Dies ist die globale Supervenienz des Mentalen über dem Physikalischen: (67)
a.
Für alle Welten v, w gilt: sind v, w P-ununterscheidbar, so sind sie auch M-ununterscheidbar.
b.
∀v, w( Indisc(v, w, P) → Indisc(v, w, M) ) (globale Supervenienz )
Formal ist zu bemerken, daß die Formel (67b) gar kein Ausdruck der Modallogik mehr ist. In der Modallogik ist die Quantifikation über mögliche Welten implizit, d.h. die Welten sind nur in der semantischen Metasprache Objekte der Quantifikation. Insofern sind die Bedingungen (66b) und (67b) gar nicht direkt vergleichbar. Noch unübersichtlicher wird die Beziehung beider Kriterien zu einem dritten, welches sich bei J. Kim ([139], [140]) unter der Bezeichnung starke Supervenienz findet. Zwar besteht nun die Ununterscheidbarkeit wie bei der schwachen Supervenienz wieder zwischen Objekten und nicht zwischen Welten, aber der Vergleich der Objekte überschreitet die Weltengrenzen, es geht also jetzt, um einen Ausdruck W. Stegmüllers zu benutzen, “querweltein”. (68)
a.
Für alle Objekte x, y und alle Welten v, w gilt: ist x in v P-ununterscheidbar von y in w, so ist x in v auch M-ununterscheidbar von y in w.
b.
∀x, y∀v, w( Indisc(x, v; y, w; P) → Indisc(x, v; y, w; M) ) (starke Supervenienz )
Dabei kürzt ‘Indisc(x, v; y, w; P)’ die Formel ‘∀F ∈ P(F (x, v) ↔ F (y, w))’ ab (analog für M), und ‘F (x, v)’ stehe für “x hat in v die Eigenschaft F ”. Es leuchtet intuitiv ein, daß die starke Supervenienz die schwache Supervenienz impliziert, da die Determination der M-Eigenschaften durch die Einbeziehung anderer Welten schärfer gefaßt ist. Was aber die logische Beziehung zwischen
lxxx
Einleitung
starker und globaler Supervenienz ist, hängt von dem Verhältnis zwischen dem Begriff der möglichen Welt und den in ihr gegebenen Objekteigenschaften ab, und das bedarf weiterer begrifflicher Explikation. Schließlich fächern sich alle Supervenienzbegriffe zusätzlich auf, je nachdem welcher Begriff von Notwendigkeit zugrunden gelegt wird. Zum Beispiel argumentiert Chalmers in [42], daß Bewußtsein zwar nomologisch oder “natürlich”, wie er sagt, auf der physikalischen Basis superveniert, aber eben nicht logisch superveniert; und das reicht ihm für die Verteidigung seiner dualistischen These. Aus all dem dürfte jedenfalls deutlich geworden sein, daß hier wie anderswo das philosophische Argument logischer Unterstützung bedarf.
0.2.8
Wenn-dann-Verknüpfungen Der Philosoph, der tritt herein Und beweist Euch, es müßt’ so sein: Das Erst’ wär’ so, das Zweite so, Und drum das Dritt’ und Vierte so, Und wenn das Erst’ und Zweit’ nicht wär’, Das Dritt’ und Viert’ wär’ nimmermehr. Das preisen die Schüler aller Orten, Sind aber keine Weber geworden. Goethe, Faust I
Im Alltag wie in den Wissenschaften sind Wenn-dann-Sätze allgegenwärtig; ihre Interpretation gehört jedoch zu den schillernsten Phänomenen der logischen Sprachanalyse. Der Grund ist, daß die grammatisch einheitliche Form eines Konditionalsatzes ‘wenn A dann B ’ logisch gesehen ganz verschiedene Beziehungen ausdrücken kann. Zwar unterscheidet die Sprache durch den Modus zwischen indikativischen und kontrafaktischen Konditionalsätzen, aber dieser grammatische Unterschied ist kein wirklich verläßlicher Führer durch das Labyrinth der begrifflichen Differenzierungen, die notwendig sind, um der vollen Bandbreite der möglichen Bedeutungen solcher Verknüpfungen gerecht zu werden. Wie wichtig die Deutung, d.h. die Semantik von Wenn-dann-Verknüpfungen ist, vergegenwärtigt man sich am besten, wenn man zunächst nur den rein formalen Charakter des Übergangs von der Bedingung im Wenn-Satz zur Folge im Hauptsatz betrachtet; wir wollen im folgenden die beiden Teilsätze mit den Fachausdrücken Protasis und Apodosis bezeichnen.43 Einen sinnfälligen Ausdruck der formalen Seite liefert die in der Informatik benutzte Metapher des “Inferenztickets”: eine Inferenzmaschine, welche für gewisse A und B die Regel Wenn A dann B (in Symbolen: A =B B) enthält, hat die Lizenz, “blind” auf B zu schließen, wann immer sie in einem Beweis eine Instanz von A antrifft. In diesem Fall wird A eine hinreichende Bedingung für B genannt. Es sei an dieser Stelle auf den wichtigen sprachlichen Umstand hingewiesen, daß das logische Verhältnis zwischen Protasis und Apodosis sich umdreht, wenn der Bedingungssatz den Zusatz ‘nur ’ enthält: “nur wenn A dann B ” bedeutet 43 Das griechische Begriffspaar Prótasis (“Vorsatz”) und Apódosis (“Rückgabe”, “Nachsatz”), welches ursprünglich aus der Rhetorik stammt, wird in der Linguistik für den Wenn-Satz bzw. den Folgesatz benutzt, nicht zuletzt um die Mehrdeutigkeit des Begriffs ‘Bedingungssatz’ zu vermeiden, der manchmal für den ganzen Wenn-dann-Satz und dann wieder nur für den WennSatz benutzt wird. Zur linguistischen Begriffsbildung hier und anderswo siehe [34].
lxxxi
Moderne Logik und Philosophie materiale Implikation A → B bedingter Allsatz ∀x(A(x) → B(x)) logische Folgerung A |= B ' $
Logik strikte Implikation (A → B) & 3 6 Konditionallogik A → B Relevanzlogik ' $ +
Konditionalsätze Implikaturen % Q k QQ Präsuppositionen QQ QQ QQ Generische Sätze QQ ' $ s Q Linguistische
Philosophische Logik Semantik & % & % Y HH * HH 6 6 HH ' $ wenn – dann A =B B & H% HH HH'? '? $ $ j H WissenschaftsInformatik theorie KI & % & % Q k 3 QQ Gesetzesartigkeit QQ Defaults QQ Q Nicht-monotone Logik Dispositionsprädikate Q QQ ? ' $ Q s + Plausibles Schließen Wahrscheinlichkeitsschlüsse Belief Revision P (B|A) Philosophie “Logik der Wissenschaften” & % Kausalverknüpfungen: B weil A Induktion, Vorhersage Abduktion, Diagnose
Abbildung 5: Wenn-dann-Verknüpfungen soviel wie daß das Vorliegen von B den Schluß auf A erlaubt, in unserer Symbolik: B =B A; hier fungiert A als notwendige Bedingung für B: ohne A kein B. Ist A nicht nur eine hinreichende, sondern auch notwendig Bedingung für B, so sind A und B äquivalent, d.h. man kann von A auf B und von B auf A schließen. Erlaubt nun ein Inferenzticket den Schluß von A auf B, so wird eine Begründung für diesen Übergang natürlich noch nicht geliefert. Die Zulässigkeit des Übergangs hängt entscheidend davon ab, welcher begriffliche Zusammenhang durch das Inferenzticket ausgedrückt werden soll. Das breite Spektrum von Deutungen in der reinen Logik und ihren Anwendungen ist in Abbildung 5 graphisch wiedergegeben.
lxxxii
Einleitung
1. Wir beginnen mit der Logik; die erste und elementarste Lesart der Beziehung A =B B ist die im Sinne der materialen Implikation oder des (logischen) Konditionals, wie wir im folgenden sagen werden. Das Konditional, das wir oben bereits in Formelbeispielen mehrfach verwendet haben, ist eines der logischen Zeichen der Aussagenlogik. Es verbindet zwei Sätze A und B zu einem neuen Satz A → B. Das Vorderglied des Konditionals nennen wir Antecedens und sein Hinterglied Consequens.44 Aufgabe der Logik ist es zu bestimmen, welchen Wahrheitswert das Konditional in Abhängigkeit von den Wahrheitswerten der Teilsätze A und B erhält. Betrachten wir unser Eingangsbeispiel (69)
Wenn der Reschenpaß geschlossen ist, ist der Brennerpaß offen.
und geben ihm die Form A → B. Wir nehmen zunächst an, das Antecedens A sei wahr, d.h. der Reschenpaß sei geschlossen; was können wir dann über den Wahrheitswert des Gesamtsatzes sagen? Wir halten ihn ganz sicher für falsch, wenn das Consequens B falsch ist, also der Brennerpaß ebenfalls geschlossen ist; das ist der klarste Fall. Ebenso ist (69) wahr, wenn B wahr ist; auch das ist unkontrovers. Ist jedoch das Antecedens falsch, so sind wir unsicher, welchen Wahrheitswert wir dem Gesamtsatz zuordnen sollen. Hier “diktiert” nun die Aussagenlogik, daß er wahr wird, völlig unabhängig davon, ob der Brennerpaß offen oder geschlossen ist. Dies erscheint intuitiv inadäquat. Das gleiche gilt für den umgekehrten Fall, wenn das Consequens B wahr ist. Dann erklärt die Logik wiederum den Gesamtsatz sofort für wahr, d.h. der Zustand des Reschenpasses spielt gar keine Rolle. Die beiden letzten Befunde tragen den Namen Paradoxien der materialen Implikation; sie weisen zu Recht darauf hin, daß in der aussagenlogischen Deutung eines Wenn-dann-Satzes keine innere Beziehung zwischen Protasis und Apodosis wiedergegeben wird, die jedoch gemäß der intuitiven Semantik unserer Sprache in Konditionalsätzen mittransportiert wird. Die angesprochene innere Beziehung liegt vor allem dann vor, wenn der Wenn-dann-Satz eine generelle Aussage macht, also z.B. eine temporale oder kausale Regularität ausdrückt. Generelle Aussagen sind quantifizierende Aussagen; die Quantifikation ist jedoch nicht in der Aussagenlogik, sondern erst in der Prädikatenlogik ausdrückbar. Es ist daher nicht verwunderlich, wenn in einem solchen Fall die aussagenlogische Formalisierung besonders inadäquat erscheint. Betrachten wir die folgenden Sätze, deren genereller Charakter durch den temporalen Quantor ‘immer’ bzw. den modalen Quantor ‘notwendigerweise’ oder ‘in allen Umständen’ explizit gemacht werden kann. (70)
(71)
a.
Wenn das Barometer fällt, gibt es Regen.
b.
Immer wenn das Barometer fällt, gibt es Regen.
a.
Wenn Alfred sich konzentriert, dann besteht er die Prüfung.
b.
Wenn Alfred sich konzentriert, dann besteht er notwendigerweise die Prüfung.
c.
In allen Umständen, in denen Alfred sich konzentriert, besteht er die Prüfung.
44 Wir reservieren dieses neue Begriffspaar für die aussagenlogische Deutung von Protasis und Apodosis.
Moderne Logik und Philosophie
lxxxiii
Daß nun das rein wahrheitsfunktionale 45 Konditional der Aussagenlogik nicht ausreicht, die intendierte Bedeutung wiederzugeben, zeigt sich deutlich, wenn solche Sätze negiert werden. Ein negiertes Konditional ist in der Aussagenlogik äquivalent zur Konjunktion von Protasis und negierter Apodosis. Wäre nun die aussagenlogische Formalisierung der obigen Sätze adäquat, so müßten die folgenden a)- und b)-Sätze intuitiv äquivalent sein, was aber offensichtlich abwegig ist: (72)
(73)
a.
Es ist nicht der Fall, daß, wenn das Barometer fällt, es Regen gibt.
b.
Das Barometer fällt (jetzt), und es gibt (jetzt) keinen Regen.
a.
Es ist nicht der Fall, daß, wenn Alfred sich konzentriert, er die Prüfung besteht.
b.
Alfred konzentriert sich, und er besteht die Prüfung nicht.
Um eine Regularität zu bestreiten, reicht es, einen Fall anzugeben, in dem sie durchbrochen ist. In Beispiel (70) etwa muß man eine Situation angeben können, in der es trotz fallendem Barometer keinen Regen gibt. Das kann gegenwärtig der Fall sein, muß aber nicht; in jedem Fall ist (72a) nicht gleichbedeutend mit der Aussage, daß jetzt das Barometer fällt und es nicht regnet. Analog muß derjenige, der die Aussage (71a) bestreitet, mindestens einen Umstand nennen können, in dem der Zusammenhang [ Konzentration ⇒ bestandene Prüfung ] aufgehoben ist (indem man etwa argumentiert, daß der Prüfungsstoff für Alfred zu schwer ist). Das ist aber ganz etwas anderes als wie in (73b) unter anderem zu behaupten, daß Alfred bei der Prüfung durchfällt; vielmehr ist (73a) durchaus verträglich damit, daß er sie dennoch (eher zufällig) besteht. Nun gibt es gute systematische Gründe, die Wahrheitsregel für das Konditional A → B genau so festzulegen, wie das in der Aussagenlogik geschieht (siehe Kapitel 2); allerdings wird damit nicht behauptet, daß der umgangsprachliche Gebrauch von Wenn-dann-Sätzen vollkommen erfaßt sei. Die unintuitiven Konsequenzen sind also nur scheinbar paradox, da das Analyseziel der Aussagenlogik einfach begrenzter ist. Immerhin werden wir sehen, daß die Bedeutung von Konditionalsätzen, die Regularitäten ausdrücken, besser in der stärkeren Prädikatenlogik erfaßt wird, in der das Konditional mit dem Allquantor zusammenwirkt und durch das Instrument der gebundenen Variablen eine wesentliche Facette des “inneren Zusammenhangs” zwischen Protasis und Apodosis repräsentiert werden kann. Die resultierende logische Form des bedingten Allsatzes ∀x(A(x) → B(x)) kann etwa zur Formalisierung von (70) herangezogen werden, wobei der implizite temporale Allquantor ‘immer ’ explizit als über alle Zeiten oder Situationen laufend symbolisiert wird. Negiert man einen solchen Satz, so ergibt sich korrekterweise, daß es einen Zeitpunkt oder eine Situation gibt, in der das Barometer fällt und es dennoch keinen Regen gibt (etwa wenn am nördlichen Alpenrand Föhn herrscht). Eine weitere logische Beziehung, die häufig in der Form eines Bedingungssatzes auftritt, ist die der logischen Folgerung oder logischen Implikation A |= B zwischen zwei Sätzen A und B. Der Konditionalsatz 45 Dabei heißt eine Satzverknüpfung wahrheitsfunktional , wenn ihr Wahrheitswert ausschließlich von den Wahrheitswerten der Teilsätze abhängt; siehe Kapitel 2.
lxxxiv (74)
Einleitung Wenn alle Griechen Menschen sind, so ist auch der Grieche Sokrates ein Mensch
kann auch dazu benutzt werden, um zwischen dem Sachverhalt, daß alle Griechen Menschen sind, und dem Sachverhalt, daß der Grieche Sokrates ein Mensch ist, die Relation der logischen Folgerung zu behaupten. Anders als das Konditional drückt diese Art von Wenn-dann-Verknüpfung keinen neuen Satz der Objektsprache aus, sondern besitzt den Status einer metasprachlichen Relation zwischen objektsprachlichen Sätzen; sie sagt im wesentlichen aus, daß ein Zustand, in dem alle Griechen Menschen sind, aber der Grieche Sokrates kein Mensch ist, logisch unmöglich ist, daß folglich der Übergang von Protasis zu Apodosis in (74) eine logische Notwendigkeit darstellt. Die Umgangssprache macht keinen systematischen Unterschied zwischen Objekt- und Metasprache; daher ist es ganz abgesehen von den vielen außerlogischen Deutungen nicht leicht, einem Bedingungssatz anzusehen, ob er ein einfaches Konditional oder eine logische Folgerung wiedergibt, zumal es eine enge Beziehung zwischen diesen Begriffen gibt (siehe Kapitel 2, Satz 2.2).46 Es ist demnach stets möglich, aus einem Wenn-dann-Satz der Art (74) auch ein logisches Argument aus mehreren Sätzen zu machen, etwa indem man das Beispiel folgendermaßen umformuliert: (75)
Alle Griechen sind Menschen. Sokrates ist ein Grieche. Also ist Sokrates ein Mensch.
Dabei sind die ersten beiden Sätze die Prämissen des Arguments, und der ‘also’Satz ist die Konklusion. Wie sich hier schon zeigt, ist es bequem, links vom logischen Folgerungszeichen mehrere Sätze als Prämissen zuzulassen, etwa in der Form A1 , A2 |= B; in der späteren formalen Entwicklung werden sogar beliebige (auch unendliche) Prämissenmengen auftreten.47 2. Die Paradoxien der materialen Implikation haben in der Philosophischen Logik zu Theorien geführt, die der Intuition Rechnung tragen, daß für die Gültigkeit einer Wenn-dann-Verknüpfung A =B B die Protasis A für die Apodosis B in dem einen oder anderen Sinne relevant sein muß. Die rein wahrheitsfunktionale Verbindung der Aussagenlogik reicht dafür nicht aus. Wir sahen oben, daß in der Modallogik eine strikte Implikation definiert wird; sie ist eine Kombination aus Konditional und Notwendigkeitsoperator, nämlich (A → B). Ihr liegt die Idee zugrunde, die Beziehung der logischen Notwendigkeit bei der Implikation A |= B auf andere Typen von Notwendigkeit, etwa metaphysische Notwendigkeit, zu verallgemeinern und zugleich “in die Objektsprache zu drücken”, wie man sagt. Zumindest qualitativ wird dadurch der Aspekt einer durch einen Konditionalsatz ausgedrückten Regularität wiedergegeben. Zum Beispiel liefert der Negationstest in den obigen Sätzen korrekte Ergebnisse; wenn man nämlich etwa bestreitet, daß notwendigerweise Regen auf 46 Quine war bekannt dafür, daß er in seinen Schriften die Verwechslung von Konditional und logischer Folgerung als eine Konfusion von Gebrauch und Erwähnung geißelte; er diagnostizierte sie ausgerechnet bei den Mitbegründern der modernen Logik, Russell und Whitehead (siehe z.B. [201]:17 und [205]:44). 47 Allerdings können undendlich viele Prämissen dann nicht mehr zu einem einzigen Antecedens-Satz zusammengefaßt werden, etwa um daraus wieder ein Konditional zu machen: die klassische Logik erlaubt nur die Konjunktion von höchstens endlich vielen Sätzen zu einem neuen Satz.
Moderne Logik und Philosophie
lxxxv
fallenden Luftdruck folgt, dann sagt man soviel wie daß es möglich ist, daß das Barometer fällt und es dennoch nicht regnet. Nun sind nicht alle “relevanten” Wenn-dann-Verknüpfungen vom Typ genereller Aussagen. Es gibt auch singuläre Konditionalsätze, die dennoch nicht wahrheitsfunktional sind. Häufig drückt die Protasis einen Sachverhalt aus, auf dessen Basis die Apodosis als lediglich plausibel oder wahrscheinlich beurteilt wird. Die Wahrheit solcher Wenn-dann-Sätze hängt dann im allgemeinen nicht nur von der in der Protasis gegebenen Information ab, sondern auch von impliziten Voraussetzungen, die mit dieser Information “mitgedacht” werden. Dadurch können logische Gesetze, die für das Konditional, für Allsätze und für die logische Folgerung gelten, ihre Gültigkeit verlieren. Dazu ein Beispiel. Unter den Schlußregeln der Aussagenlogik befindet sich die Schnittregel, auch Kettenschluß oder hypothetischer Syllogismus genannt, mit dem zwei Konditionale hintereinandergeschaltet und das Mittelglied “herausgeschnitten” werden können: aus A → B und B → C folgt A → C. Dieselbe Regel gilt wie im klassischen modus barbara der Syllogistik auch für bedingte Allsätze: Wenn alle Athener Griechen und alle Griechen Menschen sind, dann sind alle Athener Menschen. Die Prädikatenlogik vererbt diese Eigenschaft sogar an die strikte Implikation: Wenn es richtig ist, daß ein Luftdruckfall notwendig Regen und Regen notwendig sinkende Temperaturen mit sich bringt, dann gilt notwendigerweise, daß die Temperaturen sinken, wenn der Luftdruck fällt. Man könnte also vermuten, daß für alle Wenn-dann-Verknüpfungen gilt: wenn A =B B und B =B C, dann gilt auch A =B C. In diesem Fall könnte man die strikte Implikation als Kandidatin für eine adäquate Explikation des abstrakten Inferenzpfeils =B ansehen. Betrachten wir nun den folgenden “Schluß”, der eine mögliche Überlegung vor der Schlacht von Waterloo hätte sein können (unter der Annahme, daß Wellington ohne die Feldherrn-Künste Blüchers auf verlorenem Posten stand):48 (76)
a.
Wenn Napoleon die Schlacht gewinnt, dann nimmt Blücher seinen Abschied.
b.
Wenn Blücher vor der Schlacht stirbt, gewinnt Napoleon die Schlacht.
c.
Wenn Blücher vor der Schlacht stirbt, dann nimmt Blücher seinen Abschied.49
Die beiden Prämissen dieses offensichtlichen Fehlschlusses gehen jedoch “von verschiedenen Voraussetzungen aus”: der Kettenschluß wäre höchstens dann anzuwenden, wenn die Information aus dem Bedingungssatz der ersten Prämisse (“Blücher stirbt vor der Schlacht”, hier unter b. aufgeführt) mit in die Bedingung der zweiten Prämisse (unter a.) aufgenommen würde. Dann wären diese Prämisse und damit der gesamte Schluß natürlich sofort hinfällig. Daß die Hinzufügung von Information den Wahrheitswert eines Wenn-dannSatzes verändert, ist aber ein untrügliches Zeichen dafür, daß der Satz keinen rein wahrheitsfunktionalen Zusammenhang ausdrückt. In der Logik gilt nämlich das folgende Monotonie-Prinzip: Ein wahres Konditional bleibt wahr, wenn im 48 Siehe
[3]:16 für einen ähnlichen Beispielsatz nach demselben Muster. die Gültigkeit des Kettenschlusses ist die Reihenfolge, in der die Prämissen aufgeführt sind, natürlich irrelevant. 49 Für
lxxxvi
Einleitung
Vorderglied ein Satz konjunktiv hinzugefügt wird. Ebenso bleibt ein logisch gültiger Schluß gültig, wenn eine zusätzliche Prämisse, die völlig beliebig sein kann, eingeführt wird. Wir können also festhalten, daß es nicht-wahrheitsfunktionale Konditionalsätze gibt, die weder durch die materiale noch auch durch die strikte Implikation adäquat formalisiert werden. Es gibt nun drei verschiedene Wege, den Relevanzgedanken bei der Deutung des Inferenzpfeils ‘=B’ zu berücksichtigen: (1) Abänderung der Regeln der klassischen Logik; (2) Ergänzung der klassischen Logik durch neue theoretische Mittel, die auch die Probleme der strikten Implikation vermeiden; (3) eine außer-logische Analyse der Relevanz. Der erste Weg wird in der Philosophischen Logik exemplarisch auf dem Spezialgebiet der Relevanzlogik beschritten (für einen Überblick siehe [57]). In dem System R von Alan R. Anderson und Nuel D. Belnap [6], den Begründern der Relevanzlogik, werden die klassischen Axiome der Aussagenlogik so abgeändert, daß die Paradoxien der materialen Implikation keine Theoreme mehr sind. Der leitende Gedanke bei Schlüssen in R ist, daß Prämissen auch wirklich benutzt werden und damit eben “relevant” sind für die Konklusion.50 Hat man allerdings erst einmal angefangen, an der klassischen Logik “herumzubasteln”, fällt es schwer, genau die störenden Inferenzen zu isolieren und andere weiterhin plausible Schlüsse intakt zu lassen. Ein Beispiel für dieses Problem im Fall von R ist die Regel des Modus Tollendo Ponens, auch disjunktiver Syllogismus genannt: Wenn A oder B, aber nicht A, dann B (in Zeichen: ¬A, A ∨ B =B B). Es fält schwer, hier eine Relevanzverletzung zu erkennen. Die Erweiterung von R um eine modale Komponente zu dem System E (für engl. ‘entailment’) in [6] ändert an diesem Punkt nichts. Ein weiteres Problem war lange Zeit die Frage nach einer adäquaten Semantik für diese Systeme. Durch eine geeignete Erweiterung der Kripke-Semantik für die Modallogik ließ sich dieses Problem jedoch lösen. Wir gehen nun zunächst kurz auf den dritten der genannten Wege ein, der das Relevanzproblem von einer sprachphilosophisch-linguistischen Warte aus betrachtet; er wurde von H. P. Grice ([105]; siehe auch [91]) eingeschlagen. Grice läßt die Logik intakt, macht jedoch Effekte ganz anderer Art für das scheinbare Versagen der klassischen Regeln verantwortlich, die er von einer gewöhnlichen logischen Implikation durch den Neologismus Implikatur (engl. implicature) abhebt. Implikaturen sind nicht-logische Folgerungen, die aufgrund gewisser impliziter Regeln für eine gelungene Konversation in einer Gesprächssituation erlaubt sind. Ein derartiges Konversationspostulat, die jeder Hörer von einem kooperativen Gesprächspartner intuitiv erwartet, ist zum Beispiel: “Sei relevant! ” Informationen, die nichts zur Sache tun, sollte man als Sprecher vermeiden anzuführen, auch wenn man sie für wahr hält. Relevant sein bedeutet auch, die dem eigenen Kenntnisstand entsprechende Aussagen zu machen, nicht mehr, aber auch nicht weniger. Gesetzt ein Journalist hat erfahren, daß (i) alle Mitglieder eines Parteipräsidiums für einen gewissen Antrag gestimmt haben; wenn er dann berichtet: (ii) Einige Präsidiumsmitglieder haben für den Antrag gestimmt, so ist das nicht falsch, lädt jedoch zu der Implikatur ein: (iii) Einige haben nicht dafür gestimmt (sonst hätte er ja ‘alle’ gesagt). Dies ist ein deutliches Indiz dafür, daß Implikaturen nicht nur keine logischen Inferenzen 50 Diese Idee des “ressourcen-bewußten” Schließens fand in jüngerer Zeit auch ihren Niederschlag in Inferenzsystemen wie der Linearen Logik , die für die Informatik von Interesse sind; siehe [95], [255].
Moderne Logik und Philosophie
lxxxvii
sind, sondern zuweilen mit der Logik in direktem Widerspruch stehen. Denn der Übergang von (i) nach (ii) ist ein logisch gültiger Schluß, und durch Anhängen der Implikatur würde man einen direkten Widerspruch bekommen. Implikaturen sind also nicht “robust” unabhängig vom Kontext und widerrufbar in einer geänderten Gesprächssituation. Wir sind somit erneut auf das Phänomen der Kontext-Sensitivität gestoßen, welches ein Charakteristikum nicht-logischer Inferenzen darstellt. Wir verbleiben für einen Augenblick auf dem Feld der Linguistik und knüpfen an die elementare Beobachtung an, daß die Sprache unterscheidet zwischen indikativischen und irrealen oder kontrafaktischen Konditionalsätzen. Der Reichtum grammatischer Verwendungen und kommunikativer Nuancen der verschiedenen Konditionalsätze kann hier nicht das Thema sein.51 Das folgende, auf E. Adams zurückgehende minimale Paar von Beispielsätzen zeigt jedoch, daß auch die logisch-philosophische Analyse die genannten Klassen von Konditionalsätzen auseinanderhalten muß: (77)
a.
Wenn Oswald Kennedy nicht getötet hat, dann hat es ein anderer getan.
b.
Wenn Oswald Kennedy nicht getötet hätte, dann hätte es ein anderer getan.
Vor dem historischen Hintergrund, daß Kennedy keines natürlichen Todes starb, sondern ermordet wurde, ist der erste, indikativische Satz wohl als wahr anzusehen.52 Dagegen können beträchtliche Zweifel bestehen, ob der zweite Satz wahr ist. Er wäre es nur dann, wenn man annimmt, daß Kennedy auf der Todesliste einer Verschwörer-Organisation von hinreichender Durchschlagskraft stand, so daß sein Tod quasi unvermeidlich war; eine andere Analyse der historischen Situation würde den Satz dagegen falsch machen. Man sieht, daß das Urteil davon abhängt, wie ein vorgestelltes Szenario, in dem Oswald nicht der Täter ist, mit weiteren Annahmen ausstaffiert wird. Die Systematisierung dieses Gedankens bildet den Kern von Analysen in der philosophischen Logik, die den zweiten oben genannten Weg verfolgen, nämlich die übliche Logik nicht zu verändern, sondern nach geeigneten Erweiterungen Ausschau zu halten, um dem eigentümlichen Charakter kontrafaktischer Konditionale Rechnung zu tragen. Jener Gedanke wurde explizit zuerst von F. P. Ramsey formuliert ([208]: 247, Fußnote): Wenn zwei Personen eine Auseinandersetzung darüber haben, ob q eintreten wird, wenn p der Fall ist, und beide bezüglich p Zweifel hegen, dann fügen sie p hypothetisch der Grundmenge ihres Wissens hinzu und führen auf dieser Basis ihre Auseinandersetzung über q.53 51 Wie
soll man z.B. Sätze interpretieren wie ‘In der Zeitung steht ein Artikel über Mozarts Don Giovanni, wenn es dich interessiert’ ? Für die einschlägige linguistische Literatur, die die grammatischen, semantischen, pragmatischen und kognitiven Aspekte von Konditionalsätzen untersucht, siehe z.B. [47], [52] und dort zitierte weitere Titel. 52 Er kann sogar als einfache materiale Implikation A → B formalisiert werden, die den Satz auch für wahr erklärt, wenn die Protasis falsch ist, also Oswald der Mörder war. Vorzuziehen ist allerdings eine Analyse von (77a) als logische Implikation A, C |= B, wobei A und B Protasis und Apodosis des Satzes sind, und C den historischen Hintergrund beinhaltet; die Falschheit von A, stets eine Quelle der Unsicherheit beim Konditional, ist dann irrelevant. 53 Zitiert nach der deutschen Übersetzung, S. 123.
lxxxviii
Einleitung
In der Literatur wird diese Passage als Grundlage für eine Auswertungsvorschrift von Konditionalen genommen, die Ramsey-Test genannt wird. Wie oben ist man vor die Wahl gestellt, den Ramsey-Test metasprachlich zu interpretieren (d.h. von gleicher Art wie die logische Folgerung) oder einen objektsprachlichen Ansatz zu wählen, welcher der strikten Implikation gleicht, aber deren Schwächen zu vermeiden sucht. Die vor allem von R. Stalnaker [238] und D. Lewis [159] entwickelte modale Konditionallogik verfolgt den zweiten Ansatz und führt als neues Grundzeichen einen zweistelligen Satzoperator ‘→’ ein, mit dem kontrafaktische Konditionalsätze formalisiert werden.54 Der Operator wird in einer Mögliche-Welten-Semantik interpretiert, jedoch derart, daß den lokalen Hintergrundannahmen, welche mit der hypothetischen Setzung der Protasis aufgerufen werden, Rechnung getragen werden kann. Während der metasprachliche Ansatz für die Zusatzannahmen eigene Prämissen in die syntaktische Darstellung einführt (siehe unten), werden diese hier semantisch behandelt und im abstrakten Begriff der möglichen Welt zusammengefaßt. Neu gegenüber der üblichen Modallogik ist, daß die Semantik angereichert wird mit einem qualitativen Abstandsbegriff zwischen Welten:55 jede mögliche Welt i ist danach mit einem System Si abstrakter Kugeln oder “Sphären” (kurz: i-Sphären) versehen, die konzentrisch um i herum gelagert sind; eine i-Sphäre ist dabei eine gewisse Menge von möglichen Welten. Eine Welt j ist dann der Ausgangswelt i umso “ähnlicher”, je weiter innen sie in dem Sphärensystem um i angesiedelt ist. Die Sphärensysteme erfüllen gewisse Bedingungen, die wir hier nicht angeben wollen; wichtig ist, daß jede Welt ein eigenes solches System Si besitzt, das von Welt zu Welt variieren kann. Auf diese Weise wird aus der strikten Implikation der klassischen Modallogik eine variable strikte Implikation, wie Lewis sagt, welche die unerwünschten Inferenzen blockiert. In die Sprache dieser Konditionallogik übersetzt bedeutet dann der RamseyTest für A → B, daß man sich hypothetisch in eine i-Sphäre S versetzt, die mindestens eine Welt enthält, in denen A gilt (kurz A-Welt genannt), und dann nachprüft, ob in jeder A-Welt in S auch B erfüllt ist. Die Idee der minimalen Abweichung von der wirklichen Welt kann man dann dadurch wiedergeben, indem man von den i-Sphären fordert, daß es zu jedem A stets eine kleinste Sphäre gibt, die A-Welten enthält. Dies ist die Minimalitätsforderung, die Stalnaker in seine Formulierung des Ramsey-Tests aufnimmt (vgl. [238]: 101**). Lewis diskutiert diese Bedingung ebenfalls, baut sie aber nicht in seine Definition ein, da nicht ausgemacht ist, ob sie intuitiv adäquat ist. Im OswaldKennedy-Beispiel (77b) ist es vielleicht noch plausibel, daß das kontrafaktische Szenario, in dem Kennedy seine Amtszeit lebend beendet, näher an der Wirklichkeit ist als sein Tod durch einen anderen Attentäter. Was aber soll man zu dem folgenden raffinierten Beispiel sagen, das von Quine stammt ([205]: 21): (78)
a.
Wenn Bizet und Verdi Landsleute gewesen wären, wäre Bizet Italiener gewesen.
b.
Wenn Bizet und Verdi Landsleute gewesen wären, wäre Verdi Franzose gewesen.
Es seien A die Protasis, daß Bizet und Verdi Landsleute waren, i die A-Welt, in der Bizet und Verdi Italiener waren, und j die A-Welt, in der beide Franzosen 54 Dies 55 Wir
ist die Notation von Lewis in [159]; Stalnaker benutzt stattdessen das Symbol >. folgen nunmehr [159].
Moderne Logik und Philosophie
lxxxix
waren. Unter der Annahme, daß sie nicht zugleich Italiener und Franzose sein konnten, sind i und j miteinander unverträglich, aber ohne weitere Annahmen gibt es schwerlich eine Möglichkeit, eine der beiden Welten als wirklichkeitsähnlicher gegenüber der anderen auszuzeichnen. Wie dem auch sei, Lewis ist mit seiner Semantik auf jeden Fall in der Lage, die üblichen kontrafaktischen Fehlschlüsse zu vermeiden; es gelingt ihm außerdem, die Konditionallogik mit dieser Semantik korrekt und vollständig zu axiomatisieren. Diese unbestrittenen Vorzüge formaler Natur gehen allerdings einher mit einer für Lewis charakteristischen ontologischen oder metaphysischen Deutung der Sachverhalte, welche durch (kontrafaktische) Konditionalsätze zum Ausdruck gebracht werden. Die möglichen Welten und die Ähnlichkeitsmetrik zwischen ihnen besitzen einen Status, der als “objektiv in den Dingen gründend” gedacht wird. Allerdings sind die möglichen Welten und ihr Instrumentarium vollkommen abstrakte Modellierungen dieser Objektivität, die unzugänglich erscheint: sie geben für sich genommen keinen operationalen Hinweis auf ihre Anwendung in konkreten Fällen, und sie berücksichtigen nicht die doxastische56 Perspektive einer Person, die in einer gegebenen Wissenssituation einen Konditionalsatz äußert. Diese Schwächen sind häufig ein Grund, statt des metaphysischen Ansatzes von vornherein einen erkenntnistheoretischen oder epistemischen Zugang zu wählen. Die zentralen Instrumente der Modellierung sind dann Mengen von Überzeugungen einer Person und die Mechanismen ihrer Änderung bei neuer Information (engl. belief revision; siehe unten). 3. Wir hatten oben schon die linguistische Semantik gestreift und kehren zu ihr zurück, um den alternativen Weg einer folgerungstheoretischen Analyse von Konditionalsätzen einzuführen. Danach etabliert ein Satz Wenn A dann B eine elliptische Folgerungsbeziehung zwischen einer Menge von Prämissen, die mit der Protasis A verträglich sein müssen, und der Apodosis B. Diese naheliegende Grundidee findet sich bereits bei Ramsey und wurde vor den objektsprachlichen Theorien von Stalnaker und Lewis in ihrer metasprachlichen Version auch von anderen Philosophen vertreten, allen voran von Nelson Goodman, auf den wir unten zu sprechen kommen. In der Linguistik, wo das Hauptgewicht naturgemäß auf der sprachlichen “Feinstruktur” liegt, sind vor allem die Arbeiten von Angelika Kratzer (speziell [144], [145], [146], [147]) hervorzuheben, deren Prämissensemantik technisch gesehen zwar wiederum die Metaprache mit Hilfe des Mögliche-Welten-Formalismus in die Objektsprache drückt, in ihrer Begrifflichkeit aber folgerungstheoretischer Natur ist. Eine interessante Beobachtung und ein Hinweis auf die Vielfalt der Phänomene ist in diesem Zusammenhang zum Beispiel, daß Wenn-Sätze keine eigene Bedeutung haben unabhängig von dem quantifizierenden Ausdruck, den sie einschränken (siehe [157], [145]). ‘Wenn A dann B ’ kann meist gelesen werden als ‘Immer wenn A dann B ’; verschiedene Zeit- und Modaladverbien, die allerdings explizit gemacht werden müssen, können jedoch den Sinn modifizieren und sogar drastisch verändern. Betrachten wir etwa den Satz (79)
Wenn Hans in der Stadt zu tun hat, fährt er X mit dem Fahrrad.
Lassen wir die mit ‘X’ markierte Stelle frei, so hat der Satz eine allquantifizierende Bedeutung, genauso wie wenn wir dort das Zeitadverb ‘immer ’ einfügen. 56 Von
griech. (doxa), Meinung, Überzeugung.
xc
Einleitung
Für ‘X’ können jedoch eine ganze Reihe von anderen Adverbien eingesetzt werden, z.B. ‘meistens’, ‘gewöhnlich’, ‘häufig’, ‘manchmal ’, ‘selten’, ‘niemals’, ‘notwendigerweise’, ‘wenn nötig’, ‘möglicherweise’, ‘wenn irgend möglich’, usw. Die diese adverbialen Abstufungen führen also im Extremfall, d.h. für X = niemals, zum direkten Gegenteil der Aussage in (79). Eine Konditionalsemantik muß in der Lage sein, alle diese Fälle adäquat zu behandeln. Zur Illustration der Methode seien die Wahrheitsbedingungen für die bedingte Notwendigkeit angegeben, wie sie sich in [145]:127 finden. Kratzers Mögliche-Welten-Format modelliert Aussagen als Propositionen, d.h. Mengen von möglichen Welten; wir fassen also jetzt die Protasis A, die Apodosis B und den gesamten Konditionalsatz C = Wenn A dann B als Propositionen auf. Die bedingte Notwendigkeitsaussage ‘Wenn A dann notwendig B ’ kürzen wir mit ‘NC ’ ab. In einer gegebenen Situation oder Welt w ist stets ein Redehintergrund H gegeben, wie Kratzer das nennt; H besteht aus einer Menge von Propositionen, die die zusätzlichen Prämissen beinhalten, welche zusammen mit A auf B schließen lassen. Nun ist H im kontrafaktischen Fall mit der Protasis A unverträglich; wir betrachten daher alle konsistenten Teilmengen G von H + A,57 die aber auf jeden Fall A enthalten (A wird ja “angenommen”). Dann gilt: die Proposition NC ist wahr in w, wenn jede derartige Menge G eine konsistente, nicht aus H + A hinausführende Erweiterung G 0 besitzt, welche weiterhin A enthält und aus der B im folgenden Sinn logisch folgt: B ist wahr in allen Welten, in denen jede Proposition aus G 0 wahr ist.58 Es ist klar, daß sich die Details dieser Definition erst nach einer genauen Diskussion erschließen; siehe dazu [145], wo die Konstruktion anhand eines anschaulichen Beispiels motiviert wird. Wichtig ist, daß der Mögliche-Welten-Formalismus kein wesentlicher Bestandteil des Ansatzes ist und die Folgerungsbeziehung ebenso gut in der üblichen logischen Metasprache ausgedrückt werden kann. Die gegebene Definition läßt als Spezialfall zu, daß die Protasis A mit dem Redehintergrund H verträglich ist, was aber in der kontrafaktischen sprachlichen Formulierung ausgeschlossen scheint. Einige Theoretiker sind von vornherein der Meinung, daß die Unverträglichkeit von A und H lediglich eine Implikatur im Griceschen Sinne darstellt und nicht zur eigentlichen Semantik von Bedingungssätzen gehört. Hier wird die allgemeine Frage aufgeworfen, wieviel von den transportierten Bedeutungselementen und Folgerungen einer Aussage der logisch-semantischen Seite und wieviel der pragmatichen Seite zuzuordnen ist. Ein wichtiges Beispiel für diese Problematik der Grenze zwischen Semantik und Pragmatik ist das Phänomen der Präsuppositionen. Eine Präsupposition eines Satzes A ist ein Satz Q, der erfüllt sein muß, damit A überhaupt als wahr oder falsch beurteilt werden kann. Bevor man wie im obigen Satz (16a) sagen kann, ob der König von Frankreich weise ist, muß er existieren, und es darf keine zwei Könige geben. Dies ist die Existenz - und die Eindeutigkeitspräsupposition eines Satzes, der eine Kennzeichnung enthält. Präsuppositionen sind daher spezielle Folgerungen, die aus der Behauptung eines Satzes und seiner Negation zugleich gezogen werden können; denn wenn es wahr ist, daß der König von Frankreich weise ist, dann gibt es einen und nur einen König von Frankreich. Die Eindeutigkeit gilt aber auch dann, wenn es wahr ist, daß der König von 57 ‘H
+ A’ stehe für die Menge H plus der Proposition A. Propositionen Mengen von möglichen Welten sind, bedeutet Wahrheit einer Proposition A0 in einer Welt w einfach, daß w ein Element von A0 ist. 58 Da
Moderne Logik und Philosophie
xci
Frankreich nicht weise ist. Angenommen nun, man möchte Präsuppositionen mit dieser Eigenschaft in die übliche Logik einbauen. Dann sind die einzigen Präsuppositionen Tautologien, weil nur Sätze, die immer wahr sind, sowohl aus einem Satz als auch aus seiner Negation gleichzeitig folgen. Das liegt an einem Grundprinzip der klassischen Logik, dem Bivalenzprinzip, nach dem jeder Satz entweder wahr oder falsch ist, tertium non datur. Dieser Befund hat manche Linguisten und Philosophen dazu geführt, Präsuppositionen den Status einer regulären logischen Folgerung abzusprechen und sie als spezielle Implikaturen zu behandeln (siehe z.B. [91]). Mit der Äußerung eines Satzes macht ein Sprecher erst dann eine Aussage, wenn die Präsuppositionen des Satzes erfüllt sind; ist das nicht der Fall, so ist die Äußerung nicht erfolgreich gewesen, die intendierte Aussage über einen Sachverhalt ist nicht “geglückt”. Die Alternative zu dieser pragmatischen Analyse besteht darin, das Bivalenzprinzip aufzugeben und einen dritten “Wahrheitswert”, etwa ‘unbestimmt’ für einen Satz einzuführen, dessen Präsuppositionen nicht erfüllt sind. Die Frage ist dann, ob sich auf dieser Idee ein kohärentes Logik-System aufbauen läßt. Dazu gibt es in der Literatur viele Ansätze, auf die in diesem Buch nicht eingegangen werden kann; wir verweisen jedoch auf die sorgfältig motivierte Dreiwertlogik in [21]. Schließlich merken wir an, daß es bei genauerem Hinsehen auch im Rahmen der zweiwertigen Logik eine nicht auf die obige Weise zu trivialisierende Analyse der Präsuppositionen gibt. Dazu muß aber die Negation differenzierter behandelt werden; siehe Kapitel 4. Ein letztes sprachliches Phänomen, welches wir hier ansprechen wollen, sind die sogenannten generischen Sätze.59 Ein Standardbeispiel ist ‘Vögel fliegen’; seine Bedeutung unterscheidet sich von dem expliziten Allsatz ‘Alle Vögel fliegen’ darin, daß Ausnahmen zugelassen sind: Pinguine etwa fliegen nicht. Man drückt das dann so aus, daß Vögel typischerweise oder normalerweise fliegen. Bei den Vögeln könnte man auch sagen, daß die meisten Vögel fliegen, aber diese Paraphrase ist nicht in jedem Fall zulässig. So ist es sicherlich richtig zu sagen, daß Anopheles-Mücken Malaria übertragen, auch wenn nur etwa 10% der ca. 400 Arten dieser Stechmückengattung als Wirt für den Erreger fungieren. Mit ‘typisch’ oder ‘normal ’ ist also nicht einfach ein quantitatives Maß gemeint. Was rechtfertigt aber dann den Schluß, daß ein gegebener Beispielvogel (er heiße Tweety) fliegt? Der Schluß ist zwar nicht zwingend, aber plausibel, solange keine spezifischen Informationen darüber vorliegen, ob das Exemplar Tweety etwa vielleicht ein Pinguin oder ein Kasuar ist. 4. Die Systematisierung plausibler Schlußverfahren wird in der Informatik und dort speziell in dem Teilgebiet der Künstlichen Intelligenz (kurz: KI) untersucht. Generische Sätze wie ‘Vögel fliegen’ werden in der KI default rules 60 genannt. Sie stellen Inferenztickets auf Widerruf dar: beim Auftreten konfligierender Information können schon erreichte Konklusionen wieder zurückgezogen werden. Man spricht auch von “besiegbaren” (engl. defeasible) Schlüssen. Ein Schluß mit Hilfe der Default-Regel Vögel fliegen ist also wie folgt zu verstehen: 59 Einen Überblick über die vielfältigen linguistischen Erscheinungsformen generischer Aussagen findet sich in [37], darin speziell die Einleitung [149]. 60 Das englische Wort ‘default’ bedeutet einen Mangel, ein Versagen oder Versäumnis, z.B. ein Nichterscheinen vor Gericht oder ein Zahlungsversäumnis. Eine default-Regel oder kurz ein Default ist dann hier wie in einem Rechnerprogramm eine voreingestellte Regel, die mangels spezifischerer relevanter Information zum Zuge kommt.
xcii
Einleitung Nixon ist Pazifist Nixon ist kein Pazifist I @ Quaker sind Pazifisten
Quaker
I @
@
@
@
@
@
@
@
Republikaner sind keine Pazifisten @
@
Republikaner
@
Nixon
Abbildung 6: Die Nixon-Raute
Wenn Tweety ein Vogel ist, und es ist mit dem gegenwärtigen Wissen konsistent anzunehmen, daß Tweety fliegt, dann darf geschlossen werden, daß Tweety fliegt. Die Zusatzinformation, daß Tweety ein Pinguin ist (und Pinguine bekanntermaßen nicht fliegen), hebt jedoch diese Folgerung auf. Es liegt auf der Hand, daß besondere Vorkehrungen getroffen werden müssen, wenn man Defaults in ein logisches System integrieren will. Eine zentrale Schwierigkeit läßt sich an der sogenannten Nixon-Raute illustrieren.61 Gegeben seien die beiden Defaults (80a) und (80b) sowie die Information (80c) über Nixon: (80)
a. b. c.
Quaker sind Pazifisten. Republikaner sind keine Pazifisten. Nixon ist Quaker und Republikaner.
Abbildung 6 zeigt die Nixon-Raute, in der man über den Pfad ‘Quaker’ zu dem Schluß gelangt, daß Nixon Pazifist ist, und über den Pfad ‘Republikaner’, daß Nixon kein Pazifist ist. Um den Widerspruch zu vermeiden, muß man die Defaults auf die eine oder andere Weise gewichten, um der einen Regel einen Vorrang vor der anderen zu verleihen. Enhält eine Datenbasis eine Vielzahl von Defaults, so ergeben sich komplizierte Netzwerke, die konsistent gehalten werden müssen. Dies ist eine Aufgabe der sogenannten Default-Logiken; sie gehören zur Familie der Nicht-monotonen Logiken, die Schlüsse, wie schon angesprochen, auf der Basis lokaler Information untersucht und semantisch zu begründen versuchen.62 61 Der frühere US-Präsident Richard Nixon war Quaker, also eigentlich dem Pazifismus verpflichtet, aber zugleich Republikaner und als solcher ein “Bellizist” im Kalten Krieg. 62 Für Überblicksdarstellungen mit Hinweisen zur Original- und Spezialliteratur siehe etwa [32] sowie [85], vol. 3: Nonmonotonic Reasoning and Uncertain Reasoning, Oxford 1994.
Moderne Logik und Philosophie
xciii
Wir hatten oben bereits das Prinzip der Monotonie in der klassischen Logik erwähnt: Wenn C aus A folgt, dann folgt C auch aus A, verstärkt durch ein beliebiges B. Diese Regel muß in der nicht-monotonen Logik abgeschwächt werden, um den genannten Gegenbeispielen zu entgehen. Man kann zum Beispiel zusätzlich voraussetzen, daß die weitere Information B selbst aus A (nicht-monoton) folgen soll. Dies ist das Prinzip der schwachen oder vorsichtigen Monotonie, in Zeichen: wenn A =B C und A =B B dann A ∧ B =B C. Auf ähnliche Weise wird die klassische Schnittregel abgestützt, um dem möglicherweise schädlichen Kontextwechsel vorzubeugen: der Schnitt soll erlaubt sein, wenn die erste Protasis A in der zweiten Protasis mitgeführt wird. Dies ist die schwache Schnittregel : wenn A =B B und A ∧ B =B C dann A =B C. Wie gesehen geht das Waterloo-Beispiel (76) mit dem schwachen Schnitt nicht durch. Natürlich liefert der Hinweis auf die Blockierung eines Gegenbeispiels keine hinreichende semantische Begründung für nicht-monotone Regeln. Auch kann man sich nicht einfach auf die sprachliche “Intuition” berufen, wenn man einmal den sicheren Boden der klassischen Logik verlassen hat. Daß diese Intuition fehlgehen kann, läßt sich an einer dritten wichtigen Regel demonstrieren, der Disjunktionsregel ; siehe Abbildung 7.63 Sie lautet: wenn A =B C und B =B C dann A∨B =B C. Es ist nicht zu sehen, warum diese Regel nicht auch im nichtmonotonen Bereich gelten sollte, weil sie ja nur zwei Inferenztickets zusammenfaßt. Dennoch ist sie inkorrekt in der “Mehrheitsinterpretation” von Defaults, in der A =B C gelesen wird als Mehr als die Hälfte der A sind B.64 Eng verwandt mit diesem Phänomen ist das sogenannte Simpson-Paradox, welches in der statistischen Literatur viel diskutiert wurde. Es hat einen hypothetischen Test auf die Wirksamkeit eines Medikaments zum Gegenstand, welches einer Gruppe von Männern und Frauen verabreicht wird. Der Test ist so angelegt, daß, wenn man die Gesamtpopulation zugrundelegt (also die Männer und Frauen zusammengenommen), das Medikament einen positiven Effekt besitzt; betrachtet man jedoch die beiden Unterpopulationen getrennt, so ergibt sich, daß der Test sich negativ auf die Männer auswirkt und sich negativ auf die Frauen auswirkt. Das Simpson-Paradox verletzt also die Disjunktionsregel sogar bei zueinander sich ausschließenden Untergruppen. Der Grund ist wie oben, daß die Mehrheitsinterpretation die Disjunktionsregel nicht stützt.65 In dem Buch [3] von Ernest Adams findet sich nun eine zunächst exotisch erscheinende Semantik, die von dem Proportionen-Kalkül der Mehrheitsinterpretation zu einer probabilistischen Deutung übergeht. Zugleich löst sie das Problem der Beliebigkeit der Schwellenwahrscheinlichkeit r > 0.5, ab welcher die Apodosis auf der Basis der Protasis gefolgert werden kann, durch die Forderung einer infinitesimalen Nähe zur sicheren Wahrscheinlichkeit 1. Ohne hier auf die Details eingehen zu können, sei immerhin folgendes festgehalten: Die Semantik von Adams, auch ε-Semantik genannt, kann nicht-monotone Schlüsse mit Hilfe von Default-Regeln zulassen, ohne inkonsistent zu werden. Die Defaults ‘Vögel fliegen’ und ‘Vögel, die Pinguine sind, fliegen nicht’ können koexistieren, da Wahrscheinlichkeiten kontextabhängig sind und daher bei neuer Informati63 Das
aussagenlogische Gegenstück Wenn A → C und B → C dann A ∨ B → C werden wir später Oder-Einführung im Antecedens nennen. 64 In der Linguistik gilt die Mehrheitsinterpretation als Standardsemantik für die vage Quantifikation Die meisten A sind B, um der Beliebigkeit höherer Schwellen (70%? 80%?) auszuweichen. 65 Siehe die Diskussion des Simpson-Paradoxes in [186], [223] und erneut in [187].
xciv
Einleitung
C
A
A∨B
B
A∧B (Disj)
( A =B C ) , ( B =B C )
=⇒
( A ∨ B =B C )
Abbildung 7: Die Disjunktionsregel
on (‘Pinguin’) neu berechnet werden. Zugleich sind die Regeln der vorsichtigen Monotonie und des schwachen Schnitts ε-semantisch korrekt, während ihre klassischen Gegenstücke ungültig werden. Die Disjunktionsregel dagegen ist in beiden Systemen gültig. Die Abbildungen 8 und 9 zeigen graphische Darstellungen der Schnitt- und der Monotonie-Regel, wobei jeweils die klassische und die nicht-monotone Form nebeneinander gestellt sind.66 Mit der ε-Semantik taucht in unseren Ausführungen zum ersten Mal der Begriff der Wahrscheinlichkeit auf. Da er von ebenso grundlegender Bedeutung ist wie die Logik selbst, kommen wir unten noch im systematischen Kontext der Philosophie und Wissenschaftstheorie auf ihn zu sprechen. Hier im Abschnitt über informatische Anwendungen sei nur auf die charakteristische Spannung verwiesen, die zwischen den zahlengestützten Wahrscheinlichkeitsmodellen in der Statistik einerseits und den regelbasierten Modellierungen in der Informatik und KI andererseits herrscht. Lange Zeit hatten denn auch Statistik und Informatik wenig mit einander zu tun. Es ist nicht zuletzt das Verdient von Forschern wie J. Pearl ([186], [187]), mit Hilfe von graphentheoretischen Methoden (den sogenannten Bayes-Netzen) gezeigt zu haben, daß Wahrscheinlichkeiten sehr wohl in Regeln gefaßt und so in Inferenz-Systemen eingesetzt werden können. Die Regeln stellen dabei lediglich die operationale Oberfläche dar, welche jedoch mittels eines kohärenten Wahrscheinlichkeitsmodells, so ähnlich wie oben angedeutet, semantisch zu rechtfertigen sind. Der Regelkalkül kann also nur vor dem Hintergrund einer inhaltlichen Konzeption oder Deutung “verstanden” werden. 66 In den Figuren stehen die fetten durchgezogenen Pfeile für die Prämissen der Regel und die dünnen Pfeile für auf jeden Fall gültige logische Folgerungen (etwa daß aus A ∧ B sowohl A als auch B folgt). Der doppelt gezogene Pfeil stellt die Konklusion der Regel dar. Unter den Figuren sind die Regeln noch einmal formal angegeben, wobei der lange Pfeil ‘=⇒’ die metaprachliche Wenn-dann-Verknüpfung zwischen Prämissen und Konklusion abkürzt.
xcv
Moderne Logik und Philosophie
C
C
A∨B
A∨B
A
B
A
B
A∧B (Schnitt) (sSchnitt)
A∧B ( A =B B ) , ( B =B C )
=⇒
( A =B B ) , ( A ∧ B =B C )
( A =B C )
=⇒
( A =B C )
Abbildung 8: Klassische und schwache Schnittregel
C
C
A∨B
A∨B
A
B
A
(sMon)
A∧B (Mon)
A∧B ( A =B C )
=⇒
( A ∧ B =B C )
( A =B C ) , ( A =B B ) =⇒ ( A ∧ B =B C )
Abbildung 9: Klassische und schwache Monotonie-Regel
B
xcvi
Einleitung
Dies ist übrigens ein Motiv, das uns im Bereich der Logik immer wieder begegnen wird und sich philosophisch gesehen gegen einen reinen Formalismus in der Logik und der Mathematik richtet. 5. Wir schlagen nunmehr die Brücke zurück zur Philosophie selbst, indem wir einige spezifische Themen anschneiden wollen, die zwar auch in der Informatik behandelt werden, bei denen aber die konzeptuelle Seite von Wenn-dannVerknüpfungen im Mittelpunkt steht. Wenn wir von den soeben besprochenen mehr technischen Problemen nicht-monotoner Inferenzmaschinen Abstand nehmen und die Thematik unter philosophischen Aspekten betrachten, so gelangen wir in einen Teilbereich zeitgenössischer Erkenntnistheorie, der Dynamik der Änderung von Überzeugungen (engl. belief revision). Jede Person besitzt eine Vielzahl von Überzeugungen, die einfach als eine Menge U von Sätzen modelliert werden können. Diese Menge ist einem ständigen dynamischen Veränderungsprozeß unterworfen. Das Ziel einer logischen Theorie dieses Prozesses besteht darin, wie neu gewonnene Informationen in die bestehenden Überzeugungen so eingebaut werden können, daß die Gesamtmenge U frei von Widersprüchen bleibt. Ist eine neue Information A schon konsistent mit U, so wird A in U integriert, indem man als neue Überzeugungsmenge U 0 den deduktiven Abschluß der um A erweiterten Menge U nimmt. Der interessante Fall ist der, in dem A mit U unverträglich ist; dies ist der eigentliche “Revisionsfall”. Die klassische Logik sagt hier, daß aus einem Widerspruch alles folgt (Ex falso quodlibet sequitur ); das käme aber einem “epistemischen Kollaps” gleich: keine rationale Person würde in diesem Fall beginnen, alles und jedes zuu glauben. Vielmehr wird U intuitiv so abgeändert, daß in der resultierenden Menge U 0 auf jeden Fall das neue A liegt, aber auf minimale Weise alte Überzeugungen entfernt werden, so daß sich Konsistenz einstellt. Wir werden in Kapitel 3 ein einfaches Beispiel zu dieser Problematik besprechen, deren Hauptmerkmal die Tatsache ist, daß die Forderung nach minimaler Änderung alles andere als eindeutig ist. Die Standardreferenz in der Literatur ist [89]. Kausalverknüpfungen und verwandte Begriffe Wir wenden uns nun einer klassischen philosophischen Thematik im Umkreis von Wenn-dann-Verknüpfungen zu. Eine der wichtigsten sprachlichen Bedeutungskomponenten eines Konditionalsatzes Wenn A dann B, welche in der reinen Logik zunächst nicht wiedergegeben wird, ist die häufig mitgedachte zeitliche Abfolge zwischen Protasis und Apodosis; dies ist insbesondere der Fall, wenn der Satz im Sinne von Immer wenn A dann B verstanden wird, also eine Regularität ausdrückt. Regularitäten verleiten uns aber dazu, zusätzlich einen ursächlichen Zusammenhang zwischen A und B anzunehmen, und aus dem Wenn A dann B wird unversehens ein Weil A so B oder A, deshalb B. Damit wird die Frage der philosophischen Analyse von Kausalaussagen und Kausalilität im allgemeinen aufgeworfen. Angeschlossen sind die Komplexe von Erklärung, Bestätigung und Vorhersage. Wir wollen in aller Kürze, mit David Humes berühmter Schrift [126] beginnend, die unvermindert aktuelle Frage nach der Rolle von Kausalität in der modernen Wissenschaft und Philosophie behandeln. Dem Begriff der Wahrscheinlichkeit, der heute besser, wenn auch keineswegs vollständig verstanden ist, kommt dabei eine zentrale Rolle zu. Humes Auffassung von Kausalität gründet in einer erkenntnistheoretischen
Moderne Logik und Philosophie
xcvii
Unerforschlichkeitsthese: in seinen Augen besitzen wir keinen Zugang zu dem kausalen Mechanismus in den Dingen der Welt, der aus einem gegebenen Weltzustand einen anderen mit Notwendigkeit hervorbringt. Kausalität zwischen den Dingen oder Ereignissen in der Welt ist vielmehr eine psychologische Illusion; der Gedanke einer kausalen Verknüpfung zwischen zwei Ereignissen A und B entsteht in unserem Geist, wenn wir bei ähnlichen Ereignissen stets dieselbe Abfolge beobachtet haben. Hume schreibt: Thus we remember to have seen that species of sensation we call flame, and to have felt that species of sensation we call heat. We likewise call to mind their constant conjunction in all past instances. Without farther ceremony, we call the one cause and the other effect, and infer the existence of one from the other. ([126]: 87) Es ist hier nicht der Ort, auf die nachhaltige Wirkungsgeschichte dieses skeptischen Gestaltwechsels einzugehen, der aus der erkenntnistheoretischen Not eine philosophische Tugend im Sinne des Empirismus macht und kurzerhand (“without farther ceremony”) unseren gewohnten Begriff von Kausalität umdefiniert. Nun verstehen wir zwar Humes Argument, daß sich Naturnotwendigkeit nicht direkt beobachten läßt; doch ist die kausale Sprache so fest in unserer Alltagswelt, nicht zuletzt auch zum Beispiel in unserem Rechtssystem, verankert, daß wir eigentlich nicht bereit sind sie aufzugeben. Wir haben dabei begründete Intuitionen auf unserer Seite: zwar ist es etwa, im Einklang mit unserem obigen Beispiel (70), eine Erfahrungstatsache, daß das Fallen des Barometers (A) mit schlechtem Wetter (B) einhergeht, aber wir betrachten trotz dieser “konstanten Verbindung” den Barometerfall nicht als Ursache des schlechten Wetters. Vielmehr haben wir es hier mit einer bloßen Korrelation zwischen A und B zu tun, die etwa ein drittes Ereignis C als gemeinsame Ursache von A und B nahelegt (das Aufziehen eines Tiefdruckgebietes). Auch sagt eine konstante Verbindung allein noch nichts darüber aus, was Ursache und was Wirkung ist. So führt zum Beispiel eine durch die Anopheles-Mücke übertragene Infektion mit dem Erreger plasmodium falciparum regelmäßig zu hohem Fieber, aber das Fieber ist nur ein (leider oft nicht richtig gedeutetes) Symptom für die gefährliche tropische Malaria. Auf so einfache Weise können wir uns also des Begriffs einer im genuinen Sinn ursächlichen regulären Verknüpfung zweier Ereignisse im Unterschied zu einer bloßen Korrelation also nicht entledigen. Auch Hume war das wohl bewußt; in seinem anderen großen Werk [127] nämlich gibt er eine ähnliche Regularitätsdefinition von Ursache und Wirkung wie oben, jedoch mit einer Ergänzung: [W]e may define a cause to be an object, followed by another, and where all the objects similar to the first are followed by objects similar to the second. Or in other words where, if the first object had not been, the second never had existed. ([127]: 76) Jetzt wird zunächst explizit gesagt, daß die Ursache der Wirkung zeitlich vorgelagert sein muß, was auch im ersten Zitat durch das Beispiel Flamme – Wärme mitgedacht ist. Der Zusatz besteht aus einem kontrafaktischen Konditionalsatz, der nicht einfach das Vorhergehende paraphasiert, sondern eine inhaltliche Erweiterung darstellt: nur dann steht eine reguläre Abfolge in einer Kausalbeziehung, wenn sie durch die Wahrheit eines derartigen Konditionals
xcviii
Einleitung
unterfüttert wird. Dies legt eine Konditionalanalyse von Kausalität nahe, die allerdings den empfundenen ursächlichen Zusammenhang zwischen Protasis und Apodosis nunmehr der Semantik der kontrafaktischen Konditionale aufbürdet. Das stellt eine Verbindung her zu der oben besprochenen Konditionallogik, und in der Tat hat David Lewis [160] versucht, seine Theorie für die Explikation von Kausalität nutzbar zu machen. Philosophisch gesehen gilt es aber wiederum festzuhalten, daß diese Verlagerung keineswegs bedeutet, daß von einem substantiellen Begriff von Kausalität Abstand genommen wird: die metaphysischen Annahmen über die kausale Struktur der Welt verbergen sich vielmehr in der spezifischen Beschaffenheit der Ähnlichkeitsmetrik auf den möglichen Welten. Der Kausalbegriff kam auf der anderen Seite nicht nur durch den philosophischen Angriff von Hume in Bedrängnis, sondern vor allem durch die mathematisierten Wissenschaften: die Gesetze der Physik werden nicht mehr als Folgegesetze formuliert, sondern in Form von Gleichungen, die keine natürliche Richtung aufweisen. So sagen wir zwar, daß eine an einen Körper angreifende Kraft dessen Beschleunigung erzeugt und insofern als Ursache der Beschleunigung anzusehen ist; aber jeder Gymnasiast weiß, daß man aus dem zweiten Newtonschen Gesetz bei gegebener Masse aus der Beschleunigung wieder die Kraft errechnen kann. Kraft und Beschleunigung befinden sich in “konstanter Verbindung”, so daß nur die zeitliche Abfolge einen Hinweis darauf geben kann, was Ursache und was Wirkung ist. Allerdings kann man sich bei diesem Beispiel schwer vorstellen, wie eine Beschleunigung vorgegeben werden kann, welche dann eine entsprechende Kraft “hervorzaubert”. In den durchaus zirkulären Phänomenen der Elektrodynamik wird es aber schon schwieriger, Ursache und Wirkung zu unterscheiden: nach dem Ampèreschen Durchflutungsgesetz geht jeder Strom in einem Leiter mit einem Magnetfeld einher, und nach dem Induktionsgesetz jedes zeitlich veränderliche Magnetfeld mit einem Strom; das Induktionsgesetz, angewendet auf das eigene Magnetfeld, liefert das Phänomen der Selbstinduktion, und hier wird man kaum noch sagen können, was die Henne und was das Ei ist.67 Die Formulierung dieser elektromagnetischen Gesetze in den Maxwellschen Gleichungen markiert den Beginn der modernen Feldtheorie, welche die Symmetrie von Gleichungen zum Prinzip macht. Dies bringt Russell zu einer seiner für seinen trockenen Humor charakteristischen Bemerkungen: All philosophers, of every school, imagine that causation is one of the fundamental axioms or postulates of science, yet, oddly enough, in advanced sciences such as gravitational astronomy, the word ‘cause’ never occurs. ... The law of causality, I believe, like much that passes muster among philosophers, is a relic of a bygone age, surviving, like the monarchy, only because it is erroneously supposed to do no harm. ([215]: 173) Warum ist es dennoch vernünftig, an der kausalen Sprache festzuhalten? Das hat nicht nur damit zu tun, daß wir uns typischerweise im makroskopischen Bereich der Alltagswelt bewegen; auch im Labor eines Wissenschaftlers werden durch den Aufbau und das Ingangsetzen eines Experiments Rand- und Anfangsbedingungen gesetzt, die als zeitlich wohldefinierte Intervention in den 67 Die Natur hat dafür gesorgt, daß dies keine Anleitung für ein Perpetuum Mobile ist: die Selbstinduktionsspannung wirkt gemäß der sogenannten Lenzschen Regel einem anwachsenden Strom entgegen.
Moderne Logik und Philosophie
xcix
natürlichen Gang der Dinge den Status von Ursachen bekommen, so daß gewisse charakteristische Nachfolgeereignisse als deren Wirkungen betrachtet werden können. Im Fall von unbeeinflußbaren Naturprozessen wie dem Wetter kann man sich die Anfangsbedingungen durch passende Messungen ersetzt denken, bei denen immerhin noch der Zeitpunkt frei wählbar ist, wodurch eine kausale Betrachtung der Nachfolgeereignisse legitimiert wird. Wenn wir nun aber die Kausalbeziehung nicht eliminieren, dann stellt sich die Frage, wie das obige Inferenzticket A =B B in seiner kausalen Deutung expliziert werden soll. In erster Näherung kann der Regularitätscharakter durch bedingte Allsätze erfaßt werden, wenn man im Auge behält, daß diese lediglich die konstante Verbindung, aber weder die zeitliche Abfolge, noch den notwendigen Zusammenhang wiedergeben. Man kann an diesem vereinfachten Modell immerhin gewisse Begriffsbildungen erläutern, die in der philosophischen Diskussion eine wichtige Rolle spielen (siehe etwa das Buch [166] von J. Mackie). Zunächst ist eine Grundunterscheidung zu treffen zwischen generellen und singulären Kausalaussagen; jene beziehen sich auf kausale Verbindungen zwischen Typen von Ereignissen, diese auf solche zwischen Einzelereignissen, welche jeweils als Instanzen von Regularitäten auf der Ebene der Ereignistypen aufgefaßt werden. Sodann muß eine realistische Analyse berücksichtigen, daß typischerweise mehrere Ereignisse zusammentreffen müssen, damit eine bestimmte Wirkung B eintritt, und daß eine gegebene Ursache A nicht der einzige Weg ist, um B hervorzubringen. Wenn dem so ist, mit welchem Recht nennen wir dann aber einen solchen Faktor A “die” Ursache von B? Diese Redeweise wird am besten pragmatisch dadurch erklärt, daß A in einer konkreten Situation besonders hervorsticht (man spricht auch von Salienz,68 etwa weil A überraschend eintritt oder das auslösende Moment für B darstellt. Im allgemeinen muß aber immer ein Kontext von anderen Bedingungen einbezogen werden, damit die Wirkung hervorgerufen wird. Ein allgemeines Schema, in dem diese zusätzlichen Bedingungen wiedergegeben sind, läßt sich dann etwa so darstellen: das Ereignis A ist zusammen mit einem Komplex U von anderen Faktoren hinreichend für das Eintreten von B, allerdings nicht notwendig, da etwa ein anderes Ereignis A0 zusammen mit einem Komplex V ebenfalls B erzeugt; in Formeln: (A ∧ U ) ∨ (A0 ∧ V ) ∨ . . . =B B
(81)
Schließlich möchte man A nur dann Ursache von B nennen, wenn A im Kontext von U auch notwendig für das Eintreten von B ist. All diese Überlegungen führen Mackie zu dem (etwas sperrigen) Begriff der INUS-Bedingung, welcher in die Explikation der Kausalbeziehung eingeht; danach heißt A Ursache von B, wenn A unzureichender, aber notwendiger Teil eines allein nicht notwendigen, aber für die Wirkung B hinreichenden Ereigniskomplexes A ∧ U im Sinne von (81) ist.69 Kürzer könnte man einfach sagen, daß A ein notwendiger Teil eines für B hinreichenden Ereigniskomplexes ist. Ein Beispiel aus der Epidemiologie wäre etwa, daß der Stich (A) einer Anopheles-Mücke in einem Malariagebiet die Malaria B verursacht, wenn A ein allein zwar nicht ausreichender, aber notwendiger Teil eines Ereigniskomplexes A ∧ U ist, der insgesamt hinreichend, wenn auch nicht notwendig für B ist. Zu U gehört zum Beispiel, daß die betreffende Mücke den Plasmodium-Erreger trägt und kein Malariamittel den Ausbruch der 68 Von 69 A
engl. salient is an insufficient but non-redundant part of an unnecessary but sufficient condition
c
Einleitung
Krankheit verhindert; aber natürlich könnte die Infektion auch über einen der vielen anderen Stiche (etwa A0 im Kontext V ) erfolgen, so daß sie keineswegs den Weg über den Komplex A ∧ U nehmen mußte.
Eine Begriffsbildung wie die der INUS-Bedingungen liefert allerdings lediglich erst einmal ein grobes Raster, mit dem Kausalverhältnisse klassifiziert werden können. Sobald mehr als ein Faktor ins Spiel kommt, ergibt sich eine Fülle von Kombinationsmöglichkeiten, die in der Literatur zur Kausalität eingehend diskutiert werden. Wenn zum Beispiel die obigen Komplexe A ∧ U und A0 ∧ V keine alternativen Wege zur Realisierung von B darstellen, sondern zeitlich hintereinander angeordnet sind, dann kann der spätere Ursachenkomplex den früheren kausal außer Kraft setzen. Im Fall der Malariaexposition ist es natürlich unerheblich, welcher einzelne von vielen Stichen die Infektion in Gang gesetzt hat, aber intuitiv gesehen werden frühere Stiche durch spätere aus ihrer kausalen Rolle gedrängt. Ein drastisches Beispiel mit möglicher strafrechtlicher Relevanz für dieses Phänomen der Abschirmung oder Präemption 70 wird in der Literatur unter der Bezeichnung “Wüstenreisender” diskutiert:71 Eine Person P will die Wüste durchqueren, hat aber zwei Feinde, die unabhängig voneinander einen Mordanschlag auf P geplant haben. Der erste füllt Gift in P s Wassersack, der zweite kommt danach und bohrt ein Loch in den Sack, so daß das (vergiftete) Wasser ausläuft; das Ergebnis ist, daß P verdurstet, aber wohl auch ohne das Loch im Wassersack zu Tode gekommen wäre. Gesetzt, beide Feinde können vor Gericht gestellt werden: wer könnte wegen Mordes verurteilt werden? Ein anderer problematischer Falltyp ist der der Überdetermination: An den Iden des März empfängt Cäsar von den Verschwörern Brutus und Cassius gleichzeitig tödliche Messerstiche; wessen Messerattacke ist ursächlich für Cäsars Tod? Eine umfassende Zusammenstellung von Kausalverhältnissen zwischen nur drei Ereignissen mit eingehender Diskussion findet sich in W. Spohns Habilitationsschrift ([234]:73ff.). Der Autor schlägt dort auch eine eigene Explikation des Kausalpfeils in (81) vor, die die folgenden Merkmale aufweist: (i) es handelt sich um einen epistemischen Zugang zur Kausalität, der statt der Ursachen selbst die Gründe für unsere Überzeugungen über die Vorgänge in der Welt in den Mittelpunkt rückt; (ii) die Theorie stellt den verbreiteten probabilistischen Ansätzen eine Analyse deterministischer Prozesse gegenüber. Für das eigens dazu entwickelte Instrument der Konditionalfunktionen siehe [235]. Ein neuerer Sammelband zur Kausalität ist [233]. Wie schon das Malariabeispiel gezeigt hat, dehnen wir unseren Kausalbegriff auf die unüberschaubare Fülle von Ereignissen aus, in denen wir uns auf gar kein deterministisches Gesetz berufen, um eine Kausalaussage zu machen. Zwar findet beim Stich der den Erreger tragenden Mücke eine Infektion statt, aber manche Menschen erkranken dennoch nicht an Malaria; Rauchen erzeugt Krebs, aber längst nicht bei jedem Menschen, usw. Dennoch sprechen wir natürlich davon, daß Rauchen die Ursache des Krebses ist, und der Mückenstich die Ursache der Malaria. Hier nun kommt der Begriff der Wahrscheinlichkeit ganz wesentlich ins Spiel. Es gibt auch statistische Kausalzusammenhänge, bei denen die Ursache A lediglich mit einer gewissen Wahrscheinlichkeit die Wirkung 70 Engl. preemption; das deutsche Wort existiert nicht, sollte aber eingeführt werden, weil es wie der englische Begriff kurz und genau das Außerkraftsetzen einer Kausalkette bezeichnet. 71 Nach [114]; siehe z.B. [246], [234]:99ff., [187]:312.
Moderne Logik und Philosophie
ci
B hervorruft. Da jedoch der Kausalbegriff in der Sprache der Wahrscheinlichkeitstheorie noch viel mehr als in der Welt physikalischer Gleichungen einen Fremdkörper darstellt, galt er zumindest in den “offiziellen Verlautbarungen” der statistischen Wissenschaftler des letzten Jahrhunderts als ein metaphysischer Begriff, der zu vermeiden war, auch wenn diese Art von Sprachregelung in dauerndem Konflikt mit den alltäglichen Intuitionen stand. Erst in jüngster Zeit hat J. Pearl in seiner wichtigen Studie [187] aufgezeigt, zu welchen konzeptuellen Deformationen diese Praxis in der Vergangenheit geführt hat.72 Zugleich entwickelt er ein originelles begriffliches Rüstzeug für eine Kausalanalyse im Rahmen der Wahrscheinlichkeitstheorie, mit dem unter anderem auch die oben erwähnten philosophischen Ansätze von Mackie und Lewis auf ihre Adäquatheit hin untersucht werden können. Bevor wir im letzten Unterabschnitt allgemein auf Wahrscheinlichkeitsschlüsse eingehen, wollen wir hier ihren begrifflich-philosophischen Kern herausheben. Das führt uns zu dem großen Themenkomplex der sogenannten Erweiterungsschlüsse. Bei den deduktiven Schlüssen der reinen Logik, die mit Kant analytisch genannt werden, ist der Gehalt der Konklusion im Gehalt der Prämissen “enthalten” (auch wenn ein logischer Beweis nötig sein mag, sich davon zu überzeugen). In einem Erweiterungsschluß geht dagegen der Gehalt der Konklusion über den der Prämissen hinaus: es handelt sich um einen synthetischen Schluß. Der Preis, der dafür gezahlt werden muß, ist der der absoluten Gewißheit eines deduktiven Schlusses. Wenn nun schon die logische Notwendigkeit verloren geht, so konnte doch nach traditioneller Auffassung die Naturnotwendigkeit des Kausalgesetzes diese Lücke füllen. Diese Hoffnung wurde von Hume nachhaltig zerstört. Selbst wenn man ein Phänomen, etwa die Augenzahl Sechs bei ein und demselben Würfel, schon eintausendmal beobachtet hat, kann man nicht mit Sicherheit vorhersagen, daß der nächste Wurf wieder eine Sechs ergibt. Da nach Hume Kausalität auf Gewohnheit beruht, ist ein solcher induktiver Schluß, wenn auch pragmatisch gerechtfertigt, dennoch nicht verläßlich. Das Würfelbeispiel ist ein Fall von enumerativer Induktion, da die Induktionsbasis aus einer Reihe von bestätigenden Instanzen besteht, die den Schluß legitimieren sollen. Es war Karl Popper, der den begrenzten Wert dieses Typs von Induktionsschluß erkannte und an seine Stelle die eliminative Induktion setzte, die z.B. auch das Prinzip statistischer Signifikanztests ausmacht: man konfrontiert eine wie immer gewonnene Gesetzeshypothese H mit einem Test, der eine (möglichst aussagekräftige) Instanz E von H realisiert; ist E mit H logisch unverträglich oder im Lichte von H extrem unwahrscheinlich, so wird die Hypothese verworfen, also eliminiert. Dies ist Poppers Methode des Falsifikationismus; siehe [190]. Um also die Hypothese Alle Schwäne sind weiß zu testen, schaut man nicht nur die Schwäne am Starnberger See an, sondern geht nach Australien, wo man schwarze Schwäne trifft und somit die Hypothese widerlegt. Hypothesen, die allen Falsifikationsversuchen widerstehen, gelten dann zwar nicht als bewiesen, aber zumindest als im hohem Maße bestätigt und werden für die weitere Forschung (stets im Prinzip revidierbar) zu Grunde gelegt.73 Einen Überblick 72 Siehe den unterhaltsamen und informativen Epilog in [187]:331ff., “The Art and Science of Cause and Effect”. 73 Die Schwan-Hypothese ist natürlich ein triviales Proseminar-Beispiel. Daß die reale wissenschaftliche Forschung nach dem Popperschen Muster voranschreitet, ist vor allem von Thomas Kuhn und Paul Feyerabend bestritten worden, die mit ihren Schriften [152] und [68]
cii
Einleitung
über die Induktionsproblematik liefern [242], [220]:chap.2 sowie [48]. In den empirischen Wissenschaften, aber auch etwa in der KI-Forschung, wird neben der Induktion häufig auf einen anderen Tap von Erweiterungsschluß Bezug genommen, die sogenannte Abduktion. Dieser Begriff wurde von dem amerikanischen Philosophen und Logiker Charles Sanders Peirce geprägt. Er meinte damit den Prozeß der Bildung einer erklärenden Hypothese H auf der Basis gegebener empirischer Evidenz E. Da eine Hypothese eine generelle Aussage ist, geht ihr Gehalt weit über eine begrenzte Zahl von Einzeldaten hinaus, wie sie sich typischerweise in E finden. H soll natürlich mit E in einem Zusammenhang stehen, und zwar derart, daß man danach fragt, welches die plausibelste Hypothese ist, die das Resultat E hervorgebracht haben könnte. Ich nenne diesen Typ von Folgerung auch den Detektivschluß : Hercule Poirot findet den Toten und muß aufgrund der Indizien eine Hypothese über die Art und Weise machen, wie die Person vom Leben zum Tod befördert wurde. Derselbe Schluß vom Effekt auf die Ursache geschieht bei der ärztlichen Diagnose: es wird von den Symptomen auf die Krankheit geschlossen, die die Symptome verursacht. Ein anderes Beispiel aus dem Hamlet, der oben bereits mehrfach zur Illustration herangezogen wurde: König Claudius und sein Minister Polonius rätseln über die Ursache von Hamlets Wahnsinn; Polonius vollzieht die Abduktion von Hamlets Verhalten auf verweigerte Liebe durch Ophelia, der Köning ist aber skeptisch: “Love? His affections do not that way tend; nor what he spake, though it lacked form a little, was not like madness...” (III.1) Es zeigt sich, daß das sogenannte Likelihood -Schlußverfahren in der Statistik, welches diejenige Hypothese H auswählt, unter der die Wahrscheinlichkeit des Datums E am größten ist, genau dem qualitativen Begriff der Abduktion entspricht. Wiederum können wir eine Verbindung philosophischer Begriffsbildung zu ihrer quantitativen Ausformulierung herstellen, mit der sich vorrangig die Wissenschaftstheorie beschäftigt. Die Abduktionsmethode wird häufig auch Schluß auf die beste Erklärung genannt (engl. inference to the best explanation); dazu siehe etwa [165]. 6. Wir gelangen so zu dem sechsten Gebiet, der Wissenschaftstheorie, welche als methodologische Disziplin die Natur von Wenn-dann-Verknüpfungen aus der Sicht der empirischen Wissenschaften reflektiert. Natürlich wenden die Wissenschaften in ihrem täglichen Geschäft die deduktive Logik an, wenn sie z.B. allgemeine theoretische Aussagen auf einen konkreten Fall in einem gegebenen Experiment spezialisieren; dies liefert eine Vorhersage für das zu erwartende Resultat. Derartige allgemeine Aussagen werden gesetzesartige Aussagen, Gesetzeshypothesen oder kurz Gesetze genannt; sie haben die logische Form bedingter Allsätze. Zum Beispiel lautet das ideale Gasgesetz, daß bei einem beliebigen Gasquantum x, welches die Bedingungen eines idealen Gases erfüllt,74 das Produkt aus Druck und Volumen konstant ist. Dies hat die Form einer bedingten Allaussage, deren Formalisierung etwa lauten würde (mit IG(g) für “x ist ein ideales große Resonanz fanden. Um ein berühmtes Beispiel zu nennen: Die wirkliche Falsifikation der geozentrischen Hypothese, die unter anderem beinhaltet, daß die Erde sich nicht im Raum bewegt, gelang erstmals im Jahre 1838 durch Friedrich Wilhelm Bessel, indem er eine FixsternParalaxe bei dem Stern 61 Cygni nachwies. Im 19. Jahrhundert war aber die wissenschaftliche Revolution längst vorüber, d.h. das heliozentrische Weltbild hatte sich schon lange durchgesetzt, nicht durch Falsifikation des alten ptolemäischen Paradigmas, sondern durch seine wenn auch unbewiesene überwältigende Plausibilität im Lichte der Newtonschen Erkenntnisse. 74 Diese Bedingungen sind in der Praxis immer nur annähernd erfüllt.
Moderne Logik und Philosophie
ciii
Gas”, sowie P (x) für den Druck von x und V (x) für das Volumen von x): ∀x ( IG(x) → P (x) · V (x) = const. )
(82)
Die Prognose, daß sich bei einem bestimmten Gasquantum x0 in einer gegebenen Versuchsanordnung der Druck verdoppelt, wenn sein Volumen halbiert wird, ergibt sich durch logische Spezialisierung des Allsatzes in (82) auf x0 . Steht die Messung im Einklang mit dieser Vorhersage, so ist das eine Bestätigung der Hypothese (82); bei negativem Ausgang kann man entweder bezweifeln, daß x0 die Kriterien für ein ideales Gas erfüllen, oder aber das Gesetz muß als falsifiziert gelten. Je zentraler die Gesetzesaussage und je besser man sie in der Vergangenheit bestätigt fand, desto vorsichtiger wird man bei ihrer Verwerfung sein, sondern eher die Versuchsanordnung überprüfen oder die Kriterien, hier IG(x), die das Probequantum x überhaupt zu einer Instanz des Gesetzes machen. Diese Überlegungen gehören zur Pragmatik der Wissenschaft und entziehen sich der rein logischen Analyse. Geht man nun einen Schritt zurück und fragt, was überhaupt einen bedingten Allsatz zu einer Gesetzeshypothese macht, so kommen wir zurück zur Problematik notwendiger und kausaler Allaussagen. So können wir etwa einen bedingten Allsatz gesetzesartig nennen, wenn er den folgenden Typ von irrealem Konditionalsatz stützt: wenn unter sonst unveränderten Bedingungen (ceteris paribus) das Protasis-Ereignis nicht erfüllt wäre (oder in einem konkreten Experiment: nicht erfüllt gewesen wäre), so würde sich auch der Effekt (das Apodosis-Ereignis) nicht einstellen bzw. hätte sich nicht eingestellt. In unserem Beispiel hätte sich der Druck des Gases nicht verdoppelt, wenn das Volumen des Behälters nicht halbiert worden wäre. Die offensichtliche Frage ist bei dieser Analyse, daß wir nicht verstehen können, was ein Gesetz ist, wenn wir nicht die Logik irrealer Konditionalsätze verstanden haben. Hier schließt sich ein konzeptueller Kreis von Problemen, wie er durch die Graphik in Abbildung 5 sinnfällig gemacht wird. Ein weiterer Punkt, an dem Konditionalsätze in der Wissenschaftstheorie ins Spiel kommen, sind dispositionelle Eigenschaften wie die Löslichkeit in Wasser. Historisch stellten die Dispositionsprädikate eine unüberwindbare Anomalie für den Verifikationismus der logischen Empiristen dar, da sie einerseits ganz offensichtlich zu einem wissenschaftlichen Vokabular gehören, aber ihr Vorliegen nicht direkt feststellbar ist. Dies war für Carnap [39] der Anlaß, in seiner Wissenschaftstheorie neben Beobachtungstermen auch theoretische Terme zuzulassen, die sich einer direkten Verifikation entziehen. Wie aber sollte man ein Prädikat wie wasserlöslich explizieren? Eine naheliegende Idee wäre, einen Stoff als wasserlöslich zu bezeichnen, wenn alle Proben des Stoffs sich auflösen, sobald sie ins Wasser gelegt werden. Das Problem liegt dann aber darin, daß jeder Stoff, von dem niemals Proben ins Wasser gelegt werden, auch wasserlöslich ist, weil das Antecedens des bedingten Allsatzes “leererweise” erfüllt wird. Man kann diese Schwierigkeit umgehen, wenn man das Kriterium wieder mittels eines kontrafaktischen Konditionalsatzes formuliert: der Stoff heißt dann wasserlöslich, wenn jede Probe sich auflösen würde, falls sie ins Wasser gelegt würde. Es ist klar, daß es für die Stützung eines solchen Konditionals im allgemeinen tiefer liegender theoretischer Gründe bedarf, die zwar an Beobachtungen überprüft wurden, aber nicht einfach mit ihnen gleichzusetzen sind. Wir wollen hier noch das klassische Schema der wissenschaftlichen Erklä-
civ
Einleitung
rung erwähnen, das von C. Hempel und P. Oppenheim [118] entwickelt wurde, und kurz H-O-Schema oder D-N-Modell der Erklärung (‘D-N ’ für “deduktivnomologisch”) genannt wird. Es analysiert den Begriff der Erklärung einer Tatsache oder eines Ereignisses E als ein spezielles logisches Argument, welches E unter ein oder mehrere allgemeine Gesetze75 G subsumiert, indem es E aus G zusammen mit geeigneten konkreten Antecedens-Bedingungen A logisch herleitet.76 Im Kontext einer Erklärung heißt E das Explanandum und G zusammen mit A das Explanans. Eine D-N-Erklärung sollte dabei folgende Adäquatheitsbedingungen erfüllen: (i) Das Explanandum ist eine logische Folgerung aus dem Explanans (wie bereits gesagt); (ii) das Explanans muß mindestens ein allgemeines Gesetz G als notwendige Bedingung enthalten, d.h. ohne G verliert das Argument seine Gültigkeit; (iii) das Explanans muß “empirischen Gehalt” besitzen, d.h. Antecedensbedingungen und Gesetzesspezialisierungen müssen empirisch überprüfbar sein; (iv) die Sätze des Explanans müssen “wahr” sein.77 In unserem obigen Beispiel ist das Explanandum E0 die Tatsache, daß sich der Druck des Gasquantums x0 in dem gegebenen Experiment verdoppelt hat. Das Explanans enthält als allgemeines Gesetz G0 die Aussage (82) und als in A0 zusammengefaßte Antecedensbedingungen die Konjunktion aus den empirisch überprüfbaren Einzelsätzen IG(x0 ) sowie “das Ausgangsvolumen V (x0 ) wurde halbiert, mit dem Ergebnis V 0 (x0 ) = 12 V (x0 )”. Die Verdopplung des Ausgangsdrucks P (x0 ) auf P 0 (x0 ) = 2P (x0 ) kann dann deduktiv gefolgert werden.78 Trotz seiner intuitiven Plausibilität läßt das H-O-Schema viele Fragen in der Erklärungsthematik offen, die in der wissenschaftstheoretischen Literatur ausführlich diskutiert wurden; siehe dazu [240], [259]: chap. 5, [220]: chap. 1, [10] sowie [236] als Beispiel für einen neueren Forschungsartikel. Wir kehren zu den induktiven Schlußverfahren zurück und betrachten sie aus wissenschaftstheoretischer und mehr quantitativer Sicht. Popper umging, wie wir sahen, das Problem der logisch nicht mehr gültigen Erweiterungsschlüsse durch das Verfahren der Falsifikation; es bedient sich nach wie vor der deduktiven Logik, begreift aber Induktion als eliminativ. Die enumerative Induktion wurde im Rahmen der Bestätigungsproblematik von Carnap [40] weiterverfolgt und mit quantitativen Methoden behandelt. Im Zuge dieser Untersuchungen entwickelte Carnap einen “logischen” Begriff von Wahrscheinlichkeit [41]. Aus der Tradition des logischen Empirismus kommend stellten aber weder Popper noch Carnap denjenigen Begriff von Anfang an in den Mittelpunkt, den die mathematischen Wissenschaften als das zentrale Instrument der Induktion zur Verfügung stellen: den Begriff der Wahrscheinlichkeit. So versieht denn auch Wolfgang Stegmüller im vierten Band seiner Wissenschaftstheorie, der sich mit Wahrscheinlichkeit befaßt [243], einen der Hauptteile mit der Überschrift: “Jenseits von Popper und Carnap”. In der Tat ist die Logik der empirischen Wissenschaften nicht die deduktive Logik, welche lediglich den allgemeinen Rahmen widerspruchsfreien Räsonierens liefert, sondern die probabilistische Logik, wie sie “nomologisch”, von griech. (nomos), Gesetz. “deduktiv”. 77 Gesetze können im strengen Sinn niemals wahr sein, da alle unsere empirischen Theorien hypothetisch sind und ihre Gesetze nur mehr oder minder gut bestätigt sein können. 78 Genau genommen handelt es sich nur dann im eine rein logische Folgerung, wenn in das Explanans die arithmetischen Gesetze der reellen Zahlen aufgenommen werden, welche bei der Division des Volumens V (x0 ) durch 2 für die korrekte Algebra sorgen, die bei Konstanz des Produktes P 0 (x0 ) · V 0 (x0 ) den Faktor 2 beim Druck erzwingt. 75 Daher
76 Daher
Moderne Logik und Philosophie
cv
sich auch in ihren statistischen Anwendungen aus der Theorie der Wahrscheinlichkeit ergibt.79 In der Wahrscheinlichkeitsinterpretation ist die Wenn-dann-Beziehung A =B B etwa zu lesen als “die Wahrscheinlichkeit von B unter der Bedingung A übersteigt einen gewissen Schwellenwert α nahe bei 1”, formal P (B | A) > α. Dann nämlich scheint es vernünftig, auf der Basis der Information A auf B zu schließen. Ein Wahrscheinlichkeitsschluß dieser Art ist nicht wahrheitsfunktional, nicht-monoton und daher wesentlich lokaler Natur; d.h. ändert sich die Information A, so ergibt sich im allgemeinen, wenn nämlich A und B korreliert sind, ein anderer Wert für P (B | A), und die Schwellenbedingung > α kann verletzt sein, so daß der Schluß auf B nicht mehr gerechtfertigt erscheint. Zudem hängt die Lizens zum Übergang auf B von dem Wert für α ab, der sich nur aus dem Inhalt von A und B sowie dem Kontext der Fragestellung festlegen läßt. Diese prinzipielle Unschärfe hat ihren Grund in der begrenzten Information, mit der derartige Schlüsse vollzogen werden müssen. Das heißt aber nicht, daß die Bewertungen völlig willkürlich wären; die Wahrscheinlichkeitsfunktion P (· | ·) selbst gehorcht strengen mathematischen Gesetzen, auf denen die Theorie der Wahrscheinlichkeit aufbaut. Wahrscheinlichkeitsschlüsse lassen sich in zwei große Klassen einteilen: direkte und indirekte Schlüsse. Beim direkten Wahrscheinlichkeitsschluß liegt das dem gegebenen Problem zugrunde liegende Verteilungsgesetz vor, und auf dieser Basis wird die Wahrscheinlichkeit eines bestimmten Ereignisses berechnet. Der indirekte Wahrscheinlichkeitsschluß hat den Charakter einer Abduktion: hier wird auf eine allgemeine Gesetzeshypothese H im Lichte eines eingetretenen Ereignisses oder aufgrund vorliegender Daten E zurückgeschlossen. Hat H selbst statistischen Charaker, so hat man es gleichzeitig mit zwei Arten von Wahrscheinlichkeiten zu tun: mit derjenigen, die in H formuliert ist, und mit der Wahrscheinlichkeit “zweiter Stufe” P (H | E), die die Wahrscheinlichkeit von H beurteilt. Derartige Hypothesenwahrscheinlichkeiten galten in der traditionellen Statistik als “verboten”, mit der Begründung, daß ihnen kein Zufallsprozeß zugrunde liegt, der allein einen Wahrscheinlichkeitsansatz rechtfertige. Hier zeigt sich jedoch ein begrifflicher Unterschied zwischen der statistischen Wahrscheinlichkeit von Zufallsprozessen (wie etwa dem radioaktiven Zerfall) und der rationalen Bewertung von Sachverhalten bei unvollständiger Information, welche interessanterweise ebenfalls den Gesetzen der mathematischen Wahrscheinlichkeitstheorie genügt. Dieser Unterschied wird manchmal durch die Bezeichnungen objektive vs. subjektive Wahrscheinlichkeit wiedergegeben. Das erweckt jedoch im Fall des letztgenannten Begriffs den Eindruck von “subjektiver Willkür” bei den Bewertungsmaßstäben eines einzelnen Individuums. Die sogenannten Bayesianer unter den Theoretikern, die diesen Typ von Wahrscheinlichkeit verteidigen, weisen jedoch darauf hin, daß auch ihr Begriff insofern objektiv ist, als jede rationale Person, die in einer Situation dieselbe Information besitzt, zu denselben Bewertungen gelangen muß. Für eine philosophische Diskussion dieser Wahrscheinlichkeitsbegriffe siehe [243]. Wir erwähnen zum Abschluß dieses Streifzugs durch die verschiedenen Konzeptionen von Wenn-dann-Beziehungen das zentrale Inferenzinstrument der indirekten Wahrscheinlichkeitstheorie, das der bayesianischen Schule ihren Na79 Man muß also stets zwischen einem engen und einem weiten Begriff von Logik unterscheiden: Logik im engen Sinne ist die deduktive Logik, Logik im weiten Sinn ist praktisch alles, was in irgendeiner Weise einem konsistenten Regelwerk folgt.
cvi
Einleitung
men gegeben hat: das Bayessche Theorem.80 Eigentlich ein einfacher Satz der Theorie bedingter Wahrscheinlichkeiten, gewinnt es in seiner Umdeutung im Sinne der Abduktion seine große Bedeutung. Wie oben schon angedeutet, ist die Grundsituation die einer unbekannten Hypothese H, deren Plausibilität beurteilt werden soll. Ein einfaches Beispiel aus der statistischen Schätztheorie ist die Frage, ob eine gegebene Münze als fair zu betrachten ist, d.h. bei vielen Würfen annähernd gleich oft Kopf wie Zahl zeigt. Mathematisch bedeutet das, daß die Wahrscheinlichkeit von Kopf, sie heiße θ, gleich 21 ist. Angenommen, es sei bekannt, daß aufgrund eines Herstellungsfehlers die Münze unsymmetrisch ist und daher der Wert θ = 21 ausscheidet, man weiß nur nicht, auf welche Seite die Münze bevorzugt fallen wird. Die zwei konkurrierenden Hypothesen mögen lauten: H1 : θ > 12 (häufiger Kopf) und H2 : θ < 12 (häufiger Zahl). Eine zweite Bewertung in Form einer Hypothesenwahrscheinlichkeit P ordnet dann H1 und H2 selbst eine Zahl P (Hi ) zwischen 0 und 1 zu (i = 1, 2). Wenn noch keinerlei Daten zu Würfen mit der betreffenden Münze vorliegen, dann gibt es keine spezifischen Informationen, die H1 plausibler als H2 erscheinen lassen, und umgekehrt. Also wird man beiden Hypothesen, da sie logische Alternativen darstellen, mit dem Wert P (H1 ) = P (H2 ) = 21 belegen. Diese Annahmen für P (Hi ) vor dem ersten Münzwurf, also vor jeglicher Beobachtung, wird traditionell mit der Kantschen Terminologie Apriori-Wahrscheinlichkeit bezeichnet. Wir führen nun mit dieser Münze eine Reihe von Würfen aus und fassen die Ergebnisse in dem Datum E zusammen. E wird die beiden Hypothesen verschieden stark stützen; wenn z.B. 10 mal Zahl erschienen ist, ist es äußerst unplausibel, auf die Richtigkeit von H1 schließen zu wollen. Diese Überlegung kann man mit Hilfe des Bayesschen Theorems mathematisch begründen. Die Kenntnis von E hat die gegebene Information verändert; wir betrachten nunmehr nicht P (Hi ), sondern die Wahrscheinlichkeit von Hi auf der Basis von E, P (Hi | E). Dies ist dann die sogenannte Aposteriori-Wahrscheinlichkeit von H i im Lichte des Datums E (i = 1, 2). Das Bayessche Theorem liefert die folgende Gleichung (dabei ist k eine Konstante): P (Hi | E) = k · P (Hi ) · P (E | Hi )
(i = 1, 2)
(83)
Die Aposteriori-Wahrscheinlichkeit von Hi errechnet sich also bis auf einen konstanten Faktor als Produkt aus der Apriori-Wahrscheinlichkeit und der Wahrscheinlichkeit des Datums E unter der Annahme, daß Hi wahr ist (hier haben Hi und E ihre Rollen vertauscht!). Dieser letzte Term P (E | Hi ) ist die oben kurz erwähnte Likelihood der Hypothese Hi ; sie ist bestimmt durch die hypothetische Wahrscheinlichkeit, mit der sich E realisiert hat, falls Hi zutrifft. Wir sehen hier wieder den Detektiv-Schluß am Werk: die Frage, welche Ursache, H1 oder H2 , für das Resultat E verantwortlich war, wird mit einem Schluß auf die beste Erklärung beantwortet, nämlich mit demjenigen Hi , welches die höhere Wahrscheinlichkeit für E besitzt. Bei weiteren Würfen wird einfach nur das Datum E vergrößert; die Struktur des Ansatzes bleibt gleich, nämlich stets ist die neue Wahrscheinlichkeit proportional (in Zeichen: ∼) dem Produkt aus alter Wahrscheinlichkeit und aktueller Likelihood. Diese halbformale Version ist der 80 Nach dem Mathematiker Thomas Bayes (1702–1761), der dieses Theorem zum ersten Mal formulierte.
Logik als Metawissenschaft
cvii
Kern des Bayesschen Theorems und sei hier ebenfalls noch angeführt: Aposteriori-Wahrscheinlichkeit ∼ Apriori-Wahrscheinlichkeit × Likelihood (84) Selbst wenn die anfängliche Apriori-Wahrscheinlichkeit weit neben der “wahren” Hypothese liegen sollte, ist das kein Grund zur Beunruhigung: es spiegelt lediglich den aktuellen Wissensstand wider, der möglicherweise sehr rudimentär ist und im Grenzfall völliges Nicht-Wissen durch eine Gleichverteilung repräsentiert (wie etwa im Fall eines Würfels, dem man eine mögliche Manipulation nicht ansieht und daher aufgrund der symmetrischen Geometrie jeder Augenzahl die gleiche Wahrscheinlichkeit 16 zuweist). Dies war auch das ursprüngliche Vorgehen von Laplace, dem Hauptvertreter der klassischen Wahrscheinlichkeitsrechnung. Es zeigt sich nämlich, daß in dem gleichen Maße, wie neue Daten hinzukommen und in die Likelihood Eingang finden, das Gewicht der AprioriWahrscheinlichkeit in dem Produkt mit der Likelihood schwindet. Dieser Prozeß des “Lernens aus der Erfahrung” objektiviert also nach und nach die Gesamtverteilung. Die Laplacesche Gleichverteilungsansatz als logischer Ausdruck von abwesender Information und mit ihr der gesamte Bayesianismus geriet in der modernen “objektivistischen” Statistik in Verruf, und zwar im wesentlichen aus zwei Gründen: (i) das erste Argument war begrifflicher Natur; es erklärte die Frage nach der Wahrscheinlichkeit einer wenn auch unbekannten, aber objektiv zutreffenden Hypothese für sinnlos; (ii) das zweite Argument entdeckte paradoxe Folgerungen aus der Gleichverteilungsannahme bei sogenannten kontinuierlichen Verteilungen. Die Wissenschaftstheorie ließ sich davon mehrheitlich beeindrucken, so daß der Bayesianismus immer noch philosophisch umstritten ist. Allerdings spielt er in allen Wissensbereichen, die mit rationalen Entscheidungen aufgrund von begrenzter Information zu tun haben (z.B. in der Ökonomie) eine wesentliche theoretische Rolle. In dem Werk des brillanten Physikers und Statistikers E. T. Jaynes findet sich eine ebenso scharfsinnige wie leidenschaftliche Verteidigung der bayesianischen Position, welche nicht nur statistische Methodenkritik betreibt, sondern bis zur Reflexion der Rolle der Wahrscheinlichkeit in den Grundlagen der Physik reicht; siehe die Aufsatzsammlung [212] sowie sein Lehrbuch [130] mit einer kommentierten Bibliographie.
0.3
Logik als Metawissenschaft
Wir beschließen das Einleitungskapitel mit einem stichwortartigen Überblick über die Rolle der Logik als Metawissenschaft. Viele einschlägige Themen wurden oben bereits angesprochen. Die moderne Logik nimmt in den gegenwärtigen Wissenschaften eine besondere Stellung ein. Sie bildet zusammen mit der Wissenschaftstheorie und Philosophie eine Trias von Metawissenschaften, die in verschiedene Bereiche des Wissens hineinreichen und so außer ihrem jeweils eigenen Gegenstandsbereich auch Grundlagenfragen und Fragen der Methodologie von Einzelwissenschaften zum Thema machen. Eine Beschäftigung mit diesen Metawissenschaften in daher geeignet, “Querschnittstechniken” zu fördern, die zu transdisziplinärem Arbeiten befähigen und so eine professionelle Grundlage für den philosophischmethodologischen Blick über die Grenzen der Disziplinen hinweg bieten.
cviii
Einleitung
Die internen Beziehungen der Logik zur Wissenschaftstheorie sind naturgemäß besonders eng. Sie spielt in fast allen Teilgebieten der Wissenschaftstheorie eine zentrale Rolle. Diese sind vor allem • Allgemeine Wissenschaftstheorie ( Theorie und Erfahrung, wissenschaftliche Erklärung, Bestätigung, Prognose) • Spezielle Wissenschaftstheorie (logische Rekonstruktion von spezifischen einzelwissenschaftlichen Theorien ) • Allgemeine wissenschaftliche Methodologie (wissenschaftliche Begriffsbildung, Daten und Messprozesse, Modellbildung, Deduktion, Induktion)
0.3.1
Logik in den formalen Wissenschaften
Was ihre externen Beziehungen zu anderen Wissenschaften betrifft, so dient die Logik vor allem den Formalwissenschaften als Grundlagendisziplin; dazu zählen insbesondere die folgenden Fächer: • Mathematik • Informatik • Künstliche Intelligenz • Theoretische Linguistik • Computerlinguistik • Statistik
0.3.2
Logik in den empirischen Wissenschaften
Die Rolle der Logik in den empirischen Wissenschaften ruht in wesentlichen auf drei Säulen: • Methodologie (allgemeine Wissenschaftstheorie) • Axiomatische Grundlegung (spezielle Wissenschaftstheorie) • Ideengeschichte (diachron und synchron) als historisch-kulturelles Bindeglied zwischen Geistes- und Naturwissenschaften
Kapitel 1
Elementares Handwerkszeug: Mengen, Funktionen, Zeichen Das Ziel dieses Kapitels ist es, zunächst eine Arbeitsumgebung zu schaffen, in der die elementare Logik dargestellt werden kann. Dabei empfiehlt es sich, einige grundlegende Begriffe der Mengenlehre relativ informell einzuführen. Das Gewicht liegt hier nicht auf formaler Genauigkeit, welche am Anfang das Verständnis eher erschweren würde; ein intuitives Erfassen jener Begriffe reicht aus, um gewisse Aussagen über logische Sachverhalte präzise zu formulieren. Erst wenn die Logik bis zu einem bestimmten Punkt entwickelt ist, wird es möglich sein, auch die elementaren mengentheoretischen Begriffe und Tatsachen mit der gebotenen logischen Sorgfalt einzuführen und zu beweisen. Da die Logik ferner eine Wissenschaft ist, zu der wesentlich die symbolische Repräsentation gehört, widmet sich der zweite Teil des Kapitels einigen Grundtatsachen aus dem Bereich der Semiotik , der Wissenschaft von den Zeichen.
1.1
Mengen
Die Mengenlehre handelt von gewissen Objekten, Mengen genannt, welche Gesamtheiten von anderen Objekten darstellen, die ihre Elemente heißen. Die Grundbeziehung der Mengenlehre ist die Beziehung der Elementschaft, welche in Symbolen so ausgedrückt wird: (1)
a. b.
x∈A
x 6∈ A
für “x ist ein Element der Menge A” für “x ist kein Element der Menge A”
Das charakteristische Mengensymbol besteht aus einer Reihe von Namen von Elementen einer Menge, die zwischen zwei geschweifte Klammern, den Mengenklammern, gesetzt werden, z.B. (2)
a. b.
{ a, b, c }
zu lesen: “die Menge der Elemente a, b und c”
oder aber aus einer Beschreibung der Eigenschaften der Elemente der Menge, ebenfalls flankiert von den geschweiften Klammern und einer “gebundenen” 1
2
Elementares Handwerkszeug
Variablen, die stellvertretend für die Namen der Elemente steht, sowie einem senkrechten Strich: (3)
a. b.
{ x | Φ[x] } zu lesen: “die Menge der Elemente x mit der Eigenschaft Φ”
Man unterscheidet zwischen der reinen Mengenlehre und einer “nicht-reinen” Mengenlehre: bei der ersteren sind nur Mengen zugelassen, die vollständig aus Objekten aufgebaut sind, die wieder Mengen sind. Es zeigt sich, daß im wesentlichen die gesamte Mathematik in der reinen Mengenlehre entwickelt werden kann. In den vielfältigen Anwendungen der Mengenlehre als Wissenschaftssprache außerhalb der Mathematik hat man jedoch meist ein anderes Bild: dort denkt man sich eine gewisse Gesamtheit von (typischerweise konkreten, raumzeitlichen) Objekten als gegeben, die spezifisch für den gewählten Wissensbereich sind, und faßt bestimmte von diesen Objekten zu einer Menge zusammen. Eine solche Menge heißt nicht-rein, weil ihre Elemente selbst keine Mengen sind (Mengen gelten als abstrakte Objekte, außerhalb von Raum und Zeit). Elemente von Mengen, die selbst keine Mengen sind, werden auch Urelemente genannt. Zum Beispiel handelt die Astronomie des Sonnensystems von den neun Planeten, die zu der nicht-reinen Menge der Planeten zusammengefaßt werden können: (4)
{Merkur, Venus, Erde, Mars, Jupiter, Saturn, Uranus, Neptun, Pluto}
Ferner kann man etwa die nicht-reine Menge der steuerzahlenden Bundesbürger, die Menge der in München zugelassenen Kraftfahrzeuge oder die Menge der Sauerstoffmoleküle in einem Kubikzentimeter Luft betrachten. Aber auch in der Mathematik behandelt man meist die Zahlenmengen als Gesamtheiten von Urelementen und denkt etwa bei den natürlichen Zahlen nicht an gewisse reine Mengen, als welche sie in der Mengenlehre rekonstruiert werden können, sondern faßt sie als gegebene Urelemente auf. Danach wäre dann etwa die Menge der ungeraden Augenzahlen eines Würfels, d.h. die Menge bestehend aus den drei natürlichen Zahlen: (5)
{1, 3, 5}
eine nicht-reine Menge mit den Urelementen 1, 3 und 5 als Elementen dieser Menge. Bleiben wir bei den natürlichen Zahlen. In ihrer Gesamtheit sind das “unendlich viele”, die man auf jeden Fall nicht alle zwischen den Mengenklammern aufführen kann. Man behilft sich hier mit den üblichen drei Punkten, die so viel wie “und so weiter” bedeuten: (6)
N = {0, 1, 2, 3, . . .};
diese Menge heißt die Menge der natürlichen Zahlen und wird in der Mathematik meist wie angegeben mit N bezeichnet; in der Logik wird sie jedoch häufig identifiziert mit der Menge ω der endlichen Ordinalzahlen, so daß man neben ‘N’ auch das Symbol ‘ω’ verwendet. Die natürlichen Zahlen beginnen mit der Null 0. Will man in (6) die Punkte vermeiden, muß man zu einer geeigneten Beschreibung der Menge nach dem Schema (3) greifen. Aber auch endliche Mengen sind häufig nur durch eine Beschreibung gegeben, etwa:
3
Mengen {x|Φ[x]}
A
Φ[x]
Abbildung 1.1: Aussonderung der Menge der x in A mit der Eigenschaft Φ
(7)
a.
Die Gesamtheit aller Flugzeuge auf dem Rhein-Main-Flughafen an einem gegebenen Tag;
b.
die Gesamtheit aller Flugbewegungen auf dem Rhein-Main-Flughafen an einem gegebenen Tag;
c.
die Gesamtheit der von der Lufthansa beförderten Passagiere;
d.
die Gesamtheit aller produzierten Güter und Dienstleistungen.
Die Beispiele zeigen, daß es nicht immer “konkrete” Objekte zu sein brauchen, die zu einer Menge zusammengefaßt werden.
1.1.1
Operationen der Mengenbildung
Wir kehren zurück zu Cantors Mengendefinition aus der Einleitung; sie muß, wie wir dort sahen, ein wenig vorsichtiger gefaßt werden. Anstatt zum Beispiel von der unbeschränkten Zusammenfassung völlig beliebiger “Objekte unserer Anschauung oder unseres Denkens” zu sprechen, gehen wir zunächst von einer Grundmenge A als einem vorgegebenen Rahmen aus und betrachten dann lediglich diejenigen Elemente x in dieser Rahmenmenge A, die zusätzlich noch eine Bedingung Φ[x] erfüllen, also (8)
a. b.
{ x ∈ A | Φ[x] }
die Menge der Elemente x von A mit der Eigenschaft Φ
So kann man etwa von der Menge A der deutschen Staatsbürger ausgehen und zusätzlich nach der Eigenschaft Φ fragen, einen Führerschein zu besitzen. Damit bekommt man die Menge der deutschen Führerscheinbesitzer. Ein Axiom der Mengenlehre, das Aussonderungsaxiom, lautet, daß man ausgehend von einer Menge A wieder eine Menge bekommt, wenn man eine solche “aussondernde” Bedingung Φ an die Elemente von A stellt. Ein mathematisches Beispiel ist die Menge der natürlichen Zahlen, die zugleich Primzahlen sind, usw. Schematisch läßt sich das wie in Abbildung 1.1 veranschaulichen. Die bekannten Venn-Diagramme illustrieren weitere Grundoperationen auf gegebenen Mengen. Sind z.B. A und B zwei Mengen, so definiert man ihren
4
Elementares Handwerkszeug
B A
A∩B
Abbildung 1.2: Venn-Diagramm des Durchschnitts zweier Mengen A und B B A
A∪B
Abbildung 1.3: Venn-Diagramm der Vereinigung zweier Mengen A und B
Durchschnitt A ∩ B als die Menge derjenigen Elemente, die sowohl in A als auch in B liegen (siehe Abbildung 1.2). Die Vereinigung A ∪ B von A und B ist dagegen alles, was entweder in A oder in B (oder in A ∩ B) liegt, also im obigen Bild die die beiden Mengen symbolisierenden Gebiete (genauer: deren Punkte) zusammengenommen; siehe Abbildung 1.3. Als spezielle Menge spielt die leere Menge ∅, die gar keine Elemente enthält, eine wichtige Rolle; aus ihr kann man das gesamte Universum der reinen Mengen in einer Art “creatio ex nihilo” aufbauen. Die leere Menge besitzt die triviale Eigenschaft, Teilmenge einer jeden anderen Menge A zu sein. Die Teilmengenbeziehung A ⊆ B ist allgemein dadurch erklärt, daß alle Elemente von A auch Elemente von B sind, oder negativ gewendet, daß es kein Element von A gibt, daß nicht in B liegt. Damit ist speziell die leere Menge Teilmenge einer jeden Menge A, weil es überhaupt keine Elemente von ∅ gibt, insbesondere auch keine, die nicht in B liegen: (9)
∅⊆A
für jede Menge A
Mit Hilfe der Teilmengenbeziehung kann man auch den Begriff der Gleichheit zweier Mengen A und B definieren: (10)
a. b.
A=B gdw A ⊆ B und B ⊆ A Die Menge A ist gleich der Menge B genau dann, wenn A eine Teilmenge von B und B eine Teilmenge von A ist.
5
Mengen
Die Mengen A und B sind also gleich oder identisch genau dann wenn alle Elemente von A auch Elemente von B und umgekehrt alle Elemente von B auch solche von A sind. Dies ist in der Praxis des Beweisens das wichtigste Identitätskriterium für Mengen. Die Axiome der Mengenlehre sind zum großen Teil bedingte Aussagen folgender Gestalt: wenn man von einem oder von mehreren Objekten schon weiß, daß es sich um Mengen handelt, dann führt eine bestimmte Operation auf diesen Mengen wieder zu einer Menge. Zum Beispiel seien zwei Mengen A und B gegeben; dann erklärt das Paarmengenaxiom die Zusammenfassung von A und B zu der “Paarmenge” { A, B } zu einer weiteren Menge. Die Operation ist hier die Paarmengenbildung. Da es bei der Zusammenfassung von Objekten zu einer Menge nicht auf die Reihenfolge ihrer Nennung ankommt, kann die Paarmenge { A, B } auch als { B, A } geschrieben werden. Die Paarmengenbildung läßt sich verallgemeinern auf die Zusammenfassung endlich vieler Mengen A1 , . . . , An zu der Menge (11)
a. b.
{A1 , . . . , An }
die Menge der Mengen A1 bis An
Faßt man auf diese Weise endlich viele Urlemente a1 , . . . , an zusammen, so bekommt man im Einklang mit dem oben Gesagten das Mengensymbol (12)
a. b.
{a1 , . . . , an }
die Menge der (Ur)Elemente a1 bis an
In diesen beiden Beispielen kommt es ebenso wie bei der Paarmenge nicht auf die Reihenfolge der Nennung der Elemente an. Es sei angemerkt, daß wir hier nur zur Deutlichkeit der Unterscheidung zwischen reinen und nicht-reinen Mengen erstere mit Großbuchstaben und letztere mit Kleinbuchstaben mitgeteilt haben. Die Unterscheidung zwischen Groß- und Kleinbuchstaben ist ein Anhaltspunkt dafür, wovon im gegebenen Zusammenhang die Rede ist; sie läßt sich aber keineswegs überall konsequent durchhalten, wie wir sehen werden. Ist bei einer Paarmenge { A, B } das Element A gleich dem Element B, so braucht es nicht doppelt notiert zu werden, und es bleibt die sog. Einermenge (engl. singleton) {A} übrig. Ebenso kann man die Einermenge eines Urelements a bilden, nämlich {a}.1 (13)
a. b.
{A}
bzw.
{a}
die Einermenge von A bzw. a
Ein anderes wichtiges Axiom der Mengenlehre besagt, daß man aus einer gegebenen Menge A die Gesamtheit aller Teilmengen von A bilden kann, und daß dies wieder eine Menge ergibt. Man nennt diese Menge die Potenzmenge von A und bezeichnet sie mit PA; also: 1 Anhand der Einermengen wird besonders deutlich, daß philosophisch gesehen die Mengenlehre eine große ontologische Extravaganz darstellt. Zu jedem Objekt a, ob Menge oder Urelement, gibt es nämlich einen ganzen “Turm” unendlich vieler von einander verschiedener Mengen, der durch iterierte Einermengenbildung entsteht: a, {a}, {{a}}, {{{a}}}, . . . . Der moderne logische Nominalismus verweigert den Einstieg in diese Komprehensionshierarchien.
6
Elementares Handwerkszeug B A
S
{A, B, C} = A ∪ B ∪ C
C
Abbildung 1.4: Die “große” Vereinigung einer Menge von Mengen
(14)
a. b.
PA = { X | X ⊆ A }
die Potenzmenge von A ist gleich der Menge aller Mengen X, die Teilmengen von A sind.
Man stellt fest, daß die Potenzmenge einer jeden Menge A mindestens A selbst enthält, wegen A ⊆ A, sowie die leere Menge ∅ nach unserer obigen Bemerkung; falls A selbst leer ist, bleibt natürlich nur ∅ als Element übrig. Jedenfalls ist jede Potenzmenge nicht leer. Die Potenzmenge ist definitiv keine Menge von Urelementen mehr; als Menge von Mengen ist sie eine Menge “höherer Stufe”. Derartige Mengenbildungen höherer Stufe sind der Kern der modernen Mengenlehre. Durch weitere wiederholte Anwendung der Potenzmengenoperation erzeugt man nach Mengen von Mengen in weiteren Schritten Mengen von Mengen von Mengen und so fort. Die Stufe einer Menge läßt sich an der Klammertiefe ablesen, d.h. an der tiefsten Schachtelung von Mengenklammern. So hat etwa die Menge {∅}, deren einziges Element die leere Menge ist, die Klammertiefe 1 und die Menge { ∅, {∅} } die Tiefe 2. Hat man sich an Mengen der zweiten Stufe, also Mengen von Mengen, gewöhnt, so kann man etwa die Menge A bilden, die aus drei gegebenen Mengen A1 , A2 , A3 besteht, und eine neue Menge bilden, die genau aus denjenigen Elementen besteht, die in mindestens einer jener drei Mengen liegt. Ein weiteres Axiom der Mengenlehre, das Vereinigungsmengen-Axiom, “erlaubt” diesen Schritt. Man notiert diese neue Menge mit dem “großen” VereinigungsmengenSymbol in der folgenden Form (vgl. Abbildung 1.4): S S (15) A = {A1 , A2 , A3 } Die Operation der großen Vereinigung erniedrigt die Klammertiefe um 1. Habe ich z.B. die beiden Mengen der Tiefe 1, {2, 4} und {1, 3, 4}, gegeben, und bilde daraus die Paarmenge {{2, 4}, {1, 3, 4}}, so ergibt sich die Klammertiefe 2. Die große Vereinigung führt zurück zur Tiefe 1:
7
Mengen B A
T
{A, B, C} = A ∩ B ∩ C
C
Abbildung 1.5: Der “große” Durchschnitt einer Menge von Mengen
(16)
S
{{2, 4}, {1, 3, 4}} = {1, 2, 3, 4}
Die oben eingeführte “übliche” Vereinigung zweier Mengen stellt sich nun als Spezialfall der großen Vereinigung heraus; wir erhalten: S (17) a. A∪B = { A, B } b. Die Vereinigung der Mengen A und B ist gleich der “großen” Vereinigung der Paarmenge { A, B }. Einen Beweis für diese Tatsache führen wir an dieser Stelle nicht, sondern verweisen auf das spätere Kapitel 9 zur Mengenlehre; hier begnügen wir uns mit der Plausibilität der entsprechenden Venn-Diagramme. Es sei noch vermerkt, daß die Potenzmengenoperation und die große Vereinigungsoperation im folgenden Sinn Umkehrungen voneinander sind: jene erhöht die Klammertiefe um 1, diese erniedrigt sie um 1. Wir werden später beweisen, daß für eine Menge A gilt: S (18) a. A = PA b. Die Menge A ist gleich der Vereinigung der Potenzmenge von A. Das duale Gegenstück zur großen Vereinigung ist der große Durchschnitt einer Menge von Mengen; er liefert etwa für die obige Beispielmenge A (vgl. Abbildung 1.5): T T (19) A = {A1 , A2 , A3 }
Für die Durchschnittsbildung wird übrigens kein neues Axiom benötigt, da die Durchschnittsmenge sich aus schon vorhandenen Mengen durch Aussonderung ergibt.2 Die große Durchschnittsbildung verringert ebenfalls die Klammertiefe um 1. Analog zu unserem obigen Beispiel (16) haben wir etwa: 2 Allerdings darf die Menge, über die der Durchschnitt gebildet wird, nicht leer sein; siehe Kapitel 9.
8 (20)
Elementares Handwerkszeug T
{{2, 4}, {1, 3, 4}} = {4}
Der normale Durchschnitt zweier Mengen ist wiederum ein Spezialfall des großen Durchschnitts: T (21) a. A∩B = { A, B } b.
Der Durchschnitt der Mengen A und B ist gleich dem “großen” Durchschnitt der Paarmenge { A, B }.
Beim Begriff des Durchschnitts verdient der Fall besondere Erwähnung, wenn zwei Mengen A und B kein gemeinsames Element besitzen, d.h. wenn der Durchschnitt A ∩ B leer ist: (22)
A∩B = ∅
Man sagt in diesem Fall, daß A und B disjunkt sind. Hat man eine endliche Anzahl von Mengen A1 , . . . , An , so daß für jeweils zwei verschiedene Mengen Ai und Aj gilt Ai ∩ Aj = ∅, so heißen die Mengen paarweise disjunkt; man notiert dies so: (23)
a. b.
1.1.2
A i ∩ Aj = ∅
für
1 ≤ i, j ≤ n mit i 6= j
für alle i und j zwischen 1 und n mit i ungleich j ist der Durchschnitt von Ai und Aj leer
Geordnete Paare, Relationen, n-Tupel
Ein letzter zentraler Grundbegriff, auf dem die Begriffe der Relation und der Funktion aufbauen, ist der eines geordneten Paares: (24)
a. b.
hx, yi
das geordnete Paar von x und y
Geordnete Paare sind das formale Hilfsmittel zur Mitteilung von Beziehungen oder Relationen. Wenn die Person a die Person b besticht, dann ist das offenbar etwas anderes als wenn b besticht und a der Bestochene ist. Ist nur ersteres der Fall, so sagt man, das geordnete Paar ha, bi stehe in der Relation des Bestechens, während das Paar hb, ai nicht in dieser Relation steht. Es gibt zwar einen Typ von Relation, die sog. symmetrischen Relationen, bei denen automatisch mit einem Paar ha, bi auch das “konverse” Paar hb, ai in der Relation liegt, etwa die Relation der Ähnlichkeit: wenn a ähnlich zu b ist, dann ist auch b ähnlich zu a; aber viele Relationen, wie die zu bestechen, zu betrügen, zu unterstützen, zu lieben, gehören nach unserer Lebenserfahrung nicht zu ihnen. Am Anfang des 20. Jahrhunderts wurde ein großer Schritt zur Vereinheitlichung der Mathematik und der mit mathematischen Mitteln arbeitenden Wissenschaften vollzogen: man sah eine Möglichkeit, den Begriff der Relation auf den der Menge zurückzuführen. Während z.B. noch Whitehead und Russell in den Principia Mathematica neben der Logik der Klassen oder Mengen eine Logik der Relationen entwickelten, die zum großen Teil strukturell eine Wiederholung der Klassenlogik darstellte, konnte man beide Strukturen in ein und
9
Mengen
demselben Format behandeln, indem man eine Mengendarstellung des geordneten Paares fand und dann Relationen als Mengen von geordneten Paaren definierte. So wird etwa die Beziehung “... ist links von —” (bezogen auf eine feste Perspektive) als die Menge derjenigen geordneten Paare hx, yi von Objekten x und y erklärt, bei denen sich x links von y befindet. Wählt man die Perspektive des Odeonsplatzes in München mit Blick Richtung Süden, so ist das geordnete Paar (25)
hFeldherrnhalle, Theatinerkirchei
ein Element dieser Relation. Die Relation “... ist Bruder von —” ist die Menge derjenigen geordneten Paare hx, yi von Menschen x und y, so daß x ein Bruder von y ist. Wenn wir eine solche Relation mit R bezeichnen, dann läßt sich der Sachverhalt, daß zwei Objekte x und y in der Beziehung R zueinander stehen, in der Mengenlehre folgendermaßen ausdrücken: (26)
a. b.
hx, yi ∈ R
Das geordnete Paar von x und y ist ein Element der Relation R.
R ist dabei die gegebene Relation, und x und y heißen die Relata. Diese Schreibweise ist ziemlich unständlich, und so wird meist stattdessen das Symbol R zwischen die Namen für die Relata gestellt (sog. Infix-Notation): (27)
a.
xRy
b.
x steht in der Relation R zu y.
Mengentheoretisch bedeutet (27a) jedoch nichts anderes als (26a). Es seien zwei Mengen A und B gegeben; dann kann man die Menge aller geordneten Paare hx, yi betrachten mit x ∈ A und y ∈ B. Diese Menge heißt das kartesische Produkt von A und B und wird mit A × B bezeichnet; also: (28)
a. b.
A × B = { hx, yi | x ∈ A und y ∈ B }
das kartesische Produkt von A und B
Ist A = B, so schreibt man statt A × A auch A2 ; dies ist die Menge der geordneten Paare, die man aus Elementen von A bilden kann, also die Menge der hx, yi mit x, y ∈ A. Zur Beschreibung der logischen Syntax benötigen wir noch eine Verallgemeinerung der geordneten Paarbildung. Betrachten wir zunächst die Syntax einer natürlichen Sprache, etwa des Deutschen. Ein deutscher Satz besteht aus einer Anzahl von Wörtern, deren Reihenfolge für die Frage der Grammatikalität des Satzes eine wesentliche Rolle spielt. Die Reihung der Wörter unter a) ist grammatisch, die unter b) nicht: (29)
a.
München ist eine große Stadt.
b.
Eine München ist Stadt große.
10
Elementares Handwerkszeug
Ganz ähnlich verhält es sich mit einem einzelnen Wort einer Sprache, etwa dem Wort ‘Sonne’. Auch hier kommt es auf die Reihenfolge der Buchstaben an. Die Reihung ‘noSen’ ist kein korrektes Wort des Deutschen. Die Syntax einer natürlichen wie auch formalen Sprache baut also aus einem gegebenen Arsenal von Grundausdrücken (Buchstaben bei der Wortbildung; ganze Wörter bei der Satzbildung) nach den festen syntaktischen Regeln der Sprache Folgen oder “Verkettungen” von Ausdrücken auf, bei denen es auf die Reihenfolge ankommt. Die Folge ‘Maria schläft’ ist etwas anderes als ‘schläft Maria’.3 Die Wichtigkeit der Reihenfolge haben solche Folgen mit den geordneten Paaren gemein, außer daß hier mehr als zwei Objekte aneinandergereiht werden können. Dieses Verkettungsprinzip gilt sowohl in natürlichen als auch in den formalen Sprachen der Logik. Der Unterschied liegt lediglich in der Art der Grundausdrücke: bei der natürlichen Sprache sind es die Wörter des Lexikons, in den formalen Sprache ein bestimmter Vorrat von Grundsymbolen, wie Variablensymbole, logische Zeichen sowie gewisse, für die Sprache charakteristische nicht-logische Zeichen wie etwa das ∈-Symbol in der Mengenlehre. In dem Bestreben, die Anzahl der Grundbegriffe möglichst klein zu halten, werden nun Verkettungen von Symbolen in der Mengenlehre “modelliert”. Zunächst wird der Begriff des geordneten Paars auf den geordneter Tripel , Quadrupel und allgemein von n-Tupeln oder Folgen der Länge n für eine beliebige Zahl n erweitert, indem die geordnete Paarbildung entsprechend oft iteriert wird: (30)
a. b.
(31)
a. b.
(32)
a. b.
ha, b, ci
für
hha, bi, ci
das (geordnete) Tripel aus den Objekten a, b und c
ha, b, c, di
für
hhha, bi, ci, di
das (geordnete) Quadrupel aus den Objekten a, b, c und d
ha1 , . . . , an i
für
hha1 , . . . , an−1 i, an i
das n-Tupel oder die Folge aus den Objekten a1 bis an
Speziell sind also Tripel 3-Tupel und Quadrupel 4-Tupel. Diese Konstruktion garantiert, daß für ein gegebenes n zwei n-Tupel ha1 , . . . , an i und hb1 , . . . , bn i dann und nur dann gleich sind, wenn für jedes i zwischen 1 und n gilt: ai = bi . Vertauschungen der Reihenfolge der Objekte in einem n-Tupel führen also zu einem verschiedenen n-Tupel, wenn nicht zufällig an beiden Plätzen dasselbe Objekt aufgeführt ist. Genau diese Eigenschaft ist es aber, die wir auch bei den Verkettungen von Wörtern oder Symbolen in der Syntax benötigen. Werden zwei Grundausdrücke umgestellt, handelt es sich in der Regel um eine andere Kette, sofern nicht gerade zwei Vorkommen desselben Ausdrucks vertauscht werden. Eine Kette von n Wörtern oder Symbolen wird also in der Mengenlehre einfach als ein n-Tupel aufgefaßt. In der Notation wird sich diese Reduktion jedoch nicht niederschlagen. Ketten von Symbolen werden nicht mit Hilfe der spitzen Tupelklammern mitgeteilt, sondern einfach durch Nebeneinandersetzen der einzelnen Symbole, auch Juxtaposition genannt, also ganz so wie die Wörterkette in Beispiel (29a). Allerdings möchte man in der Syntax gelegentlich hervorheben, daß es sich bei 3 Die zweite Reihung der beiden Wörter kann in diesem Beispiel ebenfalls als grammatisch gelten, da die Vertauschung zufällig einen Fragesatz erzeugt, der allerdings nicht dasselbe ist wie der Aussagesatz.
11
Funktionen
A
B
Abbildung 1.6: Eine Funktion f von A nach B
der Juxtaposition um eine echte Operation handelt, und führt für sie dann ein eigenes Symbol, das Verkettungssymbol _ ein. Die Kette aus den Symbolen ‘S’, ‘o’, ‘n’, ‘n’ und ‘e’ zum Beispiel, die das deutsche Wort ‘Sonne’ (33a) ergibt, kann mit dem Verkettungssymbol wie in (33b) und in der mengentheoretischen Auffassung als (33c) geschrieben werden: (33)
a.
Sonne
b.
S _ o _ n_ n_ e
c.
hS, o, n, n, ei
Ketten von Symbolen sind mengentheoretisch also einfach Folgen oder n-Tupel aus diesen Symbolen. Im Abschnitt zur Zeichentheorie werden wir noch weitere Bemerkungen zu Symbolketten machen. In Verallgemeinerung des kartesischen Produkts zweier Mengen definiert man das kartesische Produkt von n Mengen A1 , . . . , An als die Menge der nTupel hx1 , . . . , xn i mit x1 ∈ A1 , x2 ∈ A2 , . . . , xn ∈ An : (34)
a. b.
A1 × . . . × An = { hx1 , . . . , xn i | xi ∈ Ai für 1 ≤ i ≤ n } das kartesische Produkt der Mengen A1 , . . . , An
Sind alle Mengen Ai gleich ein und derselben Menge A, so schreibt man statt A × . . . × A (n-mal) auch An .
1.2
Funktionen
In der Mengenlehre sind Funktionen spezielle Relationen und damit spezielle Mengen. Die intuitivste Auffassung von Funktion ist jedoch eine operationale: danach ist eine Funktion eine Operation f , die gewisse Objekte annimmt und diesen andere Objekte zuordnet. In vielen Fällen läßt sich eine Funktion durch
12
Elementares Handwerkszeug
A
B
A0
g(x) = f (x)
f
x
g
g
y
g(y)
g A0 = f Abbildung 1.7: Die Fortsetzung einer Funktion f von A0 nach A
eine Rechenvorschrift beschreiben, welche ein Objekt oder ein n-Tupel von Objekten als Input nimmt und in Abhängigkeit davon gewisse Objekte als Output produziert, z.B. zu gegebenen zwei Zahlen x und y als Input deren Summe x + y als Output berechnet. Ein wichtiges Kennzeichen der Funktionen ist, daß zu einem gegebenen Input nicht zwei verschiedene Outputs geliefert werden. In der Richtung Input ⇒ Output ist die Wirkung einer Funktion also eindeutig; man spricht von der charakteristischen Rechtseindeutigkeit der Funktionen. Eine Funktion f ist damit eine rechtseindeutige Relation, bestehend aus der Menge der geordneten Paare hx, yi, in denen x ein zu f passender Input und y der Output f (x) ist. Als Zeichen für die funktionale Zuordnung wird das Pfeilsymbol 7→ verwendet. Die Inputs werden auch Argumente und die Outputs (Funktions-)Werte genannt. Die folgenden Zuordnungen stellen Beispiele von Funktionen dar: (35)
a. b. c.
n 7→ 2n,
für beliebige natürliche Zahlen n
x 7→ Vater von x,
für beliebige Menschen x
x 7→ Geburtstag von x,
für beliebige Menschen x
Dagegen beschreiben die folgenden Zuordnungen keine Funktionen, da die Rechtseindeutigkeit verletzt ist. √ (36) a. x 7→ x, für beliebige positive reelle Zahlen x b. c.
x 7→ Großmutter von x,
x 7→ Hochzeitstag von x,
für beliebige Menschen x
für beliebige Menschen x
Das letzte Beispiel unter c) zeigt außerdem, daß eine Zuordnung nicht für alle Argumente auch einen Wert zu liefern braucht: viele Menschen haben gar keinen Hochzeitstag. Die Menge derjenigen Argumente, für die die Funktion einen (eindeutigen) Wert liefert, heißt ihr Argument- oder Definitionsbereich; in (35a) z.B. ist der Definitionsbereich die Menge der natürlichen Zahlen. Der Wertebereich
13
Funktionen
A
B
f
Abbildung 1.8: Eine injektive Funktion f von A nach B
einer Funktion ist eine Menge von Objekten, aus der die Werte der Funktion genommen werden; in (35c) ist der Wertebereich die Menge der Kalendertage. Es sei bemerkt, daß der Begriff des Wertebereichs nicht beinhaltet, daß jedes seiner Elemente als Wert unter der Funktion auch vorkommt. Ein und dieselbe Funktion im Sinne der Rechenvorschrift kann also im allgemeinen mit mehreren Mengen als ihrem Wertebereich korreliert werden. Die Standardnotation für Funktionen lautet (zur Veranschaulichung siehe Abbildung 1.6): (37)
a. b.
f : A → B,
x 7→ f (x)
die Funktion f mit Definitionsbereich A und Wertebereich B, die einem Element x aus A den Funktions-(Wert) f (x) aus B zuordnet; umgangsprachlich: “die Funktion f von A in (oder nach) B mit x geht über in f (x)”
Für die Funktion in (35a) z.B. schreibt man daher kurz: (38)
a. b.
f : N → N, n 7→ 2n
die Funktion f von N in N mit n geht über in 2n
Funktionen werden auch Abbildungen genannt. Sind zwei Funktionen f, g : A → B gegeben, so handelt es sich dann und nur dann um ein- und dieselbe Funktion, wenn die Funktionswerte alle gleich sind, also: (39)
a.
f = g
b.
Die Funktionen f und g sind genau dann identisch, wenn für alle Argumente x ∈ A gilt: der Funktionswert von x unter f ist gleich dem Funktionswert von x unter g.
genau dann wenn
f (x) = g(x) für alle x ∈ A
Sei f : A → B eine Funktion und A0 eine Teilmenge von A; dann ist von den einzelnen Funktionswerten f (x) die Menge der Werte { f (x) | x ∈ A0 } zu unterscheiden, die wir mit f [A0 ] bezeichnen. Sie heißt auch das Bild von A’ unter f . Es gilt offenbar: f [A0 ] ⊆ B für alle A0 ⊆ A, speziell f [A] ⊆ B. Umgekehrt
14
Elementares Handwerkszeug
A
B
f
Abbildung 1.9: Eine surjektive Funktion f von A nach B
kann man für eine Teilmenge B 0 ⊆ B die Menge derjenigen x ∈ A betrachten, deren f -Wert in B 0 liegt; diese Menge heißt das Urbild von B 0 unter f und wird mit f −1 [B 0 ] bezeichnet. Es gilt: f −1 [B 0 ] ⊆ A, speziell f −1 [B] = A.
In den verschiedenen Zahlensystemen der Mathematik (z.B. die natürlichen Zahlen, die reellen Zahlen) sind Rechenoperationen definiert, etwa die Addition. In der Trägermenge N nimmt sie zwei natürliche Zahlen n und m als Input und liefert die Summe n+m als Output. Also ist die Addition eine Funktion von dem kartesischen Produkt N2 in N. In Anlehnung an die Rechenoperationen spricht man für eine Menge A ganz allgemein von einer n-stelligen Operation f auf A, wenn f eine Funktion von An in A ist. Speziell sind einstellige Operationen in A Abbildungen von A in sich, und zweistellige Operationen Abbildungen von A2 in A. Die Addition auf den natürlichen Zahlen ist damit eine zweistellige Operation auf N.
In der Mathematik werden nicht nur natürliche Zahlen addiert, sondern typischerweise reelle Zahlen. Die Addition ist also auch eine Operation auf der Menge der reellen Zahlen. Bezeichnen wir diese Menge mit R, so haben wir eine zweistellige Operation auf R. Nun sind alle natürlichen Zahlen spezielle reelle Zahlen, d.h. es gilt: N ⊆ R. Der Definitionsbereich der Addition auf den natürlichen Zahlen ist also eine Teilmenge des Definitionsbereichs der reellen Addition. Aber natürlich brauchen wir diese beiden Operationen im Bereich von N nicht zu unterscheiden, da die Summen dieselben sind. Man sagt, daß die reelle Addition die Addition der natürlichen Zahlen auf die Menge R fortsetzt. Umgekehrt ist diese die Einschränkung von jener auf die Menge N. Dieser Sachverhalt wird allgemein so formuliert. Gegeben seien zwei Mengen A und B, eine Teilmenge A0 von A, sowie zwei Funktionen f : A0 → B und g : A → B. Dann ist g eine Fortsetzung von f auf A, wenn für alle x ∈ A0 gilt: g(x) = f (x); in Symbolen: f ⊆ g. Umgekehrt heißt f die Einschränkung von g auf die Menge A0 ; in Symbolen: g A0 . Die Einschränkung von g auf A0 ist also eine Funktion von A0 in B, und es gilt f = g A0 . Die Fortsetzung von Funktionen wird uns vor allem im Zusammenhang mit der Semantik der Aussagen- und
15
Endliche und unendliche Mengen
A
B
f
Abbildung 1.10: Eine bijektive Funktion f von A nach B
Prädikatenlogik begegnen: dort werden “atomare” Aussagen mit einem Wahrheitswert belegt; dies stellt eine Abbildung dar, welche dann in einem zweiten Schritt auf die Menge aller Formeln beliebiger Komplexität fortgesetzt wird. Zur Illustration der Fortsetzung von Funktionen siehe Abbildung 1.7. Wir betrachten jetzt wichtige Typen von Funktionen. Es kann vorkommen, daß eine Funktion f nicht nur (definitionsgemäß) rechtseindeutig ist, sondern auch linkseindeutig, d.h. zu jedem Funktionswert y gibt es genau ein Argument x mit y = f (x). Die Funktion n 7→ 2n z.B. ist von dieser Art. Dann wird f eineindeutig, injektiv oder eine Injektion genannt. Ferner heißt f : A → B surjektiv , eine Surjektion oder eine Funktion auf ihren Wertebereich B, wenn jedes Element von B als Wert unter f auftritt, d.h. wenn es für alle y ∈ B ein x ∈ A gibt mit y = f (x). Man kann das auch durch die Bedingung f [A] = B ausdrücken. Schließlich heißt f bijektiv oder eine Bijektion, wenn f sowohl injektiv als auch surjektiv ist. Bijektionen bilden exakte Paare zwischen den Elementen des Definitions- und des Wertebereichs. Die drei Typen von Funktionen sind in den Abbildungen 1.8 – 1.10 illustriert.
1.3
Endliche und unendliche Mengen
Eine Menge A heißt endlich, wenn sie nur endlich viele Elemente enthält, d.h. wenn man ihre Elemente bis zu einer gewissen Zahl n durchzählen kann; bei dieser Zählung soll jedes Element eine Nummer erhalten, und keine zwei verschiedenen erhalten dieselbe Nummer. Das ist die übliche Praxis des Abzählens, ob beim Klassenausflug oder bei der Volkszählung. Mathematisch kann man das Numerieren so formulieren, daß es eine bijektive Funktion von der Menge {1, . . . , n} in A gibt. Dieses Verfahren haben wir oben bereits ohne Umstände angewandt, als wir etwa die Elemente einer Menge in der Form { a1 , . . . , an } schrieben: das Indizieren ist eine Form des Numerierens durch eine derartige bijektive Funktion:
16
Elementares Handwerkszeug
(40)
1 7→ a1 , 2 7→ a2 , . . . , n 7→ an
Man setzt fest, daß die leere Menge endlich ist; sie enthält 0 Elemente. Unendliche Mengen sind nun solche, die nicht endlich sind, d.h. bei denen eine Abzählung mit nur n Nummern nicht gelingt, egal wie groß n ist. Für eine unendliche Menge A gilt also: Egal wie groß n ist, es gibt keine bijektive Abbildung von {1, . . . , n} in A. Offenbar ist die Menge N der natürlichen Zahlen unendlich. Der Begriff der Unendlichkeit wurde in der philosophischen Tradition lange Zeit für inkohärent gehalten. Ein Hauptproblem war dabei, von einer unendlichen Menge sagen zu können, wie “groß” sie sei. Man hatte schon früh beobachtet, daß unendliche Mengen echte Teilmengen, also “kleinere” Mengen, enthalten können, die andererseits aus “ebenso vielen” Elementen bestehen; ein Standardbeispiel ist etwa die Menge der geraden Zahlen, die aus der Menge N durch Entfernung der “Hälfte” ihrer Elemente entsteht und immer noch unendlich ist. Cantor löste das Problem, indem er im Bereich des Unendlichen den Begriff des Teils von dem der Größe teilweise entkoppelte. Zwar kann weiterhin keine Menge größer sein als eine andere, wenn sie ein Teil (d.h. Teilmenge) von ihr ist. Aber eine echte Teilmenge B einer Menge A kann genauso groß sein wie A, und zwar im folgenden Sinn: es gibt eine eineindeutige Abbildung von A auf B. Bei den geraden und den natürlichen Zahlen z.B. liefert die Zuordnung n 7→ 2n eine solche Abbildung. Cantor nannte in einem solchen Fall die Mengen gleichmächtig: (41)
Zwei Mengen A und B heißen gleichmächtig, wenn es eine bijektive Abbildung von A nach B gibt; in Symbolen: A ≈ B.
Die Eigenschaft, gleichmächtig mit einer echten Teilmenge von sich zu sein, ist ein Kennzeichen unendlicher Mengen. Im Endlichen ist es offenbar unmöglich, in eineindeutiger Weise alle Elemente einer Menge den Elementen einer echten Teilmenge zuzuordnen. Man kann nun zwei Mengen “nach Mächtigkeit” ordnen, indem man erklärt: (42)
Eine Menge B ist mächtiger als eine Menge A, wenn es eine injektive Abbildung von A in B gibt, aber keine injektive Abbildung von B in A; in Symbolen: A ≺ B. B ist mindestens so mächtig wie A, wenn es eine injektive Abbildung von A in B gibt, oder wenn A gleich B ist; in Symbolen: A B.
Es liegt nahe zu vermuten, daß A und B genau dann gleichmächtig sind, wenn A mindestens so mächtig wie B und B mindestens so mächtig wie A ist. Dies ist in der Tat ein gültiger Satz (Satz von Schröder-Bernstein), dessen Beweis allerdings nicht unmittelbar auf der Hand liegt. Die Eigenschaft der Gleichmächtigkeit ist natürlich nur dann interessant, wenn nicht alle unendlichen Mengen sich untereinander als gleichmächtig erweisen. Cantor bewies, daß es im Bereich des Unendlichen eine unendliche Hierarchie von Mächtigkeiten gibt. Speziell ist die Menge R der reellen Zahlen mächtiger als die Menge der natürlichen Zahlen. Allgemeiner gilt nach dem Satz von Cantor : Für jede Menge A ist die Potenzmenge PA mächtiger als A.
Von besonderer Bedeutung sind all diejenigen Mengen, die gleichmächtig mit der Menge N sind. Diese Mengen werden abzählbar unendlich genannt, weil
Definitionen
17
man ihre Elemente mit Hilfe der natürlichen Zahlen “durchnumerieren” kann. Sei A eine abzählbar unendliche Menge; dann dient die existierende Bijektion f : N → A als Abzählung oder Numerierung der Elemente von A: (43)
A = {f (0), f (1), f (2), . . . , }
Jedes Element a ∈ A erhält wegen der Surjektivität von f eine Nummer, und keine zwei Elemente erhalten dieselbe Nummer, wegen der Injektivität von f . Also gibt es genau ein n ∈ N mit a = f (n). Man schreibt A dann meist als Menge mit indizierten Buchstaben, also statt (43): (44)
A = {a0 , a1 , a2 , . . . , }
mit an = f (n) für alle n ∈ N. Eine Menge heißt abzählbar , wenn sie endlich oder abzählbar unendlich ist; im ersten Fall kann sie durch endlich viele Zahlen numeriert werden, im zweiten Fall durch alle (natürlichen) Zahlen. Hier sind einige wichtige Beispiele von abzählbar unendlichen Mengen, wobei wir an dieser Stelle auf eine Begründung verzichten: (45)
1.4
a.
die Menge der geraden Zahlen
b.
die Menge der ungeraden Zahlen
c.
die Menge der ganzen Zahlen
d.
die Menge der Primzahlen
e.
die Menge der Zahlen größer als 1000
f.
die Menge der geordneten Paare natürlicher Zahlen
g.
die Menge der rationalen Zahlen
h.
die Menge der geordneten Paare einer abzählbar unendlichen Menge
i.
die Menge der n-Tupel einer abzählbar unendlichen Menge
j.
die Menge der endlichen Ketten von Symbolen über einer abzählbaren Menge
Definitionen
Ein wichtiges Element wissenschaftlicher Methodologie ist das korrekte Definieren von Begriffen bzw. von Ausdrücken, die für die Begriffe stehen. In der Tradition unterschied man zwischen Realdefinitionen, die das Wesen der Gegenstände, die unter einen Begriff fallen, bestimmen sollten, und den Nominaldefinitionen, die mehr sprachorientiert die Bedeutung eines Ausdrucks durch die Angabe von schon bekannten anderen Ausdrücken charakterisieren. Eine einfache Nominaldefinition ist etwa die Bestimmung des Ausdrucks ‘Junggeselle’ durch ‘unverheirateter Mann’. In der Logik geht es vorrangig um die Definition von Ausdrücken. Wir werden uns später aber auch mit der Definierbarkeit von Gegenständen sowie Mengen und Relationen in einer Struktur durch die Audrucksmittel einer zu der Struktur passenden formalen Sprache oder Theorie beschäftigen. Dabei geht es aber nicht mehr um Wesensbestimmungen, sondern um den sprachlichen Zugriff (im
18
Elementares Handwerkszeug
Sinne von Charakterisierbarkeit) auf einen Gegenstand oder eine Relation in einem typischerweise unendlichen Individuenbereich. Es ist nämlich keineswegs ausgemacht, daß die Sprache stets reich genug ist, jedes Objekt in der Struktur auch eindeutig herauszugreifen. Ein paradigmatisches Beispiel für das Mißlingen einer solchen Charakterisierung ist der Begriff der arithmetischen Wahrheit, der in der Arithmetik selbst nicht definierbar ist; dies ist ein klassisches Resultat von Tarski, welches eng mit den Gödelschen Sätzen zusammenhängt. Ein zu definierender Ausdruck heißt allgemein das Definiendum, und der (meist komplexe) Ausdruck, der die definierende Bestimmung liefert, das Definiens. Wir stellen hier die wichtigsten Typen von Definitionsverfahren kurz vor und richten dabei unser Augenmerk besonders auf die in der Logik allgegenwärtigen “induktiven Definitionen”.
1.4.1
Explizite Definitionen
Die Nominaldefinitionen bilden den Ausgangspunkt für das Standardverfahren in der Definitionslehre, die explizite Definition. Sei α der zu definierende Ausdruck, also das Definiendum; dann müssen wir zunächst unterscheiden, von welcher syntaktischen Kategorie α ist. Steht α für einen Gegenstand d.h. ein Individuum (im logischen Sinn), so handelt es sich um einen Gegenstandsausdruck oder (Individuen-)Term; bezeichnet α dagegen einen Begriff oder eine Eigenschaft, so nennen wir α ein einstelliges Prädikat oder (etwas ungenau) selbst wieder einen Begriff oder eine Eigenschaft; ist α schließlich der Ausdruck für eine Relation zwischen zwei oder mehreren Gegenständen, so handelt es sich um einen Relationsausdruck oder kurz eine Relation. Die Anzahl n der Relata der Relation bestimmt ihre Stelligkeit und ebenso die von α. Wir haben also als verschiedene Kategorien von Definienda: • Gegenstandsausdrücke • Begriffe (einstellige Prädikate) • 2-stellige Relationen (Relationsausdrücke) • 3-stellige Relationen (Relationsausdrücke); und allgemein für alle n ∈ N: • n-stellige Relationen (Relationsausdrücke) Wir geben einige Beispiele für diese Kategorien. Zu den Gegenständen zählen alle Einzeldinge, konkret oder abstrakt, so etwa auch die Tage im Jahr oder reelle Zahlen. Bekanntlich fällt Ostern jedes Jahr auf einen anderen Tag; die folgende unter a) gegebene Term-Definition bestimmt das Datum des Ostertages. Unter b) ist eine Charakterisierung der Zahl π angegeben. (46)
a.
Der Ostertag ist der erste Sonntag nach dem ersten Frühlingsvollmond.
b.
π ist die Maßzahl für den Flächeninhalt des Einheitskreises.
Die Definientia bestehen hier aus den komplexen Ausdrücken ‘der erste Sonntag nach dem ersten Frühlingsvollmond ’ bzw. ‘die Maßzahl für den Flächeninhalt des Einheitskreises’, die wiederum beide Individuenterme sind. Wenn es sich um
19
Definitionen
mathematische oder logische Terme handelt, steht häufig das Gleichheitszeichen mit einem Doppelpunkt auf der Seite des Definiendum, zu lesen als “definitionsgemäß gleich”; z.B. können wir die obige Gleichung (6) schreiben, wenn wir betonen wollen, daß das Symbol‘N’ durch die rechts stehende Menge definiert wird: (47)
N := {0, 1, 2, 3, . . .}
Als nächstes betrachten wir die Definition von Begriffen durch einstellige Prädikate. Die eine Leerstelle eines Begriffs, die, um mit Frege zu sprechen, mit einem Gegenstand “gesättigt” werden muß, wird durch eine IndividuenVariable, etwa ‘x’, markiert. Wie im Fall der Terme müssen auch hier beide Seiten der Definition von der gleichen Kategorie sein, d.h. auch im Definiens darf nur die Variable x auftreten, und sie muß auch mindestens einmal auftreten. Ferner sind Definiendum und Definiens statt wie bei den Termen durch das Gleichheitszeichen jetzt durch ein Symbol für die Äquivalenz der links und rechts stehenden Ausdrücke verbunden, die jetzt syntaktisch schematische Aussagen in der Variablen x darstellen. Die Äquivalenz drücken wir informell durch die Abkürzung ‘gdw’ (für “genau dann wenn”) aus. Dann können wir zum Beispiel den Begriff des Junggesellen folgendermaßen definieren (unter b. ist die logische Form angegeben, mit dem später erklärten Bikonditional-Symbol für ‘gdw’): (48)
a.
x ist ein Junggeselle unverheiratet.
b.
J(x)
←→
gdw
x ist ein Mann und x ist
M (x) ∧ U (x)
Dagegen wäre es fehlerhaft, folgende “Definition” zu geben: (49)
a.
x ist ein Junggeselle mit y verheiratet.
b.
J(x)
←→
gdw
x ist ein Mann und x ist nicht
M (x) ∧ ¬Vh(x, y)
Links steht weiterhin ein einstelliges Prädikat, aber rechts ein zweistelliger Relationsausdruck. Mit der Stelligkeit wechselt also die syntaktische Kategorie, und damit wird die Definition inkorrekt. Wir halten fest: Regel Definiendum und Definiens müssen Ausdrücke von gleicher syntaktischer Kategorie sein. Ähnlich verfehlt wäre damit auch der folgende Definitionsversuch der zweistelligen Relation, Großvater von jemandem zu sein: (50)
a.
x ist Großvater von y oder Mutter von y.
b.
G(x, y)
←→
gdw
x Vater von z und z ist Vater
V (x, z) ∧ (V (z, y) ∨ M (z, y))
Auf der rechten Seite treten nämlich jetzt drei statt zwei verschiedene Variablen auf; wiederum passen die Kategorien von Definiendum und Definiens nicht zusammen. Allerdings enthält diese Bestimmung natürlich die richtige Idee, die Großvater-Relation mit Hilfe der Vater- und Mutter-Relation zu definieren: x
20
Elementares Handwerkszeug
ist Großvater von y, wenn x Vater einer Person z ist, die selbst Vater oder aber Mutter von y ist. Hier begegnet uns in dem Ausdruck ‘eine Person’ der oben schon angesprochene Existenzquantor. Wir müssen die dritte Variable z durch den Existenzquantor “abbinden”, wie man sagt. Das reduziert die dreistellige Relation in den Variablen x, y, z auf eine zweistellige Relation in den noch “freien” Variablen x, y. Das relevante Kriterium für die Stelligkeit einer Relation ist also nicht die Anzahl der in einem Ausdruck auftretenden verschiedenen Variablen, sondern nur die Anzahl derjenigen Variablen, die nicht durch einen Quantor gebunden sind. Korrekt lautet demnach die letzte Definition: (51)
a.
x ist Großvater von y gdw es gibt ein z so daß x Vater von z ist und z Vater oder Mutter von y.
b.
G(x, y)
←→
∃z [ V (x, z) ∧ (V (z, y) ∨ M (z, y)) ]
Übung 1.1 Geben Sie explizite Definitionen für die üblichen Verwandtschaftsbeziehungen. Definitionen dienen dazu, mit Hilfe bereits gegebener Begrifflichkeit neue Begriffe und Relationen zu definieren. Ohne Definitionen, die die Darstellung unseres Wissens entscheidend abkürzen und strukturieren, wäre Wissenschaft unmöglich. Bei der Vielzahl der zu treffenden Bestimmungen muß es allerdings vermieden werden, daß sich zirkuläre Definitionen einschleichen. Dies ist der Fall, wenn der Begriff B durch den Begriff B 0 und B 0 mit Hilfe von B definiert wurde. Ein Bespiel wäre die Erklärung der Großeltern-Relation durch die Enkel-Relation und umgekehrt. Definitionen müssen prinziell eliminierbar sein (d.h. alle Vorkommen des Definiendum müssen durch das Definiens wieder “verlustfrei” ersetzbar sein), da mit ihnen keine neuen Grundrelationen eingeführt, sondern lediglich bekannte Begriffe geeignet zusammengefaßt werden. Zirkuläre Definitionen sind nicht eliminierbar und damit unbrauchbar. Ferner sollen Definitionen in einer Theorie nicht dazu führen, dass mit ihnen Aussagen beweisbar werden, die ohne sie nicht aus der Theorie folgen. Dies ist das Kriterium der Nicht-Kreativität. Zusammen ergibt sich die weitere Regel Definitionen müssen die Kriterien der Eliminierbarkeit und der NichtKreativität erfüllen. Wir erwähnen noch kurz zwei weitere Typen von Definitionen, die in speziellen Zusammenhängen auftreten. Es kann zum Beispiel sein, dass mit Hilfe einer Definition die Bedeutung eines Ausdrucks spezifiziert werden soll, der syntaktisch von keiner der oben genannten Kategorien ist. Ein wichtiges Beispiel ist der bestimmte Artikel in der Sprache, dessen syntaktische Kategorie (ein so genannter Determinator ) in der üblichen Prädikatenlogik keine Entsprechung besitzt. In der formalen Kennzeichnungstheorie führt man nun ein Symbol ‘ι’ für den Artikel ein, erklärt aber seine Bedeutung “im Kontext” einer ganzen Aussage als Definiendum, welche dann durch ein Definiens bestimmt wird, welches ebenfalls eine Aussage darstellt und in dem das ι-Symbol nicht mehr auftritt. Ein solches Definitionsschema heißt Kontext- oder Gebrauchsdefinition. Ein weiterer Zusammenhang, in dem von Definitionen die Rede ist, ist die Bestimmung eines Begriffs durch eine Anzahl von Axiomen, wie dies in den axiomatischen Theorien geschieht. Wichtigstes Beispiel ist die Mengenlehre, in
21
Definitionen
der der Mengenbegriff durch die mengentheoretischen Axiome implizit charakterisiert werden soll. Die Angabe von Axiomen für einen Begriff wird daher auch manchmal implizite Definition genannt. Das Hauptproblem bei dem Verfahren der axiomatischen Charakterisierung besteht allerdings darin, daß die zentralen Beispiele mathematischer Theorien, wie die Peano-Arithmetik PA und die ZFMengenlehre, den Bereich der Objekte, die unter die Begriffe der natürlichen Zahl bzw. der Menge fallen, nicht bis auf Isomorphie eingrenzen kann. PA etwa besitzt neben dem Modell mit den intendierten Standardzahlen 0, 1, 2, . . . auch unendlich viele verschiedene Modelle mit “Nicht-Standardzahlen”, welche “größer” als alle normalen Zahlen sind. Die Ausdruckskraft von PA reicht nicht aus, um derartige “pathologische” Zahlen auszuschließen. Die Definition von Begriffen durch die Aufstellung von Axiomen ist also von ganz anderer Natur als die üblichen Definitionen.
1.4.2
Induktive Definitionen und Beweise
Von dem Mathematiker Leopold Kronecker stammt der vielzitierte Ausspruch: “Die natürlichen Zahlen hat Gott gemacht, alles andere (in der Mathematik) ist Menschenwerk.” Wenn wir diesen Gedanken aufnehmen, so können wir uns fragen, auf genau welche Weise Gott die Zahlen wohl erschaffen hat. Dabei kommen vor allem zwei grundlegend verschiedene Verfahren in Betracht. Nach dem einen erzeugte Gott in einem einzigen gewaltigen Schöpfungsakt die unendliche Gesamtheit der Zahlen sozusagen auf einen Schlag. In dem anderen Verfahren erschuf er zunächst eine Anfangszahl, die Null ‘0’; anstatt nun die anderen Zahlen der Reihe nach zu erschaffen, setzte er einen Prozeß P der folgenden Art in Gang: findet P eine Zahl vor, so soll P an die Zahl einen Strich ‘|| ’ anhängen, wobei das Resultat dann ebenfalls als Zahl gelten soll. Auf diese Weise entstehen Zeichenfolgen der Gestalt: 0, 0||, 0||| , 0|||| , 0||||| , . . . Zeichenfolgen gleicher Länge werden identifiziert, oder es wird von ihnen eine ausgewählt, welche die Zahl dieser Gestalt repräsentiert. Ist auf diese Weise eine beliebige Zahl n mit der Zahlzeichenfolge n gegeben, so werde die um einen Strich längere Zahlzeichenfolge n_ | mit n + 1 bezeichnet. Wir führen dann die üblichen Zahlennamen ein und schreiben: 0 1 2 3 4 ... n+1
:= := := :=
0+1 0+1+1 0+1+1+1 0+1+1+1+1 ...
:= := := := := :=
0 0|| 0||| 0|||| 0||||| ... n_ |
Es liegt intuitiv auf der Hand, daß der Prozeß P in eine endlose Schleife gerät. Sein Output wächst über alle Grenzen und kommt erst “im Unendlichen” zum Stillstand. Man sagt, P besitze einen Fixpunkt im Unendlichen. Nun könnte es sein, daß sich im platonischen Himmel Objekte unter die Zahlen mischen, die nicht aus dem Prozeß P hervorgegangen sind, etwa folgendermaßen: 0, 0||, 0||| , ♠, 0|||| , ℵ, ♥, 0||||| , . . .
22
Elementares Handwerkszeug
Um das zu verhindern, muß Gott explizit deklarieren, dass nichts eine Zahl sein soll, das nicht aus dem Prozeß P hervorgegangen ist. (Eine entsprechende Bestimmung heißt in der Informatik prosaisch “garbage out”.) Wir zeichnen damit unter den möglichen Fixpunkten im Unendlichen den kleinsten aus. Wir haben nunmehr die drei Ingredientien einer induktiven Definition der natürlichen Zahlen beieinander: (i) das Ausgangsmaterial , (ii) den Erzeugungsprozeß , sowie (iii) die Abschlußbedingung. Wir definieren also: Definition 1.1 Induktive Definition der natürlichen Zahlen: 1. 0 ist eine natürliche Zahl; 2. ist n eine natürliche Zahl, so ist auch n + 1 eine natürliche Zahl; 3. nichts sonst ist eine natürliche Zahl. Die so definierte Gesamtheit enthält genau die Elemente der oben eingeführten Menge N, welche nämlich gerade die Zahl 0 enthält und mit jeder Zahl n auch ihren Nachfolger n + 1. Die Abschlußbedingung garantiert, daß N auch die kleinste Menge mit dieser Eigenschaft ist. Man kann daher in der Mengenlehre induktive Definitionen stets durch eine explizite Definition ersetzen. Im vorliegenden Fall ist N der Durchschnitt aller Mengen X, für die gilt (i) 0 ∈ X und (ii) wenn n ∈ X so auch n + 1 ∈ X. In Symbolen: \ N = {X | 0 ∈ X & für alle n : wenn n ∈ X so n + 1 ∈ X}
Die Mengenklammer enthält das Ausgangsmaterial und den Erzeugungsprozeß. Die Abschlußbedingung entspricht der Durchschnitt-Operation, die gerade den kleinsten Fixpunkt des Erzeugungsprozesses liefert. Auf diese Weise wird der Anschein von Zirkularität, den induktive Definitionen an sich haben, beseitigt. Die induktive Definition ist eines der grundlegenden Instrumente der formalen Logik. Eine große Anzahl der logischen Begriffe ist induktiv definiert, allen voran z.B. der Begriff der (wohlgeformten) Formel einer logischen Sprache, etwa der Prädikatenlogik.
Angenommmen nun, wir wollten eine Behauptung Φ beweisen, die sich auf den Begriff der natürlichen Zahl, also auf alle Zahlen bezieht. Dann gibt es wiederum zwei Wege, dies zu bewerkstelligen. Man könnte zunächst wie in der Mathematik üblich ansetzen: “Sei n eine natürliche Zahl”, und schematisch. d.h. unter Absehung von den zufälligen Eigenschaften spezieller Zahlen, die Aussage Φ für n beweisen. So könnte Φ etwa lauten: (i) Für alle Zahlen n gilt: wenn n gerade ist, so ist n durch 2 teilbar. Das ist natürlich eine ziemlich triviale Behauptung, da die geraden Zahlen genau so definiert sind. Aber hier soll ja nur das Schema erläutert werden. Wir geben uns also eine Zahl n vor, die zugleich gerade ist; nach Definition kann n dann in der Form n = 2m geschrieben werden, wobei m eine andere natürliche Zahl ist. Wir sehen, daß sich nach Division durch 2 die Zahl m ergibt und kein Rest bleibt; also ist die Behauptung bewiesen. Wir können uns aber auch die induktive Definition der natürlichen Zahlen zunutze machen und den Beweis von Φ folgendermaßen führen: (i) wir beweisen Φ für die Zahl 0; (ii) wir nehmen an, wir hätten Φ bereits für ein beliebiges n gezeigt, und weisen unter dieser Annahme Φ für n + 1 nach. Dann pflanzt sich der Beweis gemäß des obigen Erzeugungsprozesses P von jeder Zahl auf seinen
23
Definitionen
Nachfolger fort, und da nach der Abschlußbedingung nichts sonst eine Zahl ist, werden auch alle Zahlen erfaßt. Ein solches Beweisverfahren heißt mathematische oder auch vollständige Induktion. Der Schritt (i) (in Symbolen: Φ[0]) heißt der Induktionsanfang, Schritt (ii) (halbformal: für alle n gilt, falls Φ[n], so auch Φ[n + 1] ) der Induktionsschritt, und die Annahme in Schritt (ii) (also Φ[n]) Induktionsvoraussetzung, üblicherweise mit ‘I.V.’ abgekürzt. Die Aussage, daß nach der Durchführung dieser beiden Schritte die Behauptung für alle Zahlen bewiesen ist, wird Induktionsprinzip genannt und kann in voller symbolischer Form wie folgt geschrieben werden: (52)
Φ[0] ∧ ∀n (Φ[n] → Φ[n + 1]) → ∀n Φ[n]
(IND)
(“Gilt die Eigenschaft Φ für 0, und folgt für alle Zahlen n, daß, wenn Φ für n gilt, dann auch Φ für n+1 gilt, so gilt Φ für alle n.”) Wird dieses Prinzip in der formalen Sprache der Arithmetik formuliert, so ist es das zentrale Beweisinstrument unter den von Peano angegebenen Axiomen der Arithmetik. Wir wollen als Anwendungsbeispiel eines Induktionsbeweises die bekannte Gaußsche Summe betrachten. Lemma 1.1 Für alle natürlichen Zahlen n gilt: n (n + 1) 2 Beweis. Die Formel Φ[n] im Induktionsprinzip ist im vorliegenden Fall die behauptete Gleichung, so wie sie dasteht. Der Induktionsanfang ist trivial: für n = 0 sind die linke und die rechte Seite der Gleichung 0. (Genaugenommen muß die linke Seite vorher als 0 festgesetzt werden; man verifiziert aber ebenso leicht, dass die Gleichung für n = 1 gilt.) Für den Induktionsschritt nehmen wir Φ[n] als I.V. an und müssen Φ[n + 1] beweisen; die Behauptung lautet also: 1+2+... +n
=
1 + 2 + . . . + n + (n + 1)
=
n+1 (n + 2) 2
Das ergibt sich mit folgender einfacher Umformung, bei der natürlich arithmetische Tatsachen benutzt werden, welche in der Peano-Arithmetik beweisbar sind. 1 + 2 + . . . + n +(n + 1) = | {z }
n (n + 1) + (n + 1) 2
I.V.
n + 1)(n + 1) 2 n+2 (n + 1) 2 n+1 (n + 2) 2
= (
= =
24
1.5
Elementare Handwerkszeug
Zeichentheoretische Grundbegriffe
Die Wissenschaft von den sprachlichen oder auch nicht-sprachlichen Zeichen heißt Semiotik . In ihrem Mittelpunkt steht die Bezeichnungsrelation, d.h. die Beziehung zwischen einem Zeichen und dem, wofür das Zeichen steht oder was es bedeutet. Die Bezeichnungsrelation ist von so großer Allgemeinheit, daß sie nicht nur in so verschiedenartigen Disziplinen wie der Logik und Informatik, der Philosophie, der Psychologie, den Sprachwissenschaften, den Literaturwissenschaften, der Ethnologie und der Anthropologie Gegenstand theoretischen Interesses ist; auch innerhalb jeder der genannten Wissensgebiete läßt die Relation Raum für die verschiedenartigsten Deutungen. Wir können an dieser Stelle nur einige Bemerkungen zur Stellung der Zeichen-Beziehung an der Schnittstelle zwischen Logik und Philosophie machen, um zumindest den sprachphilosophischen Kontext anzudeuten, aus dem heraus die Logik ihre zeichentheoretischen Abstraktionen entwickelt hat. Zugleich soll damit darauf hingewiesen werden, daß das logische Instrumentarium ein wesentliches Hilfsmittel für sprachphilosophische und allgemeiner zeichentheoretische Untersuchungen ist. Die Semiotik gliedert sich traditionellerweise in drei Teilgebiete: Syntax, Semantik und Pragmatik. Die Syntax beschreibt die Regeln, nach denen aus gewissen Grundausdrücken korrekte komplexe Ausdrücke und Sätze einer Sprache gebildet werden. Ein solches Regelwerk ist in der Grammatik einer Sprache niedergelegt. Zum Beispiel bilden in vielen Sprachen ein Eigenname als Subjekt und ein Verb als Prädikat einen grammatikalischen Satz, etwa Maria schläft. Nun werden sprachliche Ausdrücke einer natürlichen Sprache verwendet, um sich auf Dinge in der Welt zu beziehen und etwas mitzuteilen; dazu müssen die Ausdrücke eine Bedeutung haben. Die Beschreibung der Beziehung zwischen den sprachlichen Ausdrücken und ihrer Bedeutung ist die Aufgabe der Semantik . Die einfachste semantische Beziehung ist die Namensbeziehung zwischen einem Eigennamen und dem Träger dieses Namens, z.B. zwischen dem Namen ‘Gödel’ und dem Logiker, der die Unvollständigkeit der Arithmetik entdeckt hat. Rückt man dagegen den kommunikativen Aspekt von Sprache in den Mittelpunkt und untersucht die ziemlich komplizierten Beziehungen, aufgrund derer die Äußerung eines sprachlichen Ausdrucks in einem gegebenen Kontext eine sprachliche Handlung darstellt, die zugleich eine bestimmmte Wirkung erzielen kann, so begibt man sich auf das Gebiet der Pragmatik . Wenn ich z.B. in einer bestimmten Situation den Satz es ist kalt hier äußere, dann ist der semantische Gehalt dieses Satzes eine Aussage über die Temperatur an dem Ort, an dem ich mich befinde; ich kann damit aber auch eine unter Umständen erfolgreiche Sprachhandlung vollziehen, nämlich die Aufforderung an einen Anwesenden, das Fenster zu schließen. Die Pragmatik untersucht die Funktionsweise solcher Sprachhandlungen, die in einer Sprachgemeinschaft konventionell geregelt ist. Eine natürliche Sprache ist als Instrument sprachlicher Kommunikation einer Sprachgemeinschaft historisch gewachsen und als solche immer schon gedeutet oder interpretiert, d.h. mit einer festen Semantik und Pragmatik versehen. Natürlich sind die semantischen und pragmatischen Beziehungen einem historischen Wandel unterworfen und weisen in der Regel auch eine gewisse Variation von einem Sprecher zum nächsten auf. Genau genommen müßte man also die Bedeutung von sprachlichen Ausdrücken auf einen festen Sprecher zu einem gegebenen Zeitpunkt beziehen. Dies sei im folgenden immer vorausgesetzt, wenn die formale Logik zur “natürlichen Logik” der Sprache in Beziehung
25
Zeichen
Signifikation S
R Abbildung 1.11: Die Signifikationsbeziehung
gesetzt oder auf sie angewendet wird. Dieses Anwendungsgebiet der Logik heißt logische Sprachanalyse oder natürlichsprachliche Semantik .
1.5.1
Bedeutung und Referenz
Unser Ausgangspunkt ist die semiotische Grundbeziehung zwischen Zeichen und Bezeichnetem. Wegen ihrer vielfachen Deutbarkeit empfiehlt es sich, einen technischen Begriff für sie einzuführen, der jedoch noch neutral gegenüber den verschiedenen Deutungen ist; wir wollen von der Signifikationsbeziehung sprechen. Von dieser Relation selbst sind ihre Relata zu unterscheiden, d.h. die Objekte, die in einer gegebenen Version der Beziehung als Zeichen bzw. als Bezeichnetes auftreten können. Ohne zu viel Gebrauch davon machen zu wollen, führen wir die in der Sprachwissenschaft verwendeten technischen Begriffe Signifikant für das Zeichen und Signifikat für das Bezeichnete ein, werden aber weiterhin auch die deutschen Begriffe benutzen. Im Kontext der Philosophie wollen wir als Symbol für den Signifikanten den Buchstaben ‘S’ (von lat. signum) und für das Signifikat den Buchstaben ‘R’ (von lat. res) verwenden. Dann können wir die Signifikationsbeziehung, wenn auch in noch wenig aussagekräftiger Weise, wie in Abbildung 1.11 darstellen. Die folgende Liste gibt ohne Anspruch auf Vollständigkeit eine Vorstellung von der Vieldeutigkeit der Signifikationsbeziehung. In allen Verwendungen ist a der Signifikant und b das Signifikat. (53)
a.
a bedeutet b
b.
a steht für b
c.
a ist ein Name für b
d.
a bezeichnet b
e.
a denotiert b
f.
a weist hin auf b
g.
a ist ein Zeichen für b
h.
a ist ein Symptom für b
i.
a ist eine Metapher für b
j.
a ist ein Symbol für b
k.
a ist eine Allegorie von b
l.
a ist ein Bild von b
m.
a ist ein Abbild von b
n.
a ist ein Modell von b
26
Elementare Handwerkszeug
Signifikation
S
R Kausalbeziehung Abbildung 1.12: Natürliche Zeichen
o.
a repräsentiert b
p.
a bezieht sich auf b
q.
a nimmt Bezug auf b
r.
a referiert auf b
Übung 1.2 Finden Sie Beispiele für die Platzhalter ‘a’ und ‘b’ in der obigen Liste und diskutieren Sie Unterschiede in den verschiedenen Verwendungen der Signifikationsbeziehung. Die wichtigste Signifikationsbeziehung ist sicherlich die Bedeutungsrelation wie in (53a). Aber auch diese erlaubt die Verbindung von ganz unterschiedlichen Relata. Hier sind einige Beispiele. (54)
a.
‘exacerbate’ bedeutet ‘verschlimmern’.
b.
Die rote Ampel bedeutet HALT.
c.
Rauch bedeutet Feuer.
d.
Hitler bedeutet Krieg.
In (54a) sind Signifikant und Signifikat sprachliche Zeichen, jener ein Wort des Englischen, dieses seine deutsche Übersetzung. Aber es gibt auch “bedeutungstragende” nicht-sprachliche Zeichen. Sie werden üblicherweise in natürliche und konventionelle Zeichen unterteilt. Die rote Ampel in Beispiel (54b) erhält ihre semiotische Funktion durch eine Konvention der Straßenverkehrsordnung und ist damit ein konventionelles Zeichen. In (54c) ist der Rauch dagegen ein natürliches Zeichen für Feuer. Wichtig ist hier, daß die semiotische Beziehung vom Signifikanten zum Signifikat verläuft, während auf der Ebene der Dinge oder Phänomene eine kausale Verknüpfung genau in die umgekehrte Richtung weist, nämlich vom Signifikat zum Signifikanten: es ist das Feuer, welches Ursache für den Rauch ist. Und jemand, der etwa Anfang der Dreißiger Jahre den Satz (54d) äußerte, wolle vermutlich damit sagen, daß die auf einen neuerlichen Krieg zielenden gesellschaftlichen Tendenzen der Weimarer Republik das Phänomen Hitler hervorbrachten (obwohl hier schon weniger klar ist, wo die Ursache und wo die Wirkung liegt). Die Wechselbeziehung zwischen einem natürlichen Zeichen und seinem Signifikat ist in Abbildung 1.12 wiedergegeben. Die Idee des natürlichen Zeichens ist deshalb wichtig, weil schon bei Aristoteles4 die Bezeichnungsrelation zwischen einem Wort und einer Sache nicht 4 De
Interpretatione, Beginn.
27
Zeichen C
S
R Abbildung 1.13: Das semiotische Dreieck
direkt, sondern indirekt gedacht wurde, nämlich “vermittelt” über die Seele, in der eine Vorstellung von der Sache entsteht, welche das Signifikat des Wortes ist. Die Vorstellung kann dann als natürliches Zeichen des Gegenstandes aufgefaßt werden, wobei die Vorstellung oder der Sinneseindruck eine unwillkürliche, also “natürliche” Folge der Konfrontation mit dem Gegenstand ist. Wird das psychische Zwischenglied mit ‘C’ (von lat. conceptus, Begriff oder Vorstellung) bezeichnet, so ergibt sich die Grundstruktur des semiotischen Dreiecks, welches in der Folgezeit die sprachphilosophische Standardauffassung widerspiegelte. Das Mittelalter benutzte dazu die Wendung: Vox significat [rem] mediantibus conceptibus;5 siehe Abbildung 1.13. Bereits Aristoteles selbst unterscheidet die Art der Beziehung zwischen S und C von der zwischen C und R. Die letztere ist naturgegeben und bei allen Menschen gleich; sie läßt keinen Spielraum für konventionelle Festsetzungen. Dagegen zeigt die Verschiedenheit der menschlichen Sprachen, daß die Beziehung S → C durch keinen natürlichen Faktor determiniert ist und so Variationen unterworfen ist. Wie sich trotz dieses “Freiheitsgrades” Sprachgemeinschaften bilden, innerhalb derer die sprachlichen Zeichen keineswegs beliebig von Sprecher zu Sprecher variieren können oder dürfen, ist Gegenstand der Sprachphilosophie. Aristoteles benutzt für die Beziehung C → R den Begriff Abbild (griech. homoíoma), in dem das griechische Wort für ‘ähnlich’ (griech. homoíos) steckt. Der Signifikant C, die Vorstellung, wird also als dem Gegenstand ähnlich aufgefaßt. Dies beruht auf dem bekannten Vergleich, den Platon im Dialog Theätet bringt, nach dem die Seele wie eine Wachstafel ist, in der der Gegenstand einen “Abdruck” und damit ein ihm ähnliches Abbild hinterläßt. Dies führt eine besondere Komponente in die Signifikationsbeziehung ein, nämlich die der Repräsentation aufgrund einer Ähnlichkeitbeziehung zwischen Signifikat und Signifikant. In der Semiotik braucht diese Ähnlichkeit nicht auf einer direkten Bild-Beziehung zu beruhen; man kann auch von Repräsentation aufgrund einer abstrakteren strukturellen Ähnlichkeit sprechen. Diese allgemeine Struktur-Ähnlichkeit spielt speziell in der Logik eine wichtige Rolle; sie liegt dem Verhältnis von logischer 5 Die
sprachliche Äußerung bezeichnet die Sache, vermittelt durch die Begriffe.
28
Elementare Handwerkszeug C
S
R
Abbildung 1.14: Das semiotische Dreieck nach Locke
Syntax und modelltheoretischer Semantik und dem Verhältnis von Theorien zu ihren Modellen zugrunde. In der Psychologie spricht man von Assoziationen durch Ähnlichkeit, die sich an strukturellen Ähnlichkeiten entzünden können und, wie der Sprachwissenschaftler Roman Jakobson festgestellt hat, der Anlaß für einen Haupttypus semiotischer Beziehungen sind, dem der Metaphern oder allgemeiner (komplexer) Symbole wie etwa dem “Staatsschiff”-Symbol.6 Wir kehren zurück zum semiotischen Dreieck. In ihm steht ‘S’ auf jeden Fall für ein sprachliches Zeichen. Aufgrund der aristotelischen Vorgabe entwickelte sich folgendes philosophisches Bild: die Beziehung der sprachlichen Bedeutung besteht zwischen dem Zeichen S, etwa einem Wort, und den Vorstellungen, Begriffen oder Ideen im Subjekt, mitgeteilt durch das Symbol C im Dreieck; die Beziehung zwischen C und R dagegen war vielleicht ein Problem der Erkenntnistheorie, aber wegen seines natürlichen Chrakters keines der konventionell geregelten sprachlichen Bezugnahme. Der Sachbezug oder, wie man heute sagt, die Relation der Referenz zwischen S und R, galt als von der ersten Beziehung “mitgeliefert”. So spricht der britische Empirist John Locke etwa davon, daß das eigentliche und unmittelbare Signifikat der Wörter die ideas, also die Vorstellungen seien. Sprache ist nach Locke in erster Linie dazu da, die Gedanken einer Person mitzuteilen. Abbildung 1.14 veranschaulicht diese Auffassung durch ein “deformiertes” semiotisches Dreieck: Vor diesem Hintergrund versteht man besser die Kehrtwendung, die Russell in seinem ersten großen Buch The Principles of Mathematics 7 [213] mit seiner neuartigen Theorie der Denotation (engl. denoting) vollzog. Im Gegensatz zu Locke sah Russell die Beziehung zwischen Wort und Begriff als relativ unproblematisch an und hielt die Natur der Signifikationsbeziehung zwischen 6 Für die Logik weniger wichtig, wenngleich in einer anwendungsorientierten Sprachphilosophie durchaus von großer Bedeutung, sei der Vollständigkeit halber noch der andere Typ semiotischer Beziehungen erwähnt, mit dem Jakobson den soeben genannten konstrastiert: es ist dies der Typus metonymischer Signifikation, der aufgrund von Assoziationen durch Kontiguität (“Nachbarschaft”) entsteht. Ein Beispiel aus der Rhetorik ist etwa der Stahl als Metonymie für einen Dolch. Das Phänomen ist jedoch von größerer anthropologischer Allgemeinheit; so lassen sich etwa die unbewußten Prozesse, die Freud in seiner Traumdeutung analysiert, mit dem Gegensatz von Assoziation durch Ähnlichkeit und durch Kontiguität korrelieren: dem ersten Typ entsprechen Identifizierung und Symbolisierung, dem zweiten Verschiebung und Verdichtung. 7 Diese Schrift ist zu unterscheiden von dem zusammen mit Whitehead verfaßten mehrbändigen Werk Principia Mathematica [263].
29
Zeichen C deno
tatio
S
n
R
Abbildung 1.15: Das semiotische Dreieck nach Russell
Begriffen und der Welt der Sachen für erklärungsbedürftig. In einer bekannten Passage sagt Russell: If I say “I met a man,” the proposition is not about a man: this is a concept which does not walk in the streets, but lives in the shadowy limbo of the logic-books. What I met was a thing, not a concept, an actual man with a tailor and a bank-account or a public-house and a drunken wife. ([213]:53)8
Die folgende Version des semiotischen Dreiecks in Abbildung 1.15 illustriert Russells Ansicht vom Verhältnis zwischen S, C und R. Zwar macht Russell durchaus einen Unterschied zwischen dem sprachlichen Ausdruck S und dem zugehörigen Begriff C; aber er geht von einer mehr oder minder evidenten Strukturgleichheit zwischen S und C aus, so daß er sich häufig nicht die Mühe macht, die beiden auseinanderzuhalten. Die philosophisch wichtigere Beziehung besteht für ihn zwischen den Ausdrücken oder Begriffen einerseits und der Welt anderseits.9 Eine andersartige Umdeutung des semiotischen Dreiecks nahm Frege in der Schrift Über Sinn und Bedeutung [76] vor. Er wandte sich gegen die psychologische Interpretation der oberen Ecke C im Sinne von subjektiven Vorstellungen einer einzelnen Person und setzte an ihre Stelle eine logische Interpretation, eine von konkreten Personen unabhängige intersubjektive Instanz, deren Struktur durch die Logik bestimmt ist. Frege nannte das den Sinn eines Ausdrucks. Zum Beispiel ist der Sinn einer Aussage der Gedanke, den die Aussage ausdrückt. Der Sinn des Wortes ‘Abendstern’ hängt mit der Art und Weise zusammen, wie der Himmelskörper beschrieben wird, auf welchen man sich mit diesem Wort bezieht, nämlich daß er (zu gewissen Zeiten) am Abendhimmel erscheint. Der Sinn des Wortes ‘Abenstern’ ist demnach verschieden von dem Sinn des Wortes ‘Morgenstern’, auch wenn es sich um ein und dasselbe Objekt handelt, den Planeten Venus. Frege spricht davon, daß die Venus die Bedeutung von ‘Abendstern’ wie auch ‘Morgenstern’ sei, daß diese beiden Namen also bedeutungsgleich sind, 8 “Wenn ich sage ‘Ich traf einen Mann’, dann ist das keine Aussage über den Bestandteil einen Mann: der ist nämlich ein Begriff, welcher nicht auf der Straße spaziert, sondern im Schattenreich der Logik-Bücher lebt. Was ich traf, ist ein Ding und kein Begriff, ein realer Mann mit einem Schneider und einem Bankkonto oder einer Kneipe und einer betrunkenen Frau.” [Übersetzung G. L.] 9 Diese erste und noch ziemlich unfertige Theorie der Denotation aus den Principles hat Russell später modifiziert, ohne jedoch den Vorrang der Denotationsbeziehung zu revidieren. Der locus classicus ist sein Aufsatz von 1905, ‘On Denoting’ [214].
30
Elementare Handwerkszeug
jedoch einen verschiedenen Sinn haben. Jeder sprachliche Ausdruck steht also nach Frege in zwei verschiedenen Signifikationsbeziehungen, der Sinn-Relation und der Bedeutungsrelation. Unser Dreieck sieht jetzt wie in Abbildung 1.16 aus. Frege interessiert sich nicht mehr für die psychologisch oder auch erkenntnistheoretisch wichtige Beziehung der “Affizierung” der Seele durch den Gegenstand R, die nach der alten Auffassung Anlaß für die Bildung des Begriffs C ist. Er dreht die Richtung der Relation endgültig um und spricht von einer rein logischen Beziehung zwischen Sinn und Bedeutung: die Bedeutungsrelation identifiziert die Bedeutung eines Ausdrucks; der Sinn beinhaltet die zusätzliche Information, auf welche Weise die Bedeutung identifiziert wird. Dadurch legt der Sinn die Bedeutung fest. Die Verwendung des Begriffs der Bedeutung bei Frege gibt Anlaß zu Verwechlungen. Üblicherweise bezeichnet man in etwa das, was Frege mit ‘Sinn’ meint, als ‘Bedeutung’ eines Ausdrucks. Die Fregesche Bedeutung eines Ausdrucks dagegen wird heute allgemein Sachbezug oder Referenz (engl. reference) genannt. Die Ausdrücke ‘der Abendstern’ und ‘der Morgenstern’ sind also nicht bedeutungsgleich, aber koreferentiell , d.h. sie beziehen sich auf dasselbe Objekt. Dieser Zusammenhang ist in Abbildung 1.17 dargestellt. Was hier “Referenz” genannt wurde, trägt genauer die Bezeichnung semantische Referenz . Diese Signifikationsbeziehung besteht zwischen einem sprachlichen Ausdruck und seinem Sachbezug, oder, wie wir auch in Anlehnung an Russell sagen werden, seinem Denotat. Vom diesem Referenzbegriff ist in der Sprachphilosophie der Begriff der Sprecher-Referenz zu unterscheiden, die eine Sprachhandlung darstellt, mit der ein Sprecher sich auf ein Objekt bezieht. z.B. indem er mit einer Zeige-Bewegung auf einen Gegenstand hinweist (“Ostension”). Wir können auf diese Thematik hier nicht eingehen. Stattdessen sei noch kurz erwähnt, wie das Fregesche Signifikationsmodell in der neueren Sprachphilosophie und philosophischen Logik rekonstruiert wurde. Als wichtigster Autor ist hier Rudolf Carnap mit seiner Schrift Meaning and Necessity zu nennen. Der Gedanke der Vermittlung der Referenz eines Ausdrucks durch seine Bedeutung (den Fregeschen Sinn) wird dahingehend präzi-
Sinn leg
tf
us
es
a kt
üc
dr
t
bedeutet
S
Bedeutung
Abbildung 1.16: Das semiotische Dreieck nach Frege
31
Zeichen Bedeutung von a
Bedeutung von b
b = der Morgenstern Refe
renz
a = der Abendstern
Referenz
Venus
Abbildung 1.17: Bedeutung und Referenz
siert, daß man sagt, man kenne oder erfasse die Bedeutung eines Ausdrucks, wenn man in jeder gegebenen Situation angeben kann, worauf sich der Ausdruck in der Situation bezieht, was also in dieser Situation seine Referenz ist. Ein bekanntes Beispiel ist der Ausdruck der Gewinner , etwa der Gewinner einer Wahl oder eines sportlichen Wettkampfs. Jederman in diesem Land wird sagen können, was es heißt, Gewinner eines Fußballspiels zu sein: es muß sich um eine Mannschaft von 11 Spielern handeln, die einen Ball nach gewissen Regeln in das Tor einer gegnerischen Mannschaft zu treiben versucht, und zwar mit einer um mindestens ein Tor höheren Erfolgsquote als der Gegner; die Spielregeln legen dabei den Typ von Situation fest, der als “Tor” zählt. Dagegen wäre ich z.B. nicht in der Lage zu sagen, wer der Gewinner eines amerikanischen Baseball-Spiels ist. Auch der genaue Abstimmungsmodus bei der Wahl des amerikanischen Präsidenten ist sicher nicht allgemein bekannt. Die meisten Zeitgenossen sind zwar in der Lage, den Gewinner der Präsidentschaftswahlen zu identifizieren, d.h. sie kennen die Referenz dieses Ausdrucks, aber nur, weil sie glauben, was die Medien sagen; im allgemeinen kennen sie jedoch seine Bedeutung nicht, weil sie nicht exakt den Typ von Situation beschreiben können, der einen Kandidaten zum Gewinner der Wahl macht. Ganz ähnlich läßt sich das Fregesche Beispiel vom Morgenstern und Abendstern behandeln. Ich kenne die Bedeutung des Ausdrucks ‘der Morgenstern’, wenn ich in jeder (geeigneten) Situation die Referenz des Ausdrucks dadurch bestimme, indem ich nach jenem hellen Himmelskörper am Morgenhimmel Ausschau halte. Daß eine analoge Bedeutungsregel für den Ausdruck ‘der Abendstern’ zu demselben Objekt als seiner Referenz führt, ist ein durchaus kontingenter Sachverhalt. Kennt jemand also die Bedeutung eines Ausdrucks und ist zusätzlich mit einer Situation konfrontiert, so ist er oder sie in der Lage, die Referenz anzugeben. Formal gesprochen kann man damit die Bedeutung eines Ausdrucks als eine Funktion auffassen, die jeder Situation die Referenz des Ausdrucks in dieser Situation zuordnet. Das gibt die Fregesche Idee wieder, daß die Bedeutung die Referenz festlegt, da durch eine Funktion bereits jeder ihrer Funktionswerte bestimmt ist.
32
Elementare Handwerkszeug
Wir sprachen bisher hauptsächlich von Ausdrücken, die Dinge, Objekte oder, wie wir auch allgemeiner sagen werden, Individuen bezeichnen. Eine weitere grundlegende syntaktische Kategorie von Ausdrücken ist die der Aussagesätze oder kurz Sätze. Sätze sind typischerweise wahr oder falsch; die elementarste semantische Beziehung neben der Namenrelation, und in der Aussagenlogik in der Tat auch die einzige, ist damit die zwischen ganzen Sätzen und ihrem Wahrheitswert. Man sagt, ein Satz denotiere bei einer gegebenen Interpretation seinen Wahrheitswert. Damit ist der Wahrheitswert die Referenz von Sätzen. Schon Frege bemerkte, daß die semantische Deutung eines Satzes durch seinen Wahrheitswert wenig informativ ist; ein Wahrheitswert gibt fast nichts vom Inhalt des Satzes wieder. Deshalb sagte Frege, daß ein Satz zwar seinen Wahrheitswert bezeichnet (dieser also seine Frege-Bedeutung ist), daß jedoch der Inhalt des Satzes sein “Sinn”, hier also sein Frege-Sinn sei. Ersetzen wir ‘Sinn’ und ‘Bedeutung’ nach der obigen Vereinbarung durch ‘Bedeutung’ bzw. ‘Referenz’, so ist zunächst wie gesagt die Referenz des Satzes sein Wahrheitswert. Wie aber ist der Begriff der Satzbedeutung zu explizieren? Die Carnapsche Antwort gleicht formal derjenigen im Fall der Individuenausdrücke: man kennt die Bedeutung eines Satzes, wenn man für jede Situation sagen kann, ob er in dieser Situation wahr oder falsch ist. Wiederum kann man die Bedeutung des Satzes als eine Funktion auffassen, die allen (geeigneten) Situationen seine Referenz, also den Wahrheitswert, in dieser Situation zuordnet. Diese Funktionsauffassung von Bedeutung ist der Kern der sog. intensionalen Logik . Der Name rührt daher, daß auch bereits die philosophischen Tradition bei Begriffen zwischen ihrem Inhalt oder der Intension und ihrem Umfang oder der Extension unterschied. Nun korreliert man den Inhalt eines Begriffs mit seiner Bedeutung und den Umfang mit seiner Referenz. Wiederum kann man Beispiele für umfangsgleiche Begriffe geben, deren Inhalt verschieden ist, etwa Lebewesen mit Herz und Lebewesen mit Niere. Der Umfang eines Begriffs ist eine Menge von Individuen, während sein Inhalt wiederum als Funktion modelliert werden kann, die für jede Situation seinen Umfang bestimmt. Wir wollen genauer statt von Begriffen von den zugehörigen sprachlichen Ausdrücken, den Prädikaten, sprechen. Dann können die Grundobjekte der intensionalen Logik wie in Tabelle 1.1 zusammmengefaßt werden. Die Bezeichnungen Proposition für ‘Satzbedeutung’, Individuenkonzept für die Bedeutung von Namen sowie Eigenschaft für die Bedeutung von Prädikaten10 sind der einschlägigen Literatur entnommen. Die intensionale Logik wird uns vor allem im Kapitel über die Modallogik begegnen. In der modallogischen Semantik spricht man in Anlehnung an die metaphysische Terminologie von Leibniz statt von Situationen von möglichen Welten. Danach sind die Intensionen von Ausdrücken Funktionen, die jeder möglichen Welt die Extension des Ausdrucks in dieser Welt zuordnen.. Zum Beispiel modelliert die intensionale Logik den Begriff der Proposition als Funktion von der Menge der möglichen Welten in die zwei Wahrheitswerte ‘wahr’ und ‘falsch’. Die letzte Version unseres Dreiecks in Abbildung 1.18 zeigt die Grundbeziehungen der semantischen Signifikation in der intensionalen Logik. Es sei angemerkt, daß das Fregesche Modell, nach dem die Bedeutung die Referenz funktional bestimmt, in der heutigen Sprachphilosophie auf grundlegende Kritik gestoßen ist. Hat diese Kritik Bestand, so sinkt damit auch der 10 Genauer:
von sog. einstelligen Prädikaten; siehe unten.
33
Zeichen
syntaktische Kategorie
Denotat Referenz Umfang Extension
Bedeutung Inhalt Intension
Satz
Wahrheitswert
Proposition
Name
Individuum
Individuenkonzept
Prädikat
Menge von Individuen
Eigenschaft
Tabelle 1.1: Signifikate in der intensionalen Logik
philosophische Wert seiner mathematischen Modellierung durch Funktionen in der intensionalen Logik. Diese Problematik ist hier jedoch nicht das Thema; unser Ziel ist es inter alia, das nötige logisch-mathematische Rüstzeug für die philosophische Diskussion zur Verfügung zu stellen. In den nächsten Kapiteln wird ausschließlich von der klassischen Logik die Rede sein. Sie kommt gänzlich ohne Intensionen aus und heißt daher auch extensionale Logik . Von all diesen verschiedenen Signifikationsrelationen wird in der klassischen Logik nur die semantische Referenz- oder Denotationsbeziehung verwendet. Wenn unten weiterhin von “Bedeutung” die Rede ist, so ist diese Denotat-Relation gemeint, sofern nicht ausdrücklich auf eine andere Verwendung hingewiesen wird. Ihr wichtigster und zugleich paradigmatischer Spezialfall ist die einfache Namenrelation (siehe unten). Sie ist das Muster der direkten, unvermittelten Beziehung zwischen logischer Syntax und logischer Semantik. Die Denotat-Relation ist logisch gesehen nichts anderes als eine funktionale Zuordnung, die einen Ausdruck mit genau einem Denotat, seinem semantischen Wert versieht. Diese Beziehung ist vollkommen konventionell , d.h. “beliebig” oder “arbiträr” 11 Es besteht also kein “innerer Zusammenhang” mehr zwischen einem Ausdruck und seinem semantischen Wert. Auch durch Gewohnheit vertraute “ikonische Beziehungen” zwischen einem Symbol und seiner Bedeutung sind jederzeit durch neue Festsetzungen revidierbar. So kann etwa, wie in der Einleitung angesprochen, das Pluszeichen der arithmetischen Addition uminterpretiert werden als eine Operation auf Mengen. Es ist daher jeweils genau darauf zu achten, was in einem gegebenen logischen Kontext mit einem Symbol gemeint ist. Die prinzipielle Beliebigkeit der logischen Symbole gilt speziell auch für die Sprache, in der wir über die Logik sprechen, die sog. Metasprache, d.h. hier die deutsche Sprache, die mit einer Vielzahl von speziellen Symbolen für unsere logischen Untersuchungen angereichert ist. Man spricht allgemein von der verwendeten logischen Notation; sie variiert in der Literatur beträchtlich. Das 11 Die Logik stellt eine konsequente und radikale Realisierung der sprachwissenschaftlichen Maxime der “Beliebigkeit des Zeichens” (l’arbitraire du signe) dar, wie es bei de Saussure heißt; vgl. [53].
34
Elementare Handwerkszeug Bedeutung / Intension
aus
t leg
drü
t
ckt
fes
S denotiert
Referenz / Extension
Abbildung 1.18: Das semiotische Dreieck der intensionalen Logik
bedeutet jedoch nicht, daß feste Vereinbarungen über ihre Verwendung nicht sinnvoll sind. Ganz im Gegenteil werden wir uns im folgenden um eine möglichst einheitliche Symbolik und ihre (einigermaßen) konsequente Einhaltung bemühen. Dies hat jedoch vor allem mnemonischen Zweck. Die hier gewählte Symbolik versucht sich zwar an übliche Verwendungsweisen in der logischen Literatur zu halten; bei der Lektüre anderer logischer Texte hat man sich dennoch stets zunächst der gewählten Notation zu vergewissern.
1.5.2
Die Namenrelation What’s in a name? That which we call a rose By any other name would smell as sweet. Shakespeare, Romeo and Juliet
Die einfachste semiotische Beziehung ist die Namenrelation zwischen einem sprachlichen Namen und seinem Namensträger. Namen sind konstante Individuenbezeichnungen, d.h. feste Namen von Dingen in der Welt. Wir lassen als Namen hier nicht nur Eigennamen zu, sondern auch zusammengesetzte Bezeichnungen wie ‘der Morgenstern’ oder ‘der Bundeskanzler’. Bekannte Dinge haben Namen, wie Personen, Gebäude, Städte, Länder, Amtsinhaber, Ämter, Töne, Figuren, Zahlen und Mengen. Aus dieser Aufzählung geht hervor, daß nicht nur konkrete Dinge wie Personen Namen haben, sondern auch abstrakte Objekte wie Zahlen und Mengen. Dabei ist nicht ausgemacht, wo genau der Übergang von den Konkreta zu den Abstrakta erfolgt; manchmal kommt es dabei auf die “Lesart” an. So ist einerseits etwa der deutsche Bundeskanzler eine Person (konkret); aber ohne die staatsrechtliche Kodifizierung des Amtes (abstrakt) hat der Kanzler nicht die Befugnisse, die ihn gerade zum Kanzler machen. In dem Satz ‘der Bundeskanzler bestimmt die Richtlinien der Politik ’ kann der Ausdruck ‘der Bundeskanzler ’ einerseits die Person des Kanzlers oder auch den
Zeichen
35
“Typ” Bundeskanzler bezeichnen, dem es unabhängig vom konkreten Amtsinhaber laut Verfassung zukommt, die Richtlinien der Politik zu bestimmen.12 Allgemeiner gesprochen läßt sich unterscheiden zwischen einem konkreten Einzelobjekt oder Einzelereignis, für das ein Name steht (ein sog. Token) und dem gemeinsamen Typ von Objekt oder Ereignis, auf den sich ein Name beziehen kann. Betrachten wir zum Beispiel die Benennung von Tönen, d.h. von gewissen Klang-Ereignissen. So kann es sich etwa bei dem Kammerton a0 einmal um einen konkreten Klang handeln, der zu einem bestimmten Zeitpunkt auf einem Instrument erzeugt wird (“jetzt gibt die Oboe den Ton A vor”); in diesem Fall spricht man auch von dem (Klang-)Token des Kammertons zu jenem Zeitpunkt. Oder der Typ des Kammertons ist gemeint, der durch das Merkmal “440 Hertz” gekennzeichnet ist. Steht nun der Name ‘ a0 ’ des eingestrichenen A für den Typ oder das einzelne Token? Es liegt nahe, mit ‘ a0 ’ den Typ zu meinen, der jedes Mal, wenn ein Symphonieorchester beginnt die Instrumente zu stimmen, von der Oboe durch ein entsprechendes Klangtoken realisiert wird. In der Logik kümmert man sich in der Regel stets um Typen statt um konkrete Token. Ein nominalistisch gesinnter Philosoph könnte jedoch bestrebt sein, die Bezugnahme auf abstrakte Objekte wie Typen zu vermeiden und lediglich konkrete Token in seiner Ontologie anzuerkennen. Ein solches Projekt erfordert jedoch große logische Sorgfalt. Das Beispiel der Töne leitet zu einem für die Logik wichtigen Fall über, in dem auch Wörtern und Ausdrücken Namen gegeben werden, die natürlich selbst wieder Ausdrücke sind. Hier ergibt sich dieselbe Ambiguität zwischen Typ und Token: sollen die Namen der Ausdrücke deren Typ oder deren Token bezeichnen? Die Token sind hier konkrete Inschriften, d.h. eine bestimmte Ansammlung von Druckerschwärze in einem Buch oder ein Haufen von Kreide an einer Tafel, etwa Token für den Typ des ersten Buchstabens im lateinischen Alphabet. Die Schriftsprache hat für Ausdrücke eine Art “Standardnamen” entwickelt, der aus dem Ausdruck selbst, eingerahmt von zwei Anführungszeichen, besteht. Eine solche Anführung wird dabei als eine Operation auf Typen verstanden: sowohl der anzuführende Ausdruck und das Ergebnis, sein Standardname, sind Typen. Zur Technik der Anführung siehe unten. In der Logik werden Namen, sofern sie nicht zusammengesetzt sind oder als nicht weiter analysierbar aufgefaßt werden, als deskriptive Ausdrücke und daher als Konstanten behandelt. Namen von Individuen werden also zu Individuenkonstanten. Beispiele sind etwa der Zahlenname ‘Null’ oder der Planetenname ‘Merkur’. Der Ausdruck ‘der Morgenstern’ wird wegen seiner festen Verwendung als Beiname des Planeten Venus ebenfalls als Konstante aufgefaßt, obwohl er von der Gestalt eines definiten Nominalausdrucks der Form ‘der F ’ ist. Solche Ausdrücke heißen Kennzeichnungen (engl. definite descriptions). Kennzeichnungen können einen reichen deskriptiven Gehalt besitzen, wie etwa die folgende: der englische Philosoph, der ein Buch über die deutsche Sozialdemokratie verfaßte, einen Widerspruch in der Cantorschen Mengenlehre entdeckte und damit zum Mitbegründer der modernen Logik wurde, als Pazifist im Ersten Weltkrieg ins Gefängnis kam, eine Reformschule gründete, den Nobelpreis für Literatur erhielt, als Aktivist 12 Im Kontext der intensionalen Logik wird dieser Typ häufig als Individuenkonzept aufgefaßt.
36
Elementare Handwerkszeug gegen die atomare Bedrohung und später gegen den Vietnamkrieg Stellung bezog, Chruschtschow und Kennedy in der Kubakrise mit Telegrammen zur Vernunft zu bringen versuchte und insgesamt über 60 Bücher schrieb
In der reinen Prädikatenlogik wird auch solch ein komplexer Ausdruck als eine einfache Individuenkonstante, d.h. wie ein Name (hier: “Russell”) behandelt, wobei sein deskriptiver Gehalt unanalysiert bleibt. Man kann die Prädikatenlogik jedoch um eine Theorie der Kennzeichnungen erweitern, in der die Logik solcher Ausdrücke beschrieben wird. Auf eine solche Theorie wird an späterer Stelle eingegangen. Hier sei nur noch auf ein Problem hingewiesen, welches sich schon bei den reinen Namen stellt, aber bei der Analyse von Kennzeichnungen noch dringlicher wird: das Problem von Denotationslücken. Wir verwenden z.B. fiktive Namen wie ‘Pegasus’ und ‘Sherlock Holmes’, obwohl sie kein wirkliches Objekt bezeichnen; ihnen entspricht also gar kein Namensträger, die Namenrelation hat hier eine Lücke. Dieser Sachverhalt stellt ein Anwendungsproblem für die Prädikatenlogik dar, in der denotationslose Konstanten nicht zugelassen sind. Während man fiktive Namen vielleicht als logisches Randproblem ansehen kann, ist dies bei den Kennzeichnungen nicht so leicht möglich, dies deshalb, weil diese Terme keiner vorgegebenen (endlichen) Liste entstammen, sondern in unbegrenzter Länge und Zahl beliebig syntaktisch erzeugt werden können, wie unser Beispiel andeutet. Insbesondere hat man im Voraus keine Kontrolle darüber, ob die Objektbeschreibung, die eine Kennzeichnung liefert, ein eindeutig bestimmtes Individuum herausgreift oder nicht. Beispiel: Ob der Ausdruck ‘der Altbundespräsident’ denotiert oder nicht, hängt zu jedem gegebenen Zeitpunkt davon ab, wieviele lebende Personen das Amt des Bundespräsidenten innehatten; sowohl die Existenz- als auch die Einzigkeitsbedingung kann verletzt sein. In der Theorie der Kennzeichnungen müssen also für die Denotationslücken spezielle Vorkehrungen getroffen werden. Während in der Logik bestimmte mehr oder minder technisch motivierte Festsetzungen getroffen werden, um Probleme mit der Namenrelation in den Griff zu bekommen, ist die Thematik von Namen und Kennzeichnungen und der Art und Weise, wie Sprecher sich mit ihrer Hilfe auf die Welt beziehen, ein Hauptgebiet der modernen Sprachphilosophie; für eine exzellente Einführung siehe [176]. Sind alle Ausdrücke Namen? Doch aus der Höhle rief da zurück Polyphemos der Starke: “Freunde! Keiner will mich mit List oder Stärke ermorden.” Sie aber sprachen erwidernd und sagten geflügelte Worte: “Wenn dich Einsamen wirklich keiner mit Kraft überwältigt, Dann bist der Krankheit des großen Zeus du unrettbar verfallen! Geh und bete du lieber zum Herrscher und Vater Poseidon!” Sagtens und gingen. Homer, Odyssee
Zum Schluß dieses Abschnitts sei noch kurz die Frage der möglichen Universalität der Namenrelation angesprochen. Sind alle sprachlichen Ausdrücke Namen von etwas, oder können sie es zumindest sein? Dies ergäbe ein sehr uniformes Bild von semantischer Bedeutung, das zumindest vom logischen Standpunkt
37
Zeichen
aus gewisse naheliegende Vorteile hätte. Genauso wie sich auf der syntaktischen Ebene die Ausdrücke zu immer komplexeren Ausdrücken kombinieren lassen, könnten sich unter der namensuniversalistischen Prämisse die semantischen Denotate aller so entstehenden Ausdrücke in völliger struktureller Uniformität zur Syntax auf der Bedeutungsebene zu komplexen Bedeutungen aufbauen lassen. Diese strukturelle Deckungsgleichheit von Syntax und Semantik wird als (striktes) semantisches Kompositionalitätsprinzip bezeichnet. Wer das namensuniversalistische Projekt realisieren will, darf allerdings nicht beliebig naiv an die Sache herangehen. Eine Illustration der Fallstricke, die dabei lauern, liefert schon die Odyssee, in der Odysseus dem Kyklopen Polyphem als seinen Namen “Keiner” angibt, mit den soeben zitierten Folgen. Neueren Datums ist die apokryphe englische Geschichte von den vier “Personen” Everybody, Somebody, Nobody und Anybody, die sich nicht auf die gemeinsame Arbeit verständigen können. WHO DONE IT ! Once upon a time, there were four people named Everybody, Somebody, Nobody and Anybody. When there was an important job to be done, Everybody was sure that Somebody would do it. Anybody could have done it, but Nobody did it. When Nobody did it, Everybody got angry because it was Everybody’s job. Everybody thought that Somebody would do it, but Nobody realized that Nobody would do it. So it ended up that Everybody blamed Somebody when Nobody did what Anybody could have done in the first place. Die Moral aus dieser Geschichte ist, daß wenn alle Ausdrücke der Sprache Namen sind, dann sind die Quantorenausdrücke einer Sprache, d.h. gerade Ausdrücke wie ‘jeder ’, ‘keiner ’, ‘mancher ’ jedenfalls keine Namen für Personen. Es sei jedoch erwähnt, daß es dennoch geeignete logische Mittel gibt, um den Quantoren eigene Denotate zuzuweisen, sie also als Namen aufzufassen. Die Idee dazu geht auf Leibniz zurück.13 Vom philosophischen Standpunkt aus ist das namensuniversalistische Unternehmen jedoch äußerst fragwürdig; es wäre mit der Entscheidung verbunden, neben den bekannten und ontologisch unstrittigen Individuenbezeichnungen auch Appellativa wie ‘Mensch’, Adjektive wie ‘groß ’ oder Relationsausdrücke wie ‘links-von’ als Namen für Entitäten aufzufassen. Damit stellt sich die Frage nach der Existenz von Allgemeinbegriffen oder Universalien als Teil unserer Ontologie. Der Namensuniversalismus führt damit zur “Reifikation von Universalien”. Wie schon in der Einleitung angesprochen, ist die Zulässigkeit dieses Schritts ein Hauptthema der traditionellen wie der modernen analytischen Ontologie (siehe z.B. [198],[7]). Für die Thematik der Anwendung der Logik auf die Philosophie sei hier lediglich festgehalten, daß sich der Namensuniversalismus trotz der angesprochenen strukturellen Einfachheit keinesfalls auf logische 13 Die konsequenteste Durchführung dieses Programms findet sich in Montagues Aufsatz Universal Grammar ([182], Kap. 7). Die Quantoren (hier: Nominalausdrücke, die Quantoren enthalten, wie ‘alle Menschen’) werden dabei als Namen für Eigenschaften zweiter Stufe aufgefaßt. Zu Montagues Sprachlogik siehe [161]. Mit der Idee der Zweitstufigkeit verwandt ist die Auffassung von Quantoren als Relationen zwischen Eigenschaften bzw. Prädikat-Extensionen; siehe dazu z.B. die Beiträge in [88].
38
Elementare Handwerkszeug
Tatbestände berufen kann, die eindeutig zugunsten dieser These sprechen. Die Logik ist ontologisch neutral und enthält keine metaphysischen Behauptungen. Es ist vielmehr die Form der Sprache, die zu philosophischen Thesen führen und häufig auch verleiten kann. Die Logik ist eher ein Instrument der Analyse und Diagnose, mit dessen Hilfe Probleme der Philosophie und anderer Wissenschaften genauer beleuchtet werden können.
1.5.3
Deskriptive und logische Ausdrücke; Variablen
In der formalen Logik werden nicht natürliche, sondern präzise definierte künstliche Sprachen untersucht. Diese werden zunächst als uninterpretiert aufgefaßt, d.h. als rein syntaktisches System, welches für verschiedene Anwendungen mit wechselnden semantischen Interpretationen versehen werden kann. Lediglich die Deutung der logischen Ausdrücke wird bei diesen verschiedenen Interpretationen festgehalten. Das Vokabular einer Logik, d.h. das Arsenal ihrer Grundausdrücke, besteht daher aus zwei Gruppen: den logischen Ausdrücken und solchen, deren Interpretation wechseln kann; letztere werden deskriptive Ausdrücke genannt. Sie stehen bereit, um die Objekte eines intendierten Anwendungsbereichs der Logik zu bezeichnen. In der Arithmetik oder mathematischen Analysis z.B. sind die deskriptiven Ausdrücke etwa Zahlausdrücke wie ‘0’ oder die Kreiszahl ‘π’, das Additionszeichen ‘+’ oder das Kleiner-oder-gleichSymbol ‘≤’. So können wir z.B. in der Analysis die Aussage ‘0 ≤ π’ formulieren. Innerhalb der gegebenen Anwendung ist diese Aussage konstant, d.h. sie enthält keine mathematischen Variablen wie etwa die algebraische Aussage ‘(x + y)2 = x2 + 2xy + y 2 ’. Daher werden die deskriptiven Ausdrücke auch deskriptive Konstanten genannt. Es besteht also unter den Symbolen der Logik eine Abstufung bezüglich ihrer Variabilität: Diejenigen Symbole, deren Bedeutung stets festgehalten wird, sind die logischen Konstanten. Die Bedeutung der deskriptiven Konstanten kann zwar von Anwendung zu Anwendung wechseln, aber innerhalb derselben Anwendung wird sie festgehalten. Die mathematischen Variablen schließlich sind auch innerhalb derselben Anwendung Platzhalter für wechselnde Deutungen. Dieselbe Unterscheidung kann auch für natürliche Sprachen getroffen werden. Das Vokabular einer natürlichen Sprache kann zu logischen Zwecken ebenfalls in zwei große Gruppen unterteilt werden. In der einen Gruppe befinden sich alle Wörter, die einen deskriptiven Gehalt haben, die also Objekte der Wirklichkeit entweder benennen oder beschreiben. Die meisten Wörter der Sprache sind von dieser Art, speziell die Eigennamen, auf die bereits eingegangen wurde; ihre Anzahl und ihre Bedeutung sind einem ständigen Wandel unterworfen. Die andere und eng begrenzte Gruppe von Wörtern umfaßt die Strukturausdrücke der Sprache. Ihre Zahl und Bedeutung ändern sich kaum im Laufe der Zeit; sie bestimmen den logischen Gehalt der Sprache. Wörter der ersten Gruppe heißen daher analog zur Logik deskriptive Ausdrücke, solche der zweiten Gruppe logische Ausdrücke. Wir vereinbarten oben, daß wir den historischen Wandel der Sprachbedeutungen ausklammern und also von konstanten Bedeutungen zu einem gegebenen Zeitpunkt und für einen gegebenen Sprecher ausgehen. Wir bezeichnen die deskriptiven Ausdrücke also auch in der natürliche Sprache als deskriptive Konstanten. Beispiele im Deutschen sind Namen wie ‘Mozart’, Appellativa wie ‘Pferd’, Verben wie ‘arbeiten’ und Adjektive wie ‘gesund’. Logische Ausdrücke des Deutschen sind z.B. ‘nicht’, ‘oder’, ‘jemand’, ‘keiner’. Die logi-
Zeichen
39
sche Sprachanalyse sieht zwar von den konkreten Bedeutungen der deskriptiven Ausdrücke der Sprache ab, aber sie korreliert in systematischer Weise die verschiedenen grammatischen Kategorien mit logischen Kategorien und ordnet den logischen Ausdrücken der Sprache geeignete logische Gegenstücke zu. Sie gelangt so zu der logischen Form von natürlichsprachlichen Sätzen. Das linguistisch als auch philosophisch wichtige Thema der logischen Form wird später genauer behandelt werden; hier sei anhand einfacher Beispiele kurz angedeutet, wie eine solche Korrelation aussieht. Zunächst seien die wichtigsten logischen Konstanten der formalen Logik genannt: a) die aussagenlogischen Verknüpfungen oder Junktoren ‘¬’ für ‘nicht’, ‘∧’ für ‘und’, ‘∨’ für ‘oder’ sowie ‘→’ für ‘wenn . . . dann’; ferner b) die Quantorenausdrücke der Prädikatenlogik, ‘∀’ (‘für alle’) und ‘∃’ (‘es gibt’). Schließlich fassen wir auch das Gleichheitssymbol ‘=’ für die Identitätsrelation als logische Konstante der Prädikatenlogik mit Identität auf. Die Aussagenlogik (kurz: AL) verknüpft Sätze, d.h. Aussagen, die wahr oder falsch sein können; diese sind die deskriptiven Konstanten der Aussagenlogik. Der Inhalt der Aussagen ist von Anwendung zu Anwendung verschieden und spielt daher in der Logik keine Rolle. Es kann sich dabei z.B. um Wetteraussagen wie ‘es regnet’ oder ‘es schneit’ handeln, oder um die Zusammenstellung einer Kabinettsliste (‘Lafontaine wird Finanzminister’, ‘Fischer wird Außenminister’). Die Logik setzt dafür Buchstabensymbole ein, die Satzkonstanten heißen. Die deskriptiven Ausdrücke der Aussagenlogik sind also die Satzkonstanten; sie sind die kleinsten Bausteine (die atomaren Sätze) von AL. Wenn z.B. in der Wetteranwendung ‘p’ für ‘es regnet’ und ‘q’ für ‘es schneit’ steht, dann ist der Ausdruck ‘p ∨ q’ eine Formel der Aussagenlogik, die für die Aussage ‘es regnet oder es schneit’ steht. Die Aussagenlogik gibt dann z.B. Antwort auf die Frage, welchen Wahrheitswert (wahr oder falsch) die Formel ‘p ∨ q’ in Abhängigkeit von den Wahrheitswerten seiner Bestandteile ‘p’ und ‘q’ erhält. Die Antwort lautet, daß die Formel wahr ist, wenn mindestens einer der beiden Teile wahr ist; sie erscheint uns selbstverständlich, da die Bedeutung des Junktors ‘∨’ aus der “Logik der Sprache” herausgefiltert wurde. Allerdings stellt sie insofern eine Normierung der Bedeutung des umgangsprachlichen ‘oder’ dar, als sie stets als das “einschließende” ‘oder’ aufzufassen ist. Normierungen dieser Art spielen vor allem bei der Festlegung der Bedeutung des Konditionalpfeils ‘→’ eine Rolle. Die Prädikatenlogik (der ersten Stufe) (kurz: PL1 ) ist umfassender als die Aussagenlogik. Sie enthält alle aussagenlogischen Verknüpfungen, nimmt jedoch zwei Erweiterungen vor, die ihre Ausdruckskraft entscheidend vergrößern: (i) sie analysiert Ausdrücke unterhalb der Satzebene und gibt im wesentlichen die Subjekt-Prädikat-Struktur elementarer Aussagen wieder; und (ii) sie systematisiert die Logik genereller Aussagen, in denen Quantorenausdrücke auftreten. Punkt (i) führt analog zu den syntaktischen Kategorien der Sprache zu einer Aufteilung des deskriptiven Vokabulars von PL1 in die verschiedenen syntaktischen Kategorien der Prädikatenlogik, die Individuenterme und die Prädikatkonstanten verschiedener Stelligkeit. Punkt (ii) gestattet die logische Analyse quantifizierter Aussagen wie alle Menschen sind sterblich. Da in dieser Aussage über die Gesamtheit der Menschen gesprochen oder “quantifiziert” wird, man jedoch offensichtlich nicht für alle vergangenen und zukünftigen Menschen einen Namen parat hat, bedient man sich des logischen Mittels der Variablen, wie sie in der Mathematik verwendet werden. Das Hauptanwendungsgebiet der Logik ist ja auch bis heute die Mathematik unendlicher Bereiche, welche im Fall der
40
Elementare Handwerkszeug
reellen Zahlen sogar so groß werden können, daß selbst alle abzählbar unendlich vielen sprachlichen Ausdrücke zusammengenommen nicht ausreichen, um jedem Element eines solchen Bereichs einen eigenen Namen zu geben. Während die Aussagenlogik also neben den logischen Konstanten nur deskriptive Konstanten (die Satzkonstanten) enthält, kommen in der Prädikatenlogik zu den deskriptiven Konstanten der verschiedenen Kategorien noch Individuenvariablen für die Objekte der Bereiche, über die die Logik in ihren verschiedenen Interpretationen spricht, hinzu.14 Die Variablen von PL1 sind Platzhalter ohne eigene feste Bedeutung auch innerhalb ein und derselben semantischen Interpretation. Syntaktisch gesehen sind sie Individuenterme, da sie in denselben Positionen wie konstante Namen auftreten können. Sie können ebenso wie diese zusammen mit einer (einstelligen) Prädikatkonstante eine Formel, also einen wahrheitsfähigen Ausdruck von PL1 bilden. Wenn ‘v’ ein Symbol für Individuenvariablen ist und ‘k’ eines für Individuenkonstanten, sowie ‘p1 ’ ein Symbol für eine einstellige Prädikatkonstante, so sind die Ausdrücke ‘p1 k’ und ‘p1 v’ korrekt gebildete Formeln von PL1. Die erste Formel kann etwa für den Satz ‘2 ist eine Primzahl ’ oder für ‘Sokrates ist ein Mensch’ stehen,15 die zweite für die schematische Aussage ‘sie ist eine Primzahl ’ bzw. ‘er ist ein Mensch’. Da die natürliche Sprache keine mathematischen oder logischen Variablen enthält, wurden in den schematischen Aussagen (nicht gebundene) Pronomina an die Subjektstelle gesetzt, die in ihrer Verwendung den logischen Variablen am nächsten kommen. Auch sie sind Platzhalter, die im Gegensatz zu den deskriptiven Konstanten der Sprache keine feste Bedeutung haben, sondern in nicht gebundener Verwendung im jeweiligen Kontext der Äußerung auf verschiedene Objekte bezogen werden können. Im Gegensatz dazu liegt eine gebundene Verwendung des Pronomens z.B. in dem Satz ‘Wenn einer eine Reise tut, dann kann er was erzählen’ vor. Wird dieser Satz geäußert, so steht das Pronomen ‘er ’ nicht mehr für eine kontextuelle (externe) Deutung zur Verfügung; seine Rolle erschöpft sich in dem satzinternen Bezug, den es zu dem Quantorenausdruck ‘einer ’ herstellt. In ganz analoger Weise können auch die Individuenvariablen der Prädikatenlogik gebunden werden, und zwar durch die Quantoren ‘∀’ und ‘∃’. Zum Beispiel wird der Existenzquantor ‘∃’ zusammen mit dem Variablensymbol ‘v’ vor die Formel ‘p1 v’ gesetzt und erzeugt den Existenzsatz ‘∃vp1 v’, in unserem Beispiel zu lesen als ‘es gibt Primzahlen’ bzw. ‘es gibt Menschen’.
1.5.4
Objekt- und Metasprache; Mitteilungszeichen
Wir haben gesehen, daß die Sprache der Prädikatenlogik Variablensymbole enthält, um generelle Aussagen über einen Gegenstandsbereich machen zu können. Stellen wir uns nun vor, in einer der Anwendungen der Prädikatenlogik sei dieser Gegenstandsbereich selbst eine Logik, z.B. die Aussagenlogik. Die Prädikatenlogik würde dann als formalisierte Beschreibungssprache dienen, um Aussagen über die Formeln der Aussagenlogik zu machen. In diesem Fall 14 Der Zusatz “erste Stufe” für die Prädikatenlogik bezieht sich darauf, daß in der Logik PL1 nur Variablen der untersten Stufe, also Individuenvariablen, vorkommen, im Gegensatz zu Prädikatvariablen, welche Variablen höherer Stufe darstellen. 15 Typischerweise wird die Kopula ist bei der Formalisierung zu dem Prädikatausdruck geschlagen; ‘p1 ’ entspricht also nicht allein dem Nomen ‘Primzahl ’ bzw. ‘Mensch’, sondern dem Ausdruck ‘ist eine Primzahl ’ bzw. ‘ist ein Mensch’.
41
Zeichen
bildet die Aussagenlogik, das Objekt der Untersuchung, die Objektsprache, und die auf AL angewendete prädikatenlogische Beschreibungssprache die Metasprache. Jedesmal, wenn formale (oder auch natürliche) Sprachen zum Gegenstand der Untersuchung gemacht werden, entsteht dieses Verhältnis von Objekt- und Metasprache. Dabei ist es außerhalb gewisser technischer Zusammenhänge im Rahmen der Logik16 die Regel, daß die Metasprache nicht in formalisierter Form vorliegt. Normalerweise nimmt man einfach die natürliche Sprache her und reichert sie mit einem Vorrat von Variablen an, die entsprechend Metavariablen heißen. Da die natürliche Sprache ebenfalls die Mittel der Prädikation und Quantifikation enthält (die formale Logik ist ja eine Abstraktion aus der “natürlichen Logik”), hat sie mindestens die gleiche Ausdruckskraft wie die Prädikatenlogik und kann so bis auf deren standardisierte Form ihre Rolle einnehmen. Die Variablen der Metasprache werden z.B. gebraucht, um die syntaktischen Regeln der Aussagenlogik in allgemeiner Form zu beschreiben. Da dies eine ihrer Hauptverwendungen ist, werden sie auch syntaktische Variablen 17 genannt. Im folgenden wird für Metavariablen einheitlich der Ausdruck Mitteilungszeichen (kurz: MZ ) verwendet. Als Mitteilungszeichen für Formeln dienen die griechischen Buchstaben ‘φ’, ‘ψ’ und ‘χ’. Mit ihrer Hilfe kann man dann z.B. eine syntaktische Regel der Aussagenlogik formulieren, etwa die für das Konditionalzeichen ‘→’: (55)
Sind φ und ψ aussagenlogische Formeln, so ist auch (φ → ψ) eine aussagenlogische Formel.
Der schematische Bezug auf Ausdrücke einer gewissen Struktur (hier: Formeln, die die Gestalt eines Konditionals haben) ist nicht frei von bezeichnungstheoretischen Subtilitäten; mehr dazu unten. Hier soll noch eine übliche Bezeichnungsweise in der Syntax der Aussagenlogik erläutert werden, die prima facie unserer oben gemachten Behauptung zuwiderläuft, die aussagenlogische Sprache enthalte keine Variablen. Das, was hier ‘Satzkonstante’ genannt wird, heißt nämlich fast überall ‘Satzvariable’ oder ‘Aussagenvariable’ (engl. propositional variable). Streng genommen verhält es sich jedoch so: Da die reine Logik vollkommen gegenstandsneutral ist, gibt es praktisch keine Gelegenheit, eine spezifische Satzkonstante zu betrachten.18 Die Bezugnahme auf Satzkonstanten ist fast immer schematischer Natur, d.h. es werden Aussagen über beliebige Satzkonstanten gemacht. Dazu bedient man sich aber gerade der Mitteilungszeichen, die in ihrer Eigenschaft als metasprachliche Variablen ja Variablen sind; das sind die Aussagenvariablen. Nur gehören sie nicht zur Aussagenlogik selbst (der Objektsprache), sondern zur Metasprache. Um diesen Unterschied im Auge zu behalten, wird im folgenden eine feste Buchstabengruppe des lateinischen Alphabets für die Mitteilungszeichen der Satzkonstanten reserviert, nämlich die Großbuchstaben ‘P ’, ‘Q’, ‘R’ und ‘S’.19 Die Verwendung von Mitteilungszeichen ist nun aber weitaus umfassender. Was zur Bezugnahme auf Satzkonstanten gesagt wurde, gilt eigentlich überall in 16 Diese
ergeben sich z.B. bei den Gödelschen Unvollständigkeitsresultaten. allen in englischsprachigen Logik-Texten findet sich der Ausdruck syntactic variable. 18 Die einzigen Ausnahmen bilden die “logischen” Satzkonstanten Verum ‘>’ und Falsum ‘⊥’; siehe unten. 19 Dies weicht von der fast universellen Praxis ab, für Aussagenvariablen die entsprechenden Kleinbuchstaben ‘p’,‘q’,‘r’,‘s’ zu verwenden. Wenn der hier angesprochene Unterschied erst einmal klar erfaßt wurde, kann man problemlos zu der üblichen Notation zurückkehren. 17 Vor
42
Elementare Handwerkszeug
der Logik. Alle Namen von Ausdrücken, welche nicht gerade in einer konkreten logischen Theorie eine spezielle Bedeutung besitzen oder erhalten, werden schematisch verwendet. Für sie werden im folgenden durchgängig Mitteilungszeichen eingesetzt. So werden wir in der Prädikatenlogik statt der konkreten Individuenvariablen ‘v0 ’, ‘v1 ’, ‘v2 ’, . . . , welche selbst zur Objektsprache der Prädikatenlogik gehören, stets die für sie reservierten Mitteilungszeichen ‘x’, ‘y’, ‘z’ verwenden, und analog mit den anderen deskriptiven Konstanten verfahren. Ausdruck vs. Ausdruck-Schema Wir sagten, daß Mitteilungszeichen dem schematischen Bezug auf objektsprachliche Ausdrücke dienen. Wir heben hier den Unterschied zwischen Ausdrücken und Ausdruck-Schemata noch einmal hervor. Angenommen, wir wollen eine Aussage über eine konkrete20 Formel der Aussagenlogik machen, etwa die konditionale Verknüpfung der Satzkonstante mit dem Index 3 und der Disjunktion aus Satzkonstante mit dem Index 0 und der mit dem Index 4. Dann haben wir es mit einem festen Ausdruck zu tun, nämlich ‘(p3 → (p0 ∨ p4 ))’; da er nach den syntaktischen Regeln der Aussagenlogik korrekt gebildet wurde, ist dieser Ausdruck zugleich eine Formel. Interessieren wir uns dagegen nur für aussagenlogische Zeichenketten der genannten Gestalt mit einem Konditional als “Hauptzeichen”, und sehen von der konkreten Form der Ausdrücke links und rechts vom Pfeilsymbol ab, so können wir zwei Mitteilungszeichen ‘φ’ und ‘ψ’ verwenden und sie als syntaktische Platzhalter für die den Pfeil flankierenden Ausdrücke einsetzen. In diesem Fall haben wir es mit einem Ausdrucks- oder Formel-Schema zu tun. Der Unterschied zwischen Formeln und Formelschemata spielt in der Logik eine große Rolle. Zum Beispiel enthält die Peano-Arithmetik der ersten Stufe unendlich viele Axiome, die durch unendlich viele Instanzen eines einzigen Formelschemas, des Induktionsprinzips, entstehen. Dadurch kann man zwar die Peano-Axiome durch eine kleine Zahl von Zeichenketten notieren; der Einsatz des Induktionsschemas ist jedoch wesentlich, da man zeigen kann, daß keine endliche Anzahl von (nicht-schematischen) Axiomen zur Axiomatisierung ausreichen. Man sagt, die Peano-Arithmetik sei nicht endlich axiomatisierbar. Dasselbe gilt übrigens auch für die erststufige Axiomatisierung der Mengenlehre nach Zermelo-Fraenkel. Eindeutige Lesbarkeit von Zeichenketten Ein wesentliches Element der Zeichentheorie ist die Verknüpfbarkeit mehrerer Zeichen zu einer ganzen Kette, d.h. die Möglichkeit der Konkatenation von Symbolen. Ein wichtiges Kriterium für die korrekte Bildung solcher Ketten ist ihre eindeutige Lesbarkeit. Sie ist keineswegs automatisch garantiert. Beispiele für Fälle, in denen die eindeutige Lesbarkeit nicht gegeben ist, liefert etwa die Symbolisierung sprachlicher Laute durch das lateinische Standardalphabet. Im Deutschen sieht man z.B. dem Wort ‘Häschen’ nicht an, daß man es als ‘Häschen’ zu sprechen hat, im Gegensatz zu ‘Häscher’, das R‘Hä-scher’ gesprochen wird. Der Grund ist, daß der Zischlaut ‘sch’, phonetisch [ ], durch eine Zeichenkette mitgeteilt wird, die sich aus Buchstaben zusammensetzt, welche ihrerseits 20 ‘konkret’ hier im nicht-philosophischen Sinn; wir hatten oben gesagt, daß wir uns generell mit Typen von Zeichen und nicht ihren Token befassen.
43
Zeichen
einzeln und in einer Zweierkombination andere Laute bezeichnen, nämlich ‘s’ den s-Laut [s] und ‘ch’ den velaren Reibelaut [x]. Ein anderes Beispiel im Deutschen ist die Kombination ‘ei’, die einmal als Diphthong und das andere Mal als Folge der Laute [e] und [i] gesprochen wird (z.B. ‘be-inhalten’ vs. ‘(das) Bein halten’). Um nun die eindeutige Lesbarkeit der in der Logik auftretenden Zeichenketten zu garantieren, fordern wir, daß genau das soeben angesprochene Phänomen nicht auftreten kann. Dazu formulieren wir die folgende (56)
Bedingung der eindeutigen Lesbarkeit: Ausdrücke sind endliche Ketten von gewissen Grundsymbolen, von denen keines selbst eine Kette aus anderen Grundsymbolen darstellt.
In diesem Fall spricht man auch davon, daß die Ausdrücke aus den Grundsymbolen frei erzeugt seien. Dies sei im folgenden bei allen Ausdrücken der logischen Syntax vorausgesetzt. Metasprachliche Relationen und ihre Bezeichnung Wir treffen hier noch einige Vereinbarungen zur Symbolisierung metasprachlicher Beziehungen. 1. Metasprachliche Gleichheit. Wir werden häufig Gelegenheit haben, von der Gleichheit von Ausdrücken der Objektsprache zu sprechen, etwa in dem Sinne, daß eine Formel, die durch die Metavariable ‘φ’ mitgeteilt wurde, die gleiche Zeichenkette darstellt wie eine auf eine andere Art mitgeteilte Formel, typischerweise auf eine zusammengesetzte Art, die die Struktur der Formel erkennen läßt. In diesem Fall schreiben wir statt der metasprachlichen (also natürlichsprach. lichen!) Gleichheitsaussage ‘. . . ist derselbe Ausdruck wie - - -’ das Symbol ‘=’. Zum Beispiel lautet die semantische Regel für die Negation ausgeschrieben wie unter (57a) und bei Verwendung des metasprachlichen Gleichheitszeichens wie unter (57b). (57)
a.
b.
Wenn die Formel φ gleich der Formel ¬ψ ist, für eine gewisse Formel ψ (d.h. wenn φ die Gestalt einer negierten Formel hat), so ist φ genau dann wahr, wenn ψ falsch ist. . Wenn φ = ¬ψ, so ist φ genau dann wahr, wenn ψ falsch ist.
2. Metasprachliche Folgerung und Äquivalenz . Wenn eine metasprachliche Aussage Ψ aus einer anderen Aussage Φ folgt, so kürzen wir das häufig mit dem doppelgestrichenen Pfeil ab, also (58)
Φ =⇒ Ψ
für
“Ψ folgt aus Φ”
Gilt die Folgerung wechselseitig, d.h. sind die beiden Aussagen metasprachlich äquivalent, so schreiben wir den entsprechenden Doppelpfeil oder benutzen die Abkürzung ‘gdw ’: (59)
a. b.
Φ ⇐⇒ Ψ oder Φ gdw Ψ für: “Ψ dann und nur dann (genau dann) wenn Φ”
3. Metasprachliche logische Konstanten. Schließlich werden wir die metasprachliche Konjunktion auch mit das Zeichen ‘&’ und die metasprachliche Negation mit ‘non’ wiedergeben.
44
Elementare Handwerkszeug
1.5.5
Gebrauch und Erwähnung
Betrachten wir die folgenden Beispiele: (60) (61) (62)
a.
Konstantinopoulos ist einsilbig.
b.
‘Konstantinopoulos’ ist sechssilbig.
a.
Der Nil ist lang (ein langer Fluß).
b.
‘Nil’ ist kurz (ein kurzes Wort).
a.
die Bedeutung des Wortes ‘Bedeutung’
b.
the meaning of the word ‘Bedeutung’
In Satz (60a) wird der Eigenname ‘Konstantinopoulos’ gebraucht oder verwendet. Er steht für eine Person, der wir die Eigenschaft, einsilbig zu sein, zuschreiben (von Personen ausgesagt ist diese Eigenschaft natürlich metaphorisch gemeint). In (60b) wird dieser Name jedoch nur erwähnt: wir sagen nichts über den Träger des Namens aus, sondern über den Namen selbst. Genauso wie wir uns mit Hilfe von Namen auf Personen und Sachen beziehen, können wir auch über sprachliche Ausdrücke selbst, speziell z.B. Eigennamen, sprechen. In diesem Fall benötigen wir Namen von Ausdrücken, in unserem Beispiel einen Namen für einen griechischen Familiennamen. Wie oben bereits erwähnt, kann das im Prinzip auf vielerlei Weise geschehen; wir könnten etwa dem Namen ‘Konstantinopoulos’, weil er so lang ist, den kurzen Namen ‘Max’ geben. Das würde jedoch Anlaß zur Verwirrung geben, da ‘Max’ ein Name für eine große Zahl von Personen ist. Stattdessen treffen wir die Vereinbarung, das Namenswort in (einfache) Anführungsstriche zu setzen. Die neue Zeichenkette, also das linke Anführungszeichen, gefolgt von dem Namenswort, gefolgt von dem rechten Anführungszeichen, wird Anführungsname des Ausdrucks zwischen den Anführungszeichen genannt. Mit dem Anführungsnamen beziehen wir uns auf den Ausdruck (also in unserem Fall auf den Eigennamen ‘Konstantinopoulos’) und sagen etwas über ihn aus. Demnach behauptet Satz (60b) etwas Wahres, denn jener Name ist in der Tat sechssilbig. Derselbe Kontrast wird in Beispiel (61) angesprochen. Der Fluß Nil ist ein langer Fluß mit einem kurzen Namen. Sprechen wir über den Fluß, so gebrauchen wir seinen Namen, dürfen also keine Anführungsstriche setzen. Der Flußname in Anführungsstrichen, also sein Anführungsname ‘ ‘Nil’ ’ (hier wird der Anführungsname selbst erwähnt!) wird verwendet, um über den Flußnamen zu sprechen. Wir erwähnen also einen Ausdruck, indem wir seinen Anführungsnamen gebrauchen bzw. verwenden. Der Unterschied zwischen Gebrauch und Erwähnung führt in Beispiel (62) dazu, daß bei der Übersetzung des Ausdrucks unter a) ins Englische das Wort ‘Bedeutung’ innerhalb des Anführungsnamens nicht übersetzt werden darf. Das Wort, dessen Bedeutung thematisiert wird (zufällig das Wort ‘Bedeutung’ selbst), ist ein deutsches Wort, kein englisches. Der Ausdruck a) könnte in einer Abhandlung über die deutsche Sprache vorkommen, und nur dadurch, daß die Abhandlung ins Englische übersetzt wird, handelt sie nicht plötzlich vom Englischen. Daran sieht man, daß selbst wenn ‘Bedeutung’ im Deutschen dasselbe bedeutet wie ‘meaning’ im Englischen (was nur teilweise stimmt), diese Ausdrücke in den Anführungszeichen nicht füreinander ersetzt werden können.
45
Zeichen
Die Ersetzbarkeit oder Substituierbarkeit von Ausdrücken, die dasselbe bedeuten (genauer: bezeichnen), ist ein wichtiges logisches Prinzip, das normalerweise gilt. Wir könnten z.B. den Flußnamen ‘Nil’ in Satz (61a) durch den Ausdruck ‘der längste Fluß Afrikas’ ersetzen, und wir würden über denselben Gegenstand eine Aussage machen, die, wenn sie wahr ist, auch wahr bleibt: die Ersetzung erfolgt salva veritate. Dieses Prinzip ist in Anführungskontexten verletzt. Der Gebrauch von Anführungsnamen ist offensichtlich an die Schriftsprache gebunden. Üblicherweise werden doppelte Anführungszeichen verwendet, wo hier einfache gesetzt werden; häufig wird in Texten auch durch Hervorhebung angeführt, etwa durch Kursivschrift oder Absetzung im Satzspiegel. Ferner werden innerhalb eines Anführungskontextes mit doppelten Zeichen weitere Erwähnungen durch einfache Zeichen vorgenommen. Dabei erfüllen die doppelten Anführungsstriche noch andere Funktionen, so vor allem die Mitteilung direkter Rede, die des wörtlichen Zitats eines anderen Autors sowie der distanzierende Gebrauch der Begrifflichkeit anderer. In der gesprochenen Sprache müssen andere Mittel eingesetzt werden, um Ausdrücke zu erwähnen, z.B. Fügungen wie ‘das Wort . . . ’, ‘der Ausdruck . . . ’, etc. Übung 1.3 Setzen Sie in den Sätzen des folgenden Beispiels (63) korrekte Anführungszeichen. (63)
a.
Der Senator Cicero klagte einen Mann mit dem Namen Catilina an.
b.
Die Zahl π mißt den Flächeninhalt des Einheitskreises.
c.
π ist ein griechischer Buchstabe.
d.
Pi ist der 16. Buchstabe im griechischen Alphabet.
e.
Pi ist ein Wort mit zwei Buchstaben.
f.
Das Subjekt im vorigen Satz ist Pi.
Übung 1.4 Diskutieren Sie die Ausdrücke im Beispiel (64) unter dem Aspekt der Verwendung und Erwähnung. In welchen Fällen wird ausschließlich auf den erwähnten Ausdruck Bezug genommen? Was geschieht in den anderen Beispielen? (64)
a.
der Sieger von Trafalgar
b.
der Autor von Waverley
c.
das Wort ‘Frieden’
d.
das grammatische Prädikat “ist rot”
e.
the name of action (Hamlet 3.1)
f.
die Farbe Lila
g.
der Begriff Pferd
h.
der Begriff (der) Freiheit
i.
was das Regime “Demokratie” nennt
46
Elementare Handwerkszeug
Man kann auch ganze Sätze anführen und damit erwähnen. Ein wichtiger Kontext für die Erwähnung von Sätzen ist das Wahrheitsprädikat, sofern Wahrheit als eine Eigenschaft von Sätzen aufgefaßt wird, wie dies in der Logik meist geschieht; siehe Beispiel (65). Damit gehört das Wahrheitsprädikat von Aussagen einer gegebenen Objektsprache zur Metasprache.21 Speziell wird die Semantik der Aussagenlogik und Prädikatenlogik in der oben geschilderten informellen Metasprache beschrieben. √ (65) a. ‘ π = 2 ’ ist eine falsche mathematische Aussage. b.
‘Schnee ist weiß’ ist wahr genau dann, wenn Schnee weiß ist.
c.
Die Satzkonstante ‘>’ ist immer wahr.
Die Beziehung zwischen dem Gebrauch und der Erwähnung von Ausdrücken wird schließlich noch dadurch kompliziert, daß es Kontexte gibt, in denen ein Ausdruck gleichzeitig gebraucht und erwähnt wird. In Satz (66a) ist die Kennzeichnung ‘die Weltstadt mit Herz’ eine Name für die Stadt München; von dieser Stadt wird etwas ausgesagt. Also wird die Kennzeichnung verwendet. Trotzdem kann sie nicht einfach durch einen anderen Namen der Stadt, etwa ‘München’, ‘die bayerische Landeshauptstadt’ oder gar ‘die Hauptstadt der Bewegung’ ersetzt werden, ohne dem Satz einen anderen Sinn zu geben. Also wird jene Kennzeichnung nicht nur gebraucht, sondern zugleich erwähnt. Man beachte, daß es verfehlt wäre, den Ausdruck in Anführungszeichen zu setzen; dann würde er nämlich nur noch erwähnt, die Rede wäre von dem Ausdruck, und der Satz würde keinen Sinn geben. Analoges gilt von Satz (66b): der venezianische Maler Giorgio di Castelfranco trug den Beinamen “der Große” (Giorgio + -one, ein italienisches Augmentativ), weil er von stattlicher Statur war; wiederum ist die Rede von der Person, deren Name aber zugleich erwähnt wird. Aber auch der dritte Fall (66c) hat etwas von gleichzeitiger Verwendung und Erwähnung, obwohl Anführungsstriche, allerdings doppelte, distanzierende, gesetzt werden. Der Satz kann etwa wie unter (66d) paraphrasiert werden, wo Gebrauch und Erwähnung entzerrt sind. (66)
a.
Die Weltstadt mit Herz macht ihrem Namen keine Ehre.
b.
Giorgione wurde seiner Körpergröße wegen so genannt.
c.
Die Rückkehr zur “Normalität” hat begonnen.
d.
Die Rückkehr zu dem, was das Regime mit ‘Normalität’ bezeichnet, hat begonnen.
Zum Abschluß dieses Kapitels sei noch auf ein spezielles Problem bei der Erwähnung von komplexen Ausdrücken in der Logik eingegangen, deren innere Struktur man in der Mitteilung kenntlich machen will. Wir hatten oben bereits das Beispiel einer aussagenlogischen Formel φ, die die Gestalt einer negierten 21 In semantisch geschlossenen Sprachen, die ihre eigene Metasprache und damit ihr eigenes Wahrheitsprädikat enthalten — natürliche Sprachen sind von dieser Art — können Widersprüche auftreten, wie die in der Einleitung erwähnte Antinomie des Lügners (“ich lüge jetzt”) zeigt. Macht man die Wahrheitsproblematik nicht zum Gegenstand der Untersuchung, so folgt man in der Regel dem Tarskischen Ansatz, der durch die Trennung von Objektsprache und semantischer Metasprache die wahrheitstheoretischen Schwierigkeiten vermeidet; siehe dazu [250].
Zeichen
47
Formel hat, also mit dem Negationszeichen ‘¬’ beginnt. Der Rest der Formel möge mit dem Symbol ‘ψ’ mitgeteilt sein. Wenn ich jetzt versuche, mich auf diese negierte Gestalt in der Form ‘ ‘¬ψ’ ’ zu beziehen, dann verwende ich einen Anführungsnamen, in dem der erwähnte Ausdruck aus zwei Symbolen besteht, dem Negationszeichen ‘¬’ und dem griechischen Buchstaben ‘ψ’. Ich wollte aber gar nicht diesen Ausdruck mitteilen, sondern die Formel φ, die zwar ebenfalls mit dem Negationszeichen beginnt, aber dann folgt nicht der Buchstabe ‘ψ’, sondern der Ausdruck, den ‘ψ’ mitteilt. Um diesen Effekt zu erzielen, folgen wir einer Notation von Quine, die Quasi-Anführungen (engl. quasi-quotes) genannt werden. Die verwendeten Zeichen sind zwei hochgestellte und aufeinandergerichtete Ecken (die Quineschen “corners”), zwischen die der mitgeteilte Ausdruck tritt. Die korrekte Wahrheitsregel für negierte Formeln, wie sie in vorläufiger Form in Beispiel (57) angegeben wurde, lautet dann:22 (67)
Wenn die Formel φ die Gestalt p ¬ψq hat, so ist φ genau dann wahr, wenn ψ falsch ist.
Es stellt sich die Frage, warum ebenso wie der Ausdruck ‘¬ψ’ nicht auch die Mitteilungszeichen ‘φ’ und ‘ψ’ selbst in Quasi-Anführungszeichen gesetzt werden; auch hier sprechen wir ja nicht über die griechischen Buchstaben, sondern über das, was sie mitteilen. Es zeigt sich aber, daß in dem Fall, in dem ein Ausdruck durch ein einzelnes Symbol mitgeteilt wird, die Quasi-Anführung redundant wird. Die syntaktische Variable ‘φ’ ist ja bereits ein Zeichen der Metasprache, das ein (schematischer) Name für einen Ausdruck der Objektsprache ist; wir können sie also ohne Anführungszeichen verwenden und sprechen damit über den mitgeteilten Ausdruck. Das Setzen von Quasi-Anführungszeichen ist nicht falsch, aber nicht nötig. Das Setzen einfacher Anführungszeichen ist dagegen definitiv falsch. Wir werden zumindest in den Anfangskapiteln von dem Instrument der Quasi-Anführung häufigen Gebrauch machen. Später werden wir uns größere Laxheiten in der Anführungspraxis erlauben, mit dem stillschweigenden Verständnis, sich die korrekten Anführungszeichen hinzuzudenken. Dieser in der Regel unerwähnten Konvention folgen auch die meisten Autoren in der logischen Literatur.23
22 Das Beispiel (55) wäre ebenfalls entsprechend zu korrigieren; siehe dazu die Zusammenfassung im nächsten Unterabschnitt. 23 Es sei ferner darauf hingewiesen, daß die Ecken nicht selten für etwas gänzlich Verschiedenes stehen, nämlich für sog. Gödelnummern oder Gödelziffern, letzteres z.B. in [29]:221.
48
Elementare Handwerkszeug
1.5.6
Gebrauch und Erwähnung: Zusammenfassung
Man gebraucht oder verwendet einen Ausdruck, um seine Bedeutung (seine Referenz, sein Denotat) mitzuteilen; man erwähnt einen Ausdruck, um den Ausdruck selbst mitzuteilen. Das entsprechende englische Begriffspaar heißt use (gebrauchen) und mention (erwähnen). Beispiele. Verwendungen sind durch Kursivschrift, Erwähnungen durch Unterstreichung hervorgehoben. (68) (69)
(70)
Jack , genannt ‘the ripper’, hat wieder zugeschlagen. a.
Lagrange und Laplace haben etwas gemein.
b.
‘Lagrange’ und ‘Laplace’ haben etwas gemein.
a.
Die UNO ist eine internationale Organisation.
b.
‘UNO’ bezeichnet / steht für / ist ein Name für / ist eine Abkürzung für die Vereinten Nationen.
(71)
‘θ’ ist ein griechischer Buchstabe, während [ θ] ein griechischer Laut ist (hierbei steht ‘[θ]’ für den stimmlosen interdentalen Reibelaut).
(72)
Wenn der griechische Buchstabe ‘φ’ die Zeichenkette ‘(p3 → (p0 ∨ p4 ))’ mitteilt, dann ist φ eine AL-Formel.
Quasi-Anführungsstriche. Sie werden benutzt, um komplexe Zeichenketten-Schemata einer gewissen Struktur (z.B. negierte oder konjunktive Schemata) mitzuteilen. Es seien etwa φ und ψ Formeln der Aussagenlogik. Dann ist p (φ → ψ)q diejenige Zeichenkette, die mit ‘(’ beginnt (1), gefolgt von der Formel φ (2), gefolgt von ‘→’ (3), gefolgt von der Formel ψ (4), gefolgt von ‘)’ (5). Beispiel: ‘
(
(p0 ∧ p1 )
→
(p0 ∨ p1 )
)
’
p
(
φ
→
ψ
)
q
1
2
3
4
5
Speziell ist p αq gleich α für ein Mitteilungszeichen ‘α’. Als spezielles Zeichen für die (metasprachliche) Gleichheit von . Zeichenketten/Formeln/Ausdrücken wird vereinbart: ‘α = β’, zu lesen als: “der Ausdruck α ist derselbe wie der Ausdruck β ”, oder “die Symbole ‘α’ und ‘β’ teilen dieselbe Zeichenkette mit”.
Kapitel 2
Aussagenlogik 2.1
Logische Form I: Aussagenlogik
In der Einleitung wurde bereits darauf hingewiesen, daß es nicht die logische Form eines natürlichsprachlichen Satzes gibt, sondern daß sich je nach der Tiefe der logischen Analyse verschiedene logischen Formen ergeben. In diesem Abschnitt werden Sätze der Umgangssprache nur nach ihrer aussagenlogischen Struktur analysiert. Das Formalisierungsverfahren folgt den oben erwähnten Schritten der Herstellung einer Explizitfassung und der Übersetzung in die logische Zielsprache. Die logische Zielsprache ist hier die Aussagenlogik AL. Die mit der Erstellung der Explizitfassung einhergehende Standardisierung sei anhand einiger Beispiele erläutert. Sie betreffen der Reihe nach die aussagenlogischen Vernüpfungen der Konjunktion, Disjunktion, Negation, des Konditionals und des Bikonditionals.
2.1.1
Die logische Konjunktion
Die logische Konjunktion ‘und’ verknüpft zwei Sätze, denen in der Aussagenlogik Formeln entsprechen. In der Sprache steht die Konjunktion ‘und’ jedoch nicht nur zwischen ganzen Sätzen, sondern auch zwischen Ausdrücken gleicher Kategorie, die nicht die Kategorie des vollständigen Aussagesatzes ist. Beispiele sind ‘Peter und Anna’, ‘dirigiert und spielt das Soloinstrument’, ‘beliebt und erfolgreich’. Derartige sprachliche Konjunktionen sind in der Explizitfassung in Konjunktionen ganzer Sätze zu expandieren, wie etwa in den folgenden Beispielen: (1)
(2)
(3)
a.
Peter und Anna sind Studenten.
b.
Peter ist Student und Anna ist Student(in).
a.
Cäsar kam, sah und siegte.
b.
Cäsar kam und Cäsar sah und Cäsar siegte.
a.
Barenboim dirigiert und spielt das Soloinstrument.
b.
Barenboim dirigiert und Barenboim spielt das Soloinstrument.
49
50
Aussagenlogik
Nicht immer kann eine natürlichsprachliche ‘und’-Verknüpfung in dieser Weise paraphrasiert werden, z.B. dann, wenn das Prädikat des Satzes eine kollektive Eigenschaft ausdrückt:1 (4)
a.
Claudius und Laertes sind sich einig.
b.
*Claudius ist sich einig und Laertes ist sich einig.
Kollektive Aussagen bleiben also aussagenlogisch unanalysiert. Die Bedeutung des aussagenlogischen ‘und’ besteht (und erschöpft sich) darin, daß eine konjunktive Aussage ihre Wahrheit auf beide Teilsätze überträgt und umgekehrt. Das heißt, daß bei der Formalisierung alle sonstigen Bedeutungskomponenten des natürlichsprachlichen ‘und’ ignoriert werden. Zum Beispiel ist bei der Äußerung von konjunktiv verknüpften Sätzen häufig eine zeitliche und/oder ursächliche Reihenfolge mitgemeint, die die Vertauschbarkeit der Teilsätze verhindert; die Vertauschbarkeit oder Symmetrie ist aber gerade ein Kennzeichen der logischen Konjunktion, die sich aus ihrer soeben beschriebenen Bedeutung ergibt. So bedeuten die folgenden Sätze unter a) und b) etwas Verschiedenes, während ihre aussagenlogischen Übersetzungen äquivalent sind. (5)
a.
Das Flugzeug rammte den Berg und stürzte ab.
b.
Das Flugzeug stürzte ab und rammte den Berg.
Ferner werden andere koordinierende Satzverknüpfungen, etwa adversative Ausdrücke wie ‘aber’, ‘dennoch’, ‘gleichwohl’, in der Formalisierung als reine logische Konjunktionen behandelt: (6)
a.
Kent wird verbannt; dennoch bleibt er seinem König treu.
b.
⇒ Kent wird verbannt und Kent bleibt seinem König treu.
Eine letzte Gruppe grammatischer Konstruktionen, die konjunktiv expandiert werden können, sind attributive Phrasen, also adjektivische oder Relativsatzkonstruktionen wie in den folgenden Sätzen: (7)
(8)
a.
Mario ist ein blonder Italiener
b.
⇒ Mario ist Italiener und Mario ist blond.
a.
Die Zugspitze ist ein Berg, der fast 3000 m hoch ist.
b.
⇒ Die Zugspitze ist ein Berg und die Zugspitze ist fast 3000 m hoch
Allerdings muß einschränkend bemerkt werden, daß nur die semantisch einfachsten Adjektive, die sog. intersektiven Adjektive, eine solche Expansion zulassen. Adjektive sind intersektiv, wenn sie die Bedeutung der Nomenina durch Schnittbildung modifizieren; so ist ‘blond’ intersektiv, da etwa in unserem Beispiel (8) Mario im mengentheoretischen Durchschnitt der Menschen ist, die blond sind, und der Menschen, die Italiener sind, liegt. Viele Adjektive haben jedoch eine relationale Bedeutung, die von der Bedeutung des modifizierten Nomens abhängt und daher keine unabhängige Schnittmenge bestimmt. Beispiele sind: 1 Der
Stern vor einem natürlichsprachlichen Satz bedeutet, daß er ungrammatisch ist.
Logische Form (9)
a.
Jumbo ist ein kleiner Elephant.
b.
George ist ein intelligenter Boxer.
51
Zusammenfassend kann über die Bedeutung des logischen ‘und’ folgendes gesagt werden: (10)
Bedeutungsregel für die Konjunktion: Das logische ‘und’ ist eine symmetrische Satzverknüpfung, deren Bedeutung darin besteht, daß eine mit ihr gebildete Konjunktion ihre Wahrheit auf beide Teilsätze überträgt; sind umgekehrt beide Teilsätze wahr, so ist auch die aus ihnen gebildete ‘und’-Verknüpfung wahr.
Logische Namen für die logische Konjunktion sind ‘∧’, ‘&’ oder ‘.’; hier wird das erstgenannte Symbol verwendet.
2.1.2
Die logische Disjunktion
Während eine logische Konjunktion nur wahr ist, wenn beide Teilsätze wahr sind, reicht für die Wahrheit einer Disjunktion, also einer ‘oder’-Verknüpfung, bereits die Wahrheit eines Teilsatzes aus, wie aus den folgenden Beispielen sogleich klar wird. Auch das ‘oder’ kann Phrasen unterhalb der Satzebene verknüpfen; die obigen Bemerkungen zur Expansion in Satzverknüpfungen gilt hier entsprechend. (11)
a.
Der Brennerpaß ist offen oder der Reschenpaß ist offen.
b.
Maria singt oder spielt Querflöte.
c.
Fritz ist Deutscher oder Österreicher.
Der deskriptiven Ausdrücke im ersten und in zweiten Satz sind so gewählt, daß unser Weltwissen zuläßt, daß die Teilsätze auch beide zugleich wahr sein können, und bei einem passenden Staatsbürgerschaftsrecht auch der dritte. In der Logik ist die Bedeutung der Disjunktion in diesem nicht-ausschließenden Sinn normiert. Der systematische Grund dafür liegt in der Dualitätsbeziehung, den die Disjunktion bei dieser Festlegung zur logischen Konjunktion besitzt; Ausdruck dieser Dualität sind die sog. de Morgan-Gesetze, die später behandelt werden. Soll dagegen die Möglichkeit ausgeschlossen sein, daß beide Teilsätze zugleich wahr sind, so wird das in der Regel im folgenden explizit vermerkt. Diese Zusatzbedingung führt zu einem anderen Junktor, dem ausschließenden ‘oder’, ˙ bezeichnet wird. Im Deutschen wird häuwelches unten mit dem Symbol ‘∨’ fig die Wendung ‘entweder . . . oder’ als das ausschließende ‘oder’ aufgefaßt; der Zusatz ‘entweder’ ist jedoch kein verläßlicher Indikator, da er auch eine emphatische Bedeutungsnuance haben kann (etwa, daß es keine weiteren Fälle gibt). So kann er etwa in Beispiel (11a) hinzugefügt werden, ohne daß der Sprecher damit automatisch ausschließt, daß beide Pässe offen sind. Das logische Zeichen für ‘oder’ ist ‘∨’. Halten wir fest: (12)
Bedeutungsregel für das nicht-ausschließende ‘oder’: Ist ein ‘oder’-Satz wahr, so ist mindestens ein Teilsatz wahr; und umgekehrt: ist einer der beiden Teilsätze wahr, so ist auch der gesamte Satz wahr.
52
2.1.3
Aussagenlogik
Die Negation
Eine natürliche Sprache enthält in der Regel eine ganze Reihe von Negationsausdrücken; im Deutschen sind dies etwa: ‘nicht’, ‘kein’, ‘keiner’, ‘niemand’, die Vorsilbe ‘un-’, ‘keineswegs’, ‘es trifft nicht zu daß’, ‘es ist nicht der Fall daß’. Beispiele sind unter (13) aufgeführt. (13)
a.
Hans schläft nicht.
b.
Peter ist kein Lügner.
c.
Keiner ist so schlau wie Odysseus.
d.
Niemand hat das gehört.
e.
Maria ist unmusikalisch.
f.
Die Firma ist keineswegs am Ende.
g.
Es trifft nicht zu, daß waffenfähiges Uran verwendet wird.
h.
Es ist nicht der Fall, daß der König von Frankreich weise ist.
Wie man sieht, modifizieren diese Ausdrücke in der Sprache nicht nur ganze Sätze, sondern in erster Linie andere Ausdrücke unterhalb der Satzebene. Zum Teil handelt es sich sogar um Negationspartikel, die mit anderen Strukturausdrücken der Sprache verschmolzen sind; so ist etwa ‘kein’ = ‘nicht ein’, ‘niemand’ = ‘nicht jemand’, und p un + Adj q = p nicht + Adj q. Wie bei den anderen Verknüpfungen besteht der logische Schritt der Standardisierung darin, alle Negationsausdrücke als Operatoren auf ganzen Sätzen aufzufassen. In allen obigen Sätzen ist folgende bedeutungserhaltende Paraphrase möglich: das Negationselement wird isoliert, an den Anfang des Satzes bewegt und uniform durch die Wendung ‘es ist nicht der Fall daß’ ersetzt, wie dies in (13h) schon durchgeführt ist. Mit Hilfe dieser Standardform läßt sich dann die offensichtliche Wahrheitsregel für die Negation formulieren: (14)
Bedeutungsregel für die klassische Negation: Ein Satz der Gestalt p es ist nicht der Fall daß S q ist wahr, wenn S falsch ist, und er ist falsch, wenn S wahr ist.
Hier wurde das Wort ‘klassisch’ hinzugefügt, weil die Analyse von Kennzeichnungen zu der Unterscheidung von zwei Arten von Negationen führt, einer starken Negation, welche die Denotationsbedingungen von Kennzeichngen erhält, und einer schwachen, die dies nicht tut. Es zeigt sich, daß die schwache Negation gerade die klassische ist, die die Standardparaphrase ‘es ist nicht der Fall daß’ zuläßt. Das Beispiel (13h) illustriert diesen Fall: die Denotationsbedingungen, d.h. die Existenz- und Eindeutigkeitsbedingungen der Kennzeichnung ‘der König von Frankreich’ werden hier nicht erhalten, da der Satz verwendet werden kann, um nicht nur zu negieren, daß der (als existent angenommene) König von Frankreich kahlköpfig ist, sondern auch zu bestreiten, daß der König von Frankreich überhaupt existiert. Die starke Negation liegt dagegen plausiblerweise im folgenden Satz vor, da es merkwürdig wäre, mit diesem Satz die Existenz der Freundin des Bruders zu bestreiten: (15)
Inge mag die Freundin ihres Bruders nicht.
Logische Form
53
Die Unterscheidung zwischen starker und schwacher Negation kann nur getroffen werden, wenn entweder die Zweiwertigkeit der klassischen Logik zugunsten einer “Dreiwertlogik” aufgegeben wird2 oder innerhalb der zweiwertigen Logik Mittel bereitgestellt werden, die den “Wirkungsbereich” oder Skopus der Negation fixieren. Wir werden im Rahmen der Kennzeichnungstheorie auf diese Fragen zurückkommen. Wie wichtig Skopusbeziehungen sind, sei noch an zwei Beispielen illustriert, in denen weitere logische Strukturausdrücke auftreten, welche mit der Negation interagieren; es sind dies die Quantorenausdrücke ‘alle’ und ‘die meisten’: (16)
a. b. c.
Die Versuche waren nicht erfolgreich. ⇔ Es ist nicht der Fall, daß die Versuche erfolgreich waren. Die Versuche waren alle nicht erfolgreich. 6⇔ Es ist nicht der Fall, daß die Versuche alle erfolgreich waren. Die meisten Aufgaben sind nicht leicht zu lösen. 6⇔ Es ist nicht der Fall, daß die meisten Aufgaben leicht zu lösen sind.
Der Negationsausdruck wurde in allen Fällen an den Anfang gestellt (und in Standardform gebracht). In Satz (16a) führte das zu keiner Bedeutungsveränderung, da der definite Pluralausdruck ‘die Versuche’ selbst kein skopustragendes Element ist. Die genannten Quantorenausdrücke tragen jedoch Skopus; entsprechend wurde in den anderen Beispielen durch die Umstellung der relative Skopus zwischen Negation und Quantor verändert, was eine Bedeutungsveränderung nach sich zieht: in (16b) etwa bedeutet der erste Satz, daß alle Versuche erfolglos waren, während der zweite Satz bedeutet, daß einige Versuche erfolglos waren. In (16c) heißt der erste Satz, daß die überwiegende Mehrzahl der Aufgaben schwer zu lösen sind, während im zweiten bestritten wird, daß die große Mehrheit der Aufgaben leicht zu lösen ist; das kann z.B. der Fall sein, wenn sich leichte und schwere Aufgaben die Waage halten. Für das Formalisierungsverfahren leiten wir daraus die folgende Verbotsregel ab: Bei der Herstellung der Explizitfassung darf die relative Position skopustragender Elemente nicht verändert werden. Insbesondere darf ein Negationswort nicht über einen Quantorenausdruck hinweg an den Beginn des Satzes gerückt werden. Aber auch Junktoren sind skopussensitiv: so läßt sich etwa ein Negationselement nicht so ohne weiteres mit einer Disjunktion vertauschen, wie das folgende Beispiel zeigt. (17)
a. b.
Niemand hustete oder klatschte. Niemand hustete oder niemand klatschte.
In (17a) nimmt ‘niemand’ Skopus über das ‘oder’; wenn man sich etwa die Situation in einem Konzertsaal zwischen den Sätzen einer Symphonie vorstellt, so sagt der Satz, daß eben völlige Stille herrschte: es wurde weder gehustet noch geklatscht. (17b) dagegen kann auch wahr sein, wenn sich zwar jeder an die Konvention hielt, zwischen den Sätzen einer Symphonie nicht zu klatschen, aber dennoch auffällig gehustet wurde. Zum Schluß seien die üblichsten Symbole erwähnt, die in der Logik für die ¯ Negation verwendet werden: ‘¬’, ‘−’, ‘∼’, sowie ein Querstrich der Form ‘φ’. Wir verwenden das erstgenannte Symbol. 2 Siehe
dazu etwa [21].
54
Aussagenlogik
2.1.4
Das Konditional
Am schwierigsten ist der konditionale Junktor ‘→’, die materiale Implikation, aus der natürlichsprachlichen Verwendung heraus zu motivieren. Diese Problematik wurde bereits in der Einleitung diskutiert. Dort wiesen wir auch darauf hin, daß begrifflich zu unterscheiden ist zwischen der objektsprachlichen Verknüpfung zweier Aussagen zu einem Konditional und der metasprachlichen Wenn-dann-Verbindung im Fall der logischen Folgerung oder logischen Implikation. Um den Unterschied zwischen den beiden Arten der Implikation auch terminologisch zu markieren, werden wir im folgenden die (objektsprachliche) materiale Implikation stets ‘Konditional’ nennen. Da ferner, wie erläutert, viele Konditionalsätze generelle Wenn-dannAussagen machen und der quantifizierende Aspekt erst in der Prädikatenlogik systematisiert wird, gilt es hier, die Wahrheitsbedingungen singulärer Wenndann-Aussagen p wenn A dann Bq zu charakterisieren, die dem logischen Konditional am nächsten kommen. Die Sprachsemantik liefert eine klare Intuition für den Fall, daß A wahr ist; dann ist der Gesamtsatz wahr, wenn mit A auch B wahr ist, und falsch, wenn B falsch ist. Lesen wir zum Beispiel an einem bestimmten Tag im Internet die Information: (i) Wenn der Reschenpaß geschlossen ist, dann ist der Brennerpaß offen, und überzeugen uns ferner, daß der Reschenpaß in der Tat geschlossen ist, dann betrachten wir die Aussage (i) als wahr, wenn der Brennerpaß offen ist, und würden uns getäuscht fühlen, wenn der Brennerpaß auch geschlossen ist. Wie schon gesagt sind die kritischen Fälle die, in denen A falsch ist. Hier versagt die sprachsemantische Intuition oder ist zumindest undeutlich; es liegt eine Art “Bedeutungslücke” vor. Die Logik schließt diese Lücke, indem sie den Wahrheitswert des gesamten Konditionals als wahr ansetzt. Damit wird das Konditional äquivalent zur Aussage p non A oder Bq. Die Rechtfertigung für dieses Vorgehen kann erst in der Prädikatenlogik gegeben werden. Ein bedingter Allsatz der Gestalt p alle A sind Bq wird nämlich als allquantifiziertes Konditional der Form p ∀x(φ → ψ)q formalisiert, das wahr ist, sofern nur alle φ-Instanzen auch ψ-Instanzen sind, unabhängig davon, was in den Falschheitsfällen von φ geschieht; diese können die Inklusionsbeziehung zwischen den φ-Instanzen und ψ-Instanzen, auf die es allein ankommt, nicht “stören”. Dieser Zusammenhang wird genau von dem unter den Allquantor eingebetteten Konditional gestiftet. Ein Vergleich möge helfen, die Notwendigkeit theoretischer Festsetzungen wie dieser zu motivieren. In der Mathematik wird die Exponentiation an üblicherweise dadurch erklärt, daß die Größe a n-mal zum Faktor gesetzt wird, und daß ein Minuszeichen im Exponenten den Kehrwert der Potenz ohne Minuszeichen bedeutet. Was aber ist a0 ? Die entsprechende umgangsprachliche Erklärung “a 0-mal zum Faktor setzen” hilft nicht weiter, da man nicht weiß, was das heißen soll. Ganz ähnlich wie im Fall der Bedeutungslücke beim Konditional wird nun eine Festsetzung getroffen, die jedoch durch die Systematik der arithmetischen Operationen motiviert ist: Wird a0 = 1 gesetzt, so lassen sich die Rechenoperationen mit Potenzen auf den Fall 0 “fortsetzen”; es gilt nämlich (für a 6= 0): 1 = a2 /a2 = a2 · a−2 = a2−2 = a0 . Die Wahrheitsbedingungen für das Konditional lauten damit:
(18)
Bedeutungsregel für das Konditional: Ein Konditional der Form pφ → ψq ist wahr, wenn φ falsch oder ψ wahr ist; ist umgekehrt eine
Logische Form
55
dieser beiden Bedingungen gegeben, so ist das Konditional wahr. Als Symbol für das Konditional ist außer dem hier verwendeten Pfeilsymbol ‘→’ auch das “Hufeisen” ‘⊃’ (engl. horseshoe) gebräuchlich. In dem Konditional pφ → ψq heißt φ das Antecedens und ψ das Consequens. Das Antecedens steht immer links vom Pfeil und das Consequens rechts. In der Umgangssprache dagegen kann der Bedingungssatz (das “Antecedens”) auch hinter den Folgesatz gestellt werden, etwa in der Form p B wenn Aq oder p B falls Aq. Beide Sätze haben die logische Form p φ → ψq, wenn φ den Satz A und ψ den Satz B formalisiert. Anders liegt der Fall, wenn im Deutschen das Wort ‘nur’ hinzugefügt wird; dann dreht sich die Konditionalbeziehung um. pB nur wenn Aq ist durch p ψ → φq (wiederum mit φ für A und ψ für B) auszudrücken.
2.1.5
Das Bikonditional
Dieser Junktor wird gelesen ‘dann und nur dann wenn’ oder kurz ‘genau dann wenn’. Die ‘genau-dann-wenn’-Verknüpfung ist gleichbedeutend mit einer wechselseitigen ‘wenn-dann’-Beziehung. Als solche ererbt sie mehrere Eigenschaften von der einfachen ‘wenn-dann’-Beziehung, insbesondere ihr doppeltes Auftreten sowohl in der Objekt- als auch in der Metasprache. Als objektsprachlicher Junktor wird sie Bikonditional genannt und ist das Gegenstück zum Konditional; sie drückt ebenso wie dieses eine zweistellige Wahrheitsfunktion aus. Als metasprachliche Relation ist sie die wechelseitige logische Folgerung und heißt logische Äquivalenz . Das Symbol für das Bikonditional ist der Doppelpfeil ‘↔’, das für die logische Äquivalenz ‘≡’.3 Außer der wechselseitigen Konditional-Beziehung kann die Bedeutung des Bikonditionals aber noch auf eine andere, äquivalente Weise beschrieben werden, und zwar als Gleichheit der Wahrheitwerte. Das liefert unmittelbar die (19)
Bedeutungsregel für das Bikonditional: Ein Bikonditional der Form pφ ↔ ψq ist dann und nur dann wahr, wenn φ und ψ entweder beide wahr sind oder beide falsch sind.
2.1.6
AL-Formalisierungen: Beispiele
In diesem Abschnitt werden zwei Musterbeispiele für AL-Formalisierungen natürlichsprachlicher Sätze angegeben. Im Einklang mit den obigen Erläuterungen wird ein Beispielsatz der natürlichen Sprache (NL), hier: des Deutschen, zunächst in eine quasi-natürlichsprachliche Explizitfassung (EF) überführt und dann in die formale Zielsprache AL übersetzt (LF). Jeder elementare Satz der Explizitfassung, der keine aussagenlogischen Strukturwörter mehr enthält,4 wird durch das Mitteilungszeichen für eine Satzkonstante von AL ersetzt. Dabei werden zwei elementare EF-Sätze nur dann durch dasselbe Mitteilungszeichen ersetzt, wenn sie völlig identisch sind. Wenn sie nur teilweise gleiches Material 3 Das Symbol ‘≡’ steht häufig auch für das Bikonditional, typischerweise in Verbindung mit dem Hufeisen ‘⊃’ für das Konditional. 4 Genauer: keine solchen aussagenlogischen Strukturwörter, die nicht im Bereich eines Quantors stehen. Zum Beispiel ist in dem Satz ‘Keiner ist Amts- und Mandatsträger’ nicht äquivalent zu ‘Keiner ist Amtsträger und keiner ist Mandatsträger’; hier steht das aussagenlogische Strukturwort ‘und’ im Skopus des Quantors ‘keiner’.
56
Aussagenlogik
enthalten, werden für sie dennoch zwei verschiedene Mitteilungszeichen eingeführt. Beispiel 2.1 ‘NL’ stehe für ‘natürlich-sprachlicher Satz’ (von engl. natural language), ‘EF’ für ‘Explizitfassung’ und ‘LF’ für ‘Logische Form’. In der Explizitfassung sind die logischen Strukturausdrücke in Fettdruck wiedergegeben. NL: Puntila ist herrisch und nicht zu ertragen, oder er ist betrunken und biedert sich an. EF: (( [Puntila ist herrisch] und es ist nicht der Fall daß [Puntila ist zu ertragen] ) oder ( [Puntila ist betrunken] und [Puntila biedert sich an] )) LF: p ((P ∧ ¬Q) ∨ (R ∧ S))q
mit dem Abkürzungsschema: P : R:
Puntila ist herrisch Puntila ist betrunken
Q : Puntila ist zu ertragen S : Puntila biedert sich an
Beispiel 2.2 Die folgende Aussage betrifft drei Stromleiter, L1, L2 und L3. Die Standardwendung für die Negation in der Explizitfassung, ‘es ist nicht der Fall daß’ wird durch das (lateinische) ‘non’ abgekürzt. Klammerkonventionen (siehe unten) sind berücksichtigt. NL: Der zweite Leiter führt Strom, wenn der erste Leiter Strom hat, was nur dann nicht der Fall ist, wenn der dritte Leiter Strom hat, der selbst allerdings keinen Strom führt, falls der zweite keinen hat. EF: ((wenn [L1 Strom führt] dann [führt L2 Strom]) und (wenn (non [L1 führt Strom]) dann [L3 führt Strom]) und (wenn (non [L2 führt Strom]) dann (non [L3 führt Strom]))) LF: p (P → Q) ∧ (¬P → R) ∧ (¬Q → ¬R)q mit dem Abkürzungsschema: P :
L1 führt Strom
Q:
L2 führt Strom
R:
L3 führt Strom
Logische Form
57
Übung 2.1 Formalisieren Sie die folgenden Sätze in der Aussagenlogik AL. Begründen Sie dabei die Wahl der Explizitfassungen und diskutieren Sie die Grenzen der Ausdruckskraft von AL. (20)
a.
Die Maschine ist (zwar) nicht (sehr) laut, aber sie verbraucht eine Menge Energie.
b.
Keineswegs kommt Georg, wenn Petra oder Anna kommt.
c.
Es stimmt nicht, daß die Täter schuldig sind, der Kommandeur aber nicht.
d.
Der Brief wurde nicht mit Schreibmaschine oder Computer geschrieben, sondern mit Hand.
e.
Fritz ist nicht nur dumm, sondern auch gemein.
f.
Die Regierung wünscht sich Jobs und einen ausgeglichenen Haushalt, aber sie bekommt weder das eine noch das andere.
g.
Niemand lachte oder klatschte Beifall.
h.
Hans und Inge sind Bruder und Schwester oder Vetter und Cousine.
i.
Zum Schwimmen oder zum Turnen gehe ich zu Fuß oder fahre mit dem Fahrrad.
j.
Karl fährt mit dem Auto zur Arbeit, oder mit dem Rad und mit der S-Bahn.
k.
Du kannst Eis oder Kuchen haben, aber nicht beides zugleich.
l.
Wenn der Reschenpaß nicht offen ist, ist der Brennerpaß offen.
m.
Wenn Max da ist, ist Vroni nicht da.
n.
Max ist nur da, wenn Vroni nicht da ist.
o.
Schalter 2 ist besetzt, es sei denn, Schalter 1 ist besetzt.
p.
Wenn nicht gewisse Bedingungen erfüllt sind, ist eine Entscheidung in dieser Sache weder notwendig noch hilfreich.
q.
Peter kandidiert genau dann, wenn Hans kandidiert.
58
Aussagenlogik
2.2
Syntax der Aussagenlogik
Wir führen nun die formale Sprache LAL der Aussagenlogik AL ein. Solange wir ausschließlich die Aussagenlogik betrachten, oder wenn der Kontext klar ist, lassen wir den unteren Index ‘AL’ meist weg. Abkürzungen. Die folgenden Abkürzungen werden künftig ständig benutzt werden: ‘MZ’ stehe für ‘Mitteilungszeichen’, ‘StrI’ für ‘auch mit Strichen und Indizes versehen’. Definition 2.1 Das Vokabular (= die Menge der Grundsymbole) von LAL besteht aus den folgenden Symbolen: 1. Eine (abzählbar) unendliche Menge von Satzkonstanten ‘p0 ’, ‘p1 ’, ‘p2 ’, ‘p3 ’, ...; die Menge der Satzkonstanten heiße SK L oder kurz SK , wenn der Bezug auf L klar ist. MZ: ‘P ’,‘Q’,‘R’, StrI.
2. Die Menge der logischen Konstanten ‘¬’ (Negation), ‘∨’ (Disjunktion), ‘∧’ (Konjunktion), ‘→’ (Konditional ), ‘↔’ (Bikonditional ); diese Zeichen heißen Junktoren. 3. Die Klammersymbole ‘(’ und ‘)’. Die verschiedenen Mengen von Grundsymbolen sind paarweise disjunkt, und kein Grundsymbol ist eine Kette aus anderen Grundsymbolen. Die Grundsymbole unter 2. und 3. werden im folgenden autonym, d.h. als Namen für sich selbst, verwendet. Definition 2.2 Ein Ausdruck von LAL (kurz: L-Ausdruck oder ALAusdruck ) ist eine endliche Kette von Grundsymbolen von LAL , die auch leer sein kann; die Menge der L-Ausdrücke heiße Ad L oder kurz Ad . MZ: ‘α’, ‘β’ (StrI). Beispiele: ‘(()p0 ’, ‘)p1 p3172 (’, ‘∨∧ →’. Der leere Ausdruck , der aus 0 Grundsymbolen besteht, wird mit ‘Λ’ bezeichnet. Definition 2.3 Induktive Definition einer Formel von LAL (kurz: L-Formel oder AL-Formel , wenn der Bezug zu L klar ist): 1. Jede Satzkonstante ist eine Formel. 2. Ist φ eine Formel, so ist auch p ¬φq eine Formel. 3. Sind φ und ψ Formeln, so ist auch jeder der folgenden AL-Ausdücke eine Formel: p (φ ∨ ψ)q , p (φ ∧ ψ)q , p (φ → ψ)q , p (φ ↔ ψ)q . 4. Nichts ist eine Formel, was nicht durch endlich viele Anwendungen der Regeln 1 bis 3 entstanden ist.
Syntax
59
Die Menge der Formeln heiße Fm L . Formeln, in denen keine logischen Zeichen auftreten, heißen atomare Formeln; die Menge der atomaren Formeln ist also gleich SK L . MZ für Formeln sind ‘φ’, ‘ψ’, ‘χ’, ‘γ’, ‘δ’ (StrI). Bemerkung. Häufig gehören auch die logischen Satzkonstanten Verum (‘>’) und Falsum (‘⊥’) zur formalen Sprache der Aussagenlogik. Sie werden autonym verwendet. Die Sprache, die aus LAL durch Hinzunahme von ‘>’ und ‘⊥’ entsteht, heiße L0AL . In der Semantik ist > immer wahr und ⊥ immer falsch.
Erläuterung. Wie im ersten Kapitel dargelegt wurde, spielt der gerade benutzte Typ von Definition, die induktive Definition, in der Logik eine große Rolle. Das Definiendum, die Menge der Formeln Fm L , wird nicht einfach wie bei der gewöhnlichen expliziten Definition einer anderen Menge in einer Identitätsaussage gleichgesetzt; vielmehr wird durch eine Anzahl von Bildungsvorschriften angegeben, wie man zu den aussagenlogischen Formeln und nur zu diesen kommt. In einer ersten Klausel beschreibt man das “Ausgangsmaterial”, hier die Menge der Satzkonstanten; diese Formeln werden auch atomar genannt. In den anderen, “rekursiven” Klauseln wird gesagt, wie man aus Ausdrücken, die schon als Formeln erkannt sind, zu neuen gelangt. Diese Regeln können dabei immer wieder, d.h. unbeschränkt oft, auf bereits generierte Formeln angewendet werden. Das führt in jedem einzelnen Fall zwar immer nur zu Formeln endlicher Länge, aber die Gesamtmenge Fm L wird dabei unendlich; sie würde das auch dann, wenn sie nicht bereits unendlich viele Objekte der Grundstufe (hier: unendlich viele Satzkonstanten) enthalten würde. Schließlich sorgt die Abschlußklausel 4 dafür, daß außer den Ausdrücken, die mit Hilfe der Regeln gebildet wurden, nichts sonst in der Menge enthalten ist. Die Abschlußklausel wird übrigens in künftigen induktiven Definitionen weggelassen werden; sie ist aber jeweils hinzuzudenken. Wir haben oben ebenfalls darauf hingewiesen, daß Mengen, die auf diese Weise induktiv definiert werden, keineswegs “immer weiter wachsen”; es kommt ein Punkt, der Fixpunkt dieser Operationen, an dem weitere Regelanwendungen keine neuen Elemente mehr erzeugen. Dieser Punkt ist zwar erst im Unendlichen erreicht, aber dort “sofort” bei der kleinsten unendlichen Ordnungszahl ω. Zählt man bei einer gegebenen Formel die Anzahl der rekursiven Regelanwendungen des Typs 2 oder 3, die zu ihrer Herstellung nötig war, so gelangt man zu einem Maß ihrer Komplexität, auch Formelgrad genannt. Satzkonstanten haben den Grad 0, da keine rekursive Regel angewendet wurde. Bei jeder solchen Anwendung erhöht sich der Formelgrad dagegen. Will man allgemeine Aussagen über induktiv definierte Objekte, speziell also Formeln, beweisen, so folgt man dem in der induktiven Definition mitgelieferten Komplexitätsmaß. Bei Formeln beweist man also die Aussage erst für die atomaren Formeln und dann unter der Voraussetzung, daß man die Aussage schon für die Teilformeln einer vorgelegten Formel gezeigt hat, auch für diese selbst. Dieses Beweisschema stellt einen Induktionsbeweis dar, auch Beweis nach dem Formelgrad oder Beweis nach dem Formelaufbau genannt. Übung 2.2 Geben Sie eine induktive Definition der Menge Ad der aussagenlogischen Ausdrücke. Baumtest für die Formeleigenschaft: Siehe Abbildung 2.1. Ein AL-Ausdruck wird solange gemäß der syntaktischen Regeln des Formelaufbaus R1 bis R3
60
Aussagenlogik
P
(P → (Q → P )) H HH HH R3
R1 Q
HH
H (Q → P ) Q Q R3 Q
Q
Q
R1
Q P R1
Abbildung 2.1: Baumtest für die Formeleigenschaft in AL
(rückwärts angewandt) zerlegt, wie dies regelgerecht möglich ist. Das Verfahren bricht nach endlich vielen Schritten ab. Dann ist entweder an allen Ästen eine Satzkonstante erreicht, und der Ausgangsausdruck ist wohlgeformt; oder aber es steht an mindestens einer Stelle des Baumes ein Teilausdruck, der keine Satzkonstante ist und auf den keine Regel mehr paßt. Dann ist der Ausgangsausdruck keine Formel. Die Stelle wird mit dann mit einem “Blitzsymbol” markiert. Klammerkonventionen 1. p (φ1 ∨ φ2 ∨ . . . ∨ φn )q
für
p (. . . ((φ1 ∨ φ2 ) ∨ φ3 ) ∨ . . . ∨ φn )q
2. p (φ1 ∧ φ2 ∧ . . . ∧ φn )q
für
p (. . . ((φ1 ∧ φ2 ) ∧ φ3 ) ∧ . . . ∧ φn )q
3. Äußere Klammern werden weggelassen. 4. ‘∨’ und ‘∧’ binden stärker als ‘→’ und ‘↔’; die ersteren und letzteren Junktoren sind untereinander von gleicher Bindungsstärke. Treffen Junktoren unterschiedlicher Bindungsstärke aufeinander, so können die Klammern für den stärker bindenden Junktor weggelassen werden. Bei gleicher Bindungsstärke sind Klammern notwendig. Beispiele: p (P → Q) ∨ R ∨ Qq statt p (((P → Q) ∨ R) ∨ Q)q p ¬P ∧ (Q ∨ R) ∧ Rq statt p ((¬P ∧ (Q ∨ R)) ∧ R)q p P → (Q → R)q statt p (P → (Q → R))q p P ∧ Q → P ∨ Qq statt p ((P ∧ Q) → (P ∨ Q))q 5. Quasi-Anführungsstriche werden nur zur Deutlichkeit verwendet und in der Regel weggelassen.
61
Semantik
Bemerkung. Streng genommen sind AL-Formeln nur solche Zeichenketten, die außer Klammersymbolen und logischen Zeichen nur Satzkonstanten der Objektsprache und keine Mitteilungszeichen für diese enthalten. Kommt mindestens ein Mitteilungszeichen vor, spricht man von einem Formelschema. Wenn dieser Unterschied nicht betont wird, wird der Begriff Formel sowohl für Formeln wie Formelschemata gebraucht. Übung 2.3 Testen Sie die folgenden Ausdrücke auf ihre Formel(schema)Eigenschaft unter strikter Anwendung der Regeln (d.h. ohne Klammerkonventionen). Welche sind AL-Formeln, welche AL-Formelschemata? (21)
a. b. c. d. e. f. g. h. i. j. k. l.
2.3
¬(¬P ∨ Q) P ∨ (Q) ¬(Q)
(p2 → (p1 → (p0 → p2 ))) (P → ((P → Q)))
((P → P ) → (Q → Q)) ((p19 → p4 ) → p1 ) (P → (P → Q) → Q) (P ∧ (Q ∧ R))
(P ∨ Q ∨ R)
(¬p0 ∨ ¬¬p1 ) (R ∧ R)
Semantik der Aussagenlogik
Semantik ist die Lehre von den Bedeutungen. Wie wir oben sahen, ist der Begriff der Bedeutung ist sehr viel allgemeiner als derjenige, der in der Aussagenlogik eine Rolle spielt. Hier geht es ausschließlich um die Zuordnung von Wahrheitswerten zu Aussagen. Die bedeutungstragenden Ausdrücke sind demnach die AL-Formeln, denen genau einer der zwei (klassischen) Wahrheitswerte ‘wahr’ (als Symbol ‘w’ bzw. ‘1’) und falsch (als Symbol ‘f’ bzw. ‘0’) zugeordnet wird. Die Aussagenlogik wird mit dieser Semantik daher auch zweiwertig oder bivalent genannt.
2.3.1
Belegungen und Bewertungen
Definition 2.4 Eine (elementare) LAL -Belegung f ordnet jeder Satzkonstanten von LAL genau einen Wahrheitswert zu, d. h. f ist eine Funktion von der Menge SK L in die Menge der Wahrheitswerte; symbolisch: f : SKL → { 1, 0 }. LAL -Belegungen nennen wir auch kurz AL-Belegungen oder einfach Belegungen, wenn der Bezug auf die vorliegende Sprache klar ist. Bemerkung. Sind > und ⊥ Teil der Sprache, d.h. wird die Sprache L0AL statt LAL zugrundegelegt, so fordern wir zusätzlich f (>) = 1 und f (⊥) = 0 für alle L0AL -Belegungen f .
62
Aussagenlogik
Beispiel 2.3 In der folgenden Tabelle ordnen vier Belegungen f1 , . . . , f4 den Satzkonstanten p0 , p1 , p2 , . . . einen Wahrheitswert zu. Jede Zeile enthält die Wertefolge der links angegebenen Belegung, während jede Spalte die verschiedenen Werte der darüber stehenden Satzkonstante angibt. f1 f2 f3 f4
p0 1 0 1 0
p1 1 0 1 1
p2 1 0 0 1
p3 1 0 1 1
p4 1 0 0 0
p5 1 0 0 1
... ... ... ... ...
Ist eine Belegung f gegeben, so besitzen damit alle atomaren Formeln, d.h. die Satzkonstanten, einen Wahrheitswert bei f . Die Bedeutungsregel für die Negation liefert dann auch einen Wahrheitswert für alle negierten Satzkonstanten, indem man einfach die Wahrheitswerte vertauscht. Auf ähnliche Weise kann nun für jede beliebig komplexe AL-Formel entsprechend ihrem syntaktischen Aufbau schrittweise ein Wahrheitswert berechnet werden, indem bei jeder neuen logischen Verknüpfung die zugehörige Bedeutungsregel angewendet wird. Dies ist der Inhalt der folgenden induktiven Definition, die die Zuordnung von Wahrheitswerten auf der Basis einer gegebenen Belegung f bestimmt. Es zeigt sich, daß bei festem f jede Formel genau einen Wahrheitswert erhält. Wir haben es also wieder mit einer Funktion zu tun, welche nun nicht mehr nur auf der Menge SK L definiert ist, sondern auf der ganzen Formelmenge Fm L . Bezeichnen wir diese Funktion mit gf (der untere Index deutet die Abhängigkeit von f an), so kann man symbolisch schreiben: gf : Fm L → { 1, 0 }. Da jede Satzkonstante eine spezielle Formel ist und gf sich aus f ergibt, stimmen die Werte von gf und f auf allen Satzkonstanten überein. Damit ist gf eine Forsetzung von f im Sinne von Kapitel 1; vgl. Abbildung 2.2. Definition 2.5 Induktive Definition der durch die L-Belegung f bestimmten Bewertung(sfunktion) gf : Fm L → { 1, 0 } (auch Boolesche Bewertung genannt): 1. Ist P eine Satzkonstante, so ist gf (P ) = f (P ); 2. ist gf (φ) = 1, so ist gf (¬φ) = 0; ist gf (φ) = 0, so ist gf (¬φ) = 1; 3. ist gf (φ) = 1 oder gf (ψ) = 1,5 so ist gf (φ ∨ ψ) = 1; ist gf (φ) = 0 und gf (ψ) = 0, so ist gf (φ ∨ ψ) = 0; 4. ist gf (φ) = 1 und gf (ψ) = 1, so ist gf (φ ∧ ψ) = 1; ist gf (φ) = 0 oder gf (ψ) = 0,6 so ist gf (φ ∧ ψ) = 0; 5. ist gf (φ) = 0, oder ist gf (ψ) = 1, so gilt gf (φ → ψ) = 1; ist gf (φ) = 1 und gf (ψ) = 0, so ist gf (φ → ψ) = 0; 6. ist gf (φ) = g(ψ), so ist gf (φ ↔ ψ) = 1; ist gf (φ) 6= gf (ψ), so ist gf (φ ↔ ψ) = 0. 5 Diese 6 Die
Bedingung schließt den Fall ein, daß gf (φ) = gf (ψ) = 1. Bedingung schließt den Fall ein, daß gf (φ) = gf (ψ) = 0.
63
Semantik Fm
{ 1, 0 }
g = gf f ⊆g
SK p
f
g(p) = f (p)
g
φ
g
g(φ)
g SK = f
Abbildung 2.2: Die Boolesche Bewertung gf als Fortsetzung einer gegebenen Belegung f : SK L → { 1, 0 } auf ganz Fm L
Satz 2.1 Zu jeder L-Belegung f gibt es genau eine Boolesche Bewertung g f auf der Menge der L-Formeln; sie erfüllt die folgenden Äquivalenzen: 1. Ist P eine Satzkonstante, so ist gf (P ) = f (P ); 2. gf (¬φ) = 1 gdw gf (φ) = 0; 3. gf (φ ∨ ψ) = 1 gdw gf (φ) = 1 oder gf (ψ) = 1; 4. gf (φ ∧ ψ) = 1 gdw gf (φ) = 1 und gf (ψ) = 1; 5. gf (φ → ψ) = 1 gdw gf (φ) = 0 oder gf (ψ) = 1; 6. gf (φ ↔ ψ) = 1 gdw gf (φ) = gf (ψ); Der Beweis dieses Satzes wird durch Induktion nach dem Formelaufbau von φ geführt.7 Dabei ist sowohl die Existenz als auch die Eindeutigkeit der Booleschen Bewertung zu zeigen. Die Existenz ergibt sich unmittelbar aus der Definition 2.5.8 Zur Eindeutigkeit nimmt man zwei Boolesche Bewertungen gf und gf0 an, die f fortsetzen, d.h. für alle Satzkonstanten mit f übereinstimmen, und zeigt mit mathematischer Induktion ihre Gleichheit. Zugleich können die Wenn-dann-Klauseln in Definition 2.5 zu Genau-dann-wenn-Klauseln verstärkt werden. Wir werden im folgenden den Index ‘f ’ bei den Booleschen Bewertungen weglassen, wenn klar ist, auf welche Belegung Bezug genommen wird.9 7 Für
ein ausformuliertes Beispiel dieser Methode siehe Satz 2.4. wird die eindeutige Lesbarkeit der Formeln verwendet, die wir in den semiotischen Vorbemerkungen von Kapitel 1 erwähnt haben. Siehe dazu [62], §1.4. 9 Ferner werden wir die Wahrheitswertsymbole ‘1’ und ‘0’ nicht immer fett drucken, sondern den Fettdruck auch zur Hervorhebung verwenden. 8 Hierbei
64
Aussagenlogik
Wahrheitstafeln Die Abhängigkeit der g-Werte komplexer Formeln von den g-Werten ihrer unmittelbaren Teilformeln wird üblicherweise durch die zu den einzelnen Junktoren gehörenden Wahrheitstafeln ausgedrückt: φ 1 0
φ 1 1 0 0
ψ 1 0 1 0
¬φ 0 1
φ∧ψ 1 0 0 0
für
für
g(φ) 1 0
g(φ) 1 1 0 0
g(¬φ) 0 1
g(ψ) 1 0 1 0
g(φ ∧ ψ) 1 0 0 0
Analog sind die Wahrheitstafeln der übrigen Junktoren zu verstehen. Außer den obigen Standardjunktoren sei noch das ausschließende ‘oder’ mit seiner ˙ Wahrheitstafel angeführt. p φ∨ψq ist zu lesen als “entweder φ oder ψ aber nicht beides zugleich”. φ 1 1 0 0
ψ 1 0 1 0
φ∨ψ 1 1 1 0
φ 1 1 0 0
ψ 1 0 1 0
φ↔ψ 1 0 0 1
φ 1 1 0 0
φ→ψ 1 0 1 1
ψ 1 0 1 0
φ 1 1 0 0
ψ 1 0 1 0
˙ φ∨ψ 0 1 1 0
Ein Vergleich mit den im Abschnitt 2.1 formulierten Wahrheitsbedingungen zeigt, daß die Wahrheitstafeln diese Bedingungen genau wiedergeben. Übung 2.4 Zeigen Sie, daß die Wahrheitswertverteilung des Konditionals pφ → ψq mit der des Schemas p¬φ ∨ ψq übereinstimmt. Übung 2.5 Zeigen Sie, daß die Wahrheitswertverteilung des Bikonditionals pφ ↔ ψq mit der des Schemas p(φ ∧ ψ) ∨ (¬φ ∧ ¬ψ)q übereinstimmt. Übung 2.6 Zeigen Sie, daß die Wahrheitswertverteilung des ausschließen˙ den ‘oder’ pφ∨ψq mit der des Schemas p(φ ∧ ¬ψ) ∨ (¬φ ∧ ψ)q übereinstimmt.
Semantik
65
Wahrheit, Gültigkeit, Erfüllbarkeit, logische Folgerung Die folgenden Definitionen legen für die Aussagenlogik die Bedeutung der zentralen semantischen Begriffe fest, welche für jedes logische System bestimmend sind. Es handelt sich um metalogische Eigenschaften von Formeln und Relationen zwischen Formel(menge)n und Formeln. Wir werden diesen Begriffen in der Prädikatenlogik und weiteren Systemen immer wieder begegnen. Definition 2.6 Es seien φ, ψ AL-Formeln, Σ eine Menge von AL-Formeln, also Σ ⊆ Fm L , und f sei eine AL-Belegung. 1. φ heißt wahr bezüglich f , wenn für die durch f bestimmte Bewertung gf gilt: gf (φ) = 1; wir sagen auch, f erfüllt φ, f macht φ wahr , oder f ist ein Modell für φ, und schreiben f |= φ. 2. φ heißt (AL-)logisch wahr , (AL-)gültig oder eine Tautologie, wenn φ bezüglich jeder AL-Belegung wahr ist. 3. φ heißt (AL-)erfüllbar , wenn es eine AL-Belegung gibt, bezüglich der φ wahr ist. 4. φ heißt (AL-)kontradiktorisch, wenn φ bezüglich keiner AL-Belegung wahr ist. 5. φ folgt (AL-)logisch aus Σ (in Zeichen: ‘Σ |= φ’), wenn jede Belegung f , die jede Formel in Σ erfüllt, auch φ erfüllt; d. h. wenn aus der Tatsache, daß für alle ψ ∈ Σ gf (ψ) = 1 gilt, gf (φ) = 1 folgt. 6. φ folgt (AL-)logisch aus ψ (i. Z. ‘ψ |= φ’), wenn jede Belegung f , die ψ erfüllt, auch φ erfüllt; d. h. wenn φ AL-logisch aus der “Einermenge” Σ = {ψ} folgt. 7. φ und ψ heißen (AL-)logisch äquivalent (i. Z. ‘φ ≡ ψ’), wenn φ aus ψ und ψ aus φ AL-logisch folgt. Bemerkungen. 1. Boolesche Bewertungen werden auch durch das Symbol ‘V ’ (für engl. valuation) oder die sog. “Normfunktion” k · k mitgeteilt. Dabei dient dasselbe Symbol häufig zugleich als elementare Belegung und als ihre Fortsetzung auf alle Formeln von LAL . Man schreibt also einfach V (φ) oder kφk. 2. In Ziffer 5 wird die Menge Σ Prämissenmenge und φ die Konklusion genannt. 3. Eine Formel φ ist genau dann eine Tautologie, wenn sie aus der leeren Prämissenmenge folgt. Die Gültigkeit von φ wird durch das folgende Symbol mitgeteilt: |= φ. 4. Die Zeichen ‘→’ und ‘|=’ müssen begrifflich auseinandergehalten werden. Wie bereits in Abschnitt (2.1.4) angesprochen, ist das Konditional → ein logisches Zeichen der (Objekt-)Sprache AL und erzeugt aus zwei Formeln φ und ψ mittels einer syntaktischen Operation eine weitere Formel, nämlich p φ → ψq . Die logische Folgerung |= dagegen ist eine metasprachliche Relation zwischen zwei AL-Formeln. Die Aussage φ |= ψ stellt eine semantische Behauptung über die beiden Formeln φ und ψ dar.
66
Aussagenlogik
Es gibt dennoch eine enge Beziehung zwischen dem Konditional und der logischen Folgerung, die verständlich macht, daß die beiden Begriffe nicht immer streng auseinandergehalten werden: Satz 2.2 Es seien φ und ψ AL-Formeln. Dann gilt: (i) ψ folgt genau dann logisch aus φ, wenn das Konditional φ → ψ eine Tautologie ist. (ii) φ ist zu ψ genau dann logisch äquivalent, wenn das Bikonditional φ ↔ ψ eine Tautologie ist. In Symbolen: (i) φ |= ψ gdw
(ii) φ ≡ ψ gdw
|= φ → ψ
|= φ ↔ ψ
Beweisskizze. Zu (i). Richtung von links nach rechts (“⇒”): Sei nach Voraussetzung φ |= ψ; dann gilt für alle Belegungen f : (*) wenn gf (φ) = 1 dann auch gf (ψ) = 1. Die Behauptung sagt, daß das Konditional φ → ψ bei jeder Belegung f wahr ist. Das ist nach Bedingung 5 von Definition 2.5 genau dann der Fall, wenn gf (φ) = 0 oder gf (ψ) = 1. Im ersten Fall ist die Bedingung erfüllt; ist dagegen gf (φ) 6= 0, so gilt gf (φ) = 1 und mit (*) gf (ψ) = 1, und die Bedingung ist ebenfalls erfüllt. Damit ist die Behauptung nachgewiesen. Für die Rückrichtung von (i) (“⇐”) sowie für die beiden Richtungen von (ii) wird analog geschlossen. Bemerkung. Statt für die ausgeführte Richtung “(i)⇒” wie oben durch Fallunterscheidung zu schließen, kommt es offensichtlich auf dasselbe hinaus, in konditionaler Form (metasprachlich!) unter der Annahme des (metasprachlichen) Antecedens gf (φ) = 1 auf das (metasprachliche) Consequens gf (ψ) = 1 zu schließen. Die Wahrheitsbedingung 5 für das Konditional wird künftig meist in dieser metasprachlich-konditionalen Form gelesen werden; also: 50 . g(φ → ψ) = 1
gdw
[ wenn g(φ) = 1 so auch g(ψ) = 1 ] ;
Übung 2.7 Führen Sie den Beweis von Satz 2.2 zuende. Bestimmung des Wahrheitswerts bei gegebener Belegung Beispiel 2.4 Es seien P, Q, R Satzkonstanten; f sei eine AL-Belegung mit . f (P ) = 1, f (Q) = 0, f (R) = 1. Ist die Formel φ = p P → (Q ∨ R)q wahr bezüglich f ? Test: P
→ (Q ∨
R)
1
0
1
1 J
J 1
J
J
1
Annahme für f aus Wahrheitstafel für ∨ aus Wahrheitstafel für →
67
Semantik Antwort: φ ist wahr bezüglich f , da gf (φ) = 1.
Vollständiger Wahrheitswerttest mittels Wahrheitstafeln . Beispiel 2.5 Sei φ = p P ∨ Q → P ∧ Qq. Die Zuordnung beginnt bei den Satzkonstanten, fährt fort bei den Verknüpfungen von Satzkonstanten (unterstrichen), etc., und endet beim Hauptzeichen (eingerahmt). Die eingerahmten Werte sind die Werte der Gesamtformel φ bezüglich der verschiedenen Belegungen.
P
Q
P
∨
Q
→
P
∧
Q
f1 :
1
1
1
1
1
1
1
1
1
f2 :
1
0
1
1
0
0
1
0
0
f3 :
0
1
0
1
1
0
0
0
1
f4 :
0
0
0
0
0
1
0
0
0
Ergebnis: Es gilt gf1 (φ) = 1, gf2 (φ) = 0, gf3 (φ) = 0, gf4 (φ) = 1. Also ist φ erfüllbar , aber nicht gültig. Beispiel 2.6 Gültigkeitstest durch die vollständige Wahrheitsttafel (d.h. für alle möglichen Belegungen): Die Formel enthält 3 Satzkonstanten, also gibt es 23 = 8 mögliche Belegungen. Die Werte für die Verknüpfungen sind unter die entsprechenden Junktorenvorkommen eingetragen. Schritt 1 : Verteilung der 8 Wahrheitswertkombinationen auf die Satzkonstanten ((( P 1 1 1 1 0 0 0 0
∧
Q) 1 1 0 0 1 1 0 0
∨
(¬
P 1 1 1 1 0 0 0 0
∧
¬
R )) 1 0 1 0 1 0 1 0
→
(Q 1 1 0 0 1 1 0 0
↔
R )) 1 0 1 0 1 0 1 0
68
Aussagenlogik Schritt 2 : Bestimmung der Werte für das Antecedens und das Consequens ((( P 1 1 1 1 0 0 0 0
∧ 1 1 0 0 0 0 0 0
Q) 1 1 0 0 1 1 0 0
∨ 1 1 0 0 0 1 0 1
(¬ 0 0 0 0 1 1 1 1
P 1 1 1 1 0 0 0 0
∧ 0 0 0 0 0 1 0 1
¬ 0 1 0 1 0 1 0 1
R )) 1 0 1 0 1 0 1 0
→
(Q 1 1 0 0 1 1 0 0
↔ 1 0 0 1 1 0 0 1
R )) 1 0 1 0 1 0 1 0
(Q 1 1 0 0 1 1 0 0
↔ 1 0 0 1 0 0 0 1
R )) 1 0 1 0 1 0 1 0
Schritt 3 : Bestimmung der Werte der Gesamtformel ((( P 1 1 1 1 0 0 0 0
∧ 1 1 0 0 0 0 0 0
Q) 1 1 0 0 1 1 0 0
∨ 1 1 0 0 0 1 0 1
(¬ 0 0 0 0 1 1 1 1
P 1 1 1 1 0 0 0 0
∧ 0 0 0 0 0 1 0 1
¬ 0 1 0 1 0 1 0 1
R )) 1 0 1 0 1 0 1 0
→ 1 0 1 1 1 0 1 1
Ergebnis: Die Formel ist nicht gültig, d.h. keine Tautologie, da mindestens eine Belegung zum Wert 0 führt. . Übung 2.8 Die logische Form in Beispiel 2.2 war die Formel φ = (P → Q) ∧ (¬P → R) ∧ (¬Q → ¬R). Prüfen Sie, ob daraus logisch folgt: (i) P (L1 führt Strom); (ii) Q (L2 führt Strom); (iii) R (L3 führt Strom). Die Methode der Wahrheitstafeln liefert auf systematische Weise für jede beliebig gegebene AL-Formel φ eine Antwort auf die Frage, ob φ eine Tautologie ist oder nicht. Allerdings verdoppelt sich die Anzahl der zu untersuchenden Fälle mit jeder neuen Satzkonstante, die eine Formel zusätzlich enthält. Ist n die Anzahl der verschiedenen Satzkonstanten in φ, so gibt es 2n verschiedene Belegungen dieser Satzkonstanten und damit ebenso viele Fälle. Dennoch bricht das vollkommen automatische Verfahren stets nach endlich vielen Schritten ab. Ein solches Verfahren wird auch Algorithmus genannt. Ein Algorithmus, der eine Frage wie die nach der aussagenlogischen Wahrheit von Formeln beantwortet, heißt auch Entscheidungsverfahren. Damit stellt die Wahrheitswertmethode ein Entscheidungsverfahren für den Tautologiebegriff dar: Satz 2.3 (Entscheidbarkeit der Aussagenlogik) Es gibt einen Algorithmus, der für jede aussagenlogische Formel nach endlich vielen Schritten entscheidet, ob sie eine Tautologie ist oder nicht.
69
Semantik
Bemerkung. Der Begriff der aussagenlogischen Wahrheit ist also entscheidbar. Ein zentraler Satz der mathematischen Logik, der zuerst von Alonzo Church bewiesen wurde, besagt, daß der entsprechende Satz für die Prädikatenlogik nicht gilt; es gibt also kein Entscheidungsverfahren für den Begriff der prädikatenlogischen Wahrheit oder Gültigkeit. Dies ist die Unentscheidbarkeit der Prädikatenlogik . Das Koinzidenzlemma Wir wollen jetzt einen einfachen Satz beweisen, der im wesentlichen aussagt, daß für den Wahrheitswert einer Formel φ nur die Werte derjenigen Satzkonstanten eine Rolle spielen, die in φ auftreten; sind also f und f 0 zwei Belegungen, die für alle in φ auftretenden Satzkonstanten denselben Wert liefern, so sind die Werte von φ bei den durch f bzw. f 0 bestimmten Booleschen Bewertungen ebenfalls gleich. Der Beweis des Satzes stellt einen Beweis durch Induktion nach dem Aufbau von φ dar. Um den Beweis übersichtlich und knapp führen zu können, bedienen wir uns einer Notation für die Wahrheitsfunktionen, die sich den (eigentlich zufälligen) Umstand zunutze macht, daß die Wahrheitswerte 0 und 1 Zahlen sind mit 0 < 1. Da 1−0 = 1 und 1−1 = 0, kann man die Negationsklausel in Ziffer 2 von Satz 2.1 auch als direkte Gleichung schreiben: (22)
a.
g(¬φ) = 1 − g(φ)
Ferner wird der größte Wert von zwei (und allgemein von einer endlichen Anzahl von) Zahlen ihr Maximum genannt, und der kleinste Wert ihr Minimum. Nun ist eine Disjunktion nach Ziffer 3 von Satz 2.1 genau dann wahr, wenn mindestens ein Disjunktionsglied wahr ist; das ist aber genau dann der Fall, wenn das Maximum der Werte der Disjunktionsglieder gleich 1 ist: ist eines gleich 1, so ist das Maximum 1, und sind beide 0, so ist ihr Maximum ebenfalls 0. Ebenso ist eine Konjunktion nach Ziffer 4 genau dann gleich 1, wenn ihr Minimum gleich 1 ist. Es gelten also die zu Ziffer 3 bzw. 4 äquivalenten Wahrheitsbedingungen: (22)
b. c.
g(φ ∨ ψ) = max{ g(φ), g(ψ) } g(φ ∧ ψ) = min{ g(φ), g(ψ) }
Mit diesen Klauseln werden wir im folgenden Induktionsbeweis arbeiten, dessen Struktur im ersten Kapitel erklärt wurde. Danach besteht ein Induktionsbeweis aus zwei Hauptschritten, dem Induktionsanfang und dem eigentlichen Induktionsschritt. Führt man eine Induktion nach dem Aufbau einer Formel φ, so beweist man beim Induktionsanfang die Aussage des Satzes für den Fall, daß φ eine atomare Formel ist, welche keine logischen Konstanten enthält; also ist φ in diesem Fall eine Satzkonstante. Im Induktionsschritt ist φ komplex, d.h. eine Formel mit mindestens einer logischen Konstante. Man nimmt nun in der Induktionsvoraussetzung (kurz: “I.V.”) an, daß die Behauptung schon für “kürzere” Formeln bewiesen wurde, d.h. für Formeln mit einer kleineren Anzahl von logischen Konstanten. Speziell sind die unmittelbaren Teilformeln von φ von dieser Art; daher gilt für sie die Induktionsvoraussetzung. Der Induktionsschritt wird dann dadurch zuendegeführt, daß mit dieser Information die Behauptung für φ selbst gezeigt wird.
70
Aussagenlogik
Wenn die Formel φ komplex ist, dann kann sie von verschiedener Gestalt sein, was ihr Hauptzeichen, d.h. ihren äußersten Junktor betrifft. Daher muß beim Induktionsschritt eine Fallunterscheidung getroffen werden, wobei die Anzahl der zu betrachtenden Fälle gleich der Anzahl der logischen Zeichen der gegebenen Sprache (in LAL also fünf) ist. Meist werden davon nur ein oder zwei Fälle behandelt, da die Beweisschritte in den anderen Fällen völlig analog verlaufen. Das in Kapitel 1 genannte Prinzip der vollständigen Induktion lautete (‘Φ’ steht für eine beliebige Eigenschaft natürlicher Zahlen): (23)
Φ[0] ∧ ∀n (Φ[n] → Φ[n + 1]) → ∀n Φ[n]
(IND)
Dabei variiert n über natürliche Zahlen. Nun laufen Induktionsbeweise nach dem Formelaufbau aber nicht direkt über Zahlen, sondern über Formeln. Der Begriff des Formelgrades, der weiter oben bereits angesprochen wurde, führt die Induktion über Ausdrücke, wie Formeln es sind, auf eine Induktion über Zahlen zurück. Der Formelgrad, definiert als die Anzahl der Vorkommen von logischen Zeichen in einer Formel, ordnet jeder Formel eine natürliche Zahl zu, die ihre logische Komplexität mißt. Der Formelgrad kann induktiv wie folgt definiert werden: Definition 2.7 Induktive Definition des Grades γ(φ) einer Formel φ: 1. Ist φ eine Satzkonstante, so ist γ(φ) = 0; . 2. ist φ = ¬ψ so gilt γ(φ) = γ(ψ) + 1; . 3. ist φ = ψ J χ für einen der zweistelligen Junktoren J der Aussagenlogik, so ist γ(φ) = max{γ(ψ), γ(χ)} + 1. Eine Induktion über den Formelaufbau ist dann eine Induktion über den Formelgrad. Das diesem Beweistyp zugrundeliegende Induktionsprinzip ist nicht genau das Prinzip (23), sondern eine äquivalente Formulierung, auch starke Induktion, Wertverlaufsinduktion oder Ordnungsinduktion genannt, die sich im Induktionsschritt nicht nur auf den direkten Vorgänger stützt, sondern auf alle kleineren Werte; in Formeln ausgedrückt: (24)
Φ[0] ∧ ∀n (∀m(m < n → Φ[m]) → Φ[n]) → ∀nΦ[n]
(IND ∗ )
In unserem Fall der Formelinduktion lautet die Eigenschaft Φ[n] im Induktionsprinzip dann etwa: “die Behauptung des Satzes gilt für alle Formeln mit dem Formelgrad n”. Nach diesen Vorbereitungen kommen wir jetzt zur Formulierung des angekündigten Koinzidenzlemmas. Satz 2.4 Sei φ eine Formel mit höchstens n paarweise verschiedenen Satzkonstanten P1 , . . . , Pn . f und f 0 seien zwei Belegungen, so daß für alle i mit 1 ≤ i ≤ n gilt: f (Pi ) = f 0 (Pi ). Dann gilt für die von f und f 0 bestimmten Booleschen Bewertungen gf und gf 0 : gf (φ) = gf 0 (φ) Beweis durch Induktion nach dem Aufbau der Formel φ.
(25)
71
Semantik
1. Induktionsanfang: γ(φ) = 0; dann ist φ atomar, also eine Satzkonstante. . Also gilt für ein i mit 1 ≤ i ≤ n: φ = Pi . Dann haben wir wegen Klausel 5.1 der Definition 3.5: gf (φ) = f (Pi ) = f 0 (Pi ) = gf 0 (φ) 2. Induktionsschritt: Sei γ(φ) > 0. Dann enthält φ mindestens eine logische Konstante; die I.V. besagt, daß die Behauptung (25) für alle Formeln φ0 mit γ(φ0 ) < γ(φ) gilt. Von den fünf Fällen für die Gestalt von φ behandeln wir zwei; bei den übrigen wird vollkommen analog geschlossen. . (a) φ = ¬ψ; dann ist γ(ψ) < γ(φ), und die I.V. gilt für ψ. Also folgt: gf (φ) = 1 − gf (ψ) = 1 − gf 0 (ψ) = gf 0 (φ) . (b) φ = ψ ∨ χ; dann ist γ(ψ) < γ(φ) und γ(χ) < γ(φ), und die I.V. gilt für ψ und für χ. Damit ergibt sich: gf (φ) = max{ gf (ψ), gf (χ) } = max{ gf 0 (ψ), gf 0 (χ) } = gf 0 (φ) Damit ist der Induktionsschritt bewiesen. Mit dem Induktionsprinzip IND∗ folgt, daß die Behauptung (25) für alle Formelgrade von φ und damit für beliebige Formeln gilt.
2.3.2
Die Q-Analyse: Schnelle Gültigkeitstests
Bei Algorithmen spielt die Frage ihrer Effizienz eine große Rolle. Da bei der Wahrheitstafelmethode die Anzahl der Fälle mit der der Satzkonstanten in einer Formel exponentiell wächst, ist das Verfahren für lange Formeln praktisch unbrauchbar. Das folgende Verfahren, das auf Quine [205] zurückgeht und daher hier Q-Analyse genannt wird, ist erheblich effizienter und eignet sich besonders für einen schnellen Tautologie-Test “per Hand”. Die Idee bei der Q-Analyse besteht in einem gestaffelten Verfahren: Die Satzkonstanten in einer Formel werden hintereinander durch einen Wahrheitswert ersetzt; nach jeder derartigen Ersetzung wird die verbleibende Formel aufgrund der so gegebenen partiellen Information möglichst weit reduziert. Hat man etwa in einer Formel φ als Teilformel ein Konditional der Gestalt pP → ψq, wobei ‘P ’ durch den Wahrheitswert 0 ersetzt wird, so braucht man sich das Consequens ψ gar nicht mehr anzuschauen: der Wahrheitswert 1 für das Konditional steht mit der partiellen Information “Antecedens = 0” bereits fest. Also ist dieser Wert der Beitrag der Teilformel zum Gesamtergebnis. Aber selbst wenn nicht sofort für eine Teilformel ein konkreter Wert vorliegt, so kann sie doch auf eine einfachere Form zurückgeführt werden, die bei weiteren Einsetzungen schneller ein Resultat liefert. Ist die Teilformel zum Beispiel eine Konjunktion der Form pP ∧ ψq, so ergibt sie für “P = 0” den Wert 0 und für “P = 1” das andere Konjunktionsglied ψ. Der Wert der ganzen Konjunktion ist nämlich in diesem Fall gleich dem Wert von ψ. Dieser ist an dem gegebenen Punkt des Verfahrens zwar noch nicht bekannt; aber zum Wahrheitswert der gesamten Formel trägt die Konjunktion genau den Wert von ψ bei, und folglich kann das Konjunktionszeichen getilgt werden. Abbildung 2.3 möge illustrieren, daß eine Konjunktion mit einer 1 den
72
Aussagenlogik
Wert des anderen Konjunktionsgliedes annimmt und mit einer 0 sofort selbst 0 ist. Links sind die Fälle eingerahmt, in denen mindestens ein Konjunktionsglied 1 ist (zugehörige Regel: “tilge 1”); rechts sind die Fälle eingerahmt, in denen mindestens ein Glied 0 ist (zugehörige Regel: “reduziere auf 0”). P
Q
P ∧Q
1 - 1
1
1
1
1
0 - 0
1
0
0
0i P
1
1 0
0
1
0
0
0
0
0
0
0
P
Q
1
P ∧Q
Abbildung 2.3: Motivation der Q-Analyse: Konjunktion Dual dazu verhält sich die Disjunktion. Hier kann eine 0 getilgt werden, weil dann der Wert der Disjunktion gleich dem Wert des anderen Disjunktionsgliedes ist. Ist dagegen ein Disjunktionsglied wahr, so ist schon die ganze Disjunktion wahr. Auf der linken Seite der Abbildung 2.4 sind die Fälle mit 1 eingerahmt, mit der zugehörigen Regel: “reduziere zu 1”; auf der rechten Seite umgibt der Rahmen die Fälle mit 0, und die zugehörige Regel lautet “tilge 0”. P
Q
P ∨Q
P
Q
P ∨Q
1
1
1
1
1
1
1
0
1
1i P P
0
0
1
1
0
11 1 - 1
0
0
0
0
0 - 0
Abbildung 2.4: Motivation der Q-Analyse: Disjunktion Beim Konditional hatten wir als mögliche partielle WahrheitswertInformation den einfachsten Fall erwähnt, in dem das Antecedens 0 ist; dann ist das Konditional wahr. Tritt jedoch die 0 im Consequens auf, dann entnimmt man der rechten Seite von Abbildung 2.5, daß der Wert des Konditionals eine direkte Funktion des Wahrheitswerts des Antecedens ist: dessen Wert dreht sich nämlich um; dies ist in der Abbildung durch den durchgestrichenen Doppelpfeil angedeutet. Wir können also die Regel aufstellen, daß ein Konditional mit 0 auf die Negation des Antecedens reduziert; man beachte, daß die Regel den Ausgangsfall subsumiert, in dem das Antecedens 0 ist. Wie verhält sich ein Konditional mit einer 1? Wie auf der linken Seite von
73
Semantik
Abbildung 2.5 durch die Doppelpfeile angedeutet ist, reduziert ein solches Konditional auf das Consequens, und zwar unabhängig davon, ob die 1 im Antecedens oder im Consequens steht. P
Q
P →Q
1 - 1
1
1
1
1
0 - 0
1i P
0
0
1 - 1
0i P
1
0
0
0i P
0
P
Q
1
P →Q
1
k k k
1 0 1 1 1 1
Abbildung 2.5: Motivation der Q-Analyse: Konditional Von den Standardjunktoren bleibt schließlich noch das Bikonditional. Dessen Wahrheitstafel ist identisch mit der der Konjunktion, wenn man von dem Fall absieht, in dem beide Seiten falsch sind. Damit verhalten sich die Fälle mit einer 1 wie bei der Konjunktion, und die Regel lautet entsprechend: “tilge 1” (vgl. die linke Seite von Abbildung 2.6). Bleiben die Fälle des Bikonditionals mit einer 0. Wie die rechte Seite von Abbildung 2.6 zeigt, reduziert ein solches Bikonditional zur Negation der anderen Seite; diese Regel erfaßt sowohl die Fälle ungleicher Wahrheitswerte als auch den Fall “zweimal falsch”. P
Q
P ↔Q
1 - 1
1
1
1
1
0 - 0
1i P
0
0i P
1
10
0
0
0
1
0
P
Q
1
P ↔Q
I @ @
1 0 k 1 k- 0
0 k- 1 k
Abbildung 2.6: Motivation der Q-Analyse: Bikonditional Wir fassen die auf diese Weise motivierten Regeln der Q-Analyse zusammen. Sei φ eine AL-Formel, die auf ihre Gültigkeit geprüft werden soll. φ wird an die Wurzel eines zu erzeugenden Testbaumes gesetzt. Man schaut dann zunächst nach, welche Satzkonstante in φ am häufigsten auftritt; diese ersetzt man in einer ersten Verzweigung auf dem linken Ast durch 1 und auf dem rechten durch 0 (kommen alle Satzkonstanten von φ gleich häufig vor, ist die Reihenfolge beliebig; man kann dann z.B. alphabetisch vorgehen). Dies ist die “Vorfahrtsregel”, die übrigens bei jedem neuen Ersetzungsschritt neu zu prüfen ist. Die resultierenden Ausdrücke werden dann auf beiden Seiten gemäß den Reduktionsregeln
74
Aussagenlogik
soweit wie möglich vereinfacht. Dann wird analog mit der nächsten Satzkonstante verfahren, wobei an jedem Knoten eine neue 1-0-Verzweigung angehängt wird. Das Verfahren bricht nach endlich vielen Schritten ab. Die Formel φ ist genau dann gültig oder eine Tautologie, wenn jeder Ast mit einer 1 endet; sie ist genau dann erfüllbar, wenn mindestens ein Ast mit einer 1 endet. Es wurde noch nichts darüber gesagt, wie wir mit negierten Formeln verfahren. Bei ihnen werden in naheliegender Weise die Werte vertauscht. Ergibt sich also im Zuge der Reduktionsschritte die Kombination ‘¬w’ mit dem Wahrheitswert w = 0 oder w = 1, so reduziert sie zum umgekehrten Wahrheitswert (das läßt sich kurz als 1 − w schreiben; siehe Gleichung (22a)). Tritt eine Satzkonstante negiert auf, so kann bei ihrer Ersetzung durch einen Wahrheitswert sogleich dessen Gegenteil eingesetzt werden. Quine-Analyse (kurz: Q-Analyse) für rationelle Wahrheits- bzw. Gültigkeitstests von aussagenlogischen Formeln oder Formelschemata. (GR) Grundregel für die Q-Analyse: • Ersetze eine Satzkonstante P durch einen Wahrheitswert w ∈ {0, 1}; tritt P negiert auf, so ersetze ‘¬P ’ durch 1 − w.
Vorfahrtsregel: Beginne mit derjenigen Satzkonstanten, die am häufigsten auftritt.
• Reduziere soweit wie möglich gemäß der folgenden Regeln und beginne mit der nächsten Satzkonstanten. (Kj 1)
Tilge ‘1’ als Konjunktionsglied
(Kj 0)
Reduziere eine Konjunktion mit ‘0’ zu 0
(Dj 1)
Reduziere eine Disjunktion mit ‘1’ zu 1
(Dj 0)
Tilge ‘0’ als Disjunktionsglied
(Kd 1)
Reduziere ein Konditional mit ‘1’ zum Consequens
(Kd 0)
Reduziere ein Konditional mit ‘0’ zur Negation des Antecedens
(Bk 1)
Tilge ‘1’ als Glied eines Bikonditionals
(Bk 0)
Reduziere ein Bikonditional mit ‘0’ auf die Negation der anderen Seite
(>⊥)
Reduziere eine (erkennbare bzw. bereits bewiesene) Tautologie zu 1 und eine (erkennbare bzw. bereits bewiesene) Kontradiktion zu 0
75
Semantik
Im folgenden Kasten sind die verschiedenen Reduktionsschritte (abgekürzt durch das Symbol B) schematisch zusammengefaßt. (B) Reduktionsregeln: (¬)
Neg[w] B 1 − w
(∧)
TILGE 1
(w = 1, 0) TILGE 0
(∨)
Kj[0] B 0 (→)
Dj[1] B 1
Kd[1] B Kons
(↔)
Kd[0] B NEG(Ante) (>)
Tautologie B 1
TILGE 1 Bk[0] B NEG(andere Seite)
(⊥)
Kontradiktion B 0
Bemerkung. Die letzten Regeln (>) und (⊥) sind als “pragmatische” Regeln aufzufassen, die natürlich nicht den ganzen Test obsolet machen sollen, sondern das Verfahren an den Stellen abkürzen können, an denen Teilformeln auftreten, welche bereits in früheren Beweisen als tautologisch oder kontradiktorisch nachgewiesen wurden.
Beispiel 2.7 Wit testen zunächst die Gültigkeit einer einfachen Tautologie. Es handelt sich um das Theorem (A.4) der in Abschnitt 2.3.3 aufgeführten Liste von Tautologien. Sei also φ die Formel p (P → Q) → ((Q → R) → (P → R)) q.
(P → Q) → ((Q → R) → (P → R)) P (1 → Q) → ((Q → R) → (1 → R))
(0 → Q) → ((Q → R) → (0 → R))
Q → ((Q → R) → R)
1 → ((Q → R) → 1)
Q
1 → 1
1 → ((1 → R) → R)
0 → ((0 → R) → R)
R → R
1
1
1
76
Aussagenlogik
Man sieht hier, daß die Gültigkeit von φ von dem Wert von R überhaupt nicht abhängt, und für P = 0 auch nicht von dem Wert von Q. Während also die Wahrheitstafelmethode 8 Fälle untersuchen muß, bleiben hier nur 3 übrig. Beispiel 2.8 Gültigkeitstest für die Formel p (P ∧ Q) ∨ (¬P ∧ ¬R) → (Q ↔ R)q (P ∧ Q) ∨ (¬P ∧ ¬R) → (Q ↔ R) P (1 ∧ Q) ∨ (0 ∧ ¬R) → (Q ↔ R)
(0 ∧ Q) ∨ (1 ∧ ¬R) → (Q ↔ R)
(Q ∨ 0) → (Q ↔ R)
(0 ∨ ¬R) → (Q ↔ R)
Q → (Q ↔ R)
¬R → (Q ↔ R)
Q
R
1 → (1 ↔ R)
0 → (0 ↔ R)
0 → (Q ↔ 1)
1 → (Q ↔ 0)
1 ↔ R
1
1
Q ↔ 0
1
R
¬Q
R
Q 0
0
1
Erfüllungstest mittels Q-Analyse: Hier genügt es, den erfolgversprechendsten Ast zu verfolgen, da der Wahrheitsnachweis bei einer einzigen Belegung bereits zum Ziel führt. Im obigen Beispiel entwickelt man etwa die linke Seite bis zu dem Ausdruck p Q → (Q ↔ R)q und setzt dann f (Q) = 0.
Sinngemäßes gilt für den Nachweis, daß ein Formelschema nicht gültig ist (Wert 0 bei mindestens einer Belegung). Dies stellt zugleich einen Erfüllungstest für die Negation dieses Formelschemas dar.
Sonderstrategien. Hat bei einem Gültigkeitstest die Formel φ die Gestalt p ψ → Rq oder p R → ψq , so beginnt man vorteilhafter mit der Satzkonstanten R unabhängig von der Vorfahrtsregel. Im ersten Fall ist man nämlich mit der Wahl f (R) = 1 sofort am Ziel, im zweiten mit der Annahme f (R) = 0. Analoges gilt für die anderen Testtypen. Übung 2.9 Beweisen Sie mit Hilfe der Q-Analyse die Gültigkeit von Theoremen aus der folgenden Liste, und zwar solange, bie Sie vollkommene Kontrolle über das Verfahren haben.
77
Semantik
2.3.3
Eine Liste von Tautologien
Die folgenden Theoreme (häufig auch logische Gesetze genannt) sind tautologisch gültige Schemata.10 Es handelt sich um Schemata, da keine Satzkonstanten, sondern ihre Mitteilungszeichen (Großbuchstaben ‘P ’,‘Q’,‘R’,‘S’) verwendet werden. Zu noch allgemeineren Schemata siehe unten. Häufig sind unter den Theoremen die konditionalen Gegenstücke zu aussagenlogischen Schlußregeln wie dem Modus Ponens (MP) zu finden. Der Name der Schlußregel wurde dann als Bezeichnung für das Theorem übernommen, mit dem Zusatz ‘T’ für ‘Theorem’; ‘MP-T ’ steht also für das Modus-PonensTheorem, ‘∧B-T ’ für das Theorem der ∧-Beseitigung, usw. Die Schlußregeln selbst treten erst im Rahmen der Kalkülisierung der Aussagenlogik auf; siehe dazu Kapitel 7. Abkürzungen. Ant: Antecedens As: Abschwächung Ass: assoziativ B : Beseitigung Bk : Bikonditional bKd : bedingtes Kd Cons: Consequens Dj : Disjunktion dj : disjunktiv Dt: Distributivität DM : DeMorgan DNF : disjunktive Normalform E : Einführung EFQ: Ex falso quodlibet Exp: Exportation Idemp: idempotent Imp: Importation IrBw : Indirekter Beweis Kd : Konditional kd : konditional Kj : Konjunktion kj : konjunktiv KlD: Klassisches Dilemma KsD: Konstruktives Dilemma KNF : konjunktive Normalform
Komm: kommutativ Kp: Kontraposition Kpn : Kp mit negativem Ant Kp p : Kp mit positivem Ant Ktrd : Kontradiktion LdA: Lindenbaum-Algebra MP : Modus ponens MTP : Modus tollendo ponens ng: negiert RdA: Reductio ad absurdum Sym: symmetrisch Taut: Tautologie TND: Tertium non datur Trans: transitiv Vtlg: Verteilung Vtsg: Vertauschung Wdl : Widerlegung 0-El : Null-Element in LdA 1-El : Eins-Element in LdA ∧E.Ant: Kj-Einführung im Ant ∧E.Cons: Kj-Einführung im Cons ∨E.Ant: Dj-Einführung im Ant →E.Ant: Kd-Einführung im Ant ↔E.Ant: Bk-Einführung im Ant
10 Alle Tautologien, die an verschiedenen Stellen des Buches benötigt werden, sind in dieser Zusammenstellung enthalten. Die Theoreme stellen im wesentlichen eine Auswahl aus einer noch umfangreicheren Liste dar, welche sich in dem Lehrbuch [132] findet; die Bezeichnungen für die Schemata wurden hier hinzugefügt.
78
Aussagenlogik
(A.1)
P → P
(Selbstimplikation)
(A.2)
P → (Q → P )
(A.3)
P → ((P → Q) → Q)
(A.4)
(P → (Q → R)) → ((P → Q) → (P → R))
(A.5)
(P → Q) → ((Q → R) → (P → R))
(Schnitt-T )
(A.6)
(P → (Q → R)) → (Q → (P → R))
(AntVtsg im bKd )
(A.7)
((P → Q) → P ) → P
(A.8)
¬¬P → P
(¬B-T )
(A.9)
P → ¬¬P
(¬E-T )
(As-T ) (MP-T ) (AntVtlg im bKd )
(Peirce’sches Gesetz )
(A.10)
¬P → (P → Q)
(EFQ-T )
(A.11)
(¬P → P ) → P
(consequentia mirabilis)
(A.12)
(P → Q) → (¬Q → ¬P )
(Kp p -T )
(A.13)
(¬Q → ¬P ) → (P → Q)
(Kpn -T )
(A.14)
P → (¬Q → ¬(P → Q))
(A.15)
(P → Q) → ((¬P → Q) → Q)
(KlD-T )
(A.16)
(P → Q) → ((P → ¬Q) → ¬P )
(RdA-T )
(A.17)
(¬P → Q) → ((¬P → ¬Q) → P )
(IrBw-T )
(A.18)
(¬P → R) → ((Q → R) → ((P → Q) → R))
(A.19)
P ∧Q → P
(∧B-T )
(A.20)
P ∧Q → Q
(∧B-T )
(A.21)
P → (Q → P ∧ Q)
(∧E-T )
(A.22)
P ↔ P ∧P
(∧Idemp-T )
(A.23)
P ∧Q ↔ Q∧P
(∧Komm-T )
(A.24)
P ∧ (Q ∧ R) ↔ (P ∧ Q) ∧ R
(A.25)
(P ∧ Q → R) → (P → (Q → R))
(Exp-T )
(A.26)
(P → (Q → R)) → (P ∧ Q → R)
(Imp-T )
(A.27)
(P → Q) ∧ (P → R) → (P → Q ∧ R)
(A.28)
¬(P ∧ ¬P )
(WdlKd-T )
(→E.Ant-T )
(∧Ass-T )
(∧E.Cons-T )
(Satz vom ausgeschlossenen Widerspruch)
79
Semantik (A.29)
P ∧ Q ↔ ¬(P → ¬Q)
(Kj durch ¬ und →)
(A.30)
(P → Q) ↔ ¬(P ∧ ¬Q)
(Kd durch ¬ und ∧)
(A.31)
¬(P → Q) ↔ P ∧ ¬Q
(A.32)
P → P ∨Q
(∨E-T )
(A.33)
Q → P ∨Q
(∨E-T )
(A.34)
(P ∨ Q) ∧ (P → R) ∧ (Q → R) → R
(∨B-T )
(A.35)
P ↔ P ∨P
(∨Idemp-T )
(A.36)
P ∨Q ↔ Q∨P
(∨Komm-T )
(A.37)
P ∨ (Q ∨ R) ↔ (P ∨ Q) ∨ R
(A.38)
(P → Q) → ( (¬P → R) → Q ∨ R )
(djKlD-T )
(A.39)
(P ∨ Q) ∧ (P → R) ∧ (Q → S) → R ∨ S
(djKsD-T )
(A.40)
(P → R) ∧ (Q → R) ↔ (P ∨ Q → R)
(∨E.Ant-T )
(A.41)
(P → R) ∨ (Q → R) ↔ (P ∧ Q → R)
(∧E.Ant-T )
(A.42)
P ∨ ¬P
(A.43)
P ∨ Q → (¬P → Q)
(MTP-T )
(A.44)
P ∨ Q → (¬Q → P )
(MTP-T )
(A.45)
P ∨ Q ↔ (¬P → Q)
(Dj durch ¬ und →)
(A.46)
(P → Q) ↔ ¬P ∨ Q
(Kd durch ¬ und ∨)
(A.47)
¬(P ∧ Q) ↔ ¬P ∨ ¬Q
(DM∧-T )
(A.48)
¬(P ∨ Q) ↔ ¬P ∧ ¬Q
(DM∨-T )
(A.49)
P →Q ↔ P ∧Q↔P
(P unter Q: P inf )
(A.50)
↔
(P unter Q: Q sup)
(A.51)
P ↔ P ∨ (P ∧ Q)
(∧-∨-Absorption)
(A.52)
P ↔ P ∧ (P ∨ Q)
(∨-∧-Absorption)
(A.53)
P ↔ (Q ∨ ¬Q) ∧ P
(Taut als 1-El )
(A.54)
P ↔ (Q ∧ ¬Q) ∨ P
(Ktrd als 0-El )
(A.55)
P ↔ (P ∧ Q) ∨ (P ∧ ¬Q)
(P in DNF über P,Q)
(A.56)
P ↔ (P ∨ Q) ∧ (P ∨ ¬Q)
(P in KNF über P,Q)
(DM→-T )
(∨Ass-T )
(TND)
80
Aussagenlogik
(A.57)
P ∧ (Q ∨ R) ↔ (P ∧ Q) ∨ (P ∧ R)
(∧Dt-T )
(A.58)
P ∨ (Q ∧ R) ↔ (P ∨ Q) ∧ (P ∨ R)
(∨Dt-T )
(A.59)
(P ∧ Q) ∨ (R ∧ S) ↔ (P ∨ R) ∧ (P ∨ S) ∧ (Q ∨ R) ∧ (Q ∨ S) (allgemeine ∧-∨-Distributivität)
(A.60)
(P ∨ Q) ∧ (R ∨ S) ↔ (P ∧ R) ∨ (P ∧ S) ∨ (Q ∧ R) ∨ (Q ∧ S) (allgemeine ∨-∧-Distributivität)
(A.61)
(P → Q) ∧ (R → S) ↔ (¬P ∧ ¬R) ∨ (¬P ∧ S) ∨ (Q ∧ ¬R) ∨ (Q ∧ S) (Kj zweier Kd’e in DNF )
(A.62)
(P ↔ Q) ↔ (Q ↔ P )
(A.63)
(P ↔ Q) ∧ (Q ↔ R) → (P ↔ R)
(A.64)
(P ↔ (Q ↔ R)) ↔ ((P ↔ Q) ↔ R)
(A.65)
P ∧ Q → (P ↔ Q)
(↔E-T )
(A.66)
¬P ∧ ¬Q → (P ↔ Q)
(↔E-T )
(A.67)
(P ↔ Q) ↔ (P → Q) ∧ (Q → P )
(↔B-T )
(A.68)
(P ↔ Q) ↔ (P ∧ Q) ∨ (¬P ∧ ¬Q)
(A.69)
(P ↔ Q) ↔ ¬((P → Q) → ¬(Q → P ))
(A.70)
((P ↔ Q) → R) ↔ (P ∧ Q → R) ∧ (¬P ∧ ¬Q → R) (↔E.Ant-T )
(A.71)
(P ↔ Q) ∨ (P ↔ ¬Q)
(A.72)
(P → (Q ↔ R)) ↔ (P ∧ Q ↔ P ∧ R)
(kjAntVtlg ↔)
(A.73)
(P → (Q ↔ R)) ↔ ((P → Q) ↔ (P → R))
(kdAntVtlg ↔)
(A.74)
¬(P ↔ Q) ↔ (P ↔ ¬Q)
(A.75)
P ∧ ¬Q → ¬(P ↔ Q)
(↔∗ E-T )
(A.76)
¬P ∧ Q → ¬(P ↔ Q)
(↔∗ E-T )
(A.77)
¬(P ↔ Q) ↔ (P ∧ ¬Q) ∨ (¬P ∧ Q)
(↔Sym-T ) (↔Trans-T ) (↔Ass-T )
(Bk in DNF ) (Bk durch ¬ und →)
(TND ↔)
(DM↔-T )
(ngBk in DNF )
In den AL-Theoremen der obigen Liste können zwar beliebige Satzkonstanten gewählt werden, aber keine komplexeren Formeln. So ist etwa das Schema P ∧Q →P ∧Q zwar eine erkennbare Tautologie, aber keine Instanz eines der aufgeführten Theoreme. Wir wollen daher in systematischer Weise zu jedem dieser AL-Theoreme
81
Semantik
ein allgemeineres Schema angeben, so daß auch solche Fälle erfaßt werden. Die verwendeten Mitteilungszeichen ‘φ’, ‘ψ’, ‘χ’, ‘θ’ können nunmehr für beliebige Formeln und nicht nur für Satzkonstanten stehen. Gleichgültig wie komplex also eine Formel ist, sofern sie nur “auf der obersten Ebene” die Form einer Tautologie hat, ist sie stets gültig (natürlich müssen verschiedene Vorkommen eines und desselben Mitteilungszeichens für dieselbe Formel stehen). Der semantische Grund dafür ist leicht einzusehen: bei der Berechnung des Wahrheitswerts einer Formel kommt es bei jeder Teilformel nur auf das soweit gewonnene Resultat an, unabhängig von der “Vorgeschichte” der Berechnung. Wenn also auf der obersten Ebene eine tautologische Gestalt vorliegt, wird sich stets der Wahrheitswert 1 ergeben. Die neue Gestalt der Theoreme besitzt noch einen weiteren Vorteil. Im vorliegenden Kapitel vertreten die syntaktischen Formelvariablen ‘φ’, ‘ψ’, etc. lediglich AL-Formeln; in reicheren Sprachen, etwa der Prädikatenlogik, der Mengenlehre oder der Arithmetik, können jedoch ebenfalls Formeln auftreten, die die Form einer Tautologie haben. Während also der Inhalt wechselt, ist die Form die gleiche und in allen diesen Systemen wiederverwendbar. Betrachten wir als Beispiel etwa das zweite Theoremschema (A.2), mit ‘φ’ statt ‘P ’ und ‘ψ’ statt ‘Q’, hier wiedergegeben als (26a); (26)
a. b. c. d. e. f. g.
ψ → (φ → ψ) Q → (P → Q) p5 → (p0 → p5 ) p2 ∧ ¬p3 → ((p23 → ¬p69 ∨ p1024 ) → p2 ∧ ¬p3 ) ∃xQx → (∀x∃yP 2 xy → ∃xQx) ∃x(x ∈ a) → (∀y(y ∈ a → ∃z(z ∈ b)) → ∃x(x ∈ a) ) x + y = z → (x = x → x+ y = z)
eine mögliche Instanz (selbst ebenfalls ein Schema) ist das obige Theoremschema (A.2), das hier unter (26b) aufgeführt ist und in dem nur Mitteilungszeichen für Satzkonstanten auftreten. Für beide Schemata (26a) und (26b) ist die Formel (26c) eine mögliche Instanz, während (26d) nur für (26a) eine Instanz darstellt. Alle diese Formeln und Formelschemata gehören jedoch zur Aussagenlogik. Dagegen ist (26e) zwar ein Formelschema der Prädikatenlogik; es ist jedoch tautologischer Natur, weil es unabhängig von dem prädikatenlogischen Material auf das aussagenlogische Theoremschema (A.2) paßt. Gleiches gilt für die mengentheoretische Formel (26f) und die arithmetische Formel (26g). Wir ordnen nun jedem AL-Theorem (A.n) (für n = 1, . . . , 77) ein Theoremschemata (A.n0 ) zu, welches durch die folgende feste Ersetzung der syntaktischen Variablen entsteht: P 7→ φ ;
Q 7→ ψ ;
R 7→ χ ;
S 7→ θ
Es seien vier Beispiele für die gestrichenen Versionen der AL-Theoreme gegeben. (A.40 ) (A.250 ) 0
(A.40 ) (A.590 )
(φ → (ψ → χ)) → ((φ → ψ) → (φ → χ)) (φ ∧ ψ → χ) → (φ → (ψ → χ)) (φ → χ) ∧ (ψ → χ) ↔ (φ ∨ ψ → χ)
(AntVtlg im bKd ) (Exp-T ) (∨E.Ant-T )
(φ ∧ ψ) ∨ (χ ∧ θ) ↔ (φ ∨ χ) ∧ (φ ∨ θ) ∧ (ψ ∨ χ) ∧ (ψ ∨ θ)
82
Aussagenlogik
Kapitel 3
Strukturtheorie der Aussagenlogik 3.1
Zweistellige Junktoren
Die Junktoren sind logische Konstanten der Aussagenlogik (und auch der Prädikatenlogik). Sie sind damit syntaktische Objekte. Im Unterschied zu den Satzkonstanten, die ihre Bedeutung, d.h. ihren Wahrheitswert, von Belegung zu Belegung verändern, ist die Bedeutung der logischen Konstanten stets dieselbe. Die Bedeutung eines Junktors ist allerdings kein einfacher Wahrheitswert, sondern eine Zuordnung von neuen zu gegebenen Wahrheitswerten, also eine Funktion von (Paaren von) Wahrheitswerten in Wahrheitswerte. Solche Funktionen werden kurz Wahrheitsfunktionen genannt. Die Bedeutung eines Junktors ist also eine Wahrheitsfunktion, sein Gegenstück auf der Ebene der Semantik; ihre Argumente und Werte sind in der zugehörigen Wahrheitstafel festgelegt. Die Bedeutung eines einstelligen Junktors ist eine einstellige Wahrheitsfunktion. Zum Beispiel ist die Bedeutung der Negation diejenige Wahrheitsfunktion, die 1 den Wert 0 und 0 den Wert 1 zuordnet. Offensichtlich gibt es 22 = 4 einstellige Wahrheitsfunktionen und zugehörige einstellige Junktoren. Außer der Negation sind dies der (1-stellige) Verum-Junktor >, der (1-stellige) FalsumJunktor ⊥, sowie der Identitätsjunktor I. >φ erhält stets den Wert 1, ⊥φ stets den Wert 0, und I φ läßt den Wert von φ unverändert.1 Die Bedeutung eines zweistelligen Junktors ist eine zweistellige Wahrheitsfunktion. Die Wahrheitsfunktionen der 2-stelligen “Standard”-Junktoren ergeben sich aus den obigen Wahrheitstafeln. Da es im 2-stelligen Fall vier verschiedene Paare von Argumenten gibt (h1, 1i, h1, 0i, h0, 1i, h0, 0i), gibt es 24 = 16 zweistellige Wahrheitsfunktionen und zugehörige zweistellige Junktoren. In den üblichen Darstellungen der Aussagenlogik ist daher die Mehrzahl der Wahrheitsfunktionen durch kein Junktorensymbol vertreten. Der Grund dafür ist, daß sich alle junktorenlogischen Verknüpfungen durch einen oder zwei Junkto1 Wir verwenden hier die Symbole ‘>’ und ‘⊥’ kategoriell mehrdeutig, d.h. einerseits als Satzkonstanten und hier als einstellige Junktoren. Im folgenden werden sie ferner als Namen für zweistellige Junktoren verwendet; ihre gemeinsame Bedeutung ist, daß die zugehörigen Wahrheitsfunktionen für null, ein oder zwei Argumente stets den Wert 1 bzw. 0 liefern (hier wurden Satzkonstanten als “nullstellige” Wahrheitsfunktionen aufgefaßt).
83
84
Aussagenlogik
φJψ 11
10
01
00
J
Bezeichnung
zu lesen als
1
1
1
1
>
Verum-Junktor
Verum
1
1
1
0
∨
Disjunktion
φ oder ψ
1
1
0
1
←
Konverses Konditional
φ falls ψ
1
1
0
0
1
Erste Projektion
φ egal ob ψ
1
0
1
1
→
Konditional
wenn φ dann ψ
1
0
1
0
2
Zweite Projektion
egal ob φ, ψ
1
0
0
1
↔
Bikonditional
φ genau dann wenn ψ
1
0
0
0
∧
Konjunktion
φ und ψ
0
1
1
1
↑
Sheffer-Strich
nicht zugleich φ und ψ
0
1
1
0
∨˙
Ausschließende Disjunktion
φ oder ψ aber nicht beides zugleich
0
1
0
1
2*
Dual der 2. Projektion
egal ob φ, nicht ψ
0
1
0
0
→*
Dual des Konditionals
φ aber nicht ψ
0
0
1
1
1*
Dual der 1. Projektion
nicht φ egal ob ψ
0
0
1
0
←*
Dual des konversen Konditionals
nicht φ aber ψ
0
0
0
1
↓
Simultane Negation
weder φ noch ψ
0
0
0
0
⊥
Falsum-Junktor
Falsum
Tabelle 3.1: Die 16 zweistelligen Junktoren
85
Strukturtheorie
ren ausdrücken lassen (siehe Abschnitt 3.2.1). Daraus ergibt sich speziell, daß eigentlich auch nicht alle Standard-Junktoren zur Definition der aussagenlogischen Sprache benötigt werden. In der Metalogik wäre ein Vorteil eines kleineren Arsenals von logischen Konstanten, daß dann die Induktionsbeweise über den Formelaufbau kürzer würden (beim Induktionsschritt müßten weniger Fälle betrachtet werden). Da hier die Metalogik bis auf weiteres nicht im Vordergrund steht, belassen wir es bei der jetzigen Definition der Syntax von LAL . Wir können jedoch eine Erweiterung L00AL der Sprache LAL betrachten, in der die neuen Junktoren zu den logischen Zeichen zählen. Definition 2.3 ist dann für jedes neue Junktorensymbol J um die folgende Rekursionsklausel zu ergänzen: 30 Sind φ und ψ L00AL -Formeln, so ist auch p (φ J ψ) q eine L00AL -Formel. Man beachte, daß damit zwar nicht die Form, aber doch der “Inhalt” auch der anderen Regeln verändert wird; so kann etwa das Mitteilungszeichen φ in der Regel 2 nun nicht nur für LAL -Formeln, sondern auch für L00AL -Formeln stehen, d.h. Nicht-Standard-Verknüpfungen können nach Belieben mit den StandardJunktoren kombiniert werden.2 Wie findet man nun die restlichen Wahrheitsfunktionen? Zu nennen wären z.B. die triviale Funktion, die stets den Wert 1 liefert (den zugehörigen Junktor nennen wir wieder den Verum-Junktor >), oder stets den Wert 0, mit dem Falsum-Junktor ⊥ als syntaktischem Gegenstück. Weitere Wahrheitsfunktionen bekommt man durch lexikographische Aufzählung der Wertefolgen (siehe unten) oder durch Dualisieren schon bekannter Junktoren: die Werte dualer Junktoren ergeben sich durch Vertauschen von 1 und 0; z. B. sind > und ⊥ sowie ↔ und ∨˙ duale Paare. Ist J ein Junktor, so sei J∗ der zu J duale Junktor . Es gilt stets, mit der Normfunktion ‘k · k’ für den Wahrheitswert einer Formel bei einer unspezifizierten Belegung:3 k φ J∗ ψ k = 1 − k φ J ψ k
(1)
φ J∗ ψ ≡ ¬ ( φ J ψ )
(2)
Also ist eine Formel mit einem zu J dualen Junktor als Hauptzeichen logisch äquivalent zur Negation der Formel, die J statt J∗ als Hauptzeichen enthält:
Die 16 zweistelligen Junktoren sind zusammen mit den zugehörigen Wahrheitsfunktionen in Tabelle 3.1 zusammengestellt. Die erste Spalte enthält die Argumente und die Werte der Wahrheitsfunktionen. Die oben erwähnten vier Paare von Argumenten, die jede zweistellige Wahrheitsfunktion besitzt, sind hier verkürzt als die Ziffernpaare 11, 10, 01 und 00 wiedergegeben; dabei steht die erste Ziffer in jedem Paar für den Wert des Vorderglieds φ der Verknüpfung φJψ und die zweite Ziffer für den Wert des Hinterglieds ψ. Gibt man die Argumente in dieser festen Anordnung vor, so ist jede Wahrheitsfunktion in der Liste durch eine Folge von vier Werten (ein “Quadrupel”) eindeutig bestimmt; z.B. ist die Wahrheitsfunktion des Konditionals durch das Quadrupel h1, 0, 1, 1i 2 Schon der Begriff des Ausdrucks verändert sich: L00 -Ausdrücke sind jetzt endliche Ketten AL von L00 AL -Symbolen und nicht nur von LAL -Symbolen. Analoge Bemerkungen gelten natürlich bereits für die Sprache L0AL , die in Abschnitt 2.2 eingeführt wurde. 3 Siehe Bemerkung 1 nach Definition 2.6.
86
Aussagenlogik
gegeben, da der einzige Falschheitsfall der zweite mit dem Argument ‘10’ ist, also “Vorderglied wahr, Hinterglied falsch”. Die 16 Quadrupel bestimmen durch ihre lexikographische Anordnung 4 die Reihenfolge der Junktoren. In der zweiten Spalte sind ihre syntaktischen Symbole aufgeführt, in der dritten ihre Bezeichnungen und in der vierten ein Vorschlag, wie sie umgangsprachlich zu lesen sind. Gemäß der lexikographischen Anordnung beginnt die Liste mit dem VerumJunktor , gefolgt von der Disjunktion. In der dritten Zeile befindet sich das konverse Konditional , in dem Antecedens und Consequens vertauscht sind; folglich ist der einzige Falschheitsfall der Fall ‘01’. Danach kommt die erste Projektion 1, so genannt, weil sie genau dann den Wert 1 liefert, wenn das Vorderglied φ wahr ist (unabhängig von dem Wert des Hinterglieds), oder formal gesprochen: wenn die erste Komponente des Argument-Ziffernpaars 1 ist. Nach dem schon erwähnten Konditional folgt in der Liste die zweite Projektion 2, deren Wert genau von dem Wert des Hinterglieds bestimmt wird. Danach kommen zwei bekannte Junktoren, das Bikonditional und die Konjunktion. Das sind die ersten acht der 16 Junktoren. Die folgende horizontale Doppellinie kann als Spiegelachse aufgefaßt werden, an der sich die Quadrupel achsensymmetrisch spiegeln und dabei zu ihrem dualen Quadrupel übergehen, in dem 0 und 1 vertauscht sind. So finden sich z.B. ˙ wieder. Der zur Konjunkdie oben genannten dualen Paare h>, ⊥i und h↔, ∨i tion duale Junktor ist der sog. Sheffer-Strich ↑ (meist mit ‘|’ bezeichnet). Eine Verknüpfung pφ ↑ ψq ist genau dann falsch, wenn φ und ψ beide wahr sind, also wahr genau dann, wenn φ und ψ nicht zugleich wahr sind, oder (dual zu ∧!) wenn mindestens ein Glied falsch ist. Die Wahrheitsfälle der dann folgenden ausschließenden Disjunktion sind diejenigen, in denen φ und ψ (offensichtlich dual zu ↔) verschiedene Wahrheitswerte haben, oder anders ausgedrückt, wenn φ oder ψ wahr ist, aber nicht beide zugleich wahr sind. Nach dem Dual der zweiten Projektion, dem wir hier keinen eigenen Namen geben, kommt das Dual des Konditionals oder das negierte Konditional , welches gerade im Falschheitsfall des Konditionals wahr ist, also wenn das Antecedens wahr und das Consequens falsch ist. Unter den letzten vier Junktoren befinden sich neben dem Dual der ersten Projektion und dem Dual des konversen Konditionals der Falsum-Junktor und schließlich die simultane Negation ↓, in der natürlichen Sprache als “weder . . . noch” lexikalisiert. Die simultane Negation ist dual zur Disjunktion, was auch in der Sprachsemantik realisiert ist: eine nicht-ausschließende Alternative “φ oder ψ” ist genau dann falsch, wenn weder φ noch ψ gilt.5 Bemerkung. Unter den Nicht-Standard-Junktoren spielen der Sheffer-Strich ↑ sowie die simultane Negation ↓ eine besondere Rolle, da jeder von ihnen für 4 Die
Quadrupel kann man als “Wörter” mit je 4 “Buchstaben” über dem “Alphabet” { 1, 0 } mit 1 vor 0 auffassen; die zugehörige alphabetische Ordnung nach Art eines Lexikons ist die lexikographische Anordnung 1111, 1110, . . . , 0001, 0000. 5 Die 16 Wahrheitsfunktionen werden auch in ([25]:35) aufgeführt und mit Symbol und Namen versehen, die bei den Nicht-Standard-Junktoren von den hier gegebenen abweichen. In der lexikographischen Anordnung lauten sie: > (1111: Tautologie), ∨ (1110: Disjunktion), ← (1101: Replikation), c (1100: Präpendenz), → (1011: Implikation), b (1010: Postpendenz), ↔ (1001: Äquivalenz), ∧ (1000: Konjunktion), | (0111: Exklusion), >− −< (0110: Kontravalenz), d (0101: Postnonpendenz), >− − (0100: Postsektion), e (0011: Pränonpendenz), − −< (0010: Präsektion), † (0001: Rejektion), ⊥ (0000: Antilogie).
Strukturtheorie
87
sich allein ein minimales wahrheitsfunktional vollständiges System bildet: alle wahrheitsfunktionalen Verknüpfungen können mit ihm allein erzeugt werden. Siehe dazu Abschnitt 3.2.1.
3.1.1
Der Diamant der Wahrheitsfunktionen
Wir wollen nun die logischen Beziehungen der zweistelligen Wahrheitsfunktionen in einer Figur illustrieren, die wegen ihrer Gestalt kurz “der Diamant” heißen möge. Die hier zweidimensional wiedergegebene Figur stelle man sich als punktsymmetrischen Körper im Raum mit 16 Ecken vor, der durch 20 Dreiecke und 4 Rechtecke oder Trapeze begrenzt ist. Die Ecken liegen auf fünf übereinander liegenden parallelen Ebenen. In der untersten und obersten Ebene befindet sich jeweils eine Ecke, in der zweiten und vierten je vier und in der mittleren Ebene sechs Ecken. In Abbildung 3.1 sind diese Ebenen durch gestrichelte Linien angedeutet. Die Pfeile, die die Ecken miteinander verbinden, sind keine Kanten der Figur und fallen nur in einigen Fällen mit solchen zusammen (Kanten wurden nicht eingezeichnet, wenn auf ihnen kein Pfeil liegt). Die Pfeile geben vielmehr die Struktur an, die den 16 Ecken aufgeprägt ist. Werden die Ecken mit geeigneten Objekten “dekoriert”, so definiert das Ensemble der Pfeile eine Ordnungsrelation ≤D (‘D’ für ‘Diamant’) auf der Menge der Objekte, wobei für zwei Objekte a und b gilt: a ≤D b genau dann, wenn es einen “Pfad” entlang einer Kette von Pfeilen gibt, der in a beginnt und in b endet. Eine solche Struktur definiert einen so genannten Verband mit einem kleinsten Element (die unterste Ecke) und einem größten Element (die oberste Ecke), welcher noch weitere algebraische Eigenschaften hat, die wir unten genauer angeben werden. Im Moment sei festgehalten, daß diese Struktur durch Objekte aus verschiedenen mathematischen und logischen Bereichen realisiert wird, untern anderem durch die 16 Wahrheitsfunktionen. Die Ecken sind mit Formeln versehen, die aus den aussagenlogische Verknüpfungen zweier Satzkonstanten P und Q mit allen zweistelligen Junktoren bestehen; siehe Abbildung 3.2. In dieser Realisierung stehen die Pfade entlang der Pfeilketten für die Relation der logischen Folgerung. Zum Beispiel gibt es für jede Formel φ einen Pfad, der im untersten Element P ⊥Q beginnt und in φ endet. Nun ist P ⊥Q äquivalent zum Falsum ⊥ als Satzkonstante, und der Pfad bedeutet damit soviel wie das ex falso quodlibet. Umgekehrt führt von jeder Formel ein Pfad zur Verum-Verknüpfung, was soviel heißt wie daß logische Wahrheiten aus jeder Formel folgen. In ähnlicher Weise können, wie wir sehen werden, auch andere logische Zusammenhänge aus der Geometrie des Diamanten abgelesen werden. Aus diesen Zusammenhängen ergibt sich auch der jeweilige Platz eines jeden Junktors. Die Verteilung der Junktoren auf die verschiedenen Ebenen des Diamanten kann auf eine andere Weise noch augenfälliger gemacht werden. Abbildung 3.2 zeigt außer den Formeln auch die für die zugehörigen Wahrheitsfunktionen charakteristischen Werte-Quadrupel. Wenn wir die fünf Ebenen von unten nach oben als E0 , . . . , E4 durchzählen, dann stellt man fest, daß auf Ebene Ei gerade diejenigen Quadrupel liegen, die genau i Einsen enthalten (0 ≤ i ≤ 4). Da die Anzahl der Einsen der Anzahl der Wahrheitsfälle eines Junktors entspricht, liegen auf einer Ebene alle Junktoren, die gleich viele Wahrheitsfälle haben. Zum Beispiel ist die Konjunktion in genau einem Fall wahr (wenn beide Konjunkte
88
Aussagenlogik
Abbildung 3.1: Verband aus 16 Elementen über 4 Atomen
89
Strukturtheorie
P >Q 1111
P ∨Q 1110
P →Q 1011
P ↑Q 0111
P ←Q 1101
P 2Q 1010
˙ P ∨Q 0110
P 1Q
P 1* Q
1100
0011 P ↔Q
P 2* Q 0101
1001
P ∧Q 1000
P ←* Q 0010
P →*Q 0100
P ↓Q 0001
P ⊥Q 0000 Abbildung 3.2: Der Diamant der Wahrheitsfunktionen über zwei Satzkonstanten
90
Aussagenlogik
wahr sind), und in genau einem Fall ist auch die auf derselben Ebene liegende simultane Negation wahr (wenn beide Teilformeln falsch sind). Was weiter oben liegt, läßt sich auf mehrere Weisen erfüllen; die Disjunktion auf Ebene E3 etwa kann auf drei Weisen erfüllt werden. Ferner gilt zwischen den Pfeilen und den Wahrheitwert-Quadrupeln folgender Zusammenhang. Seien w1 w2 w3 w4 und w10 w20 w30 w40 zwei derartige Quadrupel; dann gibt es einen Pfad von w1 w2 w3 w4 nach w10 w20 w30 w40 , wenn für alle j = 1, . . . , 4 der Wahrheitswert wj als Zahl kleiner oder gleich dem Wahrheitswert wj0 ist; in Symbolen: (3)
w1 w2 w3 w4 ≤D w10 w20 w30 w40 wj ≤ wj0
gdw
f. alle j mit 1 ≤ j ≤ 4 gilt:
Ein Vergleich mit der Definition 2.6, Ziffer 6, zeigt, daß diese Bedingung genau die Beziehung der logischen Folgerung ausdrückt. Die Dekorierung der Ecken des Diamanten mit den 16 verschiedenen Wahrheitsfunktionen mag wegen der ungewohnten Junktorensymbole nicht sehr vertraut erscheinen. In Abbildung 3.3 ist daher dieselbe Figur mit Hilfe der Standard-Junktoren wiedergegeben. An den Ecken stehen jetzt zwar andere Formeln, aber es handelt sich nach wie vor um die gleiche Struktur von Folgerungsbeziehungen. In der Tat ist es so, daß eine Ecke keine einzelne Formel, sondern eine Menge von gleichartigen Formeln repräsentiert, die zwei Bedingungen erfüllen: (i) alle Formeln enthalten höchstens die Satzkonstanten P und Q (man sagt, daß es sich um Formeln in oder über den Konstanten P und Q handelt);6 und (ii) je zwei Formeln sind untereinander logisch äquivalent. Logisch äquivalente Formeln in P und Q besitzen nämlich die gleichen Wahrheitfälle und damit identische Wahrheitswert-Quadrupel. Zum Beispiel gelten in L00AL die folgenden logischen Äquivalenzen: (4)
a. b. c. d. e.
P ⊥Q ≡ ⊥ P →∗ Q ≡ P ∧ ¬Q P 2∗ Q ≡ ¬Q P ∨˙ Q ≡ P ↔ ¬Q P ↑ Q ≡ ¬P ∨ ¬Q
Wir erwähnen en passant, daß die logische Äquivalenz ein Beispiel für eine der wichtigsten Typen von zweistelligen Relationen ist, die Äquivalenzrelation. Allgemein gesprochen sind zwei Objekte äquivalent, wenn sie in einer gegebenen Eigenschaft übereinstimmen. So sind etwa zwei Menschen äquivalent bezüglich ihrer Körpergröße, wenn sie gleichgroß sind, oder äquivalent bezüglich ihres Alters, wenn sie gleichalt sind. Die Eigenschaft Lebensalter teilt die Menschen in Klassen gleichen Alters ein, und die Körpergröße — quer zur Gleichaltrigkeit — in Klassen gleicher Größe. Die Eigenschaft, die logisch äquivalente Formeln gemein haben, ist die, bei den gleichen Belegungen wahr zu sein. Für Formeln in zwei Satzkonstanten P und Q heißt das, wie oben gesagt, dasselbe Wahrheitswert-Quadrupel zu besitzen und damit denselben Platz im Diamanten einzunehmen. Logisch äquivalente Formeln werden auf diese Weise identifiziert bzw. nur bis auf oder modulo logische Äquivalenz voneinander unterschieden. Die definierenden Eigenschaften einer Äquivalenzrelation sind die folgenden. 6 Als
Grenzfall sprechen wir auch vom Verum und vom Falsum als Formeln in P und Q.
91
Strukturtheorie
>
P ∨Q
P →Q
Q→P
¬P ∨ ¬Q
Q
P ↔ ¬Q ¬P
P P ↔Q
¬Q
P ∧Q
¬P ∧ Q
P ∧ ¬Q
¬P ∧ ¬Q
⊥ Abbildung 3.3: Wahrheitsfunktionen über P, Q mit Standardjunktoren
92
Aussagenlogik
Definition 3.1 Eine zweistellige Relation R in einem gegebenen Bereich A von Objekten heißt Äquivalenzrelation, wenn für beliebige Elemente a, b, c ∈ A gilt: 1. aRa 2. wenn aRb und bRc so auch aRc 3. wenn aRb so auch bRa
(Reflexivität) (Transitivität) (Symmetrie)
Betrachtet man die Formeln der Aussagenlogik bis auf logische Äquivalenz zusammen mit der Struktur der logischen Folgerung (die nicht zwischen äquivalenten Formeln unterscheidet7 ), so bilden sie einen Verband nach Art des Diamanten, der Lindenbaum-Algebra heißt. Der Diamant ist eine Darstellung der Lindenbaum-Algebra der aussagenlogischen Formeln in zwei Satzkonstanten P und Q. Beide Algebren, die “kleine” endliche in zwei Satzkonstanten und die volle unendliche Lindenbaum-Algebra der gesamten Aussagenlogik, haben dieselbe algebraische Verbandsstruktur, die genauer Boolesche Algebra genannt wird. Wir wollen die algebraischen Eigenschaften der Booleschen Algebra nun vollständig angeben und sie anhand des Diamanten illustrieren. Dabei werden die auftretenden Formeln stets modulo logische Äquivalenz betrachtet; dies ist zulässig, weil alle algebraischen Operationen und Relationen beim Übergang zu äquivalenten Formeln erhalten bleiben. Jeder Booleschen Algebra ist eine zweistellige Relation aufgeprägt, die im Spezialfall der Lindenbaum-Algebra die Beziehung der logischen Folgerung ist. Diese Relation ist eine Halbordnung, die den Prototyp der Ordnungsrelationen darstellt. Eine Halbordnung ist wie die Äquivalenzrelation reflexiv und transitiv, aber — und das ist entscheidend für den völlig anderen Charakter von Halbordnungen gegenüber den Äquivalenzrelationen — nicht symmetrisch, sondern antisymmetrisch; diese Eigenschaft ist in der folgenden Definition beschrieben. Definition 3.2 Eine zweistellige Relation R in einem gegebenen Bereich A von Objekten heißt Halbordnung, wenn für beliebige Elemente a, b, c ∈ A gilt: 1. aRa 2. wenn aRb und bRc so auch aRc 3. wenn aRb und bRa, so gilt a = b
(Reflexivität) (Transitivität) (Antisymmetrie)
Bei dem Versuch, die Eigenschaften der Halbordnung für die logische Folgerung zu verifizieren, stellen wir fest, daß für die logische Folgerung zwischen Formeln zwar die Reflexivität und die Transitivität erfüllt sind, aber nicht die Antisymmetrie: wenn zwei Formeln φ und ψ wechselseitig auseinander folgen, so sind sie zwar logisch äquivalent, aber damit noch nicht identisch. Da aber in der Lindenbaum-Algebra logisch äquivalente Formeln identifiziert werden und somit zu “einem Objekt” verschmelzen, ist hier auch die Antisymmetrie erfüllt. Als nächstes besitzt eine Boolesche Algebra ein größtes und ein kleinstes Element bezüglich ihrer Halbordnung, welche 1-Element und 0-Element genannt werden. In der Lindenbaum-Algebra sind das das Verum und das Falsum. Mit 7 Gilt
φ |= ψ und φ ≡ φ0 sowie ψ ≡ ψ 0 , so gilt auch φ0 |= ψ 0 .
93
Strukturtheorie
Hilfe der Halbordnung lassen sich ferner drei Operationen auf der Algebra definieren, die zweistelligen Operationen des Supremums und des Infimums sowie die einstellige Komplementbildung. In der Lindenbaum-Algebra ist das Supremum zweier Formeln φ und ψ die “schwächste” logische Folgerung sowohl aus φ als auch aus ψ. Das ist aber gerade (immer modulo logische Äquivalenz) die Disjunktion φ ∨ ψ; denn wie der Diamant illustriert, folgen alle anderen Formeln χ, die aus φ und aus ψ folgen, bereits aus φ∨ψ.8 von φ und ψ graphisch dadurch bestimmen, indem man den Treffpunkt der kürzesten zwei Pfade aufsucht, die von φ bzw. ψ ihren Ausgang nehmen. Liegt speziell ψ über φ, d.h. auf einem Pfad mit Ausgang φ, so ist das Supremum ψ selbst; das entspricht dem logischen Gesetz, daß die Disjunktion φ∨ψ äquivalent zu ψ ist, wenn ψ aus φ logisch folgt. In konditionaler Form ist dies der Inhalt von Theorem (A.500 ). Dual zum Supremum ist das Infimum von φ und ψ die logisch “stärkste” Formel, aus der sowohl φ als auch ψ folgen, und das ist die Konjunktion φ ∧ ψ; jede Formel χ nämlich, die sowohl φ als auch ψ zu ihren logischen Folgerungen zählt, hat bereits φ∧ψ als weitere logische Folgerung. Im Diamanten findet man das Infimum als die gemeinsame Wurzel der kürzesten Pfade, die in φ bzw. ψ enden. Liegt wiederum ψ über φ (d.h. ψ ist eine logische Folgerung von φ), so ist das Infimum gleich φ. Daß in diesem Fall φ logisch äquivalent zur Konjunktion φ ∧ ψ ist, zeigt Theorem (A.490 ) in konditionaler Form. Schließlich gibt es zu jedem Element einer Boolesche Algebra ein (eindeutig bestimmtes) Komplement, welches dadurch charakterisiert ist, daß es zusammen mit dem Ausgangselement als Supremum das 1-Element und als Infimum das 0-Element hat, und das Komplement des Komplements eines Elements wieder das Element selbst ist. In der Lindenbaum-Algebra ist das Komplement die Negation; die Negation aber ist im Diamanten durch die Dualisierungsoperation ∗ representiert, die durch punktsymmetrische Spiegelung am Mittelpunkt gebildet wird. In Abbildung 3.4 etwa sind die dualen Paare h>, ⊥i, hQ, ¬Qi sowie hP ∧ Q, ¬P ∨ ¬Qi dargestellt. Wir fassen diese Diskussion zusammen und geben die Axiome einer Booleschen Algebra im allgemeinen Fall an, die wir danach im geschilderten Sinn auf die Lindenbaum-Algebra spezialisieren können. Definition 3.3 Eine nicht-leere Menge B heißt Boolesche Algebra, wenn B zwei ausgezeichnete Elemente 1 und 0 mit 1 6= 0 enthält sowie eine Struktur bestehend aus zwei zweistelligen Operationen u, t und einer einstelligen Operation ∗ trägt, so daß die folgenden Axiome erfüllt sind: (1) a t 1 = 1,
au0 = 0
(1 ist Einselement;
(2) a t 0 = a,
au1 = a
0 ist Nullelement)
(3) a t a∗ = 1, (4) 1∗ = 0,
a u a∗ = 0 0∗ = 1
Komplement-Operation)
(5) (a∗ )∗ = a u
t
(6) (a t b)∗ = (a∗ u b∗ ) 8 Im
(∗ ist die Boolesche
(de Morgan)
Diamanten ist das einzige χ dieser Art, welches verschieden ist von φ ∨ ψ, das Verum; in der Lindenbaum-Algebra für die volle Aussagenlogik ist die Menge solcher Formeln dagegen unendlich.
94
Aussagenlogik >
¬P ∨ ¬Q
Q Q∗ = ¬Q
¬Q
P ∧Q
(P ∧ Q)∗ = ¬P ∨ ¬Q
>∗ = ⊥
⊥
Abbildung 3.4: Dualbildungen: Übergang zur Negation
(7) a t a = a, u
aua = a
u
(8) a t b = b t a u
u
(Idempotenz ) (Kommutativität)
u
u
(9) a t (b t c) = (a t b) t c
(Assoziativität)
(10) a = a t (a u b) (11) a = a u (a t b)
(Absorption)
(12) a u (b t c) = (a u b) t (a u c) (13) a t (b u c) = (a t b) u (a t c)
(Distributivität)
95
Strukturtheorie
Satz 3.1 Mit den Operationen ∧, ∨, ∗ und den Objekten >, ⊥ ist die Lindenbaum-Algebra der aussagenlogischen Formeln “bis auf logische Äquivalenz” eine Boolesche Algebra, d.h. es gelten die folgenden Theoreme: (1) φ ∨ > ↔ >,
φ∧⊥ ↔ ⊥
(> ist Einselement;
(2) φ ∨ ⊥ ↔ φ,
φ∧> ↔ φ
⊥ ist Nullelement)
(3) φ ∨ φ
∗
↔ >,
(4) >∗ ↔ ⊥,
φ∧φ
∗
↔ ⊥ (∗ ist die Boolesche
⊥∗ ↔ >
Komplement-Operation)
(5) (φ∗ )∗ ↔ φ ∧
∨
(de Morgan)
(6) (φ ∨ ψ)∗ ↔ (φ∗ ∧ ψ ∗ ) (7) φ ∨ φ ↔ φ, ∧
φ∧φ ↔ φ
∧
(8) φ ∨ ψ ↔ b ∨ φ ∧
∧
(Idempotenz ) (Kommutativität)
∧
∧
(9) φ ∨ (ψ ∨ χ) ↔ (φ ∨ ψ) ∨ χ
(Assoziativität)
(10) φ ↔ φ ∨ (φ ∧ ψ) (11) φ ↔ φ ∧ (φ ∨ ψ)
(Absorption)
(12) φ ∧ (ψ ∨ χ) ↔ (φ ∧ ψ) ∨ (φ ∧ χ) (13) φ ∨ (ψ ∧ χ) ↔ (φ ∨ ψ) ∧ (φ ∨ χ)
(Distributivität)
Bemerkungen. 1. In der Interpretation von ∗ als Negation sind die Formeln unter (1) – (13) Tautologien. Da sie alle die Gestalt eines Bikonditionals haben, sind ihre linken und rechten Seiten jeweils logisch äquivalent. Also stellen diejenigen unter ihnen, die χ nicht enthalten und mit ‘P ’ statt ‘φ’ und ‘Q’ statt ‘ψ’ gelesen, im Diamanten denselben Punkt dar. 2. Die endliche Struktur des Diamanten der Wahrheitsfunktionen hat die zusätzliche spezielle Eigenschaft, atomar zu sein, d.h. es gibt kleinste von 0 verschiedene Elemente, Atome genannt, aus denen alle anderen Elemente aufgebaut sind. Im Diamanten sind dies (die Äquivalenzklassen von) P ∧Q, P ∧¬Q, ¬P ∧ Q und ¬P ∧ ¬Q. Es gilt der allgemeine Satz, daß jede endliche Boolesche Algebra atomar ist. Die volle Lindenbaum-Algebra der Aussagenlogik ist ein Beispiel für eine nicht-atomare Boolesche Algebra. 3. Die Elemente des Diamanten werden im folgenden Sinn von den Satzkonstanten P und Q erzeugt: Bildet man mit P und Q alle möglichen Booleschen Kombinationen, d.h. aussagenlogischen Verknüpfungen, so ergeben sich alle Elemente des Diamanten. Man sagt, daß P und Q die Erzeugenden dieser Algebra darstellen. Man beachte, daß Erzeugende etwas anderes sind als Atome! Atome sind kleinste von Null verschiedene Elemente, während die Erzeugenden P und Q selbst keine Atome sind, sondern nur das “Material” zum Aufbau der gesamten Algebra liefern. 4. Das Beispiel einer anderen grundlegenden Booleschen Algebra, die zugleich atomar ist, ist die Potenzmenge P(A) einer Menge A, d.h. die Menge aller Teilmengen von A; siehe Übung 3.1.
96
Aussagenlogik
Übung 3.1 Potenzmenge. Gegeben sei die Menge A = { 2, 3, 5, 7 }. Notieren Sie alle Elemente der Potenzmenge P(A) und ordnen Sie sie gemäß der Ordnungsrelation ⊆ der Mengeninklusion in der Diamantstruktur der Abbildung 3.1 an. Identifizieren Sie Eins- und Null-Element, Suprema, Infima und Komplemente der Elemente von A. Übung 3.2 Teilerverband . Finden Sie die Menge T210 aller Teiler der Zahl 210. Ordnen Sie ihre Elemente gemäß der Ordnungsrelation a | b (für “a ist ein Teiler von b”) in der Diamantstruktur der Abbildung 3.1 an. Identifizieren Sie Eins- und Null-Element, Suprema, Infima und Komplemente der Elemente von T210 . Stellen Sie eine Beziehung zu den zahlentheoretischen Operationen des k.g.V. (“kleinstes gemeinsames Vielfaches”) und des g.g.T. (“größster gemeinsamer Teiler”) her. Welches sind die Atome von T210 ?
3.1.2
Logische Folgerungen
Die Abbildung 3.5 zeigt an einem Beispiel, welche Formeln aus einer gegebenen Formel logisch folgen. Die zugehörigen Ecken sind jeweils hervorgehoben. Aus der Formel ¬P ∧¬Q folgen die Formeln ¬P , ¬Q, P ↔ Q, ¬P ∨¬Q, P → Q, Q → P und >. Die Menge der logischen Folgerungen aus einer Formel φ wird in der Regel mit Cn(φ) bezeichnet.9 Allgemeiner ist für eine Menge Σ von Formeln Cn(Σ) die Menge der logischen Folgerungen aus den Elementen von Σ. (5)
Cn(Σ) = { φ | Σ |= φ }
Die Menge Σ wird manchmal eine Basismenge von Cn(Σ) genannt. Eine Folgerungsmenge hat im allgemeinen mehrere Basismengen; eine triviale Basismenge wäre z.B. Cn(Σ) selbst, denn es gilt: Cn(Cn(Σ)) = Cn(Σ). In unserem ersten Beispiel sind neben {P ∧ Q} auch die Mengen { P, Q }, { P, P ↔ Q } und { Q, P ↔ Q } Basismengen für die Folgerungsmenge Cn(P ∧ Q). Der Grund dafür ist, daß mit je zwei Elementen einer Basismenge auch ihre Konjunktion in der Folgerungsmenge liegt; in unserem Fall ist das jedesmal die Ausgangsformel P ∧ Q. Analoge Überlegungen können in den übrigen Fällen angestellt werden. Übung 3.3 Bestimmen Sie im Diamanten die Mengen Cn(P ∧ Q) und Cn(¬P ∧ Q). Welche anderen nicht-trivialen Basismengen besitzt sie? Die Menge Cn(Σ) einer Formelmenge Σ ⊆ Fm L ist offenbar eindeutig bestimmt. Damit stellt die Zuordnung Cn : Σ 7→ Cn(Σ) eine Funktion dar, auch Operator der logischen Folgerung genannt. Der Folgerungsoperator besitzt drei charakteristische Eigenschaften: 1. Σ ⊆ Cn(Σ) 2. Wenn Σ ⊆ Σ0 so gilt Cn(Σ) ⊆ Cn(Σ0 ) 3. Cn(Σ) = Cn(Cn(Σ))
(Inklusion) (Monotonie) (Idempotenz )
Wir wollen mit Hilfe von Definition 2.6, Ziffer 5, die erste Eigenschaft des CnOperators, die “Inklusion”, beweisen. Sie sagt aus, daß die Formelmenge Σ eine Teilmenge von Cn(Σ) ist. Nach Kapitel 1 bedeutet das, daß jede Formel φ, die 9 ‘Cn’
für engl. ‘logical consequences’.
97
Strukturtheorie >
P ∨Q
P →Q
Q→P
¬P ∨ ¬Q
Q
P ↔ ¬Q ¬P
P P ↔Q
¬Q
P ∧Q
¬P ∧ Q
P ∧ ¬Q
¬P ∧ ¬Q
⊥
Abbildung 3.5: Folgerungen aus ¬P ∧ ¬Q
ein Element von Σ ist, auch in der Menge Cn(Σ) liegt. Wir geben uns also ein φ ∈ Σ vor; zu zeigen ist dann: φ ∈ Cn(Σ). Ein Blick auf die Definition (5) zeigt, daß dazu nachzuweisen ist: Σ |= φ. Jetzt müssen wir die Definition der logischen Folgerung heranziehen, nach der also zu zeigen ist: Gilt für eine beliebige Belegung f , daß (∗) [ für alle Formeln ψ ∈ Σ die Beziehung f |= ψ erfüllt ist ], so gilt auch f |= φ. Sei also eine Belegung f mit der Eigenschaft (∗) gegeben; da f alle Formeln in Σ wahr macht, gilt speziell auch für das obige φ, mit dem wir angefangen hatten: f |= φ. Also gilt Σ |= φ, und φ ∈ Cn(Σ). Übung 3.4 Beweisen Sie die anderen Eigenschaften des Cn-Operators nach dem gleichen Muster.
98
3.1.3
Aussagenlogik
Philosophische Anwendung: Überzeugungen
Die
Dynamik
von
Wie in der Einleitung angesprochen werden in der modernen Erkenntnistheorie die Überzeugungen eines epistemischen Subjekts S durch Satzmengen modelliert. Meist wird idealisierend angenommen, daß diese Satzmengen unter logischer Folgerung abgeschlossen sind. (Selbst wenn S sich nicht aller logischen Folgerungen aus seinen aktuellen Überzeugungen bewußt ist, so würde es doch aus Rationalitätsgründen einen Satz akzeptieren, sobald es ihn als eine solche Folgerung erkennt.) Wird nun eine Information φ, die bisher nicht aus den anderen Überzeugungen folgte, in die Überzeugungsmenge Σ aufgenommen, so gibt es zwei Fälle: (i) Der Satz φ ist mit den bisherigen Überzeugungen von S verträglich. Dann können diese sämtlich beibehalten werden. Die Überzeugungsmenge wächst jedoch nicht nur um φ, sondern auch um alle neuen Folgerungen, die sich mit Hilfe von φ zusätzlich ergeben. Das ist die Menge Cn(Σ ∪ {φ}). Diese monotone Expansion der Überzeugungsmenge erfolgt also durch stets neue Abschlußbildung unter logischer Folgerung. (ii) φ ist mit Σ unverträglich. Dann müssen, soll die Konsistenz wiederhergestellt werden, gewisse Sätze aus Σ geopfert werden. Wie das am vernünftigsten geschehen kann, ist das Problem der Überzeugungsrevision (engl. belief revision). Bei der Revision genügt es nicht, einen einzelnen Satz zu entfernen, der als störend aufgefallen ist. Er könnte bei der fälligen logischen Abschlußbildung durch die Hintertür wieder hereinkommen. Ein einfaches Beispiel möge das illustrieren. Beispiel 3.1 Ich bin dabei, mit dem Autoschlüssel meinen Wagen zu öffnen, indem ich den Schlüssel in das Türschloß stecke. Ich bin überzeugt davon, daß sich kein unbefugter Dritter an dem Auto zu schaffen macht (¬Q). Ferner bin ich davon überzeugt, daß die Alarmanlage nicht losgeht (¬P ). Nun geht die Alarmanlage aber doch los; da sie kaum zu überhören ist, ändere ich meine Überzeugung, gebe ¬P auf und glaube jetzt P . Habe ich damit die Konsistenz in meinen Überzeugungen wiederhergestellt? Nein, denn ich bin eigentlich auch davon überzeugt, daß P ↔ Q, also insbesondere, daß die Alarmanlage nur dann losgeht, wenn ein Unbefugter den Wagen manipuliert. P ↔ Q aber generiert zusammen mit der beibehaltenen Überzeugung ¬Q nach wie vor die logische Folgerung ¬P . Das schließt man in diesem einfachen Fall natürlich am schnellsten mit der Folgerung des Konditionals P → Q aus dem Bikonditional P ↔ Q sowie per Kontraposition mit ¬Q und Modus Ponens, aber man kann es auch aus dem Diamanten ablesen (siehe Abbildung 3.5): die Basismenge { ¬Q, P ↔ Q } generiert beim logischen Abschluß zunächst ¬P ∧ ¬Q und damit nach wie vor ¬P . Es ist also klar, daß die Überzeugung P ↔ Q aufgrund des unbestreitbaren Datums P ebenfalls fällt (der Alarm wird auch ausgelöst, wenn man den per Fernbedienung verriegelten Wagen nicht auf die gleiche Weise entriegelt). Das Beispiel zeigt, daß ein guter Überblick über das Geflecht der logischen Folgerungen von Sätzen wichtig ist. Hier können die am Diamanten geschärften Intuitionen von Nutzen sein. Wir sahen, daß die Revision von Überzeugungen eigentlich aus zwei Schritten besteht, dem Entfernen von Sätzen aus der Überzeugungsmenge unter Herstel-
99
Strukturtheorie
lung von Konsistenz mit einer neuen Information sowie der monotonen Expansion mit dem neuen Satz. Der erste Schritt wird auch Kontraktion genannt. Die Operation der Kontraktion ist im allgemeinen nicht eindeutig. So hat man in der Literatur Postulate angegeben, denen diese Operation in jedem Fall genügen muß, wenn sie adäquat sein will. Ein triviales Postulat ist das der Inklusion, nach dem die kontrahierte Überzeugungsmenge jedenfalls kein neues Material einführen darf, also in der Ausgangsmenge enthalten sein muß. Das Postulat des Erfolgs besagt, daß der entfernte Satz nicht mehr in der kontrahierten Menge auftauchen darf. In unserem Beispiel war dieses Postulat zunächst verletzt. Das Hauptproblem bei der Kontraktion besteht jedoch in der Charakterisierung möglichst minimaler Veränderungen der Ausgangsüberzeugungen. Niemand würde z.B. sofort alle Überzeugungen aufgeben, nur weil er mit einer (glaubwürdigen) Information konfrontiert wird, von deren Gegenteil er bisher überzeugt war (“epistemischer Kollaps”). Beispiel 3.2 Sei die Überzeugungsmenge A = { ¬P, ¬Q, P ↔ Q, R } gegeben. A soll um ¬P kontrahiert werden. Das Symbol für die Operation der Kontraktion sei ‘÷’. Was ist dann A ÷ ¬P ? Es leuchtet ein, daß etwa der Satz R nicht von der Art ist, daß gerade durch seine Entfernung ¬P “aufhört”, logisch zu folgen; R sollte also nicht entfernt werden. Andererseits sahen wir oben, daß mit ¬P auch P ↔ Q getilgt werden muß, sofern an ¬Q festgehalten wird. Es bleiben also R und ¬Q übrig. Andererseits könnte es ja sein, daß nicht ¬Q, sondern das Bikonditional P ↔ Q unumstößlich erscheint; dann muß umgekehrt ¬Q aufgegeben werden. Man sieht also, daß die Lösung der gestellten Aufgabe nicht eindeutig ist. Es kommt vielmehr darauf an, welche Sätze im Gesamtnetz unserer Überzeugungen besondern fest “verankert” sind (der englische Ausdruck für ‘Verankerung’ lautet ‘entrenchment’). Ausgefeiltere Theorien der Überzeugungsänderung versehen die einzelnen Sätze mit einer Gewichtung gemäß dem Grad ihrer Verankerung. Die dadurch entstehende Präferenzordnung erlaubt dann eine eindeutige Lösung, indem die weniger fest verankerten Überzeugungen im Konfliktfall zuerst geopfert werden.10 Übung 3.5 Sollte im vorigen Beispiel zusammen mit P ↔ Q und natürlich P → Q auch Q → P aufgegeben werden?
. Übung 3.6 Sei A = { P, Q, P ↔ Q } und φ = P ∧ Q; was ist A ÷ φ, wenn Erfolg gefordert ist?
3.2 3.2.1
Weitere Strukturaussagen Wahrheitsfunktional Junktoren
vollständige
Systeme
von
Theorem (A.460 ) zeigt die Äquivalenz des Konditionals φ → ψ mit der Disjunktion ¬φ∨ψ. Theorem (A.680 ) gibt das Bikonditional φ ↔ ψ als Kombination aus den Junktoren ¬, ∧ und ∨ wieder, und die auf beiden Seiten negierte Version 10 Wichtige Texte zur Theorie der Überzeugungsänderungen mit Hinweisen auf weitere Literatur sind [4], [89], [90] und [111].
100
Aussagenlogik
φ∧ψ ↔ ¬(¬φ∨¬ψ) des de Morgan-Gesetzes (A.470 ) drückt jede ∧-Verknüpfung durch ¬ und ∨ allein aus. Dies legt den Gedanken nahe, daß alle zweistelligen Wahrheitsfunktionen nur durch ¬ und ∨ ausgedrückt werden können. Das ist in der Tat der Fall; es gilt sogar die weitaus stärkere Aussage, daß für beliebiges n jede Wahrheitsfunktion in n Satzkonstanten auf eine Kombination von junktorenlogischen Verknüpfungen reduzierbar ist, die nur ¬ und ∨ enthält. Definition 3.4 Eine Menge J von Junktoren heißt ein wahrheitsfunktional vollständiges System, wenn jede Wahrheitsfunktion in n Satzkonstanten durch eine Kombination von aussagenlogischen Verknüpfungen ausgedrückt werden kann, die höchstens Junktoren aus J enthält. Die Negation und die Disjunktion sind nicht das einzige wahrheitsfunktional vollständige System. Das gleiche gilt für ¬ und ∧, für ¬ und → und sogar für den Sheffer-Strich ↑ bzw. die simultane Negation ↓ jeweils für sich genommen. Wir wollen in diesem Abschnitt alle diese Behauptungen beweisen. Der Beweis wird in zwei Schritten erbracht. Zunächst geben wir in zwei Tabellen explizit an, wie alle zweistelligen Junktoren durch ein gegebenes System von Wahrheitsfunktionen ausgedrückt werden können. In einem zweiten Schritt wird gezeigt, daß jede beliebige n-stellige Wahrheitsfunktion allein durch die Junktoren ¬, ∧ und ∨ ausdrückbar ist. Da aber aus dem System { ¬, ∧, ∨ } sowohl ∧ zugunsten von ¬ und ∨ als auch ∨ zugunsten von ¬ und ∧ eliminierbar sind, erhalten wir die wahrheitsfunktionale Vollständigkeit der Systeme { ¬, ∨ } und { ¬, ∧ }. Die Reduktion der zweistelligen Junktoren auf ↑ bzw. ↓ allein zeigt schließlich die Reduzierbarkeit etwa von { ¬, ∨ } und damit aller Wahrheitsfunktionen auf die Systeme {↑} und {↓}.
Die folgenden beiden Tabellen etablieren den ersten Beweisschritt. Alle 16 zweistelligen Junktorenverknüpfungen sind der Reihe nach durch die folgenden Systeme ausgedrückt: (i) J1 = { ¬, → }; (ii) J2 = { ¬, ∨ }; (iii) J3 = {↑}. Die Reduktionen auf die Systeme J4 = { ¬, ∧ } und J5 = {↓} sind hier nicht ausgeführt und werden dem Leser als Übungen überlassen. Bemerkung zum Sheffer-Strich und zur simultanen Negation. Der entscheidende Schritt bei diesen Reduktionen ist die Wiedergabe der Negation. Es gilt: (6)
a. b.
¬φ ≡ φ ↑ φ
¬φ ≡ φ ↓ φ
In weiteren Reduktionsschritten werden etwa die Standardjunktoren ∧ und ∨ ausgedrückt, und der Rest durch Bezugnahme auf die vorher vorgenommene Reduktion auf das System J2 . Übung 3.7 Verifizieren Sie die in den Tabellen ausgedrückten logischen Äquivalenzen. Übung 3.8 Dekorieren Sie die Ecken des Diamanten mit junktorenlogischen Verknüpfungen aus dem wahrheitsfunktional vollständigen System (i) J1 = { ¬, → }; (ii) J2 = { ¬, ∨ }. Übung 3.9 Zeigen Sie, daß die Systeme J4 = { ¬, ∧ } und J5 = {↓} wahrheitsfunktional vollständig sind.
101
Strukturtheorie
J1 = { ¬, → }
J2 = { ¬, ∨ }
φ>ψ
φ → φ
φ ∨ ¬φ
φ∨ψ
¬φ → ψ
φ∨ψ
φ ← ψ
ψ → φ
φ ∨ ¬ψ
φ1ψ
φ
φ
φ → ψ
φ → ψ
¬φ ∨ ψ
φ2ψ
ψ
ψ
φ ↔ ψ
(¬φ → ψ) → ¬(φ → ¬ψ)
¬(φ ∨ ψ) ∨ ¬(¬φ ∨ ¬ψ)
φ∧ψ
¬(φ → ¬ψ)
¬(¬φ ∨ ¬ψ)
φ ↑ ψ
φ → ¬ψ
¬φ ∨ ¬ψ
φ ∨˙ ψ
(φ → ψ) → ¬(ψ → φ)
¬(¬(φ ∨ ψ) ∨ ¬(¬φ ∨ ¬ψ))
φ 2* ψ
¬ψ
¬ψ
φ →* ψ
¬(φ → ψ)
¬(¬φ ∨ ψ)
φ 1* ψ
¬φ
¬φ
φ ←* ψ
¬(ψ → φ)
¬(φ ∨ ¬ψ)
φ ↓ ψ
¬(¬φ → ψ)
¬(φ ∨ ψ)
φ⊥ψ
¬(φ → φ)
¬(φ ∨ ¬φ)
Tabelle 3.2: Wahrheitsfunktionale Vollständigkeit von ¬, → und ¬, ∨
102
Aussagenlogik
J3 = {↑} φ>ψ
(φ ↑ φ) ↑ φ
φ∨ψ
(φ ↑ φ) ↑ (ψ ↑ ψ)
φ ← ψ
(φ ↑ φ) ↑ ψ
φ1ψ
φ
φ → ψ
φ ↑ (ψ ↑ ψ)
φ2ψ
ψ
φ ↔ ψ
[(φ ↑ φ) ↑ (ψ ↑ ψ)] ↑ (φ ↑ ψ)
φ∧ψ
(φ ↑ ψ) ↑ (φ ↑ ψ)
φ ↑ ψ
φ ↑ ψ
φ ∨˙ ψ
[((φ ↑ φ) ↑ (ψ ↑ ψ)) ↑ (φ ↑ ψ)] ↑ [((φ ↑ φ) ↑ (ψ ↑ ψ)) ↑ (φ ↑ ψ)]
φ 2* ψ
ψ ↑ ψ
φ →* ψ
[φ ↑ (ψ ↑ ψ)] ↑ [φ ↑ (ψ ↑ ψ)]
φ 1* ψ
φ ↑ φ
φ ←* ψ
[(φ ↑ φ) ↑ ψ] ↑ [(φ ↑ φ) ↑ ψ]
φ ↓ ψ
[(φ ↑ φ) ↑ (ψ ↑ ψ)] ↑ [(φ ↑ φ) ↑ (ψ ↑ ψ)]
φ⊥ψ
[(φ ↑ φ) ↑ φ] ↑ [(φ ↑ φ) ↑ φ]
Tabelle 3.3: Wahrheitsfunktionale Vollständigkeit des Sheffer-Strichs ↑
103
Strukturtheorie
Wir kommen nun zum zweiten Schritt des Nachweises der wahrheitsfunktionalen Vollständigkeit der obigen Junktorenmengen. Vor der Formulierung des Hauptsatzes sei noch eine Definition vorausgeschickt. Definition 3.5 Eine Formel φ erzeugt eine n-stellige Wahrheitsfunktion F gdw φ enthält höchstens n Satzkonstanten P1 , . . . , Pn und für alle Belegungen f gilt: gf (φ) = F (f (P1 ), . . . , f (Pn ))
(7)
Satz 3.2 Jede n-stellige Wahrheitsfunktion wird von einer Formel in höchstens n Satzkonstanten erzeugt, die keine anderen Junktoren als ¬, ∧ und ∨ enthält. Beweis. Sei F eine n-stellige Wahrheitsfunktion. Für n = 0 ist F der konstante Wert 1 bzw. 0. In diesem Fall setzen wir für φ das Verum > bzw. das Falsum ⊥. Sei also jetzt n ≥ 1. Wir scheiden den weiteren Grenzfall aus, in . dem F stets den Wert 0 liefert; dann sei φ = P1 ∧ ¬P1 . Wir können also jetzt annehmen, daß F für mindestens ein n-tupel von Wahrheitswerten das Ergebnis 1 liefert. Es seien P1 , . . . , Pn paarweise verschiedene Satzkonstanten. Wegen des Koinzidenzlemmas können wir uns auf die 2n möglichen Belegungen f1 , . . . , f2n beschränken, die sich auf den P1 , . . . , Pn voneinander unterscheiden. Diese Belegungen werden durch die folgenden 2n n-tupel repräsentiert: (8)
mit
wi = hw1i , . . . , wni i
wji = fi (Pj )
(1 ≤ i ≤ 2n )
Jedes wi bildet eine Zeile in der Wahrheitstafel für F , mit dem zugehörigen Wert F (w1i , . . . , wni ). Wir ersetzen nun in den w i an der j-ten Stelle eine 1 durch die Satzkonstante Pj und eine 0 durch ihre Negation ¬Pj . Das resultierende ntupel von positiven oder negierten Satzkonstanten fügen wir konjunktiv zu der Formel ψ i zusammen. . ψ i = Li1 ∧, . . . , ∧Lin (9) mit
Lij
=
Pj ¬Pj
für wji = 1 für wji = 0
(10)
Die ψ i geben die Wahrheitswertverteilung in den n-tupeln w i syntaktisch wieder. Das gesuchte φ wird nun weiter wie folgt aufgebaut. φ ist eine Disjunktion derjenigen ψ i , so daß gilt F (w1i , . . . , wni ) = 1; dies kann man wie folgt notieren: . _ φ = { ψ i | 1 ≤ i ≤ 2n und F (w1i , . . . , wni ) = 1 } (11) Da F für mindestens ein w i 1 ergibt, ist diese Disjunktion nicht leer. Die Disjunktionsglieder von φ erfassen damit die verschiedenen Wahrheitfälle von F . Sei gi := gfi ; der Satz ist bewiesen, wenn für 1 ≤ i ≤ 2n gezeigt ist: gi (φ) = F (w1i , . . . , wni ) Dazu benötigen wir das Lemma 3.1 gi (ψ k ) = 1 gdw i = k
(12)
104
Aussagenlogik
Es gilt nämlich gi (ψ k ) = gi (Lk1 ∧, . . . , Lkn )
(13)
= min{ gi (Lkj ) | 1 ≤ j ≤ n }
Nun ist offenbar gi (Lkj ) =
. fi (Pj ) falls Lkj = Pj . 1 − fi (Pj ) falls Lkj = ¬Pj
(14)
Gilt jetzt zunächst i = k, so folgt mit der Definition der Lij gerade gi (Lij ) = 1 für alle j, und die n-fache Konjunktion ψ i erhält den Wert 1 unter gi . Ist umgekehrt gi (ψ k ) = 1, so ist wegen (13) gi (Lkj ) = 1 für jedes j. Die Definition . der Lkj erzwingt dann aber Lkj = Lij für alle j. Das kann aber nur der Fall sein, wenn i = k, da zwei verschiedene Zeilen i und k sich in mindestens einer Wahrheitswertbelegung unterscheiden würden. Wir kehren zum Hauptbeweis zurück und nehmen zum Nachweis von (12) zunächst an, daß gi (φ) = 1. Da φ eine Disjunktion von gewissen ψ k ist, gilt für mindestens ein k gi (ψ k ) = 1. Mit dem Lemma folgt k = i, und somit ist ψ i ein Disjunktionsglied von φ. Nach der Definition von φ in (11) folgt damit F (w1i , . . . , wni ) = 1. Sei umgekehrt F (w1i , . . . , wni ) = 1; dann ist ψ i wieder ein Disjunktionsglied von φ. Aus dem Lemma ergibt sich gi (ψ i ) = 1. Eine Disjunktion ist aber schon wahr, wenn ein Disjunktionsglied wahr ist; also gilt gi (φ) = 1.
3.2.2
Normalformen und Boolesche Expansionen
Definition 3.6 Eine Formel heißt ein Literal , wenn sie entweder atomar ist oder eine negierte atomare Formel. Eine Literal heißt positiv , wenn es atomar ist, und negativ , wenn es negiert ist. Literale haben also die Form P (positives Literal) oder p ¬P q (negatives Literal), wobei P eine Satzkonstante ist. Definition 3.7 Eine Formel φ ist in disjunktiver Normalform gdw 1. φ enthält an logischen Symbolen nur Negation, Konjunktion und Disjunktion; 2. die Negation tritt nur vor Satzkonstanten auf; 3. die Konjunktion tritt nur zwischen Literalen auf. Eine Formel in disjunktiver Normalform hat also die Gestalt φ1 ∨ . . . ∨ φn für . n ≥ 1, wobei für jedes i mit 1 ≤ i ≤ n gilt: φi = ψi1 ∧ . . . ∧ ψim , mit Literalen ψij (1 ≤ j ≤ m). Satz 3.3 Jede AL-Formel kann in eine logisch äquivalente Formel in disjunktiver Normalform umgewandelt werden.
105
Strukturtheorie Beweis. Der Satz ergibt sich aus der Konstruktion des Satzes 3.2.
Beispiel 3.3 Die folgenden Formeln sind mit ihren äquivalenten disjunktiven Normalformen angegeben. a) b)
P → Q
(¬P ∨ ¬Q) → (P ↔ ¬Q)
≡
≡ ≡
¬P ∨ Q
˙ ¬(¬P ∨ ¬Q) ∨ (P ∨Q) (P ∧ Q) ∨ (P ∧ ¬Q) ∨ (¬P ∧ Q)
Übung 3.10 Bringen Sie die folgenden Formeln in disjunktive Normalform. (i) P ↔ Q
(ii) P ∧ ¬Q → R
Definition 3.8 Es seien P1 , . . . , Pn (paarweise verschiedene) Satzkonstanten.11 Eine Formel φ ist in disjunktiver Boolescher Normalform oder ist eine disjunktive Boolesche Expansion in P1 , . . . , Pn gdw 1. φ ist in disjunktiver Normalform oder besteht aus dem Falsum ⊥; 2. keine zwei Disjunktionsglieder sind identisch; 3. in jedem Disjunktionsglied tritt jede Satzkonstante Pi genau einmal auf; 4. in jedem Disjunktionsglied sind die Satzkonstanten nach wachsendem Index angeordnet; 5. die Disjunktionsglieder sind bezüglich der Relation “positive Literale vor negativen Literalen” lexikographisch angeordnet.
Satz 3.4 Es sei φ eine AL-Formel, die höchstens die n paarweise verschiedenen Satzkonstanten P1 , . . . , Pn enthalte. Dann kann φ in eine logisch äquivalente Formel in disjunktiver Boolescher Normalform in den P1 , . . . , Pn umgewandelt werden. Beweis. φ wird zunächst in disjunktive Normalform gebracht, etwa φ0 . Ist das Ergebnis eine Kontradiktion, so wird es durch ⊥ ersetzt. Andernfalls ist φ0 eine Disjunktion mit mindestens einem Disjunktionsglied. Die Disjunktionsglieder werden im angegebenen Sinn mit Hilfe der Symmetriegesetze lexikographisch geordnet. Tritt eine Satzkonstante Pi im Resultat nicht auf, so wird die Tautologie Pi ∨ ¬Pi konjunktiv hinzugefügt, in die Disjunktionsglieder “hineinmultipliziert” und in eine neue disjunktive Normalform umgewandelt; anschließend wird wieder umgeordnet. Das Verfahren wird solange (aber insgesamt nur endlich oft) wiederholt, bis die disjunktive Boolesche Normalform erreicht ist. Beispiel 3.4 P ∨ Q ≡ (P ∧ Q) ∨ (P ∧ ¬Q) ∨ (¬P ∧ Q) 11 Dabei möge i < j genau dann gelten, wenn P eine Satzkonstante mit kleinerem Index i als Pj mitteilt (1 ≤ i, j ≤ n). Werden die Satzkonstanten durch verschiedene Buchstaben mitgeteilt (etwa ‘P’ und ‘Q’), so gebe die alphabetische Anordnung die Anordnung der Satzkonstanten wieder.
106
Aussagenlogik
Abbildung 3.6 zeigt die disjunktiven Booleschen Normalformen in den Satzkonstanten P und Q und ihren Platz im Diamanten. Übung 3.11 Bringen Sie die folgenden Formeln in disjunktive Boolesche Normalform. (i) S → R
˙ (ii) R∨Q
(iii) P ∧ R → R ∨ ¬Q
Bemerkungen. Sei φ eine Formel mit n deskriptiven Satzkonstanten P1 , . . . , Pn in disjunktiver Boolescher Normalform für n ≥ 0 (für n = 0 sei φ das Falsum ⊥); k sei die Anzahl der deskriptiven Disjunktionsglieder in φ.12 Die folgenden Aussagen gelten für beliebiges n und können für n = 2 anhand des Diamanten verifiziert werden; siehe Abbildung 3.6. 1. In φ sind die Disjunktionsglieder paarweise logisch unverträglich, d. h. es kann höchstens ein Disjunktionsglied wahr sein. 2. Es gilt 0 ≤ k ≤ 2n . 3. φ ist eine Tautologie gdw k = 2n . 4. φ ist eine Kontradiktion gdw k = 0. 5. Allgemein ist k gleich der Anzahl der Belegungen für die n Satzkonstanten, die die Formel φ im Wahrheitsfall erfüllen. 6. Die Disjunktionsglieder sind Atome in der Lindenbaum-Algebra mit n Satzkonstanten. 7. φ ist in dieser Algebra das Supremum seiner Disjunktionsglieder.
Satz 3.5 Die Expansion einer AL-Formel in ihre disjunktive Boolesche Normalform liefert einen “syntaktischen” Gültigkeits- und Erfüllbarkeitstest. Bemerkung. Dual zu den obigen Begriffen kann man eine konjunktive Normalform und die konjunktive Boolesche Normalform definieren. Die Relationen in den entsprechenden endlichen Lindenbaum-Algebren (d. h. den “Diamanten” mit n Satzkonstanten für n ≥ 1) drehen sich dann um und sind statt von unten nach oben von oben nach unten zu lesen.
. Fall k = 0 ist φ = ⊥, und φ enthält keine deskriptiven Disjunktionsglieder in den Satzkonstanten P1 , . . . , Pn . 12 Im
107
Strukturtheorie
(P ∧ Q) ∨ (P ∧ ¬Q) ∨ (¬P ∧ Q) ∨ (¬P ∧ ¬Q)
(P ∧ Q) ∨ (P ∧ ¬Q) ∨ (¬P ∧ Q)
(P ∧ Q) ∨ (¬P ∧ Q) ∨ (¬P ∧ ¬Q)
(P ∧ Q) ∨ (P ∧ ¬Q) ∨ (¬P ∧ ¬Q)
(P ∧ ¬Q) ∨ (¬P ∧ Q) ∨ (¬P ∧ ¬Q)
(P ∧ ¬Q) ∨ (¬P ∧ Q)
(P ∧ Q) ∨ (¬P ∧ Q) (P ∧ Q) ∨ (P ∧ ¬Q) (P ∧ Q) ∨ (¬P ∧ ¬Q)
(¬P ∧ Q) ∨ (¬P ∧ ¬Q) (P ∧ ¬Q) ∨ (¬P ∧ ¬Q)
P ∧Q
¬P ∧ Q
P ∧ ¬Q
¬P ∧ ¬Q
⊥ Abbildung 3.6: Disjunktive Boolesche Normalformen über P, Q
108
Prädikatenlogik mit Identität
Kapitel 4
Prädikatenlogik mit Identität Die Prädikatenlogik oder Quantorenlogik der ersten Stufe mit Identität PL1I kodifiziert die Logik der Strukturausdrücke ‘für alle’ und ‘es gibt’. Ihre formalen Gegenstücke heißen Quantoren (daher “Quantorenlogik”). Die Quantoren sind mit Variablen versehen, die für Individuen stehen. Den Individuen können mittels der elementaren Beziehung der Prädikation Eigenschaften zugesprochen werden, die durch Prädikate ausgedrückt werden (daher “Prädikatenlogik”). Die Prädikatenlogik erlaubt somit eine Analyse von Aussagen unterhalb der Satzebene. In der Ausdruckskraft geht sie also über die Aussagenlogik weit hinaus. Diese ist jedoch ein Teil der Prädikatenlogik. Man spricht von der Prädikatenlogik “der ersten Stufe”, weil ihre Quantoren nur Variablen für Individuen binden und keine Variablen für Objekte höherer Stufe wie Mengen und Relationen von Individuen, Relationen von Relationen von Individuen, etc. Die unten eingeführte prädikatenlogische Sprache LPL1I enthält ferner als =’, das die Koreferentialität zweier Inspezielles Symbol das Identitätszeichen ‘= dividuenbezeichnungen wiedergibt (z.B. der Abendstern ist der Morgenstern). Mit seiner Hilfe wird die Logik von Identitätsaussagen formalisiert.
4.1
Logische Form II: Prädikatenlogik
In der Aussagenlogik hatten wir nur eine einzige syntaktische Kategorie von Ausdrücken, die der wahrheitsfähigen Formeln. Dies traf speziell auf die deskriptiven Konstanten der Aussagenlogik zu, d.h. auf die Satzkonstanten. In der Prädikatenlogik dagegen gibt es Ausdrücke unterschiedlicher syntaktischer Kategorien. Die Haupttypen sind Individuenterme, Prädikate verschiedener Stelligkeit und wie bisher die Formeln. Die Prädikatenlogik kennt eigentlich keine Grundausdrücke der Kategorie Formel; wir werden aber die Sprache LAL der Aussagenlogik als Teilsprache der Sprache LPL1I auffassen und so die Satzkonstanten als Formel-Konstanten in die erweiterte Logik einbeziehen. Im allgemeinen werden elementare Formeln jedoch durch die Zusammensetzung eines n-stelligen Prädikatausdrucks mit n Individuentermen gebildet (für n ∈ N). Dies stellt die Operation der elementaren Prädikation dar, die wir in der Form notieren: (1)
a.
p P n t0 . . . tn−1 q 109
110
Prädikatenlogik b.
P n trifft zu auf t0 , . . . , tn−1
Dabei ist P n ein Prädikatsymbol mit n Argumentstellen, und für jedes i < n ist ti ein Individuenterm. Da hinter dem Prädikatsymbol keine Klammern stehen, ist die Stelligkeit im Symbol selbst angegeben. Ferner sind die Argument-Terme nicht durch Kommata getrennt; wir haben also darauf zu achten, daß stets klar ist, bei welchem Symbol der eine Term aufhört und der nächste anfängt. Die gewählte Notation für Terme wird dies aber garantieren. Eine andere übliche Notation für die elementare Prädikation verwendet Klammern und kann dann auf den Stellenindex verzichten: (2)
p P (t0 , . . . , tn−1 ) q
Hier stehen Kommata zwischen den Termen. Diese Schreibweise betont die Ähnlichkeit zur Anwendung einer n-stelligen Funktion auf n Argumente, gibt aber möglicherweise zu Verwechslungen von Objekt- und Metasprache Anlaß. Wir werden sie daher zwar vor allem in den Anwendungen benutzen, ansonsten aber an der “offiziellen” Notation (1) festhalten. Umgangsprachliche Entsprechungen der elementaren Prädikation sind natürlichsprachliche Sätze, die aus Verben verschiedener Stelligkeit und einer passenden Anzahl von Individuenbezeichnungen gebildet werden. Während in den natürlichen Sprachen die Abfolge der Konstituenten von Sprache zu Sprache variiert und das Prädikat etwa in den europäischen Sprachen zwischen den Subjektterm und den Objektterm tritt, ist in der Logik die Abfolge dahingehend normiert, daß der Prädikat-Ausdruck als Operator den Individuentermen als Argumenten vorausgeht. Die folgenden Beispiele illustrieren die Symbolisierung einer einstelligen und einer zweistelligen Prädikation. Dabei ist unter a) jeweils der natürlichsprachliche Ausgangssatz angegeben und unter b) die standardisierte Explizitfassung. Unter c) findet sich die Formalisierung mit Hilfe fester objektsprachlicher Grundsymbole (nicht Mitteilungszeichen!). Da es aber völlig beliebig ist, ob schlafen durch die Prädikatkonstante mit der Nummer 3 oder irgendeiner anderen Nummer ausgedrückt wird, gehen wir auch hier sofort wieder zu den entsprechenden Mitteilungszeichen über und lassen zugleich die QuasiAnführungszeichen weg (d-Zeile). Schließlich ist unter e) noch die inoffizielle Notation angegeben. (3)
(4)
a.
Peter schläft.
b.
schläft(Peter)
c.
p13 k5
d.
P 1a
e.
P (a)
a.
Inge kennt Max.
b.
kennt(Inge,Max)
c.
p21 k1 k7
d.
P 2 ab
e.
P (a, b)
111
Logische Form
Beim letzten Beispiel muß man sich noch die Reihenfolge der Argumente merken, etwa: die Subjekt-Position geht in das erste Argument über, die Objekt-Position in das zweite Argument. Höherstellige Prädikationen erhält man z.B. durch transitive Verben mit Dativobjekt wie schenken, aber auch durch räumliche oder zeitliche Relationsausdrücke wie im folgenden Beispiel. (5)
a.
Ulm liegt zwischen München und Stuttgart.
b.
liegt.zwischen(Ulm,München,Stuttgart)
c.
p30 k0 k1 k2
d.
P 3 abc
e.
P (a, b, c)
Hier besteht der Prädikatausdruck aus zwei Wörtern, ‘liegt’ und ‘zwischen’. Da sie zusammen in ein einziges logisches Symbol übersetzt werden, schreiben wir nach Art der Internet-Adressen einen Punkt dazwischen; siehe (5b). Damit bei der Formalisierung eines natürlichsprachlichen Satzes immer klar ist, welches Argument des Prädikatsymbols welche grammatische Funktion wiedergibt, werden wir zu einer logischen Form meist eine “Legende” angeben, in der diese Beziehungen festgehalten werden; vor allem aber werden die deskriptiven Ausdrücke der Sprache mit ihren formalsprachlichen Gegenstücken korreliert. Der logischen Form (5d) etwa fügen wir dann folgende Liste bei: P 3 xyz : a:
x liegt zwischen y und z Ulm
b: c:
München Stuttgart
In der Legende verwenden wir grundsätzlich (Mitteilungszeichen für) Variablen (also x, y, z, . . .) für die Argumentstellen der Prädikatkonstanten, da die Individuenterme in einer logischen Form von Beispiel zu Beispiel verschieden sind. Auf diese Weise ist eine gewisse Uniformität gegeben. Einen weiteren Grundtyp elementarer Prädikationen in der Sprache stellen die Kopula-Konstuktionen mit Nomina oder auch Adjektiven in prädikativer Stellung dar, wie z.B. Plato ist ein Philosoph oder Sokrates ist sterblich. Die Kopula ‘ist’ tritt hier als ‘ist’ der Prädikation auf (zur zweiten Verwendung, dem ‘ist’ der Gleichheit, siehe unten). Dies sind Beispiele einstelliger Prädikationen; aber es gibt auch relationale Kopula-Verbindungen, etwa Marie Antoinette ist eine Tochter Maria Theresias. In der Legende würden diese Prädikationen z.B. wie folgt wiedergegeben (wie zu sehen ist, wird die Kopula bei der Übersetzung unterdrückt): P 1x : P 2 xy :
x ist (ein) Philosoph x ist eine Tochter von y
Q1 x :
x ist sterblich
Die bisherigen Beispiele enthielten als Individuenterme ausschließlich Eigennamen. Eine große und im Prinzip unbegrenzte Klasse von weiteren Individuentermen bilden die Kennzeichnungen, die bereits im ersten Kapitel erwähnt wurden. Die reine Prädikatenlogik sieht für diese Terme keine detaillierte Analyse entsprechend ihrer oftmals reichen deskriptiven Struktur vor, sondern behandelt sie als Individuenkonstanten, mitgeteilt durch einfache Buchstaben wie ‘a’, ‘b’, ‘c’ usw. Russells Beispiel vom König von Frankreich etwa erhält die folgende logische Form:
112 (6)
Prädikatenlogik a.
Der König von Frankreich ist kahlköpfig.
b.
kahlköpfig(der.König.von.Frankreich)
c.
p10 k0
d.
Pa
e.
P (a)
Diese Darstellung ist natürlich alles andere als befriedigend. Außerdem entsteht bei dieser Behandlung eine Spannung zwischen der prädikatenlogischen Vorschrift, daß alle Individuenterme denotieren, und der prinzipiellen Lückenhaftigkeit der Denotation von Kennzeichnungen. All diese Gründe sprechen für eine eigene Theorie von Kennzeichnungen; auf die Grundzüge einer solchen Theorie werden wir am Ende des Kapitels eingehen. Da die Aussagenlogik Teil der Prädikatenlogik ist, können wir mit den elementaren Sätzen wie bisher aussagenlogische Verknüpfungen bilden. Der neue Schritt besteht jedoch in der Einbeziehung der Quantorenausdrücke. Das Problem der logischen Form besteht hier vor allem darin, daß den quantifizierenden Nominalphrasen der natürlichen Sprache keine Konstituenten in der logischen Syntax entsprechen. Der Subjekt-Ausdruck in dem bedingten Allsatz alle Menschen sind sterblich muß bei der Übersetzung in die Logik auf geeignete Weise zerlegt werden. Die zuerst von Frege vorgenommene Analyse ergibt, daß die adäquate Paraphrase lautet: (7)
a.
Alle Menschen sind sterblich.
b.
Für alle Dinge gilt: wenn sie Menschen sind, sind sie sterblich.
c.
∀v0 (p10 v0 → p11 v0 )
d. e. f.
∀x (P 1 x → Q1 x)
∀x (P x → Qx)
∀x (P (x) → Q(x))
Hier ist (7c) die strikt objektsprachliche Formalisierung, mit ‘v0 ’ als der ersten objektsprachlichen Individuenvariable (siehe unten); (7d) ist die logische Form in der offiziellen Gestalt, jedoch in Mitteilungszeichen notiert. Bei einstelligen Prädikatkonstanten lassen wir häufig den oberen Index weg, was die Form (7e) liefert. (7f) schließlich zeigt die Version mit Argumentklammern. Es zeigt sich, daß die bedingte Allquantifikation eine wenn-dannVerknüpfung enthält. Ihre semantische Funktion wird genau durch das aussagenlogische Konditional wiedergegeben. Ein bedingter Allsatz gilt nämlich als wahr, wenn die Bedingung leer ist. In mathematischen Kontexten ist dies die nachweislich vernünftigste Festsetzung; aber auch in der Umgangssprache lassen sich Beispiele finden, die diese Festsetzung nahelegen. Als Beispiel stellen wir uns eine Situation vor, in der die Polizei die Bewohner einer Straße wegen einer Überschwemmung evakuieren muß und die Beamten häuserweise Vollzug melden müssen: (8)
Alle Bewohner von Haus Nr. n sind evakuiert.
Logische Form
113
Angenommen, das Haus Nr. 10 war unbewohnt und von vornherein leer. Dann wird sich der zuständige Polizeibeamte wohl kaum die Mühe machen und seinen Chef eigens darauf hinweisen, daß in Haus Nr. 10 nicht evakuiert wurde, weil niemand dort wohnt. Was hier allein zählt, ist, daß niemand zu Schaden kommt; die Aussage (8) gilt für n = 10 als “leererweise” erfüllt. Ganz analog zu dem Fall allquantifizierender Nominalphrasen wie alle Menschen werden indefinite Nominalphrasen wie ein Mensch behandelt. Sie besitzen jedoch keine all-, sondern existenzquantifizierende Kraft, sofern sie nicht in der prädikativen Verwendung ... ist ein Mensch auftreten (hier sahen wir, daß der unbestimmte Artikel ‘ein’ zusammen mit einem Nomen ein Prädikat bildet). Ein Beispiel für einen bedingten Existenzsatz , in dem die Nominalphrase ein Mensch vorkommt, ist in (9) angegeben. Der unbestimmte Artikel ‘ein’ wird zum Existenzquantor, und die Bedingung ist das Prädikat ‘Mensch’. Der logische Gehalt besteht in der Aussage, daß es (in einer gewissen Situation, etwa bei einem Unfall) einen Menschen gibt, der starb. Die Versionen für die logische Form unter c) bis f) sind wie in (7) zu verstehen. Zu beachten ist, daß, während die logische Form eines bedingten Allsatzes das Konditional enthält, im bedingten Existenzsatz der Existenzquantor zusammen mit der Konjunktion auftritt. (9)
a.
Ein Mensch starb.
b.
Es existiert ein Ding so daß gilt: es ist ein Mensch und es starb.
c.
∃v0 (p10 v0 ∧ p11 v0 )
d. e. f.
∃x (P 1 x ∧ Q1 x)
∃x (P x ∧ Qx)
∃x (P (x) ∧ Q(x))
Es gibt eine zweite Art von elementaren, d.h. junktoren- und quantorenfreien Aussagen in der formalen Sprache LPL1I , die der Identitätsaussagen. Sie haben die Form (10)
a.
p (s = t) q
b.
s ist gleich / identisch mit t
Wir machen uns nicht die Mühe, das neue objektsprachliche Identitätsymbol in der Notation von dem “Allerwelts-Gleichheitszeichen” zu unterscheiden, welches für Individuen in der Semantik und allgemeiner für mengentheoretische Objekte verwendet wird. Lediglich die Gleichheit von Zeichenketten wird nach unserer generellen Vereinbarung mit einem zusätzlichen Punkt über dem Gleichheitszeichen mitgeteilt. Die Formalisierung von einfachen Identitätsaussagen in der Sprache LPL1I bietet keine besonderen Schwierigkeiten. Allerdings sind Identitätsaussagen in quantifizierten Kontexten ein wenig komplizierter; wir kommen darauf zurück. Ferner werden, wie erwähnt, nicht nur Eigennamen, sondern auch komplexe Individuenausdrücke, z.B. Kennzeichnungen, als einfache Individuenkonstanten wiedergegeben, welche dann in einer Identitätsaussage miteinander verknüpft werden können. Schließlich ergibt sich eine Mehrdeutigkeit aus der doppelten Funktion der Kopula in einer Sprache wie dem Deutschen: außer dem ‘ist’ der
114
Prädikatenlogik
Prädikation gibt es noch das ‘ist’ der Gleichheit. Während im Fall der Prädikation die Kopula bei der Formalisierung ignoriert wird, wird das ‘ist’ der Gleichheit durch das Identitätssymbol wiedergegeben. Beispiele (der Übergang von b. nach c. ist wie oben motiviert): (11)
(12)
4.1.1
a.
Napoleon Bonaparte ist ein Korse.
b.
p10 k0
c.
Pa
d.
P (a)
a.
Napoleon Bonaparte ist der erste Kaiser der Franzosen.
b.
(k0 = k1 )
c.
(a = b)
PL1I-Formalisierungen: Erste Beispiele
Wir geben nun zwei erste standardisierte Beispiele für die Formalisierung von quantifizierten Sätzen an. Im Kapitel 5 wird ausführlicher auf Formalisierungen eingegangen. Wie in der Aussagenlogik stehe ‘DS’ für ‘Deutscher Satz’, ‘EF’ für ‘Explizitfassung’ und ‘LF’ für ‘Logische Form’. In der Explizitfassung sind die logischen Strukturausdrücke in Fettdruck wiedergegeben. Die Legende enthält die Zuordnung der deskriptiven Konstanten der Logik zu den deskriptiven Ausdrücken der Sprache. Das Universum spezifiziert einen Bereich von Individuen, die als Werte der quantifizierten Variablen intendiert sind. Das erspart uns die Beschränkung der Quantoren auf eine eigene Prädikatkonstante, welche diesen Bereich syntaktisch wiedergibt. Es sollte möglichst nur das explizit vorhandene lexikalisierte Material formalisiert werden. Die Symbole in den logischen Formen halten sich an die offizielle Notation in ihrer schematischen Version. Bei einstelligen Prädikatkonstanten ist der Stellenindex weggelassen. Die vier aristotelischen Haupttypen der Quantifikation sind zusammen mit ihren charakteristischen junktorenlogischen Anschlüssen in der folgenden Tabelle aufgeführt.
∀x(P x → . . .
alle P jeder P wer (immer) P jeder der P wenn einer P
∃x(P x ∧ . . .
ein P einige P manche(r) P
¬∀x(P x → . . .
nicht jeder der P nicht alle die P nicht alles was P
¬∃x(P x ∧ . . .
keiner niemand kein P nicht ein P
Tabelle 4.1: Haupttypen der Quantifikation
115
Syntax Beispiel 4.1 DS: Peter liest ein Buch und denkt darüber nach.
EF: Es gibt ein x so daß ([x ist.ein Buch] und [Peter liest x] und [Peter denkt.nach.über x]) LF: p ∃x ( Qx ∧ P 2 ax ∧ Q2 ax )q Legende: P 2 xy : Qx :
x liest y x ist.ein Buch
Q2 xy : a:
x denkt.nach.über y Peter
Universum: Personen und Sachen
Beispiel 4.2 DS: Jeder Logiker kennt ein Problem, für das ihm keine Lösung einfällt. EF: Für alle x : (wenn [x ist.ein Logiker] dann gibt es ein y so daß: [y ist.ein Problem] und [x kennt y] und es ist nicht der Fall daß: es gibt ein z so daß [z ist.eine Lösung.für y] und [z fällt.ein x]) LF: p ∀x ( P x → ∃y ( Qy ∧ P 2 xy ∧ ¬∃z ( Q2 zy ∧ R2 zx ) ) )q Legende: Px : P 2 xy : R2 xy :
x ist.ein Logiker x kennt y x fällt.ein y
Qx : Q2 xy :
x ist.ein Problem x ist.eine Lösung.für y
Universum: Personen und Sachen
4.2
Syntax
Wir beschreiben nun die formale Syntax der prädikatenlogischen Sprache LPL1I , die wir wieder kurz L nennen. Wollen wir betonen, daß es sich bei L jetzt im Gegensatz zu LAL um eine erststufige Sprache handelt, fügen wir den oberen Index ‘1’ an und schreiben ‘L1 ’. Definition 4.1 Das Vokabular (= die Menge der Grundsymbole) der PL1ISprache L besteht aus den folgenden Mengen von Symbolen: 1. einer (abzählbar) ‘v0 ’,‘v1 ’,‘v2 ’,. . .
unendlichen
Menge
von
(Individuen-)Variablen
MZ: ‘x’, ‘y’, ‘z’, ‘u’, ‘v’, ‘w’ (StI); 2. einer höchstens (abzählbar) unendlichen Menge von (Individuen-)Konstanten ‘k0 ’,‘k1 ’,‘k2 ’,. . . MZ: ‘a’, ‘b’, ‘c’ (StI);
116
Prädikatenlogik
3. für jede natürliche Zahl n ≥ 0 aus einer höchstens (abzählbar) unendlichen Menge von n-stelligen Prädikatkonstanten: ‘pn0 ’,‘pn1 ’,‘pn2 ’,. . . MZ: ‘P n ’, ‘Qn ’, ‘Rn ’, ‘S n ’ (StI); 4. der Menge der logischen Symbole ‘¬’, ‘∨’, ‘∧’, ‘→’, ‘↔’, (Junktoren) sowie ‘∀’ und ‘∃’ (Allquantor und Existenzquantor ); 5. dem Identitätssymbol ‘=’; 6. den Klammersymbolen ‘(’ und ‘)’. Die verschiedenen Mengen von Grundsymbolen sind paarweise disjunkt, und kein Grundsymbol ist eine Kette aus anderen Grundsymbolen. Die Grundsymbole unter 4. bis 6. werden autonym verwendet. Definition 4.2 Ein Ausdruck von L (kurz: L-Ausdruck ) ist eine endliche Kette von Grundsymbolen von L, die auch leer sein kann; die Menge der LAusdrücke heiße Ad L . Der leere Ausdruck wird wieder mit ‘Λ’ bezeichnet. MZ: ‘α’, ‘β’, ‘γ’ (StrI). Definition 4.3 Ein (Individuen-)Term von L (kurz: L-Term) ist eine Individuenvariable oder eine Individuenkonstante von L. Die Menge der L-Terme heiße Tm L . MZ für L-Terme sind ‘t’, ‘s’, ‘r’ (StrI). Definition 4.4 Induktive Definition einer Formel von L (kurz: L-Formel ): 1. Sind t und s Individuenterme, so ist p (t = s)q eine Formel. 2. Es seien n ≥ 0 eine natürliche Zahl, P n eine n-stellige Prädikatkonstante und t0 , . . . , tn−1 n Individuenterme; dann ist p P n t0 . . . tn−1 q eine Formel. 3. Sind φ und ψ Formeln, so ist auch jeder der folgenden L-Ausdrücke eine Formel: p ¬φq, p (φ ∨ ψ)q , p (φ ∧ ψ)q , p (φ → ψ)q , p (φ ↔ ψ)q . 4. Ist φ eine Formel und x eine Variable, so sind auch p ∀xφq und p ∃xφq Formeln. MZ für L-Formeln sind ‘φ’, ‘ψ’, ‘χ’ (StI). Die Menge der L-Formeln heiße Fm L . Bemerkungen 1. Die Klauseln in der Formel-Definition enthalten die verschiedenen Typen von syntaktischen Formationsregeln von L. Ihre Anwendung bezeichnen wir mit ‘Ri’ für 1 ≤ i ≤ 4.
2. Bei den MZ für Prädikatkonstanten kann der obere Index weggelassen werden, wenn sich die Stellenzahl aus dem Zusammenhang ergibt. Im allgemeinen stehen aber MZ ohne Index für einstellige Prädikatkonstanten.
3. Die Prädikation p P n t0 . . . tn−1 q teilt für n = 0 die Prädikatkonstante p P q mit. 0
117
Syntax (∀yP 3 byz → ∀x ((x = a) → ∃yQ2 xy)) HH R3 HH HH H H ∀x ((x = a) → ∃yQ2 xy) ∀yP 3 byz R4
R4 ((x = a) → ∃yQ2 xy) Q Q R3 Q Q Q
P 3 byz E A EA E A E A P3 b y z
R2
(x = a) R1 x
B B
B
Q ∃yQ2 xy R4
B a
Q2 xy
Q2
A A R2 A A x y
Abbildung 4.1: Baumtest für die Formeleigenschaft in LPL1I
4. Nullstellige Prädikatkonstanten der Gestalt p P 0 q werden mit den Satzkonstanten der Aussagenlogik identifiziert. Damit ist jede LAL -Formel auch eine LPL1I -Formel. 5. Formeln, die nach R1 und R2 gebildet sind, heißen atomar . Atomare Formeln und ihre Negationen heißen positive (bzw. negative) Literale.
6. In den Formelschemata von R4 heißt jedes Vorkommen der Variablen x gebunden. 7. In der reinen Prädikatenlogik fehlt das Identitätszeichen. Wird dieses aus dem Vokabular von LPL1I entfernt, so entstehe die Sprache der reinen Prädikatenlogik, LPL1 . Die Menge der LPL1 -Formeln besteht aus allen LPL1I -Formeln, in denen das Identitätssymbol nicht auftritt. 8. Die Mengen unter 2. und 3. in Definition 4.1 können auch leer sein oder nur aus endlich vielen Symbolen bestehen. Prädikatenlogische Sprachen für mathematische Theorien, wie etwa die Arithmetik oder die Mengenlehre, enthalten
118
Prädikatenlogik
nur endlich viele nicht-logische Zeichen, allerdings zusätzlich zu den Prädikatkonstanten auch sog. Funktionskonstanten, z.B. für die üblichen arithmetischen Operationen + und ·. Funktionskonstanten werden uns vorläufig nicht beschäftigen; siehe dazu Kapitel 12. 9. Die Klammerkonventionen von oben gelten weiter. Bei Identitäten können die Klammern weggelassen werden. Ferner binden die Quantoren stärker als alle Junktoren. Daher dürfen z.B. in dem bedingten Allsatz p ∀x (P 1 x → Q1 x)q die Klammern nicht weggelassen werden. 10. Besondere Aufmerksamkeit verdienen nach der syntaktischen Regel R4 gebildete quantifizierte Formeln der Gestalt p ∀xφ q und p ∃xφ q. Der Bestandteil φ in einer solchen Formel heißt auch Matrix , das Quantorensymbol heißt das Hauptzeichen der quantifizierten Formel. Die intendierte Bedeutung solcher Formeln ist eine Quantifikation, d.h. eine mit Hilfe der Variablen x gemachte und auf ihre Vorkommen in der Matrix φ bezogene allgemeine Aussage über einen bestimmten Bereich von Objekten. Typische Beispiele wurden bereits im vorigen informellen Abschnitt behandelt und seien hier noch einmal genannt;1 es werden jedoch auch “uneigentliche” Quantifikationen aufgeführt, die von den Formelregeln zugelassen werden, auch wenn der Quantor nicht alle oder keine Variablen in φ bindet. Solche Formeln stören in der Semantik nicht, ihre Einbeziehung vereinfacht aber die syntaktischen Regeln. . (i) ∀xP x; hier heißt die Matrix φ = P x. Die Variable x tritt in φ auf und wird von dem Allquantor gebunden. Die Formel besagt, daß alle Objekte eines gegebenen Bereichs von Individuen die Eigenschaft P haben. . (ii) ∃y(Qy ∨ Ry); Matrix: φ = (Qy ∨ Ry). Die Variable y tritt in φ zweimal auf und wird an beiden Stellen von dem Existenzquantor gebunden. Die Formel besagt, daß (mindestens) ein Objekt eines gegebenen Individuenbereichs die Eigenschaft Q oder die Eigenschaft R hat. . (iii) ∀z(P → Q); Matrix: φ = (P → Q). Die Variable x tritt in φ nicht auf, die Quantifikation “läuft leer”. Die Formel wird sich als logisch äquivalent zu ihrer Matrix (P → Q) erweisen. Die Formel ist nach den Regeln zwar syntaktisch wohlgeformt, aber die Quantifikation ist semantisch redundant. . (iv) ∀x∃xP 2 xx; Matrix: φ = ∃xP 2 xx. Die Variable x tritt zwar in der Matrix auf, wurde dort aber schon von dem “gleichnamigen” Existenzquantor gebunden. Der Allquantor läuft hier also ebenfalls leer. Die Formel ist wiederum äquivalent zu ihrer eigenen Matrix. . (v) ∀x(P x → ∃y(Qy ∧ R2 xy)); Matrix: φ = (P x → ∃y(Qy ∧ R2 xy)). Die Mitteilungszeichen ‘x’ und ‘y’ mögen verschiedene Variablen bezeichnen. Die Variable x tritt in φ zweimal auf und wird an beiden Stellen von dem Allquantor . gebunden, an der hinteren Stelle allerdings nur, weil wir x 6= y angenommen haben; andernfalls würde der Allquantor dort leerlaufen. Die Beispiele zeigen, daß ein Quantor eine Variable nur binden kann, wenn dies nicht schon ein “weiter innen” stehender Quantor getan hat. Ferner bezieht sich die Eigenschaft einer Variable, gebunden zu werden, genau genommen nicht 1 Wir verzichten dabei auf die Quasi-Anführungen, die man sich, sofern Mitteilungszeichen verwendet werden, stets hinzuzudenken hat.
119
Syntax
auf die Variable selbst, sondern auf jedes ihrer Vorkommen in einer Formel. Diese syntaktischen Bindungsverhältnisse werden im folgenden Abschnitt präzisiert, der vor allem zum Ziel hat, die fundamentale syntaktische Operation der Substitution zu definieren und zu erläutern.
4.2.1
Substitution von Termen in Formeln
Quantoren und Variablen können mehrfach in einer Formel vorkommen. Da ihr Bindungsverhalten von dem Kontext abhängt, in dem sie auftreten, ist eine Unterscheidung der verschiedenen Vorkommen notwendig. Beziehen wir uns auf eine spezielle Stelle ihres Auftretens in einer Formel, so sprechen wir von dem dortigen Vorkommen des Quantors bzw. der Variablen oder auch kurz von dem Quantor bzw. der Variable an dieser Stelle. Definition 4.5 Sei φ eine L-Formel, x eine Variable und Q ein Quantor in φ, der an der betrachteten Stelle die Variable x binden möge. Der kürzeste Teilausdruck von φ, der unmittelbar auf p Qxq folgt und eine Formel darstellt, heißt Bereich oder Skopus (engl. scope) von Q an der betrachteten Stelle. Ein Vorkommen von x in φ heiße gebunden, wenn es unmittelbar auf einen Quantor folgt oder im Bereich eines x bindenden Quantors liegt. Nicht gebundene Vorkommen von x in φ heißen frei in φ. x kommt in φ frei vor (tritt frei in φ auf), wenn es ein freies Vorkommen von x in φ gibt. Eine Formel φ heiße geschlossen oder ein Satz (engl. sentence), wenn es keine freien Vorkommen von Variablen in φ gibt. Andernfalls ist φ eine offene Formel.
Beispiel 4.3 Freie und gebundene Vorkommen von Variablen (gebunden: 1× unterstrichen, frei: 2× unterstrichen): (13)
∀xP 2 x y → ¬∃yP y ∨ Q3 x y z
Wie wir in der Semantik sehen werden, hat die Position eines freien Vorkommens einer Variablen in einer Formel φ einen referentiellen Status: bezüglich einer solchen Position kann φ von einem Objekt erfüllt oder wahr gemacht werden, nämlich genau dann, wenn das Objekt die Eigenschaft besitzt, welche von der Formel φ ausdrückt wird. Eine freie Variable x in einer (offenen) Formel φ entspricht am ehesten einem referentiellen Pronomen in der natürlichen Sprache, d.h. einem Pronomen, welches keiner anaphorischen Bindung im Satz unterliegt, das aber auch keine volle Individuenbezeichnung darstellt wie etwa ein Eigenname. Das folgende sprachliche Beispiel macht den Unterschied deutlich: (14)
a.
Anna glaubt, er schläft.
(referentielles Pronomen)
b.
Peteri liest das Buch, das eri gestern gekauft hat. (anaphorisches Pronomen)
Eine wahrheitsgemäße Äußerung des ersten Satzes (14a) hängt nicht nur von Annas Überzeugungen ab, sondern auch von der (männlichen) Person, die der Sprecher in der gegebenen Situation mit dem Pronomen er meint; er kann den intendierten Bezug oder die Referenz durch eine Zeigegeste (Ostension) auf die
120
Prädikatenlogik
Person hin zusätzlich deutlich machen; es handelt sich um einen referentiellen Gebrauch des Pronomens. In (14b) dagegen bezieht sich das Pronomen syntaktisch auf sein Antecedens ‘Peter’ (angedeutet durch den in der Linguistik in diesem Zusammenhang üblichen gemeinsamen Index i); es referiert nicht selbst, sondern höchstens indirekt über den Namen ‘Peter’. Man spricht hier ganz ähnlich wie in der Logik von einem gebundenen Pronomen. Ein solches Pronomen ist lediglich ein Platzhalter für den Individuenausdruck, auf den es sich bezieht. In der Logik ist eine gebundene Variable ebenfalls ein Platzhalter, der an der gebundenen Position nur unwesentlich vorkommt, mit der alleinigen Aufgabe, an dieser Stelle die korrekten syntaktischen Bezüge für den übergeordneten Quantor sicherzustellen, in dessen Skopus er auftritt. Wir wollen von einem schematischen Vorkommen der Variable oder von einer für sie schematischen Position sprechen. Eine der wichstigsten Operationen in der logischen Syntax ist die Ersetzung oder Substitution eines Ausdrucks für einen anderen Ausdruck in einem größeren Ausdruck. Wir betrachten hier den Fall, in dem in einer Formel φ eine Variable x durch einen beliebigen Term t ersetzt wird. Dies ist die typische Situation der Spezialisierung einer Allaussage etwa der Form ∀xP x auf einen speziellen Term t, mit dem Ergebnis P t. Hier wurde x in der Matrix P x des Allsatzes durch t ersetzt. Natürlich gibt es komplexere Allaussagen der allgemeineren Gestalt ∀xφ, mit einer möglicherweise ganz komplizierten Matrix-Formel φ, in der die Variable x “tief drinnen” an ein oder mehreren Stellen auftritt. Auch dann muß die Substitution erklärt sein. Wir nennen x die Substitutionsvariable und t den Substitutionsterm. Steht nun die Substitutionsvariable nicht im Bereich eines Quantors, so ist die Ersetzung unproblematisch: man entfernt x einfach aus der Zeichenkette φ und setzt stattdessen t an die Stelle. Der referentielle Status ist von vornherein gegeben, da x offensichtlich frei vorkommt, und er bleibt auch erhalten. Wenn dagegen die Substitutionsvariable im Bereich eines Quantors vorkommt, so gibt es zwei Quellen der Komplikation: (i) x wird von dem Quantor gebunden; dann ist dieses Vorkommen von x nicht frei, und es sollte keine Ersetzung stattfinden: eine gebundene Variable ist ja lediglich ein nicht denotierender Platzhalter, und die Position dieses Vorkommens würde bei der Ersetzung in der Regel ihren Status von einer schematischen zu einer referentiellen Position verändern. Auf der anderen Seite kann es vorkommen, daß (ii) x selbst zwar frei vorkommt, jedoch im Bereich eines Quantors steht, der den Substitutionsterm t “einfängt” und bindet. Dies kann hier natürlich nur dann geschehen, wenn t eine Variable ist. In diesem Fall wird aus einer referentiellen Position eine schematische, und auch das ist semantisch unerwünscht. Bei einer generellen Definition der Substitution müssen diese beiden “semantisch aktiven” Fälle also ausgeschlossen werden. In späteren Kapiteln werden wir es mit der allgemeineren Situation zu tun haben, daß ein Term t selbst syntaktisch komplex sein kann, entweder als Kennzeichnung, als Funktionsterm oder Klassenterm. Dann kann t bereits von einem Quantor Qy eingefangen werden, wenn in t lediglich eine Variable (frei) auftritt, die von dem Quantor gebunden wird. Als Kennzeichnungsterm kann t etwa die . . Gestalt t = (ιxP 2 xy) haben, in der Arithmetik könnte gelten t = 5 + y, oder . in der Mengenlehre t = {x|x ∈ y}. Wir wollen in diesen Fällen davon sprechen, daß der Quantor den Term fesselt. Genauer definieren wir: y der Gestalt, als Funktionsterm (.
121
Syntax
Definition 4.6 Ein Quantorvorkommen (oder kurz: ein Quantor) Q fesselt einen in seinem Bereich auftretenden Term t, wenn in t die von Q quantifizierte Variable frei vorkommt. Ist x die quantifizierte Variable, so fesselt Q nach dieser Festlegung speziell jedes Vorkommen von x selbst, ferner jede (später zu betrachtende) Kennzeichnung, in der x frei auftritt, sowie jeden Funktionsterm, in dem x vorkommt. Wir definieren dann weiter: Definition 4.7 Es seien φ eine Formel, x eine Variable, und t ein Term. t heißt frei für x in φ, wenn kein freies Vorkommen von x in φ im Bereich eines t fesselnden Quantors liegt (oder kürzer: wenn t an freien x-Stellen in φ nicht gefesselt wird). Wir kürzen diesen Sachverhalt durch die (metasprachliche) Formel ab: (15)
Fr(t, x; φ)
für
“t ist frei für x in φ”
Ist t eine Individuenkonstante, so ist t trivialerweise frei für x in φ. Ist t nicht frei für x in φ, so spricht man auch von einer Variablenkollision bei dem Versuch, x durch t zu ersetzen. Wir wollen jetzt zwei Begriffe von Substitution definieren. Beide sagen nur etwas über die Ersetzung von referentiellen Positionen in einer Formel, d.h. an solchen Stellen, an denen die Substitutionsvariable frei auftritt. Es gibt ferner die Ersetzung von gebundenen Vorkommen von Variablen durch andere Variablen, aber sie funktioniert anders und dient einem anderen Zweck, nämlich der sog. gebundenen Umbenennung; sie wird erst für den zweiten Begriff benötigt und im Zusammenhang mit diesem besprochen. Hier betrachten wir zunächst den Begriff der “einfachen” Substitution, bei der ein Term t für eine Variable x ersetzt wird, gleichgültig ob t frei für x ist. Der zweite Begriff betrifft dann die “eigentliche” Substitution, bei der auch eine mögliche Variablenkollision berücksichtigt wird. Definition 4.8 Induktive Definition der (einfachen) Substitution eines Terms t für eine Variable x in einer Formel φ, symbolisch: φ(t/x) 1. φ sei atomar; dann ist φ(t/x) das Ergebnis der Ersetzung aller Vorkommen von x in φ durch t. . . 2. φ = ¬ψ für eine Formel ψ; dann gilt φ(t/x) = ¬[ψ(t/x)]. . 3. φ = ψ J χ mit einem zweistelligen Junktor J und Formeln ψ und χ; dann . gilt φ(t/x) = [ψ(t/x)] J [χ(t/x)]. . 4. Sei φ = Qyψ, wobei Q einer der beiden Quantoren ∀ oder ∃, y eine Variable und ψ eine Formel ist. y heiße in diesem Zusammenhang die quantifizierte Variable. (a) Die Substitutionsvariable sei gleich der quantifizierten Variablen, d.h. . . x = y; dann gilt φ(t/x) = φ. (b) Die Substitutionsvariable sei ungleich der quantifizierten Variablen, . . d.h. x 6= y; dann gilt: φ(t/x) = Qy[ψ(t/x)].
122
Prädikatenlogik
Bemerkungen 1. Die eckigen Klammern in der Definition stehen nur der Deutlichkeit halber da, um zu betonen, auf welche Formel sich die Ersetzung bezieht. 2. Ist S eine (einfache) Substitution von x durch t in φ, so werden vermöge S alle freien (!) Vorkommen von x in φ durch t ersetzt.
3. Die (endliche) Menge der in φ frei auftretenden Variablen heiße FV (φ); dann gilt (‘∅’ ist das Symbol für die leere Menge): (i) φ ist eine offene Formel (ii) φ ist ein Satz
gdw
gdw
FV (φ) 6= ∅
FV (φ) = ∅
(iii) x tritt nicht frei in φ auf, d.h. x 6∈ FV (φ) beliebige Konstante a.
gdw
. φ(a/x) = φ für eine
. . Beispiel 4.4 Einfache Substitution: Sei x 6= y und φ = ∀x P 2 xy → ¬∃y P y.
(16)
(17)
φ(a/y)
φ(x/y)
. = . = . = . =
[ ∀x P 2 xy → ¬∃y P y ](a/y) [∀x P 2 xy](a/y) → [¬∃y P y](a/y)
. = . = . = . =
[ ∀x P 2 xy → ¬∃y P y ](x/y) [∀x P 2 xy](x/y) → [¬∃y P y](x/y)
∀x [P 2 xy](a/y) → ¬[∃y P y](a/y) ∀x P 2 xa → ¬∃y P y
∀x [P 2 xy](x/y) → ¬[∃y P y](x/y) ∀x P 2 xx → ¬∃y P y
Das zweite Beispiel zeigt deutlich, daß die einfache Substitution semiotisch aktiv ist, wie wir oben sagten: vorher sagte das Antecedens ∀xP 2 xy in der Formel φ, daß ein gewisses Objekt y in einem gegebenen Kontext (“dieses Ding da”) die Eigenschaft hat, daß alle Objekte zu ihm in der Relation P 2 stehen; nach der Ersetzung sagt die Formel ∀xP 2 xx, daß jedes Objekt zu sich selbst in der Relation P 2 steht. Nehmen wir z.B. für P 2 die Relation des Betrügens, so bedeutet die Formel vorher, daß alle eine gewisse Person y betrügen, und nachher, daß alle sich selbst betrügen. Übung 4.1 Berechnen Sie (verschiedene MZ teilen verschiedene Variablen mit): a. [P x → ∀x (Qx ∨ Ry)](a/x) c. [∀x∃y (P x ∧ Qx)](y/x)
b. [P x → ∀x (Qx ∨ Ry)](x/y) d. [∃x (P 2 xy ∧ R2 bz)](b/z)
123
Syntax
Es gibt zwei Möglichkeiten, das unerwünschte Phänomen der Variablenkollision zu vermeiden. Entweder man läßt die Ersetzung nur zu, wenn der Substitutionsterm frei für die Substitutionsvariable ist, oder man sorgt an jeder Stelle, an der ersetzt wird, dafür, daß die quantifizierte Variable, die die Kollision erzeugt, vorher gebunden umbenannt wird. Damit ist gemeint, daß etwa die quantifizierte Formel mit der Variablen x, ∀xP x, ersetzt wird durch die Formel ∀yP y. Im allgemeinen Fall mit einer beliebigen Matrix ψ ist y dabei so zu wählen, daß sie völlig neu ist, d.h. weder in ψ noch im Substitutionsterm auftritt; dies ist immer möglich, da wir einen unendlichen Vorrat von Variablen in der Sprache haben, in jedem Ausdruck aber nur endlich viele Variablen vorkommen können. Das Verfahren der gebundenen Umbenennung muß natürlich semantisch korrekt sein: es darf sich keine Bedeutungsveränderung ergeben. Das ist aber gewährleistet, da jede gebundene Variable ein semantisch unwesentlicher Platzhalter ist; wie wir sehen werden, ist jede quantifizierte Formel mit jeder ihrer gebundenen Umbenennungen logisch äquivalent. . Definition 4.9 Es sei φ = Qxψ eine quantifizierte Formel und y eine Variable, die nicht in φ auftritt. Dann ist die gebundene Umbenennung von φ mit y die Formel: (18)
(Qxψ) |y := Qy [ψ(y/x)]
(gebundene Umbenennung)
Beispiel 4.5 Hat die Formel φ die Gestalt ∀x (P x → ∃z(Qz ∧ R 2 xz)) mit . . x 6= y 6= z, so gilt: (19)
[∀x (P x → ∃z(Qz ∧ R2 xz))] |y = ∀y (P y → ∃z(Qz ∧ R2 yz))
Wir können jetzt die eigentliche Substitution definieren, die wie die einfache Substitution funktioniert, jedoch im Fall einer Variablenkollision den störenden quantifizierten Kontext automatisch gebunden umbenennt. Wir verwenden eine andere Notation für die eigentliche Substitution, damit stets klar ist, welcher Typ von Substitution gerade vorliegt. Definition 4.10 Induktive Definition der (eigentlichen) Substitution (engl. proper substitution) eines Terms t für eine Variable x in einer Formel φ, symbolisch: (φ)xt (x heißt die Substitutionsvariable und t der Substitutionsterm) 1. φ sei atomar; dann ist (φ)xt das Ergebnis der Ersetzung aller Vorkommen von x in φ durch t. . . 2. φ = ¬ψ für eine Formel ψ; dann gilt (φ)xt = ¬(ψ)xt . . 3. φ = ψ J χ mit einem zweistelligen Junktor J und Formeln ψ und χ; dann . gilt (φ)xt = (ψ)xt J (χ)xt . . 4. Sei φ = Qyψ, wobei Q einer der beiden Quantoren ∀ oder ∃, y eine Variable und ψ eine Formel ist. y heiße in diesem Zusammenhang die quantifizierte Variable. (a) Die Substitutionsvariable sei gleich der quantifizierten Variablen, d.h. . . x = y; dann gilt (φ)xt = φ.
124
Prädikatenlogik (b) Die Substitutionsvariable sei ungleich der quantifizierten Variablen, . d.h. x 6= y; dann gibt es zwei Fälle:
i. Die quantifizierte Variable tritt nicht frei im Substitutionsterm . . auf, in PL1I speziell also t 6= y; dann gilt: (φ)xt = Qy(ψ)xt . ii. Die quantifizierte Variable tritt frei im Substitutionsterm auf, . in PL1I speziell also t = y; dann wird zunächst eine gebundene . Umbenennung vorgenommen2 und dann substituiert. Sei also z 6= x eine Variable, die weder in φ noch in t auftritt; dann gilt: . . (φ)xt = [(Qyψ) |z ]xt = Qz[ψ(z/y)]xt
Wird die Formel φ durch ein einzelnes Zeichen mitgeteilt, so schreibt man statt ‘(φ)xt ’ kurz ‘φxt ’. . . Beispiel 4.6 Eigentliche Substitution: Sei x 6= y und φ = ∀x P 2 xy → ¬∃y P y. Im ersten Beispiel wird y durch a ersetzt, im zweiten Beispiel wird, da der Substitutionsterm x nicht frei für die Substitutionsvariable y in φ ist, zuerst . . mit einer neuen Variablen z (also x 6= z 6= y) gebunden umbenannt und dann substituiert.
(20)
(21)
. = . = . = . =
(φ)ya
(φ)yx
. = . = . = . = . =
( ∀x P 2 xy → ¬∃y P y )ya (∀x P 2 xy)ya → (¬∃y P y)ya
∀x (P 2 xy)ya → ¬(∃y P y)ya ∀x P 2 xa → ¬∃y P y
( ∀x P 2 xy → ¬∃y P y )yx (∀x P 2 xy)yx → (¬∃y P y)yx
∀z [(P 2 xy)(z/x)]yx → ¬∃y P y ∀z (P 2 zy)yx → ¬∃y P y ∀z P 2 zx → ¬∃y P y
Übung 4.2 Berechnen Sie (verschiedene MZ teilen verschiedene Variablen mit): a. (P x → ∀x (Qx ∨ Ry))xa c. (∀x∃y (P x ∧ Qx))xy
4.3
b. (P x → ∀x (Qx ∨ Ry))yx d. (∃x (P 2 xy ∧ R2 bz))zb
Prädikatenlogische Prinzipien
Obwohl der Ausdrucksreichtum der Prädikatenlogik gegenüber der Aussagenlogik um ein Vielfaches höher ist, bestimmen nur einige wenige Prinzipien 2 Das
ist die Bedeutung von ‘eigentlich’ in der Definition.
125
Logische Prinzipien
die Logik dieses reicheren Systems. Das wichtigste Prinzip ist das der Beispielbildung oder Spezialisierung auf eine Instanz, das den Übergang von einer Allaussage zu einem Spezialfall gestattet. In dem später zu besprechenden KalishMontague-Kalkül (KM-Kalkül) wird es die Gestalt einer Ableitungsregel, der Allbeseitigung annehmen. Als Axiom hat das Prinzip jedoch konditionale Form und lautet: (22)
∀xφ → φ(t/x)
für
Fr (t, x; φ)
(Allspezialisierung)
Da wir die einfache Substitution φ(x/t) verwendet haben, muß durch die Variablenbedingung, daß t frei für x in φ ist, sichergestellt werden, daß es bei der Spezialisierung zu keiner Variablenkollision kommt. Die Bedingung bedeutet keine wirkliche Einschränkung des Prinzips, da es ein Formelschema ist und gegebenenfalls zu einer anderen Allformel der gleichen Gestalt übergegangen werden kann, in der die quantifizierte Variable keine Kollision erzeugt. Will man das Hinzufügen der Variablenbedingung vermeiden, so muß die eigentliche Substitution verwendet werden: (23)
(Allspezialisierung)
∀xφ → φxt
Die Formeln im Consequens des Spezialisierungsprinzips, also φ(t/x) bzw. φxt , werden Instanzen oder Spezialfälle der Allformel ∀xφ genannt. Man beachte, daß es eine weitere Instanzenbildung gibt, jedoch auf der Metaebene: das Prinzip (22) bzw. (23) stellt ja ein Formelschema dar, von dem man ebenfalls Spezialfälle oder Instanzen bilden kann. Im ersten Fall sprechen wir genauer von (objektsprachlichen) Instanzen einer Allformel und im zweiten Fall von (metasprachlichen) Instanzen oder Spezialfällen eines Formelschemas. Schließlich wird auch der Substitutionsterm selbst eine Instanz genannt. Der Kontext schließt in der Regel Verwechslungen aus. Beispiel 4.7 Wir geben einige Beispiele für Allspezialisierungen. . . 1. φ = P x, t = x; dann ist ∀xP x → P x ein gültiger Spezialfall von (22), da x trivialerweise frei für x in φ ist. Allgemeiner ist ∀xφ → φ eine Instanz des Schemas der Allspezialisierung für jede Formel φ. 2. φ sei das Konditional (P y → Qy), und a sei eine Individuenkonstante. Dann ist ∀y(P y → Qy) → (P a → Qa)
eine Instanz von (22). Fassen wir etwa das Antecedens als logische Form des bedingten Allsatzes (i) alle Menschen sind sterblich auf, und nehmen wir an, a stehe für Sokrates, dann bedeutet (P a → Qa) das Konditional wenn Sokrates ein Mensch ist, dann ist Sokrates sterblich. Mit der weiteren Prämisse (ii) Sokrates ist ein Mensch, formal P a, folgt dann aus (22) und (i) rein aussagenlogisch mit zweimal Modus Ponens die bekannte Konklusion (iii) Sokrates ist sterblich, formal Qa. 3. Das Spezialisierungsprinzip spielt in der idealisierten “Logik der Forschung”, wie sie Karl Popper beschrieben hat, eine wichtige Rolle. Das Antecedens des
126
Prädikatenlogik
Prinzips ist in diesem Kontext eine Gesetzeshypothese, d.h. ein bedingter Allsatz der Gestalt alle P sind Q, formal: ∀x(P x → Qx). Hat man nun eine spezielle Instanz a mit der Eigenschaft P , so wird a auf die Eigenschaft Q getestet. Gilt Qa, so ist die Hypothese zwar im vorliegenden Fall bestätigt, aber dadurch keineswegs bewiesen; dennoch kann man bis auf weiteres an der Hypothese festhalten. Stellt sich dagegen ¬Qa heraus, so gilt P a ∧ ¬Qa oder ¬(P a → Qa), und mit Modus Tollens erhält man die Negation der Allaussage, also ¬∀x(P x → Qx). Damit ist die Hypothese falsifiziert. Dies ist der Kern des Falsifikationismus in der Wissenschaftstheorie. 4. Es sei L1 [>] eine PL1-Sprache mit der 2-stelligen Relationskonstante > für die Relation ist größer als zwischen natürlichen Zahlen. Statt > xy schreiben wir wie üblich x > y. Die Konstante ‘5’ sei der Ziffernname für die Zahl 5 . Dann ist die folgende Formel eine Instanz des Spezialisierungsprinzips: ∀x∃y y > x → ∃y y > 5 Da das Antecedens eine wahre arithmetische Aussage ist, folgt mit Modus Ponens das Consequens, d.h. daß es eine Zahl größer als 5 gibt. 5. Mit den Bezeichnungen aus dem vorigen Beispiel sei die folgende Formel gegeben: ∃y∀x y > x → ∃y y > 5
Die Formel ist keine Instanz des Spezialisierungsprinzips: dieses gestattet nicht die Spezialisierung “unter” einem anderen Quantor. Der Allquantor, bezüglich dessen spezialisiert wird, muß das Hauptzeichen im Antecedens sein.
Wenn es um Anwendungen des Spezialisierungsprinzips in der Philosophie geht, so stellt sich vor allem die Frage, welche Gestalt der Substitutionsterm t haben kann. Der semantische Gehalt des Prinzips lautet, daß, wenn alle Objekte x des Individuenbereichs die Eigenschaft φ besitzen, dies eben auch für jedes einzelne Objekt gilt; ist nun t ein Name eines solchen Objekts, so ist φ(t/x) erfüllt. Nun ist die Semantik der klassischen Prädikatenlogik so erklärt, daß jeder Individuenterm denotiert, d.h. Name eines Objekts im Individuenbereich ist; dieser Umstand validiert gerade das Spezialisierungsprinzip. In sprachlogischen und philosophischen Kontexten ist es dagegen bisweilen so, daß ein Individuenterm nicht denotiert; man denke an fiktive Namen wie ‘Pegasus’ und ‘Sherlok Holmes’ oder an Kennzeichnungen wie ‘die größte Primzahl ’ und ‘der gegenwärtige König von Frankreich’. In einer Semantik, die die Möglichkeit von Denotationslücken für Individuenterme zuläßt, gilt das Spezialisierungsprinzip in der obigen Form nicht mehr, da es ja vorkommen kann, daß der Substitutionsterm kein Objekt im Individuenbereich benennt. Das Spezialisierungsprinzip muß in diesem Fall geeignet eingeschränkt werden. Wir kommen darauf zurück. Die duale Form des Spezialisierungsprinzips ist das Prinzip der Existenzabschwächung: (24)
φ(t/x) → ∃xφ
für
Fr (t, x; φ)
(Existenzabschwächung)
Dieses Prinzip besagt in konditionaler Form, daß aus dem Vorliegen einer Instanz φ(t/x) auf die Existenz eines Objekts mit der Eigenschaft φ geschlossen werden kann. Im KM-Kalkül ist dies die Regel der Existenz-Einführung (∃E).
127
Logische Prinzipien
Wiederum ist die Existenzabschwächung nur unter der (in der klassischen Semantik erfüllten) Voraussetzung gültig, daß jeder Name denotiert. Ohne diese Voraussetzung kann man sich wahre Kontexte vorstellen, in denen ein nichtdenotierender Term auftritt; dann ist der Schluß auf den Existenzsatz nicht zwingend. Gesetzt, ein Kommissar a findet die Leiche eines gewissen Schmidt, den er für ein Mordopfer hält, und er versucht, den angeblichen Mörder zu finden. Dann kann man wahrheitsgemäß von a sagen, er suche den Mörder von Schmidt (= b), und zugleich, daß es niemanden gibt, den er sucht (nämlich . wenn Schmidts Tod ein Unfall war); formal, mit φ = P 2 ax für “a sucht x ”: (25)
P 2 ab ∧ ¬∃xP 2 ax
≡
φ(b/x) ∧ ¬∃xφ
≡
¬( φ(b/x) → ∃xφ )
Also ist die Existenzabschwächung verletzt. Sollen derartige Fälle in das formale System einbezogen werden, so muß auch dieses Prinzip geeignet eingeschränkt werden. Eine weitere Quelle der Ungültigkeit des Prinzips der Existenzabschwächung sind die in der Einleitung angesprochenen epistemischen Kontexte. Hier kann das Prinzip verletzt sein, selbst wenn keine Denotationslücke vorliegt. Angenommen, im vorigen Beispiel wurde Schmidt zwar ermordet, aber der Kommissar kennt den Mörder nicht; aufgrund des Zustands der Leiche kommt er jedoch zu der Überzeugung, daß der Mörder wahnsinnig ist. Dann kann man, ohne sich zu widersprechen, die folgenden beiden Aussagen für wahr halten, deren logische Formen in Konjunktion jedoch wie eben äquivalent zur Negation der Existenzabschwächung sind: (26)
a.
Der Kommissar glaubt, daß der Mörder von Schmidt wahnsinnig ist.
b.
Es gibt niemanden (speziellen), von dem der Kommissar glaubt, er sei wahnsinnig.
In der Sprachphilosophie spricht man bei dem Satz (26a) von einer attributiven Verwendung der Kennzeichnung ‘der Mörder von Schmidt’, die nur dann referentiellen Charakter annimmt, wenn der Kommissar die Person des Mörders kennt und von ihr glaubt, sie sei wahnsinnig. Nur unter dieser Zusatzbedingung wäre die Existenzabschwächung aus (26a) gerechtfertigt. Epistemische Kontexte gelten als intensionale Kontexte, deren logisches Kennzeichen es ist, die Existenzabschwächung ungültig werden zu lassen. Ihre Gültigkeit ist umgekehrt eine charakteristische Eigenschaft der extensionalen Logik . Ein zweites Merkmal extensionaler Sprachen, die Gültigkeit des Leibnizschen Substitutionsprinzips, auf das wir im nächsten Abschnitt zurückkommen. Aus der Sicht eines Regel-Kalküls wie des KM-Kalküls gruppieren sich die Schlußfiguren für die logischen Zeichen zu Paaren: jeweils eine Schlußregel führt das Zeichen ein, die andere beseitigt es. In der Aussagenlogik haben wir, wie wir sehen werden, sowohl für die Einführung als auch für die Beseitigung jeweils ein entsprechendes Gesetz. Bei den Quantoren ist die Situation nicht ganz so symmetrisch. Mit Hilfe des Spezialisierungsprinzips kann der Allquantor beseitigt und mit Hilfe der Existenzabschwächung der Existenzquantor eingeführt werden; die dualen Regeln der All-Einführung und der Existenz-Beseitigung sind dagegen nicht so ohne weiteres als Gesetze zu schreiben. Die in der Beschreibung des KM-Kalküls anzugebene Regel (∃B) der Existenz-Beseitigung
128
Prädikatenlogik
ist eine charakteristische Regel des natürlichen Schließens, die es so im axiomatischen Rahmen nicht gibt. Die Einführung des Allquantors geschieht beim axiomatischen Aufbau dagegen meist mittels einer Schlußregel; im KM-Kalkül muß dafür eine “All-Ableitung” eröffnet werden. Die entsprechenden Details zum KM-Kalkül werden weiter unten erläutert. Wenn in eine formale Sprache neue logische Zeichen eingeführt werden, so müssen geeignete Gesetze die Interaktion mit den vorhandenen Zeichen erklären. Beim axiomatischen Aufbau der Prädikatenlogik werden meist zwei weitere Prinzipien angegeben, die als Axiome dienen und das Zusammenspiel mit der Negation und dem Konditional regeln (die Beziehungen zu den anderen Junktoren lassen sich dann ableiten). Es sind dies die Prinzipien der Quantorennegation und der Quantorendistribution. (27)
¬∀xφ ↔ ∃x¬φ
(28)
∀x(φ → ψ) → (∀xφ → ∀xψ)
(Quantorennegation) (Quantorendistribution)
Das Prinzip der Quantorennegation gestattet es, das Negationszeichen “unter den Quantor zu ziehen”, wobei das Quantorenzeichen wechselt. Dies steht im Einklang mit der Sprachlogik, in der die Wendung nicht alle x soviel bedeutet wie es gibt ein x das nicht. Bei der Quantorendistribution kann der Allquantor über das Konditional auf das Antecedens und das Consequens “verteilt” werden.
4.4
Identität
Wir kommen nun zu den identitätslogischen Prinzipien. Es sind dies die Gesetze, die die Logik der objektsprachlichen Gleichheit ‘=’ bestimmen. Zunächst erfüllt die Gleichheit die Axiome einer Äquivalenzrelation, d.h. es gelten die Prinzipien der Reflexivität, der Transitivität und der Symmetrie (siehe Definition 3.1); für beliebige Individuenterme s, t und r gilt also: (29)
t=t
(30)
s=t ∧ t=r → s=r
(31)
s=t → t=s
(Reflexivität) (Transitivität) (Symmetrie)
Es zeigt sich, daß Transitivität und Symmetrie der Gleichheit Spezialfälle des in der Einleitung diskutierten Substitutionsprinzips sind, welches die Ersetzung von koreferentiellen Termen füreinander gestattet. Seine Gültigkeit ist zusammen mit der der Existenzabschwächung ein Merkmal extensionaler Sprachen. Bei der Formulierung des Substitutionsprinzips hatten wir vorwegnehmend die Notation ‘φ[∗]’ für einen “Kontext” verwendet, in dem an der mit dem Stern markierten Stelle die Terme eingesetzt werden können. Wir wollen diese so genannte “Nennform-Schreibweise” nun genauer im formalen Rahmen der Prädikatenlogik erklären. Mit dem komplexen Mitteilungszeichens der Gestalt ‘φ[t]’ beziehen wir uns auf eine Formel φ, in der ein Term t frei auftritt. Die Zeichenketten φ und φ[t] sollen also identisch sein;3 bei der Nennform-Notation ist . heißt, es soll gelten φ = φ[t], auch wenn natürlich das Symbol ‘φ’ von dem Ausdruck ‘φ[t]’ verschieden ist! 3 Das
129
Identität
lediglich hervorgehoben, daß t in φ an einer oder mehreren Stellen auftritt. Diese ausgezeichnete Stelle heißt Nennstelle. Genauer gesagt stellt man sich vor, daß φ[t] aus einer “Quasi-Formel” entstanden ist, die wie eine normale Formel der Prädikatenlogik aufgebaut ist, jedoch an den Stellen, an denen jetzt t steht, statt eines Individuenterms ein Platzhalter-Symbol, etwa ‘∗’, enthält; eine solche Quasi-Formel der Gestalt ‘φ[∗]’ wird auch Nennform genannt. Wir halten dies in der folgenden Definition fest. Definition 4.11 Es sei ‘∗’ ein Symbol, Nennzeichen genannt, welches nicht in der Sprache LPL1I vorkommt, und es sei Tm ∗L = Tm L ∪ {∗}. Eine prädikatenlogische Nennform ist ein Ausdruck von L ∪ {∗}, der wie eine L-Formel gebildet ist, jedoch mit Tm ∗L anstelle von Tm L (d.h. das Nennzeichen kann an Term-Positionen auftreten), und in dem das Nennzeichen an mindestens einer Stelle wirklich vorkommt; in Symbolen: ‘φ[∗]’. Die Vorkommen von ‘∗’ in φ[∗] werden (kollektiv) Nennstelle genannt. Ersetzt man in einer Nennform φ[∗] das Nennzeichen ‘∗’ durch einen Term t, so entsteht die L-Formel φ, die sich von φ[∗] nur an der Nennstelle unterscheidet und dort t enthält. φ wird dann durch das komplexe Symbol ‘φ[t]’ mitgeteilt (“φ in Nennform-Schreibweise”). Informelle Bezeichnungen für ‘Nennform’ sind häufig auch ‘Matrix ’ oder wie gesagt ‘Kontext’. Wir können nun in die Nennform φ[∗] beliebige Terme “einsetzen”, vorausgesetzt, die Terme sind frei für die durch ‘∗’ markierte Nennstelle. Das Substitutionsprinzip hat dann die Gestalt eines Formelschemas, welches als mögliche Kontexte für jedes Paar s, t von Termen so viele Instanzen aufweist, wie es Nennformen der genannten Art gibt. Bevor wir das Substitutionsprinzip hinschreiben, muß wiederum das Problem einer möglichen Variablenkollision berücksichtigt werden. Es kann nämlich vorkommen, daß einer der Terme eine Variable ist, die an der Nennstelle unintendiert gebunden wird. Um das auszuschließen, müssen wir das Prinzip mit der Variablenbedingung formulieren, daß sowohl s als auch t frei für die Nennstelle in φ[∗] ist. Wenn wir diese Bedingung als ‘Fr (s, t; φ[∗])’ notieren, so lautet das Schema, das wir auch das Prinzip der “Leibniz-Ersetzbarkeit” oder kurz “Leibniz-Prinzip” (Lb) nennen: (32)
s = t → (φ[s] → φ[t])
mit Fr(s, t; φ[∗]) (Leibniz-Prinzip Lb)
Wir wollen nun noch die Eindeutigkeitsaussagen ansprechen, an denen sich die höhere Ausdruckskraft der Identitätslogik gegenüber der reinen Prädikatenlogik bemerkbar macht. In der reinen PL1-Logik kann man mitteilen, daß alle Objekte eine gewisse Eigenschaft P besitzen (∀xP x), oder daß ein Objekt mit der Eigenschaft P existiert (∃xP x). Letztere Aussage ist erfüllt, wenn es mindestens ein P gibt, aber auch wenn es zwei, drei oder mehr P s gibt. Angenommen nun, wir möchten in unserer Logik zusätzlich ausdrücken, daß es genau ein Objekt mit der Eigenschaft P gibt. Dies kann man durch die Konjunktion der folgenden beiden Aussagen der Existenz und der Eindeutigkeit paraphrasieren: (33)
a.
Es gibt mindestens ein P .
b.
Es gibt höchstens ein P .
(Existenz ) (Eindeutigkeit)
130
Prädikatenlogik
Wie bereits in der Einleitung diskutiert, läßt sich (33b) durch (34a) paraphrasieren,4 mit der logischen Form (34b); hier geht das Identitätszeichen wesentlich ein. (34)
a.
Haben Objekte x und y die Eigenschaft P , so ist x gleich y.
b.
∀x∀y (P x ∧ P y → x = y)
(Eindeutigkeit von P )
Wir werden unten sehen, daß die Bedingungen der Existenz und der Eindeutigkeit gerade die Voraussetzungen dafür sind, daß eine Kennzeichnung wie Russells ‘gegenwärtiger König von Frankreich’ ein Denotat besitzt: in diesem Fall muß es derzeit (mindestens) einen König von Frankreich geben, und es darf nicht mehr als einen König geben. Faßt man die beiden Bedingungen in einer Formel zusammen, so ergibt sich die charakteristische Einzigkeitsbedingung für Kennzeichnungen: (35)
a.
Es gibt genau ein Objekt mit der Eigenschaft P .
b.
∃xP x ∧ ∀x∀y (P x ∧ P y → x = y)
c.
∃x (P x ∧ ∀y (P y → y = x))
Die Formeln (35b) und (35c) werden sich als logisch äquivalent erweisen. Wir bemerken noch, daß wir in der Metasprache dieselbe “Logik der Einzigkeit” verwenden; z.B. haben wir bei dem Beweis der eindeutigen Existenz einer Booleschen Bewertung auf der Basis einer gegebenen Belegung f die folgenden beiden Beweisschritte unterschieden: (i) Nachweis der Existenz einer Booleschen Bewertung bezüglich f ; (ii) Nachweis der Eindeutigkeit der Booleschen Bewertung. Beim zweiten Schritt galt es, zwei vorgegebene Fortsetzungen g und g 0 von f als gleich nachzuweisen. Mit dem Identitätssymbol lassen sich allgemeiner beliebige Anzahlaussagen machen, sofern die gewählte Zahl n endlich ist. Für n = 2 bekommen wir zum Beispiel (dabei steht ‘x 6= y’ für ‘¬(x = y)’): (36)
(37)
a.
Es gibt mindestens zwei Objekte mit der Eigenschaft P .
b.
∃x∃y (P x ∧ P y ∧ x 6= y)
a.
Höchstens zwei Objekte haben die Eigenschaft P .
b.
∀x∀y∀z (P x ∧ P y ∧ P z → x = y ∨ x = z ∨ y = z)
Wir machen abschließend noch auf eine weitere Unschärfe in der sprachlichen Wiedergabe von Anzahlquantifikationen aufmerksam. Die Formel (37b) enthält lediglich einige Allquantoren und keinen Existenzquantor. Daher ist sie prädikatenlogisch gesehen verträglich mit einer Situation, in der kein Objekt die Eigenschaft P besitzt. Andererseits scheint der Satz (37a) so viel zu bedeuten wie (38a), der den expliziten Existenzausdruck ‘es gibt’ enthält und daher wohl die Existenz eines P fordert: (38)
a.
Es gibt höchstens zwei Objekte mit der Eigenschaft P .
4 Natürlich wird wiederum nicht vorausgesetzt, daß x und y verschieden sind und sich dann später als “gleich” herausstellen. Zu dem diesbezüglichen Verdikt Wittgensteins siehe die Diskussion in der Einleitung im Unterabschnitt “Identität”.
Kennzeichnungen und Abstraktion
131
b.
Es gibt höchstens ein Objekt mit der Eigenschaft P .
c.
Es gibt nicht weniger und nicht mehr als zwei Objekte mit der Eigenschaft P .
d.
Es gibt nicht weniger und nicht mehr als ein Objekt mit der Eigenschaft P .
Aufgrund der gleichen Überlegung fordert dann aber auch der Satz (38b) die Existenz eines P . Dies erscheint jedoch zweifelhaft: die Wendung ‘es gibt’ leitet hier eher eine syntaktisch induzierte Existenzaussage ohne semantische Existenzbehauptung ein. Will man diese deutlich machen, so würde man eher eine Formulierung wie in (38c,d) gebrauchen. Wie dem auch sei, wir wollen unsere umgangssprachliche Ausdrucksweise jedenfalls dahingehend normieren, daß Aussagen wie (37a), (38a) und (38b) keine Existenzbehauptungen beinhalten. Übung 4.3 Geben Sie logische Formen für die folgenden Aussagen an. (39)
4.5
a.
Es gibt genau zwei Objekte mit der Eigenschaft P .
b.
Es gibt mindestens drei Objekte mit der Eigenschaft P .
c.
Es gibt höchstens drei Objekte mit der Eigenschaft P .
Kennzeichnungen und Abstraktion
Die Sprache L der Prädikatenlogik der ersten Stufe mit Identität enthält als Individuenterme lediglich Variablen und Individuenkonstanten. Die zugelassenen Individuenbezeichnungen sind also allesamt Grundausdrücke ohne innere logische Struktur. Nun möchte man in den verschiedenen Anwendungen der Prädikatenlogik nicht nur die logisch elementaren Formeln in ihre sinnvollen Bestandteile analysieren können, sondern auch Individuenbezeichnungen. In der Arithmetik etwa hat der Ausdruck ‘die Summe von 5 und 4’ eine innere Struktur, wenn auch keine rein logische. Um diese sichtbar und der logischen Behandlung zugänglich zu machen, erweitert man L zu einer Sprache der Arithmetik, die als neuen Typ von deskriptiven Konstanten Funktionszeichen für die arithmetischen Operationen enthält, allen voran ‘+’ und ‘·’. Mit diesen Funktionszeichen können dann komplexe Individuenterme erzeugt werden, z.B. der Term ‘5 + 4’. In der mathematischen Logik ist die Erweiterung der prädikatenlogischen Sprache um Funktionzeichen ein natürlicher Schritt. In sprachlogischen und philosophischen Anwendungen sind dagegen die weiter oben bereits informell diskutierten Kennzeichnungsterme von ebenso großem Interesse. Obwohl Funktionsterme und Kennzeichnungsterme sich inhaltlich bis zu einem gewissen Grad entsprechen, sind letztere in einem nicht auf die Mathematik spezialisierten Rahmen flexibler und begrifflich von größerer Allgemeinheit. Während ein Funktionszeichen z.B. stets eine Stelligkeit hat (die klassischen arithmetischen Operationen sind zweistellig), ist dies bei den Kennzeichnungen nicht der Fall. Auf der anderen Seite wird man bei diesen mit dem Problem der Denotationslücken konfrontiert, während in der Arithmetik etwa die Summe oder das Produkt zweier Zahlenterme stets denotiert.
132
Prädikatenlogik
Will man die diesem Problem zugrundeliegende Logik studieren, so müssen Kennzeichnungsterme in die formale Sprache eingeführt werden. Deutet man z.B. die zweistellige Prädikatkonstante P 2 als die Relation, König von einem Staat zu sein, und nimmt die Konstante a für den Namen Frankreich, so wird die Matrix P 2 xa bezüglich x von allen Objekten erfüllt, die (ein) König von Frankreich sind. Man führt nun in die Sprache einen variablenbindenden Operator ein, der die Rolle des bestimmten Artikels in der natürlichen Sprache übernimmt; es ist dies der Iota-Opertor ‘ι’, der sich syntaktisch wie ein Quantor verhält, indem er eine Individuenvariable x und eine Formel φ zu einem neuen wohlgeformten Ausdruck p (ιxφ) q zusammenfügt, in dem die Variable x gebunden wird. Der Unterschied zu einer Quantifikation der Gestalt p ∀xφ q besteht darin, daß das Ergebnis keine Formel ist, sondern ein komplexer Individuenterm. Dieser kann dann in einer Prädikation dazu verwendet werden, um erneut eine Formel zu bilden, etwa p Q(ιxφ) q. Der zusätzliche Ausdrucksreichtum der Kennzeichnungen erhöht den Grad der Analysetiefe von logischen Formen natürlichsprachlicher Sätze, die zu sprachlogischen oder philosophischen Zwecken in der Prädikatenlogik formalisiert werden. Der bestimmte Artikel trägt in der natürlichen Sprache in definiten Nominalphrasen der Gestalt ‘der F ’ die Präsupposition, d.h. die mit einer erfolgreichen Verwendung des Artikels verbundene notwendige Voraussetzung, daß es genau ein Objekt gibt, welches die Eigenschaft F besitzt. Diese Bedingung läßt sich wie erörtert zerlegen in die Existenzbedingung, daß es mindestens ein F gibt, und . die Eindeutigkeitsbedingung, daß es höchstens ein F gibt (die Matrix φ = φ[x] entspreche dabei der natürlichsprachlichen Eigenschaft F ): (40)
a. b.
∃xφ[x]
∀x∀y (φ[x] ∧ φ[y] → x = y)
(Existenz ) (Eindeutigkeit)
Die Eindeutigkeit macht vom Identitätszeichen Gebrauch; Existenz und Eindeutigkeit charakterisieren also in PL1I die Denotationsbedingungen eines Kennzeichnungsterms. Danach denotiert der Ausdruck ‘der König von Frankreich’, wenn es einen König von Frankreich gibt, und wenn für alle Objekte x und y, die König von Frankreich sind, bereits die Gleichheit gilt; formal mit den obigen Symbolen: (41)
∃xP 2 xa ∧ ∀x∀y (P 2 xa ∧ P 2 ya → x = y)
Wenn diese Konjunktion falsch ist, dann sollte die Kennzeichnung keinen Wert erhalten. Sobald aber derartige Denotationslücken zugelassen sind, stellt sich die Frage, wie dann elementare Prädikationen mit nicht-denotierenden Kennzeichnungen zu interpretieren sind; denn in diesem Fall gibt es ja kein Objekt, welches durch die Matrix des Iota-Terms eindeutig beschrieben wird. Die übliche Semantik der Prädikatenlogik, die wir in Kapitel 6 entwickeln, muß also für eine Kennzeichnungstheorie so modifiziert werden, daß diesem Problem Rechnung getragen wird. Wir werden unten eine formale Lösung des Problems angeben, die elementare (!) Prädikationen mit einer nicht-denotierenden Kennzeichnung stets falsch werden läßt. Da wir ferner an der Zweiwertigkeit der Logik festhalten, sind dann die Negationen solchen Prädikationen notgedrungen wahr. Zum Beispiel ist in der gegenwärtigen Verfassungswirklichkeit Frankreichs, wenn P 2 , a wie oben und Q als weise gedeutet werden, die Formel Q(ιxP 2 xa) falsch und ¬Q(ιxP 2 xa) wird
Kennzeichnungen und Abstraktion
133
wahr. Das zieht jedoch ein weiteres Problem nach sich: sind zum Beispiel in der gedachten Situation zufällig alle Individuen weise, dann gibt es kein Individuum, das nicht weise ist, und der Existenzsatz ∃x¬Qx wird falsch. Damit haben wir es mit einer Situation zu tun, in der das Schema der Existenzabschwächung, φxt → ∃xφ
. . ungültig wird (mit t = (ιxP 2 xa) und φ = ¬Qx). Das bedeutet, daß die Grundprinzipien der Prädikatenlogik in ihrer bisherigen Gestalt nicht einfach auf die Kennzeichnungstheorie übertragen werden können. Dieser Umstand macht Kennzeichnungstheorien für die übliche mathematische Logik unattraktiv. Es wird sich jedoch zeigen, daß eine einfache Modifikation der PL1I-Prinzipien ausreicht, um eine Logik mit Kennzeichnungen zu entwickeln. Wir sagten soeben, daß eine elementare Prädikation mit einer nichtdenotierenden Kennzeichnung stets falsch wird, und ihre Negation dementsprechend wahr. Diese Festlegung widerspricht allerdings einer ziemlich deutlichen semantischen Intuition, nach der solche Negationen auch nicht wahr sein können. Betrachten wir die folgenden Sätze. (42)
a.
Der König von Frankreich ist nicht weise.
b.
Die größte Primzahl ist nicht gerade.
Man kann etwa so argumentieren: in beiden Sätzen soll etwas von einem Objekt prädiziert werden; mißlingt es aber schon wegen des fehlenden Denotats für die Kennzeichnung, überhaupt die Frage zu erörtern, ob die Prädikation zutrifft oder nicht, so kann der Satz jedenfalls nicht wahr sein. Ein möglicher Ausweg wäre es zum Beispiel zu sagen, daß der Satz in diesem Fall gar keinen Wahrheitswert hat.5 Will man jedoch an der Bivalenz festhalten und besteht gleichzeitig auf der genannten Intuition, so kann man den Sätzen nur den Wahrheitswert 0 zuordnen. Dann kann aber ihre logische Form nicht die direkte Negation der logische Form der unnegierten Sätze sein, da sonst die Wahrheitsregel der Negation verletzt wäre. Die Situation erscheint also ziemlich hoffnungslos. Es gibt jedoch einen anderen Ausweg. Anstatt zu sagen, daß eine elementare Prädikation negiert wird, analysieren wir die Sätze als eine Prädikationsbeziehung zwischen dem Kennzeichnungterm und einem negierten Prädikat. Danach sind die Sätze wie folgt zu lesen. (43)
a.
Der König von Frankreich hat die Eigenschaft, nicht weise zu sein.
b.
Die größte Primzahl hat die Eigenschaft, nicht gerade zu sein.
Wegen des fehlenden Denotats mißlingt in beiden Fällen der Versuch, die Frage der Subsumtion unter die jeweilige (jetzt negative) Eigenschaft zu erörtern, und folglich ist der Satz jeweils falsch. Zwar sind die Extensionen der negativen Eigenschaften genau die Komplemente der Extensionen ihrer positiven Gegenstücke; dennoch ist die Falschheit der negierten Sätze im vorliegenden Sinn verträglich mit der Falschheit der unnegierten Sätze, da die Komplementarität der Extensionen und der entsprechenden Prädikationen für existierende Objekte gar nicht tangiert wird. 5 Dies
ist die Antwort, die in der dreiwertigen Logik gegeben wird; siehe etwa [21].
134
Prädikatenlogik
Der geschilderte Ausweg verlangt allerdings die Erweiterung der Ausdruckskraft des Systems im folgenden Sinn. Bisher haben nur diejenigen Teilmengen eines Individuenbereichs einen “Namen” in der Objektsprache, die die Extension eines Grundausdrucks, also einer Prädikatkonstante sind. Um im Rahmen der modelltheoretischen Semantik über negative Eigenschaften sprechen zu können, benötigen wir für sie ebenfalls Namen in der Objektsprache, wobei zugleich sichergestellt sein muß, daß ihre Extensionen genau die Komplemente der positiven Eigenschaften sind. Nun würde es wenig helfen, etwa zu jeder Prädikatkonstante P eine duale Prädikatkonstante P ∗ einzuführen, weil die negativen Prädikate ja nur ein Beispiel für logisch komplexe Prädikate sind; im allgemeinen jedoch kann ein Kontext, in den eine Kennzeichnung eingebettet ist, alle möglichen logischen Verknüpfungen enthalten, und es ist nicht zu erwarten, daß keine ähnlichen Skopuskonflikte auftreten. Wir werden somit dahin geführt, zu jedem in der Logik ausdrückbaren Kontext, also zu jeder Formel φ, die gerade eine freie Variable x enthält, einen wohlgeformten Ausdruck der Form p (λxφ) q zu bilden, der einen Namen für die Eigenschaft eines Individuums, φ zu sein, darstellt. Das Symbol ‘λ’ ist wie ‘ι’ und die Quantoren ein variablenbindener Operator, der mit einer Variablen und einer Formel einen wohlgeformten Ausdruck bildet; während die Quantifikation wieder zu einer Formel führt und ι-Ausdrücke Individuenterme sind, ist p (λxφ) q ein einstelliges Prädikat. Das λ-Symbol wird auch Abstraktionsoperator oder kurz λ-Operator genannt, und ein Term der Gestalt p (λxφ) q heißt λ-Term. Wie schon bei der Quantifikation, so wollen wir auch bei den λ-Termen p (λxφ) q (und übrigens ebenso bei den ι-Ausdrücken p (ιxφ) q) zulassen, daß die Variablenbindung “leer” läuft, wenn die Variable x nicht frei in der Formel φ auftritt, oder auch, daß neben x noch andere Variablen frei in φ sind; in diesem Fall kann man die übrigen freien Variablen als Parameter auffassen und von einem parametrisierten Prädikat oder einem parametrisierten Individuenterm sprechen. Der hauptsächlich intendierte Fall ist jedoch der, in dem x die einzige freie Variable in φ ist. Der Gedanke, daß jede Formel φ mit einer freien Variablen x als Name für eine komplexe Eigenschaft eines Individuums aufgefaßt werden kann, liegt nahe und wurde bereits weiter oben im Zusammenhang mit dem Leibnizschen Substitutionsprinzip verwendet. Die λ-Abstraktion macht diesen Gedanken lediglich “syntaktisch offiziell”, indem ein Ausdruck gebildet wird, der von der Kategorie eines einstelligen Prädikats ist (während eine offene Formel nach wie vor eine Formel ist). Ist der λ-Ausdruck (λxφ) aber ein solches Prädikat, so kann es auf einen Individuenterm t angewendet werden und erzeugt eine Formel der Gestalt (λxφ)t. Dies machen wir uns bei der Analyse der obigen Beispiele zunutze. Bemerkung. Die Einsicht, daß eine offene Formel, in Nennform-Schreibweise: φ[x], als “Kontext” vom Typ einer Aussage ist und daher von einem Namen für eine Eigenschaft unterschieden werden muß, welcher vom Typ eines Prädikats ist und somit in der Fregeschen Ausdrucksweise etwas “Ungesättigtes” darstellt, das erst noch einmal nach einem Argument verlangt, um wieder eine Aussage zu bilden: diese Einsicht stand den Begründern der modernen Logik um die Jahrhundertwende klar vor Augen, während sie sich interessanterweise in der Mathematik erst mit der Bourbakischen Reform in der Mitte des Jahrhunderts durchsetzte. Der Unterschied betrifft den logischen Spezialfall der grundlegenden Unterscheidung zwischen einer Funktion und ihrem Funktionswert. Wenn
135
Die Logik PL1IKA
man etwa in einem Mathematikbuch liest: “Die reelle Funktion f (x) . . .”, so widerspricht nach moderner Auffassung die Notation ‘f (x)’ der Bezeichnung ‘Funktion’; die Notation steht für einen (wenn auch variablen) Funktionswert; will man von der Funktion selbst sprechen, so wird sie heute einfach durch das Symbol ‘f ’ mitgeteilt. Seit Frege ist es üblich, Prädikate als Aussagefunktionen aufzufassen, die im einstelligen Fall einen Individuenterm als Argument nehmen und als Funktionswert eine Aussage liefern. In diesem Sinn sind λ-Ausdrücke Aussagefunktionen. Bei Russell heißen Aussagefunktionen propositional functions, was man wegen der besonderen Bedeutung, die Russell mit ihnen verbindet, am besten mit “propositionale Funktionen” wiedergibt. Er unterscheidet notationell die Funktionen von den Aussagen, indem er die Argument-Variable zwar hinschreibt, aber mit einem Zirkumflex versieht. In unsere Schreibweise übertragen entsteht also aus der (variablen) Aussage φ[x] die propositionale Funktion φ[ˆ x]; dieser Ausdruck entspricht unserem λ-Term. Allerdings muß daraufhingewiesen werden, daß diese Ensprechung eine rein syntaktische ist. Während Russells propositionale Funktionen intensionale Entitäten sind, die von der Form der gegebenen Matrix φ[x] abhängen, werden die λ-Terme hier semantisch als extensionale Prädikate gedeutet, und zwar im folgenden Sinn: Gilt für zwei Matrizen φ[x] und ψ[x] das Bikonditional ∀x ( φ[x] ↔ ψ[x] ) so treffen die λ-Prädikate (λxφ[x]) und (λxψ[x]) auf die gleichen Individuen zu, d.h. sie haben dieselbe Extension. Wir kehren zum obigen Beispiel zurück und notieren unter (44) nunmehr die beiden Lesarten des Satzes (42a), die zu verschiedenen Wahrheitswerten führen; dabei stehe wie oben Q für ‘ist.weise’, P 2 für ‘ist.König.von’ und a für ‘Frankreich’. Unter a) ist noch einmal die nicht negierte Version von b) angegeben, die den Satz ‘der König von Frankreich ist weise’ ausdrückt. Die Semantik wird zeigen, daß in einem Modell M , in dem der ι-Term (ιxP 2 xa) nicht denotiert, die Formel (44b) wahr wird, da sie die Behauptung, der König von Frankreich sei weise, lediglich “dementiert”, im Sinne von: “es ist keineswegs der Fall, daß der König von Frankreich weise ist (es gibt ihn nämlich gar nicht)”. Dagegen prädiziert die Formel (44c) eine gewisse Eigenschaft, nämlich nicht weise zu sein, von einem nicht-denotierenden Term; also kann sie wegen des fehlenden Denotats nicht wahr sein und wird falsch. Genau die gleiche Begründung gilt aber auch für die unnegierte Formel unter a); auch hier fehlt das Denotat, und die Prädikation ist falsch. Man sieht deutlich, daß die Formel unter c) keine direkte Negation von a) ist und somit beide Formeln ohne Widerspruch für falsch erklärt werden können. (44)
a. b. c.
Q(ιxP 2 xa)
=⇒
2
¬Q(ιxP xa)
=⇒ 2
(λx¬Qx)(ιxP xa)
falsch in M wahr in M =⇒
falsch in M
Die Formel (44b) wird häufig die schwache Lesart der Negation genannt, und (44c) ihre starke Lesart.
136
4.6
Prädikatenlogik
Die Logik PL1IKA der Kennzeichnungen und Abstraktion
Wir führen eine prädikatenlogische Sprache L0 ein, die die bisherige Sprache L um die Grundsymbole ‘ι’ (Iota-Operator ) und ‘λ’ (λ-Operator ) erweitert. Mit diesen Operatoren werden ι-Terme und λ-Terme gebildet, die neben den bisherigen Formeln weitere komplexe wohlgeformte Ausdrücke bilden, welche jedoch anderen syntaktischen Kategorien angehören: ι-Terme sind komplexe Individuenterme, und λ-Terme sind komplexe einstellige Prädikate. Dabei erfolgt der rekursive Aufbau der wohlgeformten Ausdrücke durch ein “Hin- und Herspringen” zwischen diesen drei Kategorien. Die folgende Tabelle soll diesen Prozeß verdeutlichen. Individuenterm
1.
x, y, z PP P
Formel
PP
(((( 3 Q xyz
PP
2.
a , (ιz∀yQ3 xyz) PP PP PP
(( ((( P P 2 a(ιz∀yQ3 xyz) PPP PP P
5.
6.
7.
((((
(
Pn n>1
(( (((
Q3
( ((((
P2
∀yQ3 xyz
3.
4.
1stell. Prädikat
b
PPP
PP
PP
((((
P (λxP 2 a(ιz∀yQ3 xyz))
(λxP 2 a(ιz∀yQ3 xyz))b
Es leuchtet ein, daß wir die wohlgeformten Ausdrücke der drei komplexen Kategorien nicht getrennt voneinander rekursiv definieren können, da selbst elementare Prädikationen Individuenterme enthalten können, die als ι-Terme bereits hochkomplex sind und schon komplexe Formeln als Teilausdrücke enthalten können (siehe Zeile 5 der Tabelle); ebenso können Prädikate, wenn sie einstellig sind, komplex sein und zu einer elementaren Prädikation herangezogen werden (Zeile 7). Das heißt, daß elementare Prädikationen nicht mehr notwendig atomar in dem Sinne sind, daß sie keine logischen Zeichen enthalten. Trotz dieser Komplikation ist das Verfahren zum Aufbau komplexer wohlgeformter Ausdrücke
Die Logik PL1IKA
137
von L0 fundiert, d.h. man gelangt von beliebigen komplexen Ausdrücken, welche nach diesem Schema gebildet wurden, nach endlich vielen Schritten zu den beteiligten Grundausdrücken, die zwar verschiedenen Kategorien angehören, aber selbst einfach und nicht mehr zusammengesetzt sind. Greift der Aufbau verschiedener syntaktischer Kategorien derart ineinander, spricht man bei ihrer Definition von einer simultanen induktiven Definition der wohlgeformten Ausdrücke der beteiligten Kategorien. Definition 4.12 Simultane induktive Definition von wohlgeformter Ausdruck der Kategorien Individuenterm, Formel und einstelliges Prädikat in L 0 : 1. Variablen und Konstanten sind Individuenterme; einstellige Prädikatkonstanten sind einstellige Prädikate; 2. ist P n eine n-stellige Prädikatkonstante und sind t0 , . . . , tn−1 Individuenterme, so ist pP n t0 . . . tn−1 q eine Formel; ist π ein einstelliges Prädikat und ist t ein Individuenterm, so ist pπtq eine Formel; 3. sind s und t Individuenterme, so ist p(s = t)q eine Formel; 4. ist φ eine Formel, so auch p¬φq; sind φ und ψ Formeln, so ist auch pφJψq eine Formel für alle zweistelligen Junktoren J in L0 ; 5. ist x eine Variable und φ eine Formel, so sind auch ∀xφ und ∃xφ Formeln; 6. ist x eine Variable und φ eine Formel, so ist (ιxφ) ein Individuenterm; 7. ist x eine Variable und φ eine Formel, so ist (λxφ) ein einstelliges Prädikat. Mitteilungszeichen für Terme und Formeln sind dieselben wie in L; Mitteilungszeichen für einstellige Prädikate ist ‘π’ (StI); Mitteilungszeichen für wohlgeformte Ausdrücke beliebiger Kategorie sind ζ, η, θ (StI). Die üblichen syntaktischen Begriffe wie freie und gebundene Variable, offene und geschlossene Formel etc. sowie einfache und eigentliche Substitution lassen sich sinngemäß von PL1I auf PL1IKA übertragen. Dabei sind jetzt gebundene Vorkommen von Variablen nicht nur solche, die im Bereich eines gleichnamigen Quantors stehen, sondern allgemeiner solche, die im Bereich eines der vier varablenbindenden Operatoren ∀, ∃, ι und λ stehen. Ferner ist der Begriff der Geschlossenheit auf die wohlgeformten Ausdrücke aller drei komplexen Kategorien in L0 zu erweitern. Bei der Substitution ζ(t/x) eines Terms t für die Variable x im wohlgeformten Ausdruck ζ ist zu beachten, daß es zu einer Variablenkollision kommen kann, auch wenn t selbst keine Variable ist, die in ζ an einer x-Stelle gebunden würde: t kann jedoch ein offener Kennzeichnungsterm sein, der eine solche Variable frei enthält. Diesem Umstand trug jedoch unsere Definition 4.7 bereits Rechnung: t darf an freien x-Stellen in ζ nicht gefesselt werden. Die eigentliche Substitution ζtx beseitigt dieses Problem durch automatische gebundene Umbenennung. Übung 4.4 Geben Sie für die PL1IKA-Sprache L0 Definitionen der genannten Begriffe, die den Definitionen in Abschnitt 4.2.1 entsprechen. Übung 4.5 Bestimmen Sie die (eigentlichen) Substitutionen (i) ζ(t/z) und ζtz sowie (ii) φ(t/z) und φzt mit
138 (45)
Prädikatenlogik (i) (ii)
. . ζ = (λx∃yQ3 x(ιwP 2 zw)y); t = (ιzQ2 zy) . . φ = ∀x (∃yP 3 xyz → (λz¬Qz)z); t = (ιxR2 yx)
Die PL1IKA-Sprache L0 gestattet, wie wir gesehen haben, eine größere Flexibilität und Analysetiefe für die Formalisierung natürlichsprachlicher Aussagen. Insbesondere kann die λ-Abstraktion nicht nur dazu benützt werden, negierte Prädikate zu bilden, sondern ganz allgemein auch dazu, junktorenlogische Verknüpfungen von Satzkonstituenten unterhalb der Aussage-Ebene einzuführen. Beispiele dafür sind: (46)
(47)
(48)
a.
Max ist Bayer oder Österreicher.
b.
(λx(P x ∨ Qx))a
c.
P a ∨ Qa
a.
Agamemnon ist König einer griechischen Stadt und Anführer eines Heeres.
b.
(λx (∃y(Qy ∧ Q2 xy) ∧ ∃z(P z ∧ P 2 xz)))b
c.
∃y(Qy ∧ Q2 by) ∧ ∃z(P z ∧ P 2 bz)
a.
Hans hat die Eigenschaft laut zu werden, wenn er provoziert wird.
b.
(λx (∃yP 2 yx → Rx))c
c.
∃yP 2 yc → Rc
In den Beispielen sind unter c) jeweils zu b) äquivalente Formeln angegeben, die sich aus dem Prinzip der λ-Konversion ergeben, das unten vorgestellt wird. Diese Äquivalenz ist jedoch nur gültig, wenn die Individuenterme in Subjektposition ein Denotat im Individuenbereich besitzen. Übung 4.6 Formalisieren Sie im folgenden Beispiel den Satz unter a) mit einem λ-Term und vergleichen Sie das Ergebnis mit der logischen Form des Satzes in b). (49)
4.7
a.
Alle natürlichen Zahlen sind gerade oder ungerade.
b.
Alle natürlichen Zahlen sind gerade, oder alle natürlichen Zahlen sind ungerade.
Prinzipien der Logik PL1IKA
Erweitert man eine Sprache durch neue Ausdrucksmittel, so gilt es zu untersuchen, ob die bisherigen logischen Prinzipien in der nun größeren Allgemeinheit Bestand haben, und welche Gesetze die Logik der neuen Symbole bestimmen. Ignorieren wir für einen Moment die Kennzeichnungen und betrachten nur die Prädikatenlogik mit Identität und λ-Abstraktion, PL1IA. Interpretieren wir in naheliegender Weise einen λ-Ausdruck (λxφ) im semantischen Modell als die Menge derjenigen Individuen, die die Formel φ bezüglich x erfüllen, so bleiben alle prädikatenlogischen Prinzipien aus Abschnitt 4.3 in der dementsprechend
139
Prinzipien der Logik PL1IKA
erweiterten Semantik gültig. Die Logik PL1IA stellt damit eine Erweiterung der Logik PL1I dar. Für die Verwendung des λ-Operators selbst gilt ferner das Prinzip der λ-Konversion, in der Version mit einfacher und eigentlicher Substitution: (50)
a. b.
(λxφ)t ↔ φ(t/x) (λxφ)t ↔
für
φxt
Fr (t, x; φ)
(λ-Konversion) (λ-Konversion)
. Ein λ-Ausdruck ζ = (λxφ), der auf einen Individuenterm t angewendet wird, ist also äquivalent mit der ζ definierenden Formel φ, in der x durch t substituiert wird. Dies gilt, da wir Kennzeichnungsterme erst einmal außer Acht gelassen haben, für Variablen und Individuenkonstanten als Substitutionsterme. Beispiel 4.8 Nehmen wir an, Maria sei jemand, der alle Romane von Thomas Mann gelesen hat. Dann hat Maria die (logisch komplexe) Eigenschaft, alle Romane von Thomas Mann gelesen zu haben; diese Aussage ist symbolisch in (51a) wiedergeben, mit den Individuenkonstanten a für Thomas Mann und b für Maria sowie den Prädikatsymbolen P 2 für hat.gelesen und R2 für ist.ein.Roman.von. Nach dem λ-Prinzip ist diese Formel äquivalent zu der Formel (51b), welche besagt, daß für alle Romane x von Thomas Mann gilt, daß Maria x gelesen hat. Was in unserem Beispiel intuitiv offensichtlich ist, gilt also auch formal. (51)
a. b.
(λy∀x (R2 xa → P 2 yx))b ∀x (R2 xa → P 2 bx)
Anders sieht die Situation aus, wenn Kennzeichnungen hinzugenommen werden. In der Semantik, die unten angegeben wird, verlieren wichtige prädikatenlogische Prinzipien ihre Gültigkeit, wenn in ihnen auftretende Mitteilungszeichen für Individuenterme auf den Bereich der Kennzeichnungen ausgedehnt werden. Dabei ist der Problemfall, wie zu erwarten, der der Denotationslücken. Das gilt speziell auch für das Prinzip der λ-Konversion. In der Tat muß diese für nicht-denotierende Terme t ungültig werden, da sonst die oben skizzierte Skopus-Lösung für negierte Kontexte mit der nicht-denotierenden Kennzeichnung ‘der König von Frankreich’ zusammenbricht. Wir hatten dort erklärt, daß die linke Seite des Bikonditionals der λ-Konversion falsch, die rechte Seite aber wahr werden kann; siehe Beispiel (44c,b). Wir werden folglich das Prinzip auf denotierende Terme einschränken. Die gleiche Spezifizierung muß für das Spezialisierungsprinzip und das Prinzip der Existenzabschwächung vorgenommen werden. In einer Situation, in der alle Individuen weise sind, ist der Allsatz im Antecedens des Spezialisierungsprinzips wahr, während die Instanz mit dem Term ‘der König von Frankreich’ falsch ist: wenn der Term nicht denotiert, kommt sein Denotat auch nicht im Individuenbereich vor, über den der Quantor läuft. Um die PL1I-Prinzipien geeignet einzuschränken, benötigen wir eine objektsprachliche Bedingung für die Existenz eines Denotats. Dazu führen wir ein einstelliges Prädikatsymbol ‘E!’ als Existenzprädikat ein; die Aussage E!t (“t existiert”) wird in einem Modell M für wahr erklärt, wenn t in M denotiert, d.h. einen Wert im Individuenbereich hat.
140
Prädikatenlogik
Es zeigt sich, daß das Existenzprädikat in Anwendung auf Kennzeichnungsterme gerade durch die Existenz- und Eindeutigkeitsbedingung definiert werden kann. Das folgende Bikonditional wird in der Semantik für PL1IKA gültig: (52)
E!(ιxφ[x]) ↔ ∃xφ[x] ∧ ∀x∀y(φ[x] ∧ φ[y] → x = y) mit Fr (x, y; φ[∗])
Aber auch wenn t kein Kennzeichnungsterm ist, läßt sich die Existenz von t objektsprachlich ausdrücken; für beliebiges t gilt: (53)
E!t ↔ ∃x (x = t)
(mit x nicht frei in t)
Mit diesen Vorbereitungen lauten jetzt die modifizierten logischen Prinzipien für PL1IKA: (54)
a. b. c.
E!t → (∀xφ → φxt ) E!t →
(φxt
→ ∃xφ)
E!t → ( (λxφ)t ↔
φxt
(Spezialisierungsprinzip für PL1IKA) (Existenzabschwächung für PL1IKA) )
(λ-Konversion für PL1IKA)
Muß das Substitutionsprinzip (32) ebenfalls verändert werden? Wir werden die Wahrheitsbedingung für die Identität so modifizieren, daß dies nicht der Fall ist; wir erklären nämlich alle Gleichheiten der Form s = t für falsch, wenn einer der beiden Terme s, t nicht denotiert. Damit wird das Substitutionsprinzip im Fall von Denotationslücken wegen des dann falschen Antecedens trivialerweise wahr. Denotieren aber beide Terme, dann haben wir es mit der alten Situation von PL1I zu tun, und das Prinzip bleibt gültig. Es gilt folglich auch in L0 : (55)
s = t → ( φ[s] → φ[t] )
mit Fr (s, t; φ[∗]) (Substitutionsprinzip für PL1IKA)
Die λ-Konversion für die Logik PL1IA ohne Kennzeichnungen ist ein Bikonditional, mit dessen Hilfe auftretende λ-Terme stets eliminiert werden können, da die einzigen deskriptiven Individuenterme Konstanten sind, die wie in der Prädikatenlogik mit Identität immer denotieren. In der Logik PL1IKA mit Kennzeichnungen ist die λ-Konversion dagegen nur eine bedingte Aussage, und die Elimination von λ-Ausdrücken gelingt nur, wenn sie auf denotierende Terme angewendet werden. Nun gibt es ein Eliminationsprinzip für Kennzeichnungen, das unabhängig von der Frage der Denotation funktioniert. Dieses Prinzip, das wir sogleich angeben werden, war für Russell das philosophische Instrument, das Denotationsproblem bei fragwürdigen Kennzeichnungen wie dem ‘König von Frankreich’ oder gar Meinongs ‘rundem Quadrat’ zu lösen. Diese Terme erscheinen danach nur auf der Oberfäche; Fragen der Existenz können erst erörtert werden, wenn die für Russell korrekte logische Form hergestellt ist, in der die Kennzeichnungsterme nicht mehr auftreten. Im Fall des runden Quadrats ergibt sich etwa die folgende Paraphrase. (56)
a.
Das runde Quadrat ist rund.
b.
Es gibt genau ein Objekt x so daß x rund ist und x ein Quadrat ist, und dieses x ist rund.
Prinzipien der Logik PL1IKA
141
Da ‘rund ’ und ‘quadratisch’ sich ausschließen, ist der Relativsatz in (56b) stets falsch, und der gesamte Satz ist falsch. Da aber (56b) die logische Form von (56a) wiedergibt, ist auch (56a) stets falsch.6 Wenn also Kennzeichnungen die einzige Quelle für Denotationslücken sind, und wenn alle Kennzeichnungen unabhängig von der Frage ihrer Denotation eliminiert werden können, so ergibt sich in PL1IKA doch noch eine Möglichkeit der Elimination auch der λ-Ausdrücke: man eliminiert zuerst alle Kennzeichnungen sowie alle λ-Ausdrücke, die auf denotierende Kennzeichnungen angewendet werden, und dann in einem zweiten Schritt die verbleibenden λ-Terme. Dieser Weg ist allerdings nicht gangbar, wenn auch Individuenkonstanten Denotationslücken aufweisen; Beispiele sind etwa ‘Pegasus’, ‘Sherlock Holmes’ oder ‘der Weihnachtsmann’. Dann nämlich kann es vorkommen, daß ein λAusdruck auf einen solchen Term angewendet wird und die λ-Konversion blockiert ist. Ein an dieser Stelle radikaler Ausweg in der philosophischen Behandlung von Eigennamen, die ja üblicherweise den Individuenkonstanten entsprechen, wurde von Russell und nach ihm von Quine eingeschlagen: es werden grundsätzlich alle Eigennamen als implizite Kennzeichnungen analysiert und können damit ebenfalls eliminiert werden. Damit wird auch die vollständige Elimination der λ-Terme möglich. Der Eigenname ‘Pegasus’ etwa wird zu einer Kennzeichnung mit einem künstlichen Prädikat ‘pegasiert’ umgeformt, die dann lautet: ‘dasjenige x so daß x pegasiert’. Dann ist z.B. der Satz (57a) falsch, da seine logische Form, der Existenzsatz (57b), wegen der Nichtexistenz eines pegasierenden Objekts falsch wird. (57)
a.
Sokrates hat Pegasus gesehen.
b.
Es gibt genau ein Objekt x welches pegasiert und von Sokrates gesehen wurde.
Um die Eliminierbarkeit der ι- und λ-Terme zu erhalten, werden wir in der Modelldefinition für PL1IKA an der Denotation der Individuenkonstanten festhalten. Wie lautet nun das Eliminationsprinzip für Kennzeichnungen? Es besagt, daß eine einfache Prädikation der Form π(ιxφ) ersetzt werden kann durch eine Formel des Inhalts, daß es genau ein x mit der Eigenschaft φ gibt, für das zusätzlich πx gilt. Um die Existenz- und Eindeutigkeitsbedingung kompakter zu formulieren, bemerken wir, daß in PL1I das folgende Bikonditional gültig ist, mit der üblichen Bedingung Fr(s, t; φ[∗]); den Beweis dazu werden wir im KM-Kalkül erbringen. (58)
∃xφ[x] ∧ ∀x∀y(φ[x] ∧ φ[y] → x = y) ↔ ∃x∀y (φ[y] ↔ y = x)
Informell läßt sich dieses Bikonditional so einsehen. Für die Richtung von links nach rechts nehmen wir die Existenz eines x mit der Eigenschaft φ[x] an. Wenn nun zunächst für irgendein y die Identität y = x gilt, so folgt mit dem Substitutionsprinzip auch φ[y]; dann gilt für x das Konditional y = x → φ[y]. Nun nutzen wir die Eindeutigkeitsvoraussetzung aus und nehmen außer für x auch für ein y an, daß φ gilt; dann folgt x = y, und damit das Konditional φ[y] → y = x. Zusammengenommen ergibt sich das Bikonditional φ[y] ↔ y = x für x und 6 Man beachte, daß dagegen der bedingte Allsatz ‘alle runden Quadrate sind rund ’ trivialerweise wahr wird, da sein Antecedens stets falsch ist.
142
Prädikatenlogik
damit die Existenz eines solchen x; das ist die rechte Seite der Behauptung. Der Schluß von rechts nach links läßt sich ähnlich durchführen. Die rechte Seite, die Existenz und Eindeutigkeit in einer Formel zusammenfaßt, wird auch die Einzigkeitsbedingung genannt. Mit dem Einzigkeitskriterium läßt sich das Eliminationsprinzip jetzt folgendermaßen ausdrücken (dabei stehe π für einen beliebigen einstelligen Prädikatausdruck, d.h. eine Prädikatkonstante P oder einen λ-Ausdruck (ιxφ)): (59)
π(ιxφ[x]) ↔ ∃x ( ∀y(φ[y] ↔ y = x) ∧ πx ) mit Fr (s, t; φ[∗]) (Eliminationsprinzip für Kennzeichnungen)
In Worten: Hat der φ die Eigenschaft π, so gibt es ein eindeutiges x mit der Eigenschaft φ, so daß x auch die Eigenschaft π hat. Enthält also eine Prädikation einen ι-Term, so kann er mit Hilfe dieses Bikonditionals eliminiert werden: auf der rechten Seite tritt er nicht mehr auf. Das Prädikat π kann dabei “intern” durchaus komplex, d.h. ein λ-Ausdruck sein. Für eine beliebige n-stellige Prädikation gilt ein analoges Prinzip. Es seien P n eine n-stellige Prädikatkonstante und t0 , . . . , tn−1 Individuenterme. Für ein . i mit i < n sei ti = (ιxφ[x]); x und y seien frei für die Nennstelle in φ[∗]. Dann gilt das Eliminationsprinzip: (60)
P n t0 . . . tn−1 ↔ ∃x ( ∀y(φ[y] ↔ y = x) ∧ P n t0 . . . ti−1 xti+1 . . . tn−1 )
Dabei sei die Folge der Terme links von x leer für i = 0 und die rechts von x für i = n − 1. In Worten: Steht der φ mit anderen Objekten in der n-stelligen Relation P n , dann gibt es ein eindeutiges x mit der Eigenschaft φ, so daß x mit jenen Objekten in der Relation P n steht. Sowohl hier als auch beim vorigen Eliminationsprinzip ist wichtig, daß die Elimination stets nur für die kürzeste Formel gilt, die die Kennzeichnung enthält, und nicht über logische Verknüpfungen hinweg vorgenommen werden kann (daß das beteiligte Prädikat selbst für sich genommen logisch komplex sein kann, spielt dabei keine Rolle). Der dritte logisch einfache Formeltyp ist die Identität der Gestalt s = t. Auch für sie können wir ein Eliminationsprinzip formulieren, und zwar gleich in doppelter Form für die linke und die rechte Seite. Die Variablenbedingungen für x und y gelten weiter, und x sei nicht frei in t. (61)
(ιxφ) = t ↔ ∃x ( ∀y(φ[y] ↔ y = x) ∧ x = t )
(62)
t = (ιxφ) ↔ ∃x ( ∀y(φ[y] ↔ y = x) ∧ t = x )
Treten in einer Identität bzw. in einer höherstelligen Prädikation zwei oder mehrere Kennzeichnungsterme auf, so können sie nacheinander eliminiert werden; die Reihenfolge spielt dabei keine Rolle. Als eine spezielle Anwendung dieses Verfahrens kann man zeigen, daß die Selbstidentität t = t keine gültige Formel mehr ist, da sie für einen Kennzeichnungterm t äquivalent mit der Existenzbehauptung für t wird; diese Äquivalenz steht im Einklang mit der unten definierten Semantik für PL1IKA. (63)
E!(ιxφ) ↔ (ιxφ) = (ιxφ)
Prinzipien der Logik PL1IKA
143
Werfen wir noch kurz einen Blick zurück und verifizieren mit Hilfe der Eliminationsprinzipien unsere oben gemachten Behauptungen bezüglich der starken und schwachen Lesart der Negation. In der Formel (44b): ¬Q(ιxP 2 xa) kann die Kennzeichnung unter dem Negationszeichen eliminiert werden, und es ergibt sich ein negierter Existenzsatz. Das bedeutet mit den obigen Festlegungen inhaltlich, daß es nicht der Fall ist, daß es genau einen König von Frankreich gibt mit der zusätzlichen Eigenschaft, weise zu sein. Dieser Satz wird wahr, da die Kennzeichnung nicht denotiert und der Existenzsatz unter der Negation falsch wird. Bei der Formel (44c): (λx¬Qx)(ιxP 2 xa) wird über den komplexen λ-Term (λx¬Qx) hinweg eliminiert, was nach dem Prinzip (59) erlaubt ist, da die logische Komplexität sich ganz im Prädikat “versteckt”; der λ-Ausdruck ist vom Typ eines einstelligen Prädikats π, wie es im Eliminationsprinzip auftritt. Das Ergebnis ist eine Formel, die die Existenz des König von Frankreich behauptet und lediglich seine Weisheit bestreitet. Also ist der Ausgangssatz ‘der König von Frankreich ist nicht weise’ in dieser starken Lesart falsch. Damit ergeben sich folgende Äquivalenzen für die Formeln in (44):7 (64)
a. b. c.
Q(ιxP 2 xa) ↔ ∃x[∀y(P 2 ya ↔ y = x) ∧ Qx]
¬Q(ιxP 2 xa) ↔ ¬∃x[∀y(P 2 ya ↔ y = x) ∧ Qx]
(λx¬Qx)(ιxP 2 xa) ↔ ∃z[∀y(P 2 ya ↔ y = z) ∧ (λx¬Qx)z] ↔ ∃z[∀y(P 2 ya ↔ y = z) ∧ ¬Qz]
Übung 4.7 Ordnen Sie dem folgenden Satz vier verschiedene logische Formen in L0 zu und beschreiben Sie die Unterschiede in ihren Wahrheitsbedingungen. (65)
Der König von Buganda hat den Präsidenten von Rubundi nicht getroffen.
Übung 4.8 Eliminieren Sie in der Selbstidentität (ιxP x) = (ιxP x) die Kennzeichnungen. Übung 4.9 Eliminieren Sie in den logischen Formen des Beispiels (65) die Kennzeichnungen.
7 Für Variablen gilt das ursprüngliche Prinzip (50) der λ-Konversion weiterhin; daher kann unter c) der Ausdruck (λx¬Qx)z durch ¬Qz ersetzt werden.
144
Logische Form und Argument
Kapitel 5
Logische Form und Argument 5.1
Ein Übersetzungsmanual
Bei der Formalisierung natürlichsprachlicher Sätze zeigt sich, daß der unbestimmte Artikel ‘ein’ im wesentlichen existenzquantifizierende Kraft hat. Das ist jedoch keinesfalls immer der Fall; vielmehr gibt es typische Kontexte, in denen indefinite Nominalphrasen systematisch allquantifizierende Kraft erlangen, und zwar dann, wenn sie im Antecedens von Bedingungssätzen oder bedingten Allsätzen stehen. In der linguistischen Semantik und der Entwicklung von Sprachverstehenssystemen haben solche Konstruktionen, die häufig Eselsätze genannt werden,1 eine große Bedeutung erlangt, da sie den Kernbereich der Daten für die sog. Anaphern-Resolution bilden, welche die korrekte Referenzzuweisung von Pronomina steuert und daher eine wesentliche Rolle bei der semantischen Interpretation von ganzen natürlichsprachlichen Texten spielt.2 Der Wechsel von existenz- zu allquantifizierender Kraft bei indefiniten Nominalphrasen stellt für den Ungeübten ein notorisches Hindernis für die korrekte Formalisierung natürlichsprachlicher Sätze dar. Ein zweites Problem ergibt sich bei der Wiedergabe der richtigen Skopus-Beziehungen zwischen den verschiedenen skopustragenden Elementen in einem Satz. Aus diesem Grund wird im folgendem das intuitive Übersetzungsverfahren von natürlichsprachlichen Sätzen in die Prädikatenlogik bis zu einem gewissen Grade standardisiert und mit einem allerdings ziemlich groben Regelkanon beschrieben, welcher nur die aus logischer Sicht wichtigsten Aspekte dieses Prozesses berührt.
5.1.1
Regeln zur Herstellung der Explizitfassung
Eingaben sind natürlichsprachliche (Aussage-)Sätze S. Die Umwandlung geschieht schrittweise von links nach rechts und bei Hypotaxen von oben nach unten entlang der Einbettungstiefe. Teilsätze werden nach dem gleichen Verfahren behandelt, aber erst, wenn der übergeordnete Satz (“Hauptsatz von S”) vollständig expandiert wurde. Jeder Satz S gliedert sich grammatisch in die Hauptkonstituenten Nominal. phrase (NP) und Verbalphrase (VP); also gilt S = p NP + VPq. Nominalphrasen 1 Der
paradigmatische Beispielsatz lautet: ‘Wenn Pedro einen Esel hat, schlägt er ihn’. das umfassende Lehrbuch [133] zur Diskursrepräsentationstheorie, DRT.
2 Siehe
145
146
Logische Form und Argument
sind Ausdrücke wie ‘Sokrates’, ‘jeder Mensch’ und ‘ein weiser Mann, der philosophiert’; Verbalphrasen sind Ausdrücke wie ‘lacht’, ‘ist ein Mensch’, ‘spricht zu einem Mann, der arbeitet’. Das Hauptverb der VP heißt das Hauptprädikat von S. Ausdrücke wie ‘jeder ’ und Artikel wie ‘ein’, ‘der ’ heißen Determinatoren. Nominalphrasen, die mit einem Determinator beginnen, heißen quantifizierend . In einer NP der Form p D + ζq mit dem Determinator D und der Nomen-Phrase ζ (die komplex sein kann, etwa wie ‘weiser Mann, der philosophiert’) heißen das erste Nomen in ζ das Hauptnomen, der Ausdruck ζ das Hauptprädikat von D, und die Gesamt-NP die NP von D. Ist der Determinator D in einer quantifizierenden NP ein bestimmter Artikel, so heißt die NP definit, und indefinit, wenn D ein (nicht negierter) unbestimmter Artikel ist. Definite NP heißen auch Kennzeichnungen (z.B. ‘der König von Frankreich’). Jedes Vorkommen σ eines logischen Strukturausdrucks besitzt einen oder mehrere Hauptteile, d.h. einen oder mehrere Teilsätze, die unmittelbar mit σ verknüpft sind. Im folgenden stehe ‘OP ’ für ‘(allquantifizierender) Operator ’, ‘R’ für ‘Restriktor ’, ‘K ’ für ‘Kern’, ‘E ’ für ‘Existenzquantor ’ und ‘M ’ für ‘Matrix ’. Behandlung deskriptiver Ausdrücke. Nomina, Adjektive und Verben werden gleichermaßen als Prädikate aufgefaßt, deren Stelligkeit der Anzahl der zugehörigen Valenzen entspricht. Bei der Expansion werden die Argumente in Klammern an die deskriptiven Ausdrücke angehängt. 1. und- und oder-Verknüpfungen unterhalb der Satzebene werden in entsprechende Satzverknüpfungen umgewandelt. Kollektive Aussagen werden nicht analysiert. 2. Hat S die Gestalt p S1 und S2 q (bzw. p S1 oder S2 q ) mit den Hauptteilen S1 und S2 , so wird S expandiert zu p S1 und S2 q (bzw. zu p S1 oder S2 q ). 3. Ist S ein negierter Satz , so wird sein Hauptteil S 0 in die Wendung ‘es ist nicht der Fall daß ’ eingebettet; kurz: p non S 0 q. Der Ausdruck kein ist in nicht ein aufzulösen. 4. S sei ein wenn-dann-Satz (bzw. ein nur.wenn-dann-Satz ), mit den Hauptteilen S1 ((nur.)wenn-Satz) und S2 (dann-Satz). (a) Ist S singulär , d.h. drückt S keine Regularität aus,3 dann wird S expandiert zu p S1 kond S2 q (bzw. zu p S2 kond S1 q ). (b) Ist S generell , dann erfolgt eine Operator-Expansion p OP + (R + kond + K)q; der OP-Knoten wird mit ∅ gefüllt (“OP ist leer”), der R-Knoten mit S1 und der K-Knoten mit S2 . 5. Hat S die Gestalt p S1 genau dann wenn S2 q, dann wird S expandiert zu p wenn S1 dann S2 und nur wenn S1 dann S2 q. 6. Der am weitesten links stehende logische Strukturausdruck im Hauptsatz von S sei ein allquantifizierender Ausdruck γ (“ALL-Ausdruck ”). Dann erfolgt eine Operator-Expansion p OP + (R + kond + K)q, wobei der OP-Knoten mit γ gefüllt wird; γ heißt Auslöser der Expansion. 3 Das ist offensichtlich eine Frage der Interpretation. Dies ist eine der Stellen, an denen das Verfahren notwendig unpräzise und auf eine inhaltliche Entscheidung angewiesen ist.
Ein Übersetzungsmanual
147
7. S stehe nicht in einem Restriktor, und der am weitesten links stehende logische Strukturausdruck im Hauptsatz von S ist ein existenzquantifizierender Ausdruck δ (“EX-Ausdruck ”). Dann erfolgt eine Kern-Expansion p E + M q. δ heißt Auslöser der Expansion. 8. Operator-Expansion: Sei S zu p OP + (R + kond + K)q expandiert; der Auslöser sei γ. (a) Ist OP nicht leer, so expandiert OP zu p all xq mit einer im Gesamtsatz neuen Variablen x; R expandiert zu dem Hauptprädikat von γ, angewandt auf x; K expandiert zu dem Ausdruck S 0 , der aus S durch Ersetzung der NP von γ durch x entsteht. (b) Steht eine indefinite NP der Form δ = p ein αq im Hauptsatz des Restriktors R, so wird an den vorhandenen OP-Knoten der AllAusdruck p all yq mit einem neuen y angehängt sowie in der RExpansion statt δ der Ausdruck p α(y)q konjunktiv hinzugefügt. (c) Ist nach vollständiger Expansion des Hauptsatzes von S der OPKnoten noch immer leer, so wird der Satz durch eine Allquantifikation über eine Situationsvariable s ergänzt, d.h. OP wird mit p all sq gefüllt sowie die Stelligkeit der Hauptprädikate von R und K durch das Argument s erweitert. In der Legende der Übersetzung wird das Universum ergänzt durch: “Situationen s”. Ist der R-Knoten leer, so wird auch das nachfolgende ‘kond’ mit ∅ gefüllt.
9. Kern-Expansion: S wird in die Konstituenten E und M zerlegt; der Auslöser sei δ. Dann expandiert E zu p ex xq mit einer neuen Variablen x ; M expandiert zu dem Ausdruck S 0 , der aus S entsteht, indem in S die NP von δ durch x ersetzt und das Hauptprädikat von δ, angewandt auf x, konjunktiv hinzugefügt wird. 10. Expansion von komplexen Nomina: Sei η das Hauptnomen einer komplexen NP. (a) Wird η durch ein Adjektiv A modifiziert, so wird das A entsprechende Prädikat bei der Verarbeitung der NP konjunktiv zu η hinzugefügt und seine Argumentstelle mit derselben Variablen wie η versehen. (b) Ist η der Kopf eines (restriktiven) Relativsatzes S0 , so wird S 0 konjunktiv zu η hinzugefügt, wobei das Relativpronomen in S 0 durch dieselbe Variable wie bei η ersetzt wird. 11. Pronomina: Es gibt referentielle und anaphorische Pronomina. (a) Referentielle Pronomina werden durch neue Variablen ersetzt. (b) Sei π ein anaphorisches Pronomen, das sich auf einen Namen oder eine Kennzeichnung (sein “Antecedens”) bezieht; dann wird π durch sein Antecedens ersetzt. (c) Sei π ein Pronomen mit einem quantifizierenden Antecedens; dann wird π durch diejenige Variable ersetzt, die bei der Auflösung seines Antecedens eingeführt wird. (d) Mehrfache Vorkommen eines Pronomens werden durch dieselbe Variable ersetzt, falls keine kontextuelle Information die Identifikation ausschließt.
148
Logische Form und Argument
5.1.2
Übersetzung der Explizitfassung in die logische Form
1. Konstituenten werden mit Klammern versehen; die Klammerkonventionen werden beachtet. 2. Die logischen Strukturausdrücke werden durch die entsprechenden logischen Konstanten von PL1I ersetzt. 3. Die deskriptiven Ausdrücke in EF werden durch typgerechte und gleichstellige nicht-logische Konstanten von PL1I ersetzt. (a) Eigennamen und Kennzeichnungen werden durch Individuenkonstanten ersetzt. (b) n-stellige Nomina und Adjektive werden durch n-stellige Prädikatkonstanten ersetzt (für n ≥ 1). (c) n-stellige Verben werden durch n-stellige Prädikatkonstanten ersetzt (für n ≥ 0; 0-stellige Verben sind Sätze wie ‘es schneit’).
Dieser Schritt wird in der Legende festgehalten. 4. Durch Angabe eines Universums wird der intendierte Individuenbereich der Quantoren angegeben. Bemerkung. Kennzeichnungen werden demnach in PL1I unanalysiert gelassen. Die logische Analyse dieser Ausdrücke geschieht im Rahmen einer Kennzeichnungstheorie. Die Anwendung der obigen Übersetzungsregeln kann in einer Baumstruktur dargestellt werden. Dafür werden jetzt einige charakteristische Beispiele angegeben.
149
Ein Übersetzungsmanual
Beispiel 5.1 Jeder Schüler löst eine Aufgabe. Jeder Schüler löst eine Aufgabe OP
(R
K)
kd
x löst eine Aufgabe) E
(M))
All x
(Schüler(x)
kd
Ex y
(Aufg.(y)
und
x löst y))
∀x
(P x
→
∃y
(Qy
∧
P 2 xy))
S:
Jeder Schüler löst eine Aufgabe
EF :
all x (Schüler(x)
LF :
∀x ( P x → ∃y(Qy ∧ P 2 xy) )
Legende:
ex y (Aufgabe(y) und x löst y ) )
P x:
x ist ein Schüler
Qx:
x ist eine Aufgabe
2
P xy: Universum:
kd
x löst y umfaßt Personen und Sachen
150
Logische Form und Argument
Beispiel 5.2 Kein Schüler löst jede Aufgabe. Kein Schüler löst jede Aufgabe (Ein Schüler löst jede Aufgabe)
non E
(M) (Schüler(x)
x löst jede Aufgabe)
und OP
(R
kd
K))
non
Ex x
(Schüler(x)
und
All y
(Aufgabe(y)
kd
x löst y))
¬
∃x
(P x
∧
∀y
(Qy
→
P 2 xy))
S:
Kein Schüler löst jede Aufgabe
EF :
non ex x ( Schüler(x) und all y ( Aufgabe(y) kd x löst y )
LF :
¬∃x ( P x ∧ ∀y(Qy → P 2 xy) )
Legende:
P x:
x ist ein Schüler
Qx:
x ist eine Aufgabe
2
P xy: Universum:
x löst y umfaßt Personen und Sachen
151
Ein Übersetzungsmanual
Beispiel 5.3 Wenn es regnet, wird die Straße naß.
Wenn es regnet, wird die Straße nass OP
(R
kd
K)
∅
(es regnet
kd
Die Straße wird nass)
All s
(es regnet in s
kd
Die Straße wird nass in s)
∀s
(Rs
→
P 2 as
S:
Wenn es regnet, wird die Straße naß
EF :
all s ( es regnet in s
LF :
∀s ( Rs → P 2 as )
Legende:
Rs: 2
Universum:
kd
die Straße ist naß in s )
es regnet in s
P xs:
x wird naß in s
a:
die Straße Situationen
152
Logische Form und Argument
Beispiel 5.4 Wenn Hansi ein Autoj kauft, bezahlt eri esj mit einem Scheck.
Wenn Hansi ein Autoj kauft, bezahlt eri esj mit einem Scheck OP
(R
K)
kd
eri bezahlt esj mit einem Scheck) (Hansi kauft ein Autoj
∅
E
(M))
All x
(Auto(x)
und
Hansi kauft x
kd
Ex y
(Scheck(y)
und
eri bezahlt x mit y))
∀x
(P x
∧
P 2 ax
→
∃y
(Qy
∧
Q3 axy))
S:
Wenn Hansi ein Autoj kauft, bezahlt eri esj mit einem Scheck
EF :
all x ( Auto(x) und Hansi kauft x
LF :
∀x ( P x ∧ P 2 ax → ∃y(Qy ∧ Q3 axy) )
Legende:
P x:
x ist ein Auto
Qx:
x ist ein Scheck
2
x kauft y
3
x bezahlt y mit z
P xy: Q xyz: Universum:
kd
ex y ( Scheck(y) und eri bezahlt x mit y ) )
umfaßt Personen und Sachen
Ein Übersetzungsmanual
153
Übung 5.1 Formalisieren Sie in der Prädikatenlogik PL1I mit und ohne Übersetzungsbaum so struktur-explizit wie möglich und unter Angabe von Legende und Universum. Bei welchen Beispielen entdecken Sie Schwierigkeiten mit dem Übersetzungsmanual? (1)
(2)
a.
Alles ist süß oder sauer.
b.
Alles ist süß oder alles ist sauer.
a.
Humphrey ist ein Wal.
b.
Ein Wal verirrte sich im Sacramento River.
c.
Ein Wal ist ein Säugetier.
(3)
Wer zu spät kommt, den bestraft das Leben.
(4)
Niemand gewinnt, der nicht trainiert hat.
(5)
Keiner wird von niemandem geliebt.
(6)
Jemand hat alle seine/ihre Weihnachtsplätzchen gegessen.
(7)
Jeder Politiker hat eine Idee, die alle seine Handlungen bestimmt.
(8)
Es ist nicht alles Gold, was glänzt.
(9)
Wer andern eine Grube gräbt, fällt selbst hinein.
(10)
(11)
(12)
(13)
(14)
a.
Alle Pfeile trafen nicht das Ziel.
b.
Nicht alle Pfeile trafen das Ziel.
a.
Jeder Kunde erhält mindestens zwei Flaschen.
b.
Jeder Kunde erhält höchstens zwei Flaschen.
a.
Jeder hat genau eine Aufgabe gelöst.
b.
Alle haben dieselbe Aufgabe gelöst.
c.
Jeder hat eine andere Aufgabe gelöst.
a.
Zwei Rebellen drangen ungesehen in das Gebäude ein.
b.
Einige Rebellen drangen zum gleichen Zeitpunkt in das Gebäude ein.
a.
Manche Wissenschaftler zitieren nur sich selbst.
b.
Manche Wissenschaftler zitieren sich nur gegenseitig.
154
5.2
Logische Form und Argument
Logische Argumente
Bisher haben wir lediglich einzelne umgangssprachliche Sätze formalisiert. Wir wollen nun das Beispiel eines ganzen Arguments in der natürlichen Sprache betrachten, welches den Anspruch auf ein logisches Argument erhebt: es wird behauptet, daß aus einer Reihe von Prämissen eine gewisse Konklusion logisch folgt. Wir werden in drei Schritten vorgehen: (i) Formalisierung der einzelnen Sätze des Arguments in PL1; (ii) Prüfung der Schlüssigkeit des Arguments durch Versuch eines informellen Beweises; für den Fall, daß sich kein Beweis finden läßt: Suche nach einem Gegenmodell, welches alle Prämissen wahr macht, aber die Konklusion falsch; (iii) Suche nach einer geeigneten Verstärkung der Prämissen bzw. Abschwächung der Konklusion, bis sich eine gültige Ableitung ergibt. Das Beispiel geht auf Lewis Carroll zurück und lautet wie folgt:4 (15) (P1)
Keines der unbeachteten Dinge, denen jemand auf See begegnet, ist eine Meerjungfrau.
(P2)
Dinge, die ins Logbuch eingetragen werden, wenn jemand ihnen auf See begegnet, sind der Erinnerung wert.
(P3)
Lewis ist niemals irgend einem Ding begegnet, das der Erinnerung wert wäre, wenn er auf Reisen war.
(P4)
Dinge, denen jemand auf See begegnet und Beachtung finden, werden ins Logbuch eingetragen.
(K)
Also ist Lewis niemals einer Meerjungfrau begegnet.
Schritt (i): Formalisierung. Bei der Formalisierung der einzelnen Sätze sind alle logischen Strukturelemente zu repräsentieren. Die Darstellung des deskriptiven Materials ist nur so explizit wie nötig zu gestalten. Zunächst halten wir uns an die vorgegebene Anordnung der logischen Strukturwörter und formalisieren entsprechend. Manchmal ist es jedoch von Vorteil, zu logisch äquivalenten Formeln überzugehen, wenn sich mit ihnen der Beweis der Konklusion einfacher gestaltet; natürlich müssen diese Äquivalenzen nachgewiesen werden. Legende: B(x): x ist ein beachtetes Ding Bg(x, y): x begegnet y E(x): x ist der Erinnerung wert L(x): x wird ins Logbuch eingetragen M (x): x ist eine Meerjungfrau R(x): x ist auf Reisen S(x): x ist auf See a: Lewis Logische Formen: (P1) ¬∃x( ¬B(x) ∧ ∃y(S(y) ∧ Bg(y, x)) ∧ M (x) ) 4 Für eine Vielzahl von umgangsprachlichen Beispielen für formalisierbare Sätzen und logische Argumente siehe [26].
Logische Argumente
155
(P2) ∀x( L(x) ∧ ∃y(S(y) ∧ Bg(y, x)) → E(x) ) (P3) ¬∃x( Bg (a, x) ∧ R(a) ∧ E(x) ) (P4) ∀x( ∃y(S(y) ∧ Bg(y, x)) ∧ B(x) → L(x) ) (K) ¬∃x( M (x) ∧ Bg(a, x) ) Wir überführen die erhaltenen Formeln in logisch äquivalente Formeln, mit denen es sich leichter schließen läßt. Die Begründungen für diese Umformungen ergeben sich aus der Kalkülisierung der Prädikatenlogik in den späteren Kapiteln. (P1) ∀x∀y( M (x) ∧ S(y) ∧ Bg(y, x) → B(x) ) (P2) ∀x∀y( L(x) ∧ S(y) ∧ Bg(y, x) → E(x) ) (P3) ∀x( R(a) ∧ Bg(a, x) → ¬E(x) ) (P4) ∀x∀y( S(y) ∧ Bg(y, x) ∧ B(x) → L(x) ) (K) ∀x( M (x) → ¬Bg (a, x) ) Schritt (ii): Prüfung der Schlüssigkeit. Der Schluss von (P1)–(P4) auf (K) ist in der vorliegenden Formalisierung nicht gültig. Natürlich reicht es nicht zu sagen, man habe keinen Beweis gefunden; man kann jedoch durch die Angabe eines Gegenmodells zeigen, daß es keinen Beweis geben kann. In diese Überlegung geht geht das metalogische Resultat der semantischen Korrektheit des benutzten Beweisverfahrens ein, wie wir später sehen werden. Ein informelles Gegenmodell ist im vorliegenden Fall: Lewis hätte einer Meerjungfrau zuhause (d.h. nicht auf Reisen) begegnen können; dann wären (P1)–(P4) weiterhin erfüllt, aber (K) wäre falsch. Die Systematisierung der Semantik und die Technik der Gegenmodelle finden sich in Kapitel 6. Schritt (iii): Verstärkung der Prämissen und Beweis. Eine geeignete Verstärkung der Prämissen besteht etwa in den folgenden zusätzlichen Annahmen: (P5) Meerjungfrauen begegnet man nur auf See, und (P6) Wenn man auf See ist, ist man auf Reisen; formal: (P5) ∀x∀y( M (x) ∧ Bg(y, x) → S(y) ) (P6) ∀x( S(x) → R(x) ) Natürlich ist bei der Verstärkung darauf zu achten, daß man das Argument nicht trivialisiert, indem man etwa (offen oder versteckt) die Konklusion in die Annahmen steckt (petitio principii).5 5 Präzise zu sagen, wann man eine derartige petitio principii begeht, ist allerdings nicht wirklich möglich: logisch gesehen ist die Konklusion bei einem gültigen Argument ohnehin in der Konjunktion der Prämissen enthalten, auch wenn man das nicht sofort “sieht”. Eigentlich handelt es sich um ein pragmatisches Kriterium, welches vor allem für allgemeine Begründungszusammenhänge, bei denen nicht notwendig rein deduktive Argumente herangezogen werden, die Forderung der Nicht-Zirkularität aufstellt: eine Begründung darf nicht auf Prämissen beruhen, welche ihrerseits die zu begründende Aussage bereits voraussetzen.
156
Logische Form und Argument
Beweis von (K) aus (P1)–(P6). Es wird ein informeller Beweis nach Art des natürlichen Schließens gegeben, welches später im Rahmen des KM-Kalküls systematisch behandelt wird. Ist eine Formel erst noch zu beweisen, als Behauptung oder Unterbehauptung, so wird das Wort ‘zeige’ vorangestellt. Ein bedingter Allsatz wird bewiesen, indem man das Antecedens der Matrix annimmt und mit damit das Consequens herleitet. Eine Formel wird indirekt bewiesen, indem man ihre Negation zum Widerspruch führt. Im folgenden Beweis wird am Ende einer Beweiszeile der gemachte Beweisschritt erläutert. ‘P.i’ ist die i-te Prämisse, ‘∀B’ steht für die Regel der Allbeseitigung oder Spezialisierung, und ‘AL’ für die Anwendung eines aussagenlogischen Gesetzes. Einzelne Ziffern bezeichnen frühere Beweiszeilen. 1. Zeige: ∀x( M (x) → ¬Bg (a, x) )
2. M (x)
Annahme zur bedingten Ableitung
3. Zeige ¬Bg(a, x) 4. Bg(a, x) 5. S(a)
Ansatz indirekter Beweis P5, 2×∀B,2,4,AL
6. R(a) ∧ Bg(a, x) 7. ¬E(x) 8. ¬L(x)
9. ¬B(x) 10. B(x)
P6,∀B,5,4,AL P3,∀B,6,AL P2, 2×∀B,6,AL P4, 2×∀B,8,AL P1, 2×∀B,2,6,AL
Zeile 9 und 10 liefern aber den Widerspruch, der die indirekte Annahme in Zeile 4 widerlegt; also ist der in Zeile 3 angesetzte Unterbeweis abgeschlossen, und das Consequens des Allsatzes in Zeile 1 ist gezeigt. Das ist aber die Behauptung.
5.3
Philosophische Argumente
Als weitere Anwendung der Technik der logischen Formalisierung betrachten wir ein Argument aus der philosophischen Literatur. Es handelt sich um ein berühmtes Problem in der Ideenlehre Platons, welches seit Aristoteles unter der Bezeichnung der dritte Mensch bekannt ist. Bevor wir uns der konkreten Textstelle zuwenden, die das Argument enthält, seien einige methodischen Vorbemerkungen gemacht. Die Formalisierung von philosophischen Argumenten unterscheidet sich von dem allgemeinen Verfahren der Formalisierung natürlichsprachlicher Sätze durch ihre verschiedene Zielsetzung. Ist ein beliebiger Satz der Umgangsprache gegeben, der formalisiert werden soll, so ist das Ziel, die logische Analyse möglichst weit zu treiben, damit der logische Gehalt des Satzes möglichst vollständig erfaßt wird. So dürfte meist eine rein aussagenlogische Formalisierung nicht informativ genug sein, um als adäquate logische Repräsentation gelten zu können; als geeignete Analysetiefe sollte in der Regel mindestens die prädikatenlogische Ebene erreicht werden. Da der Gegenstand der Untersuchung die natürliche Sprache selbst ist, wird man ferner alle Details eines Satzes auf ihren logischen Gehalt hin anschauen und diesen explizit zu machen versuchen.
Philosophische Argumente
157
Bei philosophischen Argumenten liegt das Analyseziel woanders. Zwar bedient sich ein solches Argument in der Regel einer natürlichen Sprache, aber hier ist die Sprache nur ein Vehikel zur Mitteilung eines Gedankengangs. Für die Formalisierung bedeutet das, daß nur diejenigen Teile des philosophischen Textes in der logischen Sprache wiedergegeben werden, die zur Darstellung der logischen Struktur des Arguments unverzichtbar sind. Die Formalisierung sollte also nur so explizit wie nötig und nicht so explizit wie möglich sein. Das hat zur Folge, daß ganze Sätze oder Satzteile weggelassen oder zu einem einzigen Relationssymbol in der logischen Repräsentation zusammengefaßt werden können, wenn sie zur logischen Struktur des Arguments keinen eigenen Beitrag leisten. Dagegen sind vor allem die logischen Aspekte des Formalisierungsverfahrens aus dem letzten Abschnitt auch in der vorliegenden Anwendung zu beachten. Dazu gehören speziell das Erkennen des logischen Charakters der verwendeten Strukturausdrücke, ihre Reihenfolge und ihr Verhältnis zueinander (SkopusBeziehungen). Im einzelnen sind folgende Punkte zu beachten: 1. Wahl der logischen Zielsprache. Im Normalfall ist dies die Prädikatenlogik der ersten Stufe. Speziell in philosophischen Anwendungen kommen jedoch auch andere Logik-Systeme in Frage, wie Modallogik, intensionale Logiken sowie Logiken höherer Stufe. Alternative Logiken sollten jedoch aus dem gegebenen Problemzusammenhang heraus zu motivieren sein (z.B. intensionale Logiken für die Behandlung intensionaler Kontexte). 2. Auswahl der wichtigsten deskriptiven Konstanten. Jedes philosophische Argument enthält eine Anzahl zentraler nicht-logischer Begriffe, die das Argument “tragen”. Für diese Begriffe werden deskriptive Konstanten der logischen Sprache ausgezeichnet, welche sie repräsentieren. 3. Axiome für die ausgezeichneten deskriptiven Konstanten. Um ihre Verwendungsweise in der Logik abzubilden, müssen Axiome formuliert werden, die ihren Gebrauch regeln und damit implizit ihre Bedeutung (zumindest im Kern) wiedergeben. 4. Historische vs. systematische Rekonstruktion. Die genaue Formulierung solcher Axiome ist eine Frage der Interpretation. Ist das Analyseziel ein systematisches, so ist die Rekonstruktion des Arguments nicht an historische Vorgaben gebunden. Man nimmt lediglich den gegebenen Text zum Anlaß für eine systematisch interessante Argumentstruktur. Dagegen ist bei der Rekonstruktion von Texten aus der Philosophiegeschichte auf historische Treue zu achten. Um die Intention eines Autors angemessen wiederzugeben, gehen typischerweise textkritische Deutungen des vorliegenden Textes und das Wissen über allgemeinere Positionen und Theorien des betrachteten Autors in die Rekonstruktion ein. Moderne Begriffsbildungen sind möglichst zu vermeiden, sofern sie anachronistisch sind, d.h. aus historischen Gründen dem Autor nicht zugeschrieben werden können. 5. Struktur des Arguments. Ein Argument gliedert sich in eine Anzahl von Prämissen, eine logische Ableitung und eine Konklusion. Die Rekonstruktion sollte diese Komponenten wiedergeben. 6. Die Frage der Schlüssigkeit. Die Formalisierung sollte eine Antwort auf die Frage liefern, ob das Argument in der gegebenen logischen Gestalt schlüssig ist.
158
Logische Form und Argument
7. Bewertung. Ist das Argument schlüssig, sind die Prämissen auf ihre Plausibilität hin zu bewerten. Im Fall eines non sequitur ist zu diskutieren, wie entweder die Prämissen verstärkt werden können, um den Schluß gültig zu machen, oder aber, wie die Konklusion abgeschwächt werden kann, um den Schluß zu rechtfertigen. Eine allgemeine philosophische Würdigung kann sich an diese Überlegungen anschließen. Wenden wir uns also nun dem Argument des “dritten Menschen” zu, wie es in Platons Dialog Parmenides (132a-b) gegeben wird.6 Gesprächspartner sind der alte Parmenides und der noch junge Sokrates. Parmenides weist Sokrates auf eine Schwierigkeit der Lehre von den Ideen hin, die entsteht, wenn man unkritisch vielen gleichartigen Dingen eine dieser Gleichartigkeit zugrundeliegende “Form” zuordnet, welche aus den vielen Dingen eine einzige Idee oder einen einzigen Begriff macht. Die relevante Passage lautet wie folgt:7 Ich glaube, daß du aus folgendem Grunde annimmst, jeder Begriff für sich sei eins: [1] Wenn dir nämlich vielerlei Dinge groß zu sein scheinen. so scheint dir dies vielleicht eine und dieselbe Gestalt oder Idee zu sein, wenn Du auf alle siehst, weshalb du denn glaubst, das Große sei eins. Ganz richtig, habe er gesagt. [2] Wie aber nun, das Große selbst und die anderen großen Dinge, wenn du die ebenso mit der Seele zusammen überschaust, erscheint dir nicht wiederum ein Großes, wodurch notwendig dieses alles dir groß erscheint? Das leuchtet sehr ein. [3] Noch ein anderer Begriff der Größe wird dir also zum Vorschein kommen außer jener ersten Größe und den Dingen, die diese an sich haben, und wiederum über allen diesen zusammen noch ein anderer, wodurch diese alle groß sind, und [4] so wird dir jeder Begriff nicht mehr eines sein, sondern ein unbegrenzt Vielfaches.
Die Aporie besteht also darin, daß der Versuch, aus den vielen Dingen der Erscheinungswelt mit gleichen Eigenschaften Einzelobjekte auszuzeichnen, die die Ideen dieser Eigenschaften darstellen, mißlingt: zu jeder Eigenschaft scheint eine unendliche Zahl von Ideen dieser Eigenschaft erzeugt zu werden. Beginnen wir mit der Analyse des Textes. Zunächst wird ein Grund angegeben, der es plausibel erscheinen läßt, in einer Anzahl von großen Dingen eine einzige Gestalt, “das Große” oder die Idee des Großen, zu entdecken: diese Dinge haben alle Anteil an dem Großen, das in oder an ihnen mehr oder minder vollkommen verwirklicht ist. Eine umgangsprachliche Formulierung dieses allgemein gedachten Zusammenhangs, der sich aus den Sätzen [1] und [2] des Textes herauslesen läßt, wäre die folgende: (16)
(EV-groß ) Das eine Große in vielen großen Dingen. Wann immer eine Mehrzahl x von Dingen gegeben ist, auf die alle die Eigenschaft ‘groß ’ zutrifft, so gibt es eine Idee i von Größe als Einheit oder Einzelindividuum, welches das Groß-Sein der x-Dinge repräsentiert und durch das die x-Dinge groß erscheinen.
6 Zur logischen Struktur der Argumente im gesamten Dialog Parmenides siehe [261]. Zum “dritten Menschen” siehe speziell S. 29ff. 7 Zitiert nach Band 5 aus Platon. Werke in acht Bänden, griechisch und deutsch. Hrsg. von G. Eigler. Darmstadt 1990. Die Übersetzung ist die von F. Schleiermacher.
Philosophische Argumente
159
Abstrahieren wir von der Eigenschaft ‘groß’ und nennen das, was die Dinge gemeinsam haben, allgemein P , so läßt sich das folgende Prinzip formulieren: (17)
(EV ) Das Eine im Vielen. Wann immer eine Mehrzahl x von Dingen gegeben ist, die alle eine gewisse Eigenschaft P haben, so gibt es eine Idee i von P als Einheit oder Einzelindividuum, welches das P -Sein der x-Dinge repräsentiert und durch das die x-Dinge als P erscheinen.
Wir isolieren aus diesem Prinzip eine dreistellige Relation, I(x, y, z), und lesen sie wie folgt: (18)
I(x, y, z)
für
“x ist eine Idee von y, durch welche die Objekte von z (die z-Dinge) als y erscheinen”
Im ersten Argument der Relation I steht Terme x, welche Ideen ausdrücken. Also sollte das intendierte Universum von Objekten, über die in der vorliegenden Anwendung gesprochen wird, Entitäten enthalten, welche Ideen heißen. Wir teilen Ideen durch die Buchstaben i, j (StI) mit. Will man sicherstellen, daß Ideen sich anders verhalten als gewöhnliche konkrete Dinge, so muß man an dieser Stelle einige Postulate oder Axiome aufstellen, die die Eigenschaften von Ideen beschreiben. Da wir für die Zwecke des vorliegenden Arguments nur so explizit wie nötig zu sein brauchen, erstellen wir hier keine “Theorie der Ideen”, sondern begnügen uns mit der minimalen Eigenschaft von Ideen, daß sie jedenfalls keine gewöhnlichen Dinge sind. Jede Idee soll also von jedem gewöhnlichen Ding verschieden sein. Wir werden der Einfachheit halber eine Folgerung aus diesem Postulat in die Formalisierung von (EV ) einbauen, die sich aus dem Text erschließen läßt, nämlich daß anläßlich einer Gesamtheit von Dingen eine Idee “evoziert” wird, welche von den Dingen der Gesamtheit verschieden ist. Wäre die Idee nämlich schon eines von diesen Dingen, so fehlt jede Rechtfertigung dafür, im zweiten Schritt von einer anderen entstehenden Idee zu sprechen. Da wir es bei Platon mit einem Universalienrealismus zu tun haben, stellt sich ferner die Frage, ob die Ideen als Universalien höherstufige Objekte sind, die in ersten Stufe nicht formalisiert werden können. Wir umgehen diese komplexe Frage und behandeln die Ideen, da wir ohnehin erststufig bleiben wollen, auf einer Ebene mit den gewöhnlichen Dingen, d.h. als Einzelindividuen, wenn auch von diesen getrennt. Da wir weiter unten noch eine dritte Sorte von Objekten, nämlich “Vielheiten”, betrachten, die keine Einzelindividuen sind, führen wir ein einstelliges Prädikat E für “... ist ein Einzelindividuum” ein. Für eine Idee i gilt also E(i). Das zweite Argument der Relation I(x, y, z) sind Objekte y, “von denen” x eine Idee ist; also etwa: die Idee des Großen, die Idee des Schönen usw. Die Idee des Großen entsteht, wenn mehreren Dingen das Prädikat ‘... ist groß’ zugeschrieben wird. In der Prädikatenlogik werden Eigenschaften wie ‘groß’ und ‘schön’ zu einstelligen Prädikatkonstanten; diese stehen aber nicht für die Art von Objekten, die als Individuen in der Relation I stehen können: der Ausdruck I(t0 , t1 , t2 ) ist nur dann syntaktisch wohlgeformt, wenn an jeder Argumentstelle ein Individuenterm steht. Wir wollen uns hier damit helfen, daß wir zu den Objekten des Individuenbereichs, genauer zu den Einzelindividuen, auch Prädikatausdrücke zählen, auf die wir uns dann aber mit gewissen Namen beziehen müssen. Ist also ein Prädikatausdruck P gegeben, so sei p P q ein Name von P . Damit ist P ein Individuenterm und kann in den Relationsausdruck I(x, y, z) für y eingesetzt werden.
160
Logische Form und Argument
Das dritte Argument von I schließlich enthält Ausdrücke für eine Mehrzahl von Dingen, die gemäß der obigen Textstelle gerade Anlaß geben zur Bildung der Idee (oder vielleicht platonischer: zur “Erinnerung” an die Idee) zu der Eigenschaft, unter die jene Dinge subsumiert werden. Hier haben wir ein weiteres Formalisierungsproblem: nur ein Vieles sollte Anlaß dazu geben, das Eine in diesem Vielen zu sehen. Also müssen wir mit einer Vielheit, einer Gesamtheit oder Kollektion von Dingen beginnen. Nun stellt die moderne Logik für den Begriff der Kollektion den Begriff der Menge zur Verfügung, und es läge nahe, das dritte Argument von I über Mengen laufen zu lassen. Allerdings wäre die Verwendung des modernen Mengenbegriffs im Kontext der platonischen Schriften sicherlich historisch verfehlt. Außerdem würden für das vorliegende Argument ohnehin nur die elementarsten Eigenschaften von Mengen gebraucht, die sich jedoch auch in einer einfacheren und historisch angemesseneren “Logik der Vielheiten” finden. Wir wollen also in unsere Formalisierung ein einstelliges Prädikat V (x) für “x ist eine Vielheit” aufnehmen, zusammen mit einer zweistelligen Relation µ, geschrieben xµy für “x ist ein Teil von y” (‘µ’ für “meros”), wobei x ein Einzelindividuum und y eine Vielheit ist. Wir brauchen nicht genau zu sagen, was eine Vielheit ist, insbesondere, wann zwei Vielheiten gleich sind; wir fordern jedoch, daß eine Vielheit mindestens zwei verschiedene Teile hat, damit Vielheiten ihren Namen verdienen und das Prinzip (EV ) inhaltlich sinnvoll ist, obwohl die Gültigkeit des Arguments nicht davon abhängt. Formal würde dieses Postulat lauten: (19)
∀x (V (x) ↔ ∃y∃z(y 6= z ∧ yµx ∧ zµx))
(Vh)
Außerdem sollen Vielheiten von Einzelindividuen verschieden sein, d.h. wir haben das Disjunktheitsprinzip: (20)
∀x (V (x) ↔ ¬E(x))
(DP )
Wir benötigen ferner eine Operation, mit der man ein Objekt zu einer Vielheit hinzufügen kann, weil ja im Text die Idee des Großen zusammen mit den anderen Dingen als neue Vielheit betrachtet wird. Wir bezeichnen diese Operation mit ‘⊕’. Syntaktisch verhält sich ⊕ wie die Addition in der Arithmetik und ist daher eine Funktionskonstante. Eigentlich sind Funktionskonstanten in unserer PL1I-Sprache noch nicht vorgesehen; wir nehmen also hier (im Vorgriff auf Kapitel 12 eine Erweiterung der syntaktischen Regeln vor, wonach zwei Individuenterme s und t zu einem neuen Term s ⊕ t zusammengefügt werden können, zu lesen als “die Summe von s und t”. Wir verwenden die Summenoperation nur für den Fall, daß s eine Vielheit von Individuen und t ein Einzelindividuum ist; dann ist s ⊕ t jedenfalls eine Vielheit, und t ist ein Teil von s ⊕ t. Allgemeiner ist ein z genau dann ein Teil von s ⊕ t, wenn z ein Teil von s ist oder wenn z gleich t ist. Formal nehmen wir also das folgende Axiom an, das wir Summenprinzip SP nennen:8 (21)
∀x∀y (V (x) ∧ E(y) → V (x ⊕ y) ∧ ∀z (zµ(x ⊕ y) ↔ zµx ∨ z = y)) (SP )
8 Dieses Prinzip ist vom theoretischen Standpunkt aus nicht das allgemeinste, sondern das Minimum zur Ableitung der gewünschten Konklusion. Was speziell den Begriff der Vielheit angeht, so werden wir später eine formale Theorie der Teilbeziehung (Mereologie) betrachten, in deren Rahmen Vielheiten systematischer behandelt werden können; siehe Kapitel 13.
Philosophische Argumente
161
Wir betrachten also jetzt die prädikatenlogische Sprache L1 [E, V, µ, ⊕, ·, I], mit den deskriptiven Konstanten in der eckigen Klammer in den angegebenen Bedeutungen. Stehen eine Idee i, ein Prädikatname P und eine Vielheit x in der Relation I, so lesen wir also: (22)
I(i, P , x)
für
“i ist eine Idee von P , durch welche die Teile von x als P erscheinen”
Wir können dann das Prinzip (EV ) formal hinschreiben: (23)
∀x ( V (x) ∧ ∀z(zµx → P (z)) → ∃i(E(i) ∧ I(i, P , x) ∧ ¬iµx) )
(EV )
Dieses Prinzip ist die Basis des Arguments; es stellt seine erste Prämisse dar. In Satz [2] des Textes wird die gedankliche Operation vollzogen, den großen Dingen, von denen wir ausgegangen waren, die (erste) Idee des Großen hinzuzufügen; mit Hilfe von ⊕ können wir diese Operation darstellen. Nun wird gesagt, daß beim Überschauen dieser neuen Vielheit eine zweite Idee des Großen entsteht. Diesen Schritt kann man nur dann nachvollziehen, wenn man an der ersten Idee ebenfalls etwas Großes entdecken kann, d.h. sie selbst zu den großen Objekten zählt; andernfalls kann das Prinzip (EV ) weder inhaltlich noch formal angewendet werden. Diese weitere Annahme ist ein Prinzip der Selbstanwendung, ohne das das Argument schon hier stecken bleibt. Dieses Prinzip wird Platon häufig zugeschrieben, und wir gehen davon aus, daß er es auch hier als Prämisse für zulässig hält, auch wenn der Text es weder formuliert noch zitiert. Wir können es wie folgt ausdrücken: (24)
(SbA) Prinzip der Selbstanwendung. Jede Idee einer Eigenschaft hat selbst diese Eigenschaft.
Bei der Formalisierung von (SbA) beachten wir, daß wir bisher nur die dreistellige Relation I zur Verfügung haben, um von einem Objekt sagen zu können, es sei eine Idee. Der Begriff “Idee” ist also relational. Von den drei Relata in I kommen in (SbA) nur zwei vor, die Idee selbst und die Eigenschaft, wovon sie die Idee ist. Man kann nun die dreistellige Relation I auf eine zweistellige Relation, sagen wir, J, zurückführen, indem wir definieren, i sei eine Idee der Eigenschaft P , formal J(i, P ), wenn es eine Vielheit x gibt, so daß die x-Dinge aufgrund von i als P erscheinen. Damit führen wir die folgende definierte Relation ein:9 (25)
a. b.
J(i, P ) ↔ ∃x I(i, P , x)
“ i ist (eine) Idee von P ”
Wir drücken noch das Selbstanwendungsprinzip formal wie folgt aus: (26)
∀i (J(i, P ) → P (i))
(SbA)
Wir sind jetzt in der Lage, das Arguments mit Hilfe üblicher logischer Schlußregeln so weit formal nachzuvollziehen, daß man sieht, wie immer neue Ideen derselben Eigenschaft generiert werden. Der Ansatz ist, daß wir uns eine spezielle Vielheit a0 von Dingen vorgeben, die alle eine gewisse Eigenschaft P haben. Auf dieses a0 wird dann das allgemeine Prinzip (EV ) spezialisiert. 9 In (25b) steht “eine” Idee, nicht “die” Idee der Eigenschaft P . Die naheliegende Annahme, daß es zu einer Eigenschaft höchstens eine Idee geben kann, können wir gar nicht gebrauchen, da sie das Argument ebenfalls stoppen würde.
162
Logische Form und Argument
Die Kommentare am Ende der Beweiszeilen geben wieder an, wie eine Zeile aus früheren folgt. Dabei werden neben den Bezeichnungen ‘SP’ für das Vielheitsaxiom und ‘EV’, ‘SbA’ für die inhaltlichen Prämissen des Arguments die folgenden Abkürzungen verwendet (siehe Kapitel 7 und 8): ‘A’ für ‘Annahme’, ‘def’ für ‘Definition’, ‘MP’ für ‘Modus Ponens’, ‘∧B’ für ‘∧-Beseitigung’, ‘∧E’ für ‘∧-Einführung’, ‘∨E’ für ‘∨-Einführung, ‘Kp’ für ‘Kontraposition’, ‘AL’ für ‘AL-Schluß’, ‘∀B’ für ‘All-Beseitigung’, ‘∃E’ für ‘Existenz-Einführung’, ‘Lb’ für ‘Leibniz-Prinzip’, und ‘PL1I’ für ‘PL1I-Theorem’. Die Ableitung ist im Stil des natürlichen Schließens gehalten. Wie wir in Kapitel 8 sehen werden, ist dafür die Regel (∃B) der Existenz-Beseitigung charakteristisch: ist ein Existenzsatz gegeben, der die Existenz eines Objekts mit einer gewissen Eigenschaft behauptet, so können wir einem Beispiel-Objekt oder “Zeugen” für diese Eigenschaft einen festen Namen in Form einer bisher noch nicht im Beweis vorkommenden Konstante geben und mit diesem Zeugen weiterargumentieren. Allsätze können mit (∀B) auf beliebige Terme spezialisiert werden.10 11 1. V (a0 ) ∧ ∀z(zµa0 → P (z))
A EV
2. ∀x ( V (x) ∧ ∀z(zµx → P (z)) → ∃i(E(i) ∧ I(i, P , x) ∧ ¬iµx) ) 3. V (a0 ) ∧ ∀z(zµa0 → P (z)) → ∃i(E(i) ∧ I(i, P , a0 ) ∧ ¬iµa0 )
2,∀B,1,MP
4. ∃i(E(i) ∧ I(i, P , a0 ) ∧ ¬iµa0 )
1,3,MP
5. E(j0 ) ∧ I(j0 , P , a0 ) ∧ ¬j0 µa0
4,∃B
6. I(j0 , P , a0 )
5,∧B 6,∃E,MP
7. ∃x I(j0 , P , x) 8. J(j0 , P )
7,def J SbA
9. ∀i (J(i, P ) → P (i)) 10. P (j0 ) 11. V (a0 ) ∧ E(j0 )
9,∀B,8,MP 1,∧B;5,∧B;∧E
12. ∀x∀y (V (x) ∧ E(y) → V (x ⊕ y) ∧ ∀z (zµ(x ⊕ y) ↔ zµx ∨ z = y))
SP
13. V (a0 ) ∧ E(j0 ) → V (a0 ⊕ j0 ) ∧ ∀z (zµ(a0 ⊕ j0 ) ↔ zµa0 ∨ z = j0 )
12,∀B
14. V (a0 ⊕ j0 ) ∧ ∀z (zµ(a0 ⊕ j0 ) ↔ zµa0 ∨ z = j0 ) 15. a1 := a0 ⊕ j0
11,13,MP def
16. V (a1 )
14,∧B,15
17. ∀z (zµa1 ↔ zµa0 ∨ z = j0 )
14,∧B,15
18. j0 µa1 ↔ j0 µa0 ∨ j0 = j0 10 Dank
17,∀B
an Karl-Georg Niebergall für eine Vereinfachung des Arguments. Beweis sieht nur deshalb “lang” aus, weil elementare logische Schritte einzeln angegeben statt (wie später) zusammengefaßt werden. 11 Der
Philosophische Argumente 19. j0 = j0 20. j0 µa0 ∨ j0 = j0 21. j0 µa1
163 PL1I 19,∨E 20,18,AL
22. ¬j0 µa0
5,∧B
23. a1 6= a0
21,22,Lb,Kp,AL
24. ∀z (z = j0 → P (z)) 25. ∀z (zµa0 → P (z)) 26. ∀z (zµa0 ∨ z = j0 → P (z)) 27. ∀z (zµ(a0 ⊕ j0 ) → P (z))
10,PL1I,AL 1,∧B 24,25,PL1 14,∧B,26,PL1
28. ∀z (zµa1 → P (z))
27,def a1
29. V (a1 ) ∧ ∀z (zµa1 → P (z))
16,28,∧E
30. ∃i(E(i) ∧ I(i, P , a1 ) ∧ ¬iµa1 )
29,EV,Sp,MP
31. E(j1 ) ∧ I(j1 , P , a1 ) ∧ ¬j1 µa1
30,∃B
32. j0 6= j1 33. P (j1 ) 34. a2 := a1 ⊕ j1 etc.
21,31,∧B,Lb,Kp,AL w.o. 5 – 10 def
Hier sind wir nun in der Schleife, die eine unbegrenzte Anzahl von Vielheiten a0 , a1 , a2 , . . . sowie von zugehörigen neuen Ideen j0 , j1 , j2 , . . . erzeugt, welche jedoch alle Ideen von P sein sollen. Das Argument ist in der vorliegenden Form schlüssig, das Ergebnis aber schwerlich akzeptabel. Als hauptverantwortliche Prämisse wird vor allem das Prinzip der Selbstanwendung angesehen, das aus heutiger Sicht völlig unplausibel ist. Allerdings gab es in jüngerer Zeit einige “Rettungsversuche”, die vor allem darauf abzielten, dem Prinzip den Charakter der offensichtlichen Absurdität zu nehmen. Unter anderem wurde vorgeschlagen, daß Platon in Wirklichkeit zwei verschiedene Typen von Prädikation betrachtet hat, welche zu einer akzeptablen Version der Selbstanwendung führen; wir können darauf hier nicht eingehen.12 Wir bemerken jedoch, daß das Prinzip (EV ) widersprüchlich wird, wenn an der Stelle des Konditionals in ∀z(zµx → P (z)) ein Bikonditional gesetzt wird. Dann ist nämlich die Vielheit z durch die Eigenschaft P charakterisiert, und kein Objekt außerhalb der Teile von z, speziell also keine der Ideen von P , kann unter die Eigenschaft P fallen. Die bikonditionale Auffassung wird Platon von dem Philosophen und Logiker Peter Geach zugeschrieben. Geach führt Platons Schwierigkeit mit dem “dritten Menschen” auf ein Skopusproblem zurück, d.h. auf eine unerwünschte Vertauschung von All- und Existenzquantor. Er schreibt ([92]: 2ff.):13 12 Siehe
z.B. [169], ferner [189]. G.L.
13 Übersetzung
164
Logische Form und Argument Es ist ziemlich klar, daß Platons Schwierigkeiten im Argument vom Dritten Menschen wie folgt zustandekommen. Er macht die Annahme (a) Es gibt einen ausgezeichnten (pre-eminent) Menschen, dem und dem allein alle beliebigen anderen Menschen es verdanken, daß sie Menschen sind. (In Anschluß an Aristoteles gebrauche ich “Mensch” als ein Beispiel eines Allgemeinbegriffs anstelle von Platons “groß”.) Aus (a) folgt natürlich: (b) Es gibt einen ausgezeichnten Menschen, dem alle beliebigen anderen Menschen es verdanken, daß sie Menschen sind. Platon verwechselt dies mit: (c) Für alle beliebigen Menschen gibt es einen von ihnen verschiedenen ausgezeichnten Menschen, dem sie es verdanken, daß sie Menschen sind.
Die Annahme (c) entspricht unserem Prinzip (EV ). Sie ist unverträglich mit der Prämisse (a), welche mit der Wendung “dem und dem allein” das charakterisierende Bikonditional enthält. Der Widerspruch entsteht, dies ist die Diagnose von Geach, indem die korrekte Reihenfolge der Quantoren ∃∀ in (b) unzulässigigerweise vertauscht wird zu ∀∃ in (c).
Nun könnte man dennoch versuchen, auch die gegenwärtige Version von (EV ) ad absurdum zu führen, indem man die Variable z auf die Gesamtheit aller P -Dinge spezialisiert. Zu dieser Gesamtheit würden natürlich die unendlich vielen P -Ideen j0 , j1 , j2 , . . . zählen. Dann könnte aber keine neue Idee generiert werden, die von allen anderen verschieden ist. Dieser Gedankengang setzt allerdings voraus, daß die unendliche Vielheit der P -Ideen (mit oder ohne die konkreten P -Dinge) eine zulässige Instanz für den Allquantor über z in (EV ) ist. Inhaltlich bedeutet er, daß man Platon die Idee einer aktual unendlichen Vielheit zuschreibt, was nicht belegt ist.14 Schleiermachers Übersetzung in Satz [4] unseres Textes, “ein unbegrenzt Vielfaches”, deutet sprachlich auf die Annahme eines solchen unendlichen Objekts hin; der griechische Text gibt das jedoch
nicht her. Satz [4] lautet im Original: “ ! " $#&%(')'*,+(-(. / 01-('2 3 ” Genauer übersetzt heißt das: “So wird dir also nicht mehr jede der Ideen eins sein, sondern [sie sind] unbegrenzt an Zahl.” Kein Nomen kann hier als Name für eine unendliche Vielheit gedeutet werden.15 Die plausibelste Deutung der Formulierung “die Ideen sind unbegrenzt an Zahl” ist eher diese: es gibt keine Grenze für die Anzahl der Ideen, d.h. für jede natürliche Zahl n gilt, daß es mehr als n Ideen gibt. Formal liefe das auf die Annahme eines Unendlichkeitsaxioms für Vielheiten hinaus, welches Platon nicht zugeschrieben werden kann und in unserer Rekonstruktion auch nicht enthalten ist. Hier zahlt es sich aus, daß wir nicht einfach die übliche moderne Mengenlehre als Instrument zur formalen Modellierung unseres Arguments herangezogen haben: für die Mengenlehre ist ein solches Unendlichkeitsaxiom konstitutiv, und die Problematik seiner Verwendbarkeit würde möglicherweise gar nicht auffallen.16
14 Platons Begriff von Unendlichkeit war nicht mathematischer, sondern metaphysischer Art. Überhaupt war das Aktual-Unendliche der modernen Mengenlehre dem traditionellen Denken fremd. Die aristotelische Konzeption der potentiellen Unendlichkeit als einem prinzipiell unvollständigen dynamischen Prozeß hielt sich bis ins 19. Jahrhundert; siehe dazu [183]. 15 465879: 0 als gleichbedeutend mit der Allformel ∀x x > 0 aufgefaßt, was wegen der falschen Instanz 0 > 0 den Wahrheitswert 0 ergibt. Eine derartige Semantik wird auch geschlossenes Variablensystem (engl. closed variable system) genannt. Sie ist motiviert durch die mathematische Praxis, in der generelle Aussagen meist ohne explizite Quantoren notiert werden. Für Anwendungen in der natürlichsprachlichen Semantik und Philosophischen Logik ist dagegen ein offenes Variablensystem geeigneter, bei dem eine offene Formel in Abhängigkeit einer Zuordnung von Individuen zu den Variablen einen Wert erhält, der von dem des Allabschlusses abweichen kann. Weist eine solche Variablenbelegung in der obigen Formel x > 0 der Variablen x etwa den Wert 3 zu, so wird die Formel bei dieser Belegung wahr; es wird in diesem Fall also keine allgemeine Aussage, sondern eine einzelne Aussage nur für diesen Wert gemacht.
169
Bewertungssemantik
Sprachphilosophisch gesehen kann man von kontextabhängiger oder parametrisierter Wahrheit sprechen, wie sie z.B. bei Sätzen mit “indexikalischen” Ausdrücken wie ‘er’, ‘jetzt’, ‘hier’ vorliegt. Die Analyse parametrisierter Wahrheit setzt jedoch wiederum den modelltheoretischen Erfüllungsbegriff voraus, dem wir uns unten zuwenden. Definition 6.3 Die semantischen Grundrelationen für LPL1 : ‘Die Begriffe wahr bezüglich einer Belegung’, ‘gültig’, ‘erfüllbar ’, ‘kontradiktorisch’, ‘logische Folgerung’, ‘logische Äquivalenz ’ sind wie in der Aussagenlogik definiert, mit ‘PL1’ statt ‘AL’. Schritt II: Erweiterung der Semantik auf die Sprache LPL1I (mit Identität). Ab jetzt sei L = LPL1I . Definition 6.4 Eine (elementare) Belegung für L ist eine Funktion f , die jedem atomaren L-Satz φ einen Wahrheitswert zuordnet, wobei gilt: . 1. Ist φ = p (a = a)q für eine Konstante a, so ist f (φ) = 1. . 2. Ist φ = φ[a] für eine Konstante a, und ist f (a = b) = 1, so gilt f (φ[a]) = f (φ[b]). Definition 6.5 Induktive Definition der durch die L-Belegung f bestimmten L-Bewertung g = gf : 1. Ist φ ein atomarer L-Satz, so gilt g(φ) = f (φ). 2. – 8. wie die entsprechenden Bedingungen 2. – 8. in Definition 6.2. Definition 6.6 Die semantischen Grundrelationen für LPL1I sind wie in Definition 6.3 definiert, mit ‘PL1I’ statt ‘PL1’. Satz 6.1 In der Bewertungssemantik sind die folgenden Formelschemata von L gültig: (1) ∀xφ → φ(a/x)
(Allspezialisierung)
(2) φ(a/x) → ∃xφ
(Existenzabschwächung)
(3) ∀x(φ → ψ) → (∀xφ → ∀xψ) . (4) Qxφ → Qy φxy mit Q = ∀, ∃;
(Quantorendistribution) (Alphabetische Varianz )
(5) t = t
(Reflexivität)
(6) t = s → s = t
(Symmetrie)
(7) t = s ∧ s = r → t = r
(Transitivität)
(8) s = t → (φ[s] ↔ φ[t])
(Leibniz-Prinzip Lb)
Beweis. Für die Prinzipien (4) und (8) sind Induktionsbeweise zu führen. Die Gültigkeit der anderen Formeln ergibt sich einfache Anwendung der Definitionen.
170
Semantik der Prädikatenlogik
Übung 6.1 Beweisen Sie die folgenden Instanzen der Aussagen des Satzes 6.1. (1) ∀x∃y(P y ∧ Q2 xy) → ∃y(P y ∧ Q2 by) (2) P b ∨ P a → ∃x(P b ∨ P x) (3) ∀x(P x → Qx) → (∀xP x → ∀xQx) (4) ∃xR2 xc → ∃yR2 yc (5) b = b (6) a = y → y = a (7) a = b ∧ b = c → a = c (8) a = b → (∀yP 2 ay ↔ ∀yP 2 by) Bemerkung. Mit der Gültigkeit dieser PL1I-Prinzipien läßt sich die Korrekheit aller quantorenlogischen Regeln des KM-Kalküls in Kapitel 8 nachweisen, bis auf die Regel (∃B) der Existenz-Beseitigung. Zum Sonderstatus dieser Regel siehe dort.
6.2
Die modelltheoretische Semantik für PL1I
In der modelltheoretischen Semantik werden nicht nur den Formeln, sondern allen wohlgeformten Ausdrücken semantische Werte zugewiesen, die auch Denotate oder Extensionen genannt werden. Die Denotate unterscheiden sich in ihrem Typ entsprechend den verschiedenen syntaktischen Kategorien der wohlgeformten Ausdrücke. Formeln erhalten nach wie vor Wahrheitswerte als Denotate. Individuenterme werden als (gegebenenfalls “variable”) Namen von Objekten eines Individuenbereichs D gedeutet, welcher der semantischen Interpretation zugrundeliegt. Weitere wohlgeformte Ausdrücke sind die Prädikatkonstanten; der Typ ihrer Denotate hängt von der gegebenen Stelligkeit n ab. Wie oben erwähnt, wird die Beziehung der elementaren Prädikation p P n t0 . . . tn−1 q als mengentheoretische Elementschaft interpretiert werden, welche zwischen den Denotaten der Argumentterme ti und der Extension der Prädikatkonstante P n besteht. Da jene zusammengenommen jeweils eine Folge der Länge n oder kurz ein n-Tupel bilden, bestehen die Extensionen n-stelliger Prädikatkonstanten aus Mengen solcher n-Tupel. Die syntaktischen Kategorien von PL1(I) und die Typen der zugehörigen Denotate sind in der folgenden Tabelle zusammengestellt. Dabei beziehen wir uns auf einen gegebenen Individuenbereich D. Mengen von Objekten in D heißen auch 1-stellige Relationen in D; Mengen von geordneten Paaren oder 2-Tupeln von Objekten in D werden 2-stellige Relationen in D genannt, und für beliebige n ≥ 0 heißen Mengen von n-Tupeln von Objekten aus D n-stellige Relationen in D.1 Ferner teilen wir Denotate von wohlgeformten Ausdrücken mit, indem wir diese zwischen Normstriche setzen. 1 Für n = 0 ergeben sich 0-stellige Relationen, die mit Wahrheitswerten identifiziert werden können, welche gerade wieder die passenden Extensionen 0-stelliger Prädikationen (d.h. Formeln) der Gestalt p P 0 q sind.
171
Tarski-Semantik MZ
syntaktische Kategorie
Denotat
semantischer Typ
t
Individuenterm
ktk
Objekt in D
φ
Formel
kφk
Wahrheitswert
P1
1-stellige Prädikatkonstante
kP 1 k
Menge von Objekten in D
P2
2-stellige Prädikatkonstante
kP 2 k
2-stellige Relation in D
Pn
n-stellige Prädikatkonstante
kP n k
n-stellige Relation in D
Die Denotate der deskriptiven Grundausdrücke der prädikatenlogischen Sprache L = LPL1I werden in einem Modell festgelegt. Ein Modell M für L spezifiziert einen Individuenbereich D und eine Zuordnung von typengerechten Denotaten zu den deskriptiven Grundausdrücken von L. Diese Zuordnung heißt auch Interpretationsfunktion des Modells und wird durch die Normstriche mitgeteilt. Da sie von Modell zu Modell wechselt, tragen die Normstriche einen unteren Index mit dem Namen des gegebenen Modells. Die Variablen, die zwar Individuenterme und Grundausdrücke sind, aber nicht zu den deskriptiven Grundausdrücken zählen, werden gesondert behandelt. Definition 6.7 Es sei L eine PL1(I)-Sprache. Ein Modell für L (kurz: LModell ) ist ein geordnetes Paar M = hD, k·kM i, bestehend aus einer nicht-leeren Menge D, Individuenbereich von M genannt, und einer Interpretationsfunktion von M , k · kM , deren Argumente die deskriptiven Grundausdrücke von L sind, und die die folgenden Bedingungen erfüllt: 1. Ist a eine Individuenkonstante, so ist kakM ein Element aus D; 2. ist P 0 eine 0-stellige Prädikatkonstante, so ist kP 0 kM ein Wahrheitswert; 3. ist n > 0 und ist P n eine n-stellige Prädikatkonstante, so ist kP n kM eine n-stellige Relation in D. Die Werte der Interpretationsfunktion sind die Denotate oder Extensionen der deskriptiven Grundausdrücke im Modell M . Nach der dritten Klausel sind speziell die Extensionen einstelliger Prädikatkonstanten einstellige Relationen in D oder Mengen von Elementen von D. Steht also etwa die einstellige Prädikatkonstante P für sprechen, so ist die Extension kP kM dieses Prädikats eine Menge von Individuen, denen im Modell M die Eigenschaft zu sprechen zukommt. Damit kann die Wahrheit der elementaren Prädikation P a in M für eine Konstante a einfach dadurch erklärt werden, daß das Denotat von a in M ein Element der Extension von P in M ist: (2)
P a ist wahr in M
gdw
kakM ∈ kP kM
Dies ist die Basis der modelltheoretischen Wahrheitsdefinition. In der formalen Semantik (hier in ihrer modelltheoretischen Version) wird die Relation der Prädikation, die philosophisch gesprochen der Subsumtion eines Objekts unter einen Begriff gleichkommt, durch die Elementschaftsbeziehung zwischen jenem Objekt und der Extension des Prädikats ausgedrückt. Da das Objekt ebenfalls
172
Semantik der Prädikatenlogik
eine Extension, nämlich die eines Individuenterms ist, wird die Wahrheit der elementaren Prädikation durch eine Beziehung zwischen Extensionen erklärt. Sowohl die Extensionen als auch die ∈-Relation sind mengentheoretische Objekte (dabei werden die Elemente des Individuenbereichs üblicherweise als Urelemente einer über ihnen aufgebauten angewandten Mengenlehre aufgefaßt). Dadurch wird der Wahrheitsbegriff mengentheoretisch definierbar und ist so einer mathematischen Behandlung zugänglich. Mit dieser Mathematisierung des zentralen Begriffs der Semantik geht allerdings eine theoretische Entscheidung einher, deren Brauchbarkeit sich in philosophischen Anwendungen zu bewähren hat und nicht automatisch gegeben ist: Da es in der elementaren Wahrheitsdefinition nur auf Extensionen ankommt, ändert sich die Wahrheitsbeziehung nicht, wenn die Bestandteile der Prädikation P a durch extensionsgleiche Ausdrücke ersetzt werden. Ist also in einem gegebenen Modell M die Extension von P gleich der eines anderen einstelligen Prädikats Q, oder ist die Extension der Konstante a gleich der einer anderen Konstante b, so ändert sich der Wahrheitswert von P a in M beim Übergang zu P b, zu Qa oder zu Qb nicht. Da die prädikatenlogischen Verknüpfungsregeln keine Kontexte erzeugen, die diese Ersetzbarkeit blockieren, gilt für die Prädikatenlogik das (3)
Extensionalitätsprinzip: Die prädikatenlogische Wahrheit ist invariant unter Extensionsgleichheit.
Die Deutung der Prädikation als Elementschaft in der Tarski-Semantik wurde bisher an einstelligen Prädikationen erläutert. Für höhere Stelligkeiten bleibt das Elementschaftsprinzip bestehen; es gilt aber nunmehr nicht zwischen Einzelobjekten und der Prädikatextension, sondern zwischen mehreren Objekten auf der einen Seite, die zu einem n-Tupel zusammengefaßt sind, und einer n-stelligen Relation. Im Fall n = 2 besteht sie also zwischen einem Paar von Individuen und einer 2-stelligen Relation. Ist diese etwa die Extension des 2-stelligen Prädikats P 2 , das für ist.größer.als stehen möge, so besteht die 2-stellige Relation kP 2 kM aus allen Paaren von Individuen, die in M in der größer.als-Relation stehen. Da es offensichtlich darauf ankommt, welches Objekt in den jeweiligen Paaren das Kleinere und welches das Größere ist, müssen diese Paare als geordnete Paare dargestellt werden. Dies geschieht in der Mengenlehre mit Hilfe der spitzen Klammern, so daß man im 2-stelligen Fall als Wahrheitsdefinition bekommt: (4)
P 2 ab ist wahr in M
gdw
hkakM , kbkM i ∈ kP 2 kM
Der allgemeine n-stellige Fall ist Bestandteil der vollständigen Wahrheitsdefinition für LPL1I , die sogleich angegeben wird. Zuvor müssen wir uns allerdings über den Status der Variablen in der modelltheoretischen Semantik Klarheit verschaffen. Als reine Platzhalter sollten sie keine selbständigen Extensionen im Modell erhalten, was in der obigen Modelldefinition auch nicht geschah. Trotzdem müssen wir einen Weg finden, offene Formeln der Gestalt P x zu interpretieren. In dem offenen Variablen-System, wie es die Tarski-Semantik darstellt, wird P x nicht als Kurzform für den Allabschluß ∀xP x aufgefaßt, sondern als kontextabhängige Aussage, die die Eigenschaft P einem Objekt d des Individuenbereichs zuspricht, welches gewissermaßen “vorübergehend”, ohne einen vom Modell gestifteten festen Zusammenhang, durch die Variable x vertreten wird.
173
Tarski-Semantik
Man sagt, das Objekt d erfülle die Matrix P x bezüglich der Variablen x. Um diesen Erfüllungsgedanken auf das obige Prädikationsschema zu bringen, definiert man eine Zuordnung von Individuen des Modells zu den Variablen der Sprache, die Variablenbelegung (engl. variable assignment) genannt wird. Variablenbelegungen sind Funktionen, d.h. jede Variable bekommt genau ein Individuum als Wert zugewiesen, aber es ist zugelassen, daß zwei verschiedene Variablen denselben Wert erhalten. Mit Hilfe der Variablenbelegungen kann man nun auch offenen Formeln einen Wahrheitswert zuordnen, allerdings nur in Abhängigkeit einer solchen Belegung. Ist also M ein Modell und ist β eine Variablenbelegung zu M , so gilt: (5)
P x ist wahr in M bezüglich β
gdw
β(x) ∈ kP kM
Eine derartige Relativierung der Wahrheit nicht nur auf das gegebene Modell, sondern auch auf eine spezielle Variablenbelegung, läßt sich zum Beispiel in der logischen Sprachanalyse verwenden, um indexikalische Aussagen zu modellieren. Ein Satz wie ‘er schläft’ hat selbst bei der gegebenen Interpretation von ‘schlafen’ in einem Modell keinen festen Wahrheitswert, da man nicht weiß, wer mit dem indexikalischen Ausdruck ‘er ’ gemeint ist. In der natürlichen Sprache wäre eine Variablenbelegung also vergleichbar mit einer “Verankerung” der indexikalischen Ausdrücke an geeignete Denotate in einer gegebenen Situation, die außersprachlich fixiert sein können, etwa durch Ostension, d.h. Zeigegesten. In der Logik ist natürlich eine derart “episodische” Wahrheit nicht der Gegenstand der Untersuchung; man spricht daher bei gegebenen Modell M statt der auf eine Variablenbelegung β relativierten Wahrheit auch einfach von der Erfüllung einer Formel φ durch M und β. Erst wenn φ stets von M und β erfüllt wird, und zwar unabhängig von der speziellen Wahl von β, nennt man φ wahr im Modell M . Der Wahrheitsbegriff ist damit nicht primär, sondern abgeleitet aus dem Erfüllungsbegriff; es ist diese Erfüllungsbeziehung, die wir rekursiv entlang dem Formelaufbau zu definieren haben. Es handelt sich dabei um eine Relation ‘|=’ zwischen einem Modell und einer zugehörigen Variablenbelegung einerseits und einer L-Formel andererseits. Bevor wir die formale Definition angeben, seien die in ihr auftretenden Klauseln kurz erläutert. Eine elementare Prädikation wird von einem Paar M, β erfüllt, wenn die Elementschaftsbeziehung zwischen den entsprechenden Denotaten besteht. Dies wurde bereits ausführlich besprochen; wir haben lediglich zu berücksichtigen, daß bei offenen Formeln für die vorkommenden Variablen nicht Extensionen in das Argument-n-Tupel eingehen, sondern die Werte der Variablen unter der Variablenbelegung β. Ein zweiter Typ von atomarer Formel sind die Gleichheiten der Gestalt p(s = t)q. Eine solche Formel wird von M, β genau dann erfüllt, wenn der Wert von s gleich dem Wert von t ist. Diese Festsetzung in der Semantik ist notwendig, weil die Gleichheitsaxiome allein die Objektgleichheit nicht erzwingen, sondern beliebige Äquivalenzrelationen als Interpretation des Identitätssymbols zulassen würden. Die Festlegung auf die Objektgleichheit in allen Modellen verschafft der Identität den Status von logischen Konstanten; diese können so charakterisiert werden, daß ihre Bedeutung in allen Modellen der Sprache gleichbleibt (z.B. ist die Bedeutung der Konjunktion stets die Minimum-Funktion auf den Wahrheitswerten, usw.). Wenn die Erfüllung von zwei Formeln φ und ψ bereits erklärt ist, so ergibt sich die Erfüllung einer junktorenlogischen Verknüpfung von φ und ψ wie bisher.
174
Semantik der Prädikatenlogik
Der kritische und zugleich zentrale Fall ist der einer Quantifikation der Form ∀xφ oder ∃xφ. Ihre Erfüllung muß in Abhängigkeit von der Erfüllung der kürzeren Teilformel φ erklärt werden. Nun bedeutet etwa die Allquantifikation ∀xφ ja intuitiv, daß die Formel φ bezüglich der Variablen x von allen Objekten des Individuenbereichs erfüllt wird: die Formel ∀xP x etwa ist wahr in einem Modell M , wenn jedes Objekt im Individuenbereich von M in der M -Extension von P liegt. Nun haben wir grundsätzlich die Erfüllungsbeziehung auf eine Variablenbelegung β zu relativieren. In dem normalen Fall, daß die Variable x in φ frei auftritt, ist φ eine offene Formel, deren Interpretation natürlich davon abhängt, welchen Wert β der Variablen x zuweist. Bei der Allquantifikation bezüglich x bleibt aber nach dem soeben Gesagten die Erfüllungsbeziehung bestehen, egal welchen Wert x annimmt; wenn wir also β zu einer Variablenbelegung β 0 abändern, die an der Stelle x einen gegebenen Wert d hat und sonst wie β ist, so können wir die Semantik der Allquantifikation ∀xφ folgendermaßen beschreiben: sie wird von einem gegebenen Paar M, β erfüllt, wenn die Matrix φ von allen Paaren M, β 0 erfüllt wird, wobei β 0 aus β entsteht, indem als Werte für die Variable x alle Objekte des Individuenbereich durchlaufen werden. Analog wird ein Existenzsatz ∃xφ von M, β erfüllt, wenn das Paar M, β 0 für mindestens eine Abänderung β 0 die Matrix φ erfüllt. Diese Überlegungen motivieren die folgenden Definitionen. Definition 6.8 Es sei M ein L-Modell und D der Individuenbereich von M ; eine Variablenbelegung zu M (kurz: M-Belegung) ist eine Funktion β von der Menge der L-Variablen in den Individuenbereich D. Definition 6.9 Es sei M ein L-Modell, D der Individuenbereich von M und β eine M -Belegung; x sei eine Variable und d ein Element von D. Dann ist die (x, d)-Variante von β diejenige M -Belegung, die allen Variablen bis auf x denselben Wert wie β zuweist und für x selbst den Wert d annimmt. Bezeichnung: β(x : d). Wir sind nun in der Lage, die angekündigte induktive Definition der Erfüllungsrelation anzugeben. Als letzte Vorbereitung, die der geschlossenen Darstellung zugute kommt, vereinbaren wir eine einheitliche Notation für die Denotate von Individuentermen. Definition 6.10 Es sei t ein Individuenterm der Sprache L, M ein L-Modell und β eine M -Belegung. Dann ist das Term-Denotat tM,β von t in M bezüglich β wie folgt definiert:
t
M,β
=
(
β(t)
falls t eine Variable ist
ktkM
falls t eine Konstante ist
(6)
Definition 6.11 Induktive Definition der Relation M erfüllt φ mit β (in Zeichen: M, β |= φ) für eine L-Formel φ, ein L-Modell M mit Individuenbereich D und eine M -Belegung β: 1. φ sei eine atomare Formel der Gestalt P n t0 . . . tn−1 ; dann gilt: M, β |= P n t0 . . . tn−1
gdw
n htM,β , . . . , tM,β 0 n−1 i ∈ kP kM
175
Tarski-Semantik 2. φ sei eine atomare Formel der Gestalt s = t; dann gilt: M, β |= s = t
gdw
sM,β und tM,β sind dasselbe Individuum
3. φ sei eine Formel der Gestalt ¬ψ; dann gilt: gdw
M, β |= ¬ψ
es gilt nicht: M, β |= ψ
4. φ sei eine Formel der Gestalt ψ ∨ χ; dann gilt: M, β |= ψ ∨ χ
gdw
M, β |= ψ oder M, β |= χ
5. φ sei eine Formel der Gestalt ψ ∧ χ; dann gilt: gdw
M, β |= ψ ∧ χ
M, β |= ψ und M, β |= χ
6. φ sei eine Formel der Gestalt ψ → χ; dann gilt: M, β |= ψ → χ
gdw
[ M, β |= ψ ⇒ M, β |= χ ]
7. φ sei eine Formel der Gestalt ψ ↔ χ; dann gilt: M, β |= ψ ↔ χ
gdw
[ M, β |= ψ ⇔ M, β |= χ ]
8. φ sei eine Formel der Gestalt ∀xψ; dann gilt: M, β |= ∀xψ
gdw
für alle d ∈ D : M, β(x : d) |= ψ
9. φ sei eine Formel der Gestalt ∃xψ; dann gilt: M, β |= ∃xψ
gdw
es gibt ein d ∈ D : M, β(x : d) |= ψ
Bemerkung. Das Symbol für die Erfüllungsrelation, ‘|=’, wurde in der Aussagenlogik bereits verwendet, allerdings in einem anderen Sinn. Dort stand es für die Folgerungsbeziehung zwischen (Mengen von) Formeln und Formeln, während es hier eine Relation zwischen Modellen (plus Variablenbelegungen) und Formeln bezeichnet. In beiden Bedeutungen handelt es sich aber um eine semantische Beziehung; die Notation mit dem waagerechten Doppelstrich, die ihr Gegenstück in dem syntaktischen Ableitbarkeitszeichen ‘`’ mit dem einfachen Strich hat, deutet dies an. Wir werden das Zeichen ‘|=’ auch in der Prädikatenlogik im Sinne der logischen Folgerung verwenden; da wir aber die Mitteilungszeichen für Formelmengen bzw. Formeln einerseits und Modelle andererseits stets auseinanderhalten, geht aus dem Kontext jeweils klar hervor, ob es sich um die Erfüllungsrelation oder die logische Folgerung handelt. Die folgende Definition stellt die zentralen semantischen Begriffe wie Wahrheit, Gültigkeit, Erfüllbarkeit, logische Folgerung für die Prädikatenlogik mit Identität zusammen. Neben dem üblichen Erfüllbarkeitsbegriff und dem soeben induktiv definierten Erfüllungsbegriff halten wir auch die Beziehung der Erfüllung einer Formel durch ein Individuum in einer eigenen definitorischen Bestimmung fest.
176
Semantik der Prädikatenlogik
Definition 6.12 Es seien φ, ψ L-Formeln, Σ eine Menge von L-Formeln, und M ein L-Modell. β sei eine M -Belegung, x eine Variable und d ein Element des Individuenbereichs von M . 1. d erfüllt φ in M bei β bezüglich x, wenn gilt: M, β(x : d) |= φ. Bezeichnung: d satM,β,x φ 2. Ist in φ höchstens x frei, so erfüllt M mit dem Individuum d die Formel φ, wenn für eine (oder jede) Belegung β, die x mit d belegt, d.h. für β mit β(x) = d, gilt: M, β |= φ; Bezeichnung: M |= φ [[ d ]]. 3. φ heißt wahr in M , wenn M φ mit jeder Belegung erfüllt, d.h. wenn für jede M -Belegung β gilt: M, β |= φ. M wird dann auch ein Modell von φ genannt. Bezeichnung: M |= φ. φ ist falsch in M , wenn φ nicht wahr in M ist, d.h. wenn es eine M Belegung β gibt mit M, β 2 φ. 4. M ist ein Modell von Σ, wenn jede Formel in Σ wahr in M ist. Bezeichnung: M |= Σ 5. φ heißt (L-)logisch wahr oder (L-)gültig, wenn φ wahr in jedem L-Modell ist. 6. φ heißt (L-)erfüllbar (engl. satisfiable), wenn es ein Modell M und eine M -Belegung β gibt mit M, β |= φ. 7. φ heißt (L-)kontradiktorisch, wenn φ nicht erfüllbar ist. 8. φ folgt (L-)logisch aus Σ, wenn für jedes Modell M und jede M -Belegung β gilt: erfüllt M mit β jede Formel in Σ, so erfüllt M mit β auch φ; Bezeichnung: Σ |= φ. 9. φ folgt (L-)logisch aus ψ, wenn φ L-logisch aus der Einermenge Σ = {ψ} folgt, d.h. wenn für alle M, β mit M, β |= ψ gilt: M, β |= φ; Bezeichnung: ψ |= φ. 10. φ und ψ heißen (L-)logisch äquivalent, wenn φ aus ψ und ψ aus φ L-logisch folgt. Bezeichnung: φ ≡ ψ Bemerkungen. 1. Gegeben sei eine Formel φ mit höchstens einer freien Variablen x sowie ein L-Modell M = hD, k · kM i. Dann kann man die Menge aller Individuen d ∈ D betrachten, mit denen M φ erfüllt. Dann ergibt sich eine (1-stellige) Relation R ⊆ D, die in M durch φ bestimmt ist. Man nennt R die durch φ in M definierte Relation: (7)
R = { d ∈ D | M |= φ [[ d ]] } . Ist z.B. φ = P x, so ist die von φ in M definierte Relation gerade die Extension kP kM von P in M . Es ist eine wichtige logische Fragestellung, welche Relationen in D durch eine L-Formel definierbar sind. Beispiel 6.2 Sei Lar = L1 [+] eine arithmetische Sprache erster Stufe und . φ[x] = x+x = x. Dann ist die durch φ in dem sogenannten Standardmodell oder der Standardstruktur N der natürlichen Zahlen definierte Relation die folgende Teilmenge von N:
177
Tarski-Semantik (8)
{ n ∈ N | N |= φ [[ n ]] } = { n ∈ N | n + n = n } = {0}
Also ist die Einermenge, die nur aus der Zahl 0 besteht, in der Standardstruktur der natürlichen Zahlen definierbar. Man sagt dann auch, die Zahl 0 selbst sei in N definierbar. 2. Die obige Definition der logischen Folgerung sieht gegenüber derjenigen in der Aussagenlogik relativ kompliziert aus. Eine einfachere Version wäre derselbe Wortlaut wie in der Aussagenlogik: 80 . φ folgt (L-)logisch aus Σ, wenn jedes Modell von Σ auch ein Modell von φ ist. Diese Bestimmung ist jedoch mit der obigen nur dann äquivalent, wenn die Formelmenge Σ zusammen mit φ eine Menge von Sätzen, also von geschlossenen Formeln ist. Würde jede Formel semantisch äquivalent zu ihrem Allabschluß behandelt, so wäre die einfachere Version adäquat; unser offenes Variablensystem, in dem offene Formeln von ihren Allabschlüssen semantisch verschieden sind, führt dagegen zu der angegebenen Definition. Übung 6.2 Zeigen Sie, daß die folgende Beziehung gültig ist unter der Definition 80 ., aber nicht unter 8. (9)
P x |= ∀xP x
Wahrheitsbedingungen Wir wollen nun anhand zweier Beispiele demonstrieren, wie man die Wahrheitsbedingungen spezieller Formeln bestimmt. Die Wahrheitsbedingungen einer Formel φ geben Anwort auf die Frage, unter welchen Umständen φ in einem gegebenen Modell M wahr ist. Nach Definition heißt Wahrheit von φ in M , daß φ für alle M -Belegungen β von M, β erfüllt wird. . Beispiel 6.3 Wahrheitsbedingungen der Formel φ = ∃xP x. Sei M ein Modell, D der Individuenbereich von M und β eine beliebige M -Belegung.
M, β |= ∃xP x
gdw gdw gdw
es gibt ein d ∈ D : M, β(x : d) |= P x es gibt ein d ∈ D : d ∈ kP kM
(10)
kP kM 6= ∅
Da diese Bedingung für beliebige M -Belegungen β richtig ist (β tritt in ihr gar nicht mehr auf), gilt sie für alle solche β. Die notwendige und hinreichende Wahrheitsbedingung für die Wahrheit von ∃xP x lautet also, daß die Extension von P in M nicht leer ist, daß es also mindestens ein Objekt im Individuenbereich von M mit der Eigenschaft P gibt; dies ist das intuitiv erwartete Ergebnis. (11)
M |= ∃xP x
gdw
kP kM 6= ∅
. Beispiel 6.4 Wahrheitsbedingungen der Formel φ = ∀x(P x → Qx); M, D, β wie oben.
178
Semantik der Prädikatenlogik
M, β |= ∀x(P x → Qx)
gdw gdw gdw gdw
f. alle d ∈ D : M, β(x : d) |= (P x → Qx)
f. alle d ∈ D : [ M, β(x : d) |= P x ⇒ M, β(x : d) |= Qx ] (12) f. alle d ∈ D : [ d ∈ kP kM ⇒ d ∈ kQkM ] kP kM ⊆ kQkM
Wiederum hängt diese Bedingung nicht von β ab. Wir bekommen also: (13)
M |= ∀x(P x → Qx)
gdw
kP kM ⊆ kQkM
Die Wahrheitsbedingung für einen bedingten Allsatz lautet damit, daß die Extension des Antecedens-Prädikats eine Teilmenge der Extension des Prädikats im Consequens ist. Auch dies ist intuitiv korrekt. Übung 6.3 Berechnen Sie die Wahrheitsbedingungen für die folgenden Formeln: (14)
a. b. c. d.
∃x(P x ∧ Qx)
∀x(P x → (Qx ∨ Rx))
∀x∃yP 2 xy
∃y∀xP 2 xy
Die Extensionen einstelliger Prädikate sind Teilmengen des Individuenbereichs. Man kann sie also mit Hilfe von Venn-Diagrammen graphisch veranschaulichen. Dies ist in den folgenden Figuren geschehen. Die Punkte der Rechteckfläche stellen dabei die Elemente des Individuenbereichs D eines Modells M dar, und die Flächen der Ovale die Extensionen der Prädikate. Beispiel 6.5 Die erste Abbildung zeigt ein Modell für die Formel ∃xP x ∧ ∃xQx, welches zugleich die Formel ∃x(P x ∧ Qx) falsch macht. Damit wird ebenfalls ein Gegenmodell für die Umkehrung der Verteilung des Existenzquantors über die Konjunktion gegeben; die Abbildung veranschaulicht also ein Modell M mit den folgenden Beziehungen: (15)
a. b. c.
M |= ∃xP x ∧ ∃xQx M 6|= ∃x(P x ∧ Qx)
M 6|= ∃xP x ∧ ∃xQx → ∃x(P x ∧ Qx)
Beispiel 6.6 Im Gegensatz zu dem vorigen Beispiel sieht ein Modell der Formel ∃x(P x ∧ Qx) wie in Abbildung 6.2 aus. Die Abbildung veranschaulicht den allgemeinen Sachverhalt, daß in jedem Modell M der Formel ∃x(P x ∧ Qx) die Extensionen von P und Q nicht-leer sind und mindestens ein gemeinsames Element besitzen (d.h. ihr mengentheoretischer Durchschnitt ist ebenfalls nicht-leer). Daß beide Extensionen nicht-leer sind, reicht aber bereits dafür aus, daß die Konjunktion der Existenzsätze ∃xP x und ∃xQx wahr in M ist; folglich ist M auch ein Modell des Verteilungsschemas des Existenzquantors über die Konjunktion, und es gilt:
179
Tarski-Semantik
D
x
x
kP k
kQk
Abbildung 6.1: Modell für ∃xP x ∧ ∃xQx; Gegenmodell für ∃x(P x ∧ Qx)
D
x
kP k
kQk
Abbildung 6.2: Modell für ∃x(P x ∧ Qx) und ∃xP x ∧ ∃xQx
(16)
a. b. c.
M |= ∃x(P x ∧ Qx)
M |= ∃xP x ∧ ∃xQx
M |= ∃x(P x ∧ Qx) → ∃xP x ∧ ∃xQx
Die Veranschaulichung mittels eines Diagramms ist natürlich kein formaler Beweis. Genaugenommen müßten in diesen Beispielen spezielle Modelle definiert werden, welche die illustrierten Eigenschaften besitzen. Das geschieht am besten dadurch, daß man für ein solches Modell gerade diese Eigenschaften spezifiziert und alle irrelevanten Details beiseite läßt. Zum Beispiel benötigt man für ein Modell der ersten Art (Beispiel 6.5) lediglich einen Individuenbereich D mit zwei verschiedenen Elementen, etwa d und e, und definiert als die Extension von P die “Einermenge” {d}, die gerade aus dem Element d besteht, und als die Extension von Q die Einermenge {e}; dann sind die Wahrheitsbedingungen sowohl von ∃xP x als auch von ∃xQx erfüllt, aber nicht die von ∃x(P x∧Qx). Im zweiten Beispiel reicht sogar ein Individuenbereich D mit einem Element, etwa d aus, zusammen mit der Spezifikation kP k = kQk = D, und die genannten Formeln sind alle erfüllt.
180
Semantik der Prädikatenlogik
In komplizierteren Beispielen ist eine Veranschaulichung durch eine Skizze häufig nicht im gewünschten Maße hilfreich, und die formale Spezifikation eines Modells ist unumgänglich. Ein Beispiel dieser Art liegt vor, wenn man etwa die Frage stellt, ob die Reihenfolge von All- und Existenzquantor im allgemeinen vertauscht werden kann. Wir werden unten beweisen, daß das Konditional in (17a) gültig ist, die Umkehrung in (17b) jedoch nicht: (17)
a. b.
|= ∃y∀xφ → ∀x∃yφ
6|= ∀x∃yφ → ∃y∀xφ
Um nun ein Gegenmodell für die Umkehrung zu geben, reicht es aus, ein Modell zu finden, welches mindestens eine Instanz dieses Formelschemas widerlegt. Beispiel 6.7 Ein Gegenmodell M für die Umkehrung in (17b) ergibt sich wie folgt. Die Matrix φ wird auf die Formel P 2 xy spezialisiert, welche eine 2stellige Relation ausdrückt. Der Individuenbereich D von M sei die Menge N der natürlichen Zahlen, und die Extension kP 2 kM sei die Menge der geordneten Paare hd, ei von natürlichen Zahlen mit d < e. Dann gibt es in N zu jeder Zahl d offenbar eine Zahl e mit d < e; aber es gibt keine größte natürliche Zahl, d.h. eine solche, die im gegebenen Modell bezüglich der Variablen y die Matrix ∀xP 2 xy des Consequens erfüllt. (Hier werden natürlich arithmetische Fakten in der Metaprache benützt, zu der die modelltheoretische Semantik gehört.) Übung 6.4 Widerlegen Sie die folgenden L-Formeln durch Angabe eines Gegenmodells und formale Falsifikation der Wahrheitsbedingungen. (18)
a. b. c.
∀xP 2 xx
∀x(P x → Qx ∨ Rx)
∀x∀y(Q2 xy → Q2 yx)
In den Beispielen 6.3 und 6.4 sahen wir, daß die Erfüllungsbeziehung gar nicht von der gegebenen Belegung abhing. Das hat seinen Grund darin, daß die behandelten Formeln ∃xP x und ∀x(P x → Qx) Sätze sind, also keine freien Variablen enthalten. Dies ist der Spezialfall einer allgemeinen Koinzidenzaussage für zwei Variablenbelegungen in einem Modell M : ordnen sie den freien Variablen einer Formel φ denselben Wert zu, so wird φ in M genau dann bezüglich der einen Belegung erfüllt, wenn dies auch bezüglich der anderen der Fall ist. Satz 6.2 (Koinzidenzlemma) Es seien φ eine L-Formel und FV (φ) die Menge der in φ frei auftretenden Variablen. Ferner seien M ein L-Modell und β, β 0 zwei M -Belegungen mit β(x) = β 0 (x) für alle Variablen x in FV (φ). Dann gilt: M, β |= φ gdw M, β 0 |= φ Der Beweis wird mit Induktion nach dem Formelaufbau geführt. 1. Induktionsanfang. Der Formelgrad γ(φ) ist = 0, d.h. φ ist atomar.
181
Tarski-Semantik
. 1.1 φ = P n t0 . . . tn−1 . Dann gilt für alle i < n: ist ti eine Variable, so ist β(ti ) = β 0 (ti ), und nach der Definition 6.10 des Term-Denotats folgt tM,β = β(ti ) = β 0 (ti ) = tM,β i i
0
0
Ist ti dagegen eine Konstante, so haben wir auf jeden Fall tM,β = tiM,β , i da dann das Term-Denotat gleich kti kM ist und gar nicht von einer Variablenbelegung abhängt. Insgesamt bekommen wir also: tM,β = tM,β i i
0
für alle i < n
Dann gilt aber: M, β |= φ
gdw gdw gdw
n htM,β , . . . , tM,β 0 n−1 i ∈ kP kM 0
0
n ht0M,β , . . . , tM,β n−1 i ∈ kP kM
M, β 0 |= φ
. 1.2 φ = (s = t). Dieser Fall wird wie in 1.1 behandelt. 2. Induktionsschritt. Der Formelgrad γ(φ) ist größer als 0. Dann gilt die Behauptung für alle kürzeren Formeln ψ mit einem Grad < γ(φ); dies ist die Induktionsvoraussetzung (I.V.), die genauer lautet: (*) Für alle ψ mit γ(ψ) < γ(φ) und für alle Belegungen β, β 0 mit β(x) = β 0 (x) für alle freien Variablen x in ψ gilt: M, β |= ψ
gdw
M, β 0 |= ψ
. 2.1 φ = ¬ψ; dann gilt nach I.V. (*) für ψ, was äquivalent ist mit M, β 2 ψ
gdw
M, β 0 2 ψ
Also bekommen wir die Äquivalenzen M, β |= φ
gdw gdw
M, β 2 ψ M, β 0 2 ψ
gdw
M, β 0 |= φ
. 2.2 φ = ψ0 ∨ ψ1 ; nach I.V. gilt für i = 0, 1, da γ(ψi ) < γ(φ): M, β |= ψi
gdw
M, β 0 |= ψi
Damit haben wir: M, β |= φ
gdw gdw gdw
M, β |= ψ0 oder M, β |= ψ1 M, β 0 |= ψ0 oder M, β 0 |= ψ1 M, β 0 |= φ
. . 2.3 φ = ψ0 Jψ1 für J = ∧, →, ↔; diese Fälle sind analog zu 2.2.
182
Prädikatenlogik
. 2.4 φ = ∀yψ; dann gilt γ(ψ) < γ(φ), da in ψ ein Vorkommen eines logischen Zeichens von φ, der Front-Quantor, fehlt. Ferner ist y in φ eine gebundene Variable, also y 6∈ FV (φ). Dagegen ist y in ψ (im interessanten Fall2 ) frei, d.h. wir haben FV (ψ) = FV (φ) ∪ {y} oder jedenfalls FV (ψ) ⊆ FV (φ) ∪ {y}. Da die Induktionsvoraussetzung auf ψ angewendet werden soll, müssen wir die Wertegleichheit der Belegungen nicht nur für die freien Variablen von φ sicherstellen, sondern auch für die Variable y. Dies gelingt, weil wir im vorliegenden Quantorenfall nicht an den Ausgangsbelegungen β, β 0 interessiert sind, sondern “gleichmäßig” für alle d ∈ D an den Varianten β(y : d) und β 0 (y : d). Für diese gilt ja nach Definition: β(y : d)(y) = d = β 0 (y : d)(y) für alle d ∈ D; und weil y nicht zu den freien Variablen von φ gehört, haben wir ferner für alle x ∈ FV (φ): β(y : d)(x) = β(x) = β 0 (x) = β 0 (y : d)(x) Also gilt (*) für ψ, und die I.V. liefert für alle d ∈ D: M, β(y : d) |= ψ
gdw
M, β 0 (y : d) |= ψ
Dann haben wir aber: M, β |= φ
gdw gdw gdw
für alle d ∈ D : M, β(y : d) |= ψ für alle d ∈ D : M, β 0 (y : d) |= ψ
M, β 0 |= φ
. 2.5 φ = ∃yψ; analog zu 2.4. Damit sind alle Fälle des Induktionsschritts behandelt, und die Behauptung des Satzes folgt mit dem Induktionsprinzip. Als unmittelbare Folgerung des Koinzidenzlemmas ergibt sich der Satz 6.3 Es seien M, φ wie oben und φ eine geschlossene Formel. Dann hängt die Erfüllung von φ in M nicht von der Belegung ab. Also ist φ in M schon dann wahr, wenn M φ bezüglich mindestens einer (und damit jeder) Belegung erfüllt wird. Schließlich halten wir ohne Beweis fest, daß die wichtigen Formelschemata des Satzes 6.1 auch in der modelltheoretischen Semantik logische Wahrheiten darstellen. Die Beweise werden in Kapitel 12 geführt. Satz 6.4 In der modelltheoretischen Semantik sind die Formelschemata des Satzes 6.1 gültig, speziell also die Prinzipien der Allspezialisierung und Existenzabschwächung, die Prinzipien der Äquivalenzrelation für die Identität sowie das Leibniz-Prinzip. Übung 6.5 Führen Sie die fehlenden Fälle im Induktionsbeweis des Koinzidenzlemmas aus. 2 D.h.
wenn der äußerste y-Quantor in φ nicht “leerläuft”, was zugelassen ist.
183
Semantik der Logik PL1IKA
6.3
Semantik der Logik PL1IKA
Wir wenden uns nun der genauen Definition der grundlegenden semantischen Begriffe für die Prädikatenlogik mit Identität, Kennzeichnungen und Abstraktion zu. Für die Erfüllbarkeitsrelation |= in PL1IKA nehmen wir folgende Änderungen bzw. Erweiterungen gegenüber der bisherigen Erfüllbarkeit vor. Gleichheiten können fortan nur dann erfüllt bzw. wahr sein, wenn die beteiligten Terme denotieren. Der Satz E!t ist erfüllt, wenn t denotiert, d.h. wenn t ein Denotat hat, das ein Element des Individuenbereichs D ist. Nach der in Abschnitt 4.7 getroffenen Festsetzung ist das für Individuenkonstanten a stets der Fall; Sätze der Gestalt E!a werden damit in jedem Modell wahr. Ein Kennzeichnungsterm der Form (ιxφ) denotiert, wenn es genau ein Element in D gibt, das φ bezüglich x erfüllt. Ist das nicht der Fall, so erhält die Kennzeichnung keinen Wert; dann kann die Elementschaftsbeziehung nicht bestehen, und die Erfüllung der entsprechenden Prädikation schlägt fehl. Einem λ-Ausdrück der Form (λxφ) schließlich ordnen wir, wie oben bereits gesagt, als Extension die Menge derjenigen Elemente von D zu, die φ bezüglich x erfüllen. Am Modell-Begriff selbst ändert sich dabei zunächst noch nichts: Definition 6.13 Ein L0 -Modell ist wie ein L-Modell definiert; siehe Definition 6.7. Entsprechendes gilt für den Begriff der Variablenbelegung zu einem L0 -Modell und der (x, d)-Variante β(x : d) (Definitionen 6.8 und 6.9). Wir sahen oben, daß die L0 -Formeln nur unter Bezugnahme auf λ- bzw. ιTerme und umgekehrt induktiv definiert werden konnten. Dasselbe gilt nun auch für die semantischen Begriffe, die zu den wohlgeformten Ausdrücken der verschiedenen Kategorien gehören. Wir müssen also ebenfalls simultan die Begriffe der Erfüllung einer Formel, des Denotats eines Individuenterms und Extension eines Prädikats induktiv definieren. Definition 6.14 Es seien M ein L0 -Modell und β eine M -Belegung. Dann sind die Begriffe der Erfüllung einer Formel φ in M bezüglich β, M, β |= φ, des Denotats tM,β eines Terms t in M bezüglich β sowie der Extension π M,β eines einstelligen Prädikats π in M bezüglich β simultan induktiv wie folgt definiert: 1. Ist t eine Variable, so ist tM,β = β(t); ist t eine Konstante, so ist tM,β = ktkM ; 2. ist P n eine n-stellige Prädikatkonstante, und sind t0 , . . . , tn−1 Individuenterme, so gilt: M, β |= P n t0 . . . tn−1
gdw
tM,β ∈ D (i < n) i
und
n htM,β , . . . , tM,β 0 n−1 i ∈ kP kM
3. ist π ein einstelliges Prädikat und t ein Individuenterm, so gilt: M, β |= πt
gdw
tM,β ∈ D und tM,β ∈ π M,β
4. ist t ein Individuenterm, so gilt: M, β |= E!t
gdw
tM,β ist definiert, und tM,β ∈ D
184
Prädikatenlogik
5. sind s und t Individuenterme, so gilt: M, β |= s = t
gdw
sM,β , tM,β ∈ D, und sM,β = tM,β
6. ist φ eine aussagenlogische Verknüpfung der Gestalt ¬ψ oder ψJχ, oder ist φ eine Quantifikation der Gestalt ∀xψ oder ∃xψ, so gelten die bisherigen Bedingungen für M, β |= φ;
7. ist π ein λ-Ausdruck der Form (λxφ), so ist π M,β die Menge der Elemente d ∈ D mit M, β(x : d) |= φ; in Formeln: (λxφ)M,β = { d ∈ D | M, β(x : d) |= φ }
8. ist t ein Kennzeichnungsterm der Gestalt (ιxφ), so ist tM,β gleich einem Element d ∈ D, sofern d die Formel φ bezüglich x erfüllt und das einzige Individuum in D mit dieser Eigenschaft ist; andernfalls hat tM,β keinen Wert; in Formeln: falls M, β(x : d) |= φ und d M,β für alle e mit M, β(x : e) |= φ gilt: e = d t = undefiniert sonst
Definition 6.15 Die semantischen Begriffe der Erfüllung einer Formel durch ein Individuum, d satM,β,x φ, der Wahrheit in einem Modell , der logischen Wahrheit, der logischen Folgerung etc. für L0 ist wie für die Sprache L erklärt; siehe Definition 6.12. Beispiel 6.8 Sei M ein L0 -Modell, D der Individuenbereich von M und β eine M -Belegung. Die Extension des λ-Ausdrucks (λxP x) in M berechnet sich dann wie folgt (der Wert dieses geschlossenen Ausdrucks hängt nicht von β ab): (λxP x)M,β = { d ∈ D | M, β(x : d) |= P x }
= { d ∈ D | xM,β(x:d) ∈ kP kM } = { d ∈ D | d ∈ kP kM }
(19)
= kP kM
Man sieht, daß die λ-Abstraktion bezüglich einer atomaren Formel der Gestalt P x semantisch einfach die Extension von P ergibt. In diesem Fall ist eine solche Abstraktion redundant. Die Stärke des λ-Operators besteht in der Möglichkeit, Mengen im Individuenbereich einzugrenzen, die nicht die Extensionen elementarer Prädikatkonstanten sind (für Beispiele siehe Kapitel 4). Übung 6.6 Berechnen Sie die Extensionen der folgenden λ-Ausdrücke in einem L0 -Modell. (20)
a. b. c.
(λx¬Qx) (λx(P x ∧ ¬Qx)) (λx∃y(P y ∧ R2 yx))
Finden Sie für die drei λ-Ausdrücke natürlichsprachliche Beispiele. Übung 6.7 Verifizieren Sie die semantische Gültigkeit des Bikonditionals E!(ιxφ) ↔ (ιxφ) = (ιxφ).
Kapitel 7
Kalkül des natürlichen Schließens: Aussagenlogik Ein logisches Argument setzt sich zusammen aus einer Menge Σ von Prämissen und einer Konklusion φ, die mit Hilfe logischer Regeln aus Σ gewonnen wurde; ist das Argument gültig, so besteht zwischen Σ und φ die Beziehung der logischen Folgerung. Wenn diese Folgerungsbeziehung aussagenlogischer Natur ist, so bedeutete das, daß φ bei allen AL-Belegungen wahr ist, bei denen jede Formel in Σ wahr ist, oder auch, daß jedes aussagenlogische Modell von Σ auch ein Modell von φ ist. Symbolisch hatten wir diesen Zusammenhang wie folgt mitgeteilt: Σ |= φ Ein semantischer Beweis dieser metalogischen Aussage besteht darin, den Wahrheitstransfer von Σ auf φ für alle Belegungen zu verifizieren. Da wir aufgrund des Koinzidenzlemmas nur Belegungen untersuchen müssen, die sich in den Satzkonstanten von φ unterscheiden, ist das zwar ein entscheidbares Problem, aber jedenfalls nicht sehr effizient. In der Prädikatenlogik wird sich jedoch zeigen, daß wir keine entscheidbare Kontrolle mehr über die logische Folgerung haben.
Diese Situation führt zur Idee der Kalkülisierung der Logik. Man definiert ein syntaktisches Beweisverfahren, das es gestattet, logische Folgerungen aus einer Formelmenge Σ ohne Ansehung der semantischen Bedeutung mittels gewisser Schlußregeln in jeweils endlich vielen Schritten abzuleiten. Besteht die Beziehung der Herleitbarkeit zwischen Σ und φ, so schreibt man: Σ
`
φ
Ein solcher Beweiskalkül sollte gewissen Adäquatheitsbedingungen genügen; dazu zählen vor allem die folgenden: • Der Beweisbegriff sollte entscheidbar sein, d.h. für jede vorgelegte BeweisBehauptung sollte in endlich vielen Schritten festzustellen sein, ob es sich um einen Beweis handelt oder nicht. • Der Kalkül sollte semantisch korrekt sein, d.h. eine Formel φ, die aus einer Formelmenge Σ mit Hilfe des Kalküls abgeleitet wurde, sollte auch aus Σ logisch folgen. 185
186
Natürliches Schließen: Aussagenlogik
• Der Kalkül sollte semantisch vollständig sein, d.h. alle logischen Folgerungen aus Σ sollten im Kalkül aus Σ herleitbar sein Für die Standardkalküle der Aussagenlogik und der Prädikatenlogik der ersten Stufe sind diese Bedingungen erfüllt. Für die elementare Logik (also Aussagenlogik und Prädikatenlogik der ersten Stufe) sind eine ganze Anzahl von Kalkülen entwickelt worden, die den obigen Adäquatheitsbedingungen genügen.1 In ihren Merkmalen und den Zielen unterscheiden sie sich mehr oder minder stark voneinander. Hier seien die folgenden drei Haupttypen genannt: • Axiomatischer Kalkül • Tableaux- oder Baum-Kalkül • Kalkül des natürlichen Schließens Der axiomatische Kalkül ist besonders für metalogische Untersuchungen geeignet. Wie der Name sagt, besteht ein solcher Kalkül, auch Hilbert-Kalkül genannt, aus einer Menge von Axiomen und Schlußregeln, die möglichst auf ein Minimum reduziert sind. Grundlagenfragen in der mathematischen Logik, der Metamathematik sowie der Philosophie der Logik und Mathematik werden typischerweise anhand axiomatischer Systeme diskutiert. Auf den axiomatischen Kalkül kommen wir in den späteren Kapiteln zurück. Der Baum-Kalkül eignet sich vor allem für algorithmische und informatische Anwendungen. Ihm liegt die Idee des indirekten Beweises zugrunde: Eine Formel φ ist gültig, wenn alle Versuche, ihr Gegenteil zu erfüllen, scheitern. Diese Methode hat zu sehr effizienten Beweisverfahren geführt.2 Für eine Einführung in die Logik schließlich eignet sich am besten eine Spielart des dritten Kalkültyps, des Kalküls des natürlich Schließens,3 da in ihm die informelle Praxis des Beweisens, wie sie typischerweise von Mathematikern und anderen mit Beweisen befaßten Theoretikern befolgt wird, am besten repräsentiert ist. In den Anwendungen der Logik , sei es in mathematischen, naturwissenschaftlichen oder auch philosophischen Theorien, ist die Logik nicht Gegenstand der Untersuchung, sondern Instrument; der Kalkül des natürlichen Schließens formalisiert im gewissen Sinn den natürlichen Gang von Argumentationen in solchen Anwendungen. Charakteristisch für diesen Kalkültyp ist der Umstand, daß er keine Axiome, sondern nur Ableitungsregeln kennt. Der Kalkül wird hier zunächst eingeübt und später dazu verwendet werden, die elementaren Tatsachen der Mengenlehre (Klassenalgebra, Relationen und Funktionen) herzuleiten. Die hier gewählte Version des natürlichen Schließens ist der besonders übersichtliche Kalish-Montague-Kalkül (kurz: KM-Kalkül ).4 Intuitiv gesprochen ist eine Formel φ aus einer Formelmenge Σ im KM-Kalkül herleitbar, wenn sie in 1 Für einen Überblick über die verschiedenen Verfahren und den Nachweis ihrer Äquivalenz siehe [245]. 2 Siehe z.B. [71]. Zur Metatheorie dieses Kalküls siehe [229]. 3 Dieser Kalkültyp geht auf den Logiker G. Gentzen zurück; siehe seine Untersuchungen über das logische Schließen [93]. 4 Siehe [132]. Die hier gemachten Ausführungen stellen den Kalkül in kompakter Form vor. Für ausführlichere Informationen sei das Buch empfohlen, das sich auch hervorragend zum Selbststudium eignet.
AL-Beweise
187
Form eines “KM-gerechten” Beweises aufgrund von Prämissen aus Σ mit Hilfe der offiziellen Schlußregeln des Kalküls abgeleitet werden kann. Ist dies der Fall, so schreiben wir: Σ `KM φ
Wenn die Menge Σ leer ist, d.h. wenn die Formel φ ohne Prämissen herleitbar ist, heißt φ herleitbar im KM-Kalkül oder ein KM-Theorem. Wir werden die semantische Adäquatheit des Kalküls hier nicht vollständig beweisen, sondern nur zeigen, daß er korrekt ist: Satz 7.1 Der KM-Kalkül ist semantisch korrekt, d.h. jede aus einer Prämissenmenge im Kalkül herleitbare Formel ist auch eine logische Folgerung aus dieser Prämissenmenge.
Der Beweis dieses Satzes wird in zwei Etappen gegeben. Im vorliegenden Kapitel wird nur der aussagenlogische Teil des Kalküls in Beispielen erläutert und seine Korrektheit nachgewiesen. In Abschnitt 7.2 wird eine Beschreibung des gesamten Kalkül einschließlich seines prädikatenlogischen Teils gegeben. Im folgenden Kapitel wird der Kalkül dann zuerst auf Theoreme der Prädikatenlogik (PL1) ausgedehnt und dann auch auf solche der Prädikatenlogik mit Identität (PL1I) und mit Kennzeichnungen (PL1IK).
7.1
Aussagenlogische Beweise
Wie aus der Referenzbeschreibung in Abschnitt 7.2 ersichtlich ist,5 enthält der KM-Kalkül in seinem aussagenlogischen Teil eine größere Anzahl von Schlußregeln. Schlußregeln bestehen aus einer endlichen Menge von (de facto maximal drei) Prämissen und einer einzelnen Konklusion. Wir betrachten vorerst nur die Regeln unter I. Diese gliedern sich in Grundregeln und zulässige Regeln. A. Grundregeln. Dies sind die elementaren Schlußregeln des Kalküls, die im Prinzip allein ausreichen, um alle aussagenlogischen Beweise zu führen. Sie beschreiben in der syntaktischen Sprache der Regeln die Verwendungsweisen der Standard-Junktoren, geben also in gewissem Sinn ihre “Gebrauchsbedeutung” an. So besteht eine Verwendungsregel etwa für die Konjunktion darin, daß man die Konjunktion φ ∧ ψ bekommt, wenn man sowohl φ als auch ψ bereits hergeleitet hat. Dies ist die Regel der Konjunktionseinführung. Ist umgekehrt φ ∧ ψ gegeben, so kann man einzeln sowohl φ als auch ψ ableiten (Konjunktionsbeseitigung). Für die anderen logischen Konstanten gibt es ebenfalls mindestens je ein Paar von Regeln, eine, mit der das Zeichen eingeführt, sowie eine, mit der es beseitigt wird. Üblicherweise notiert man die Regeln mit einem Ableitungsstrich, über dem die Prämissen und unter dem die mit der Regel erschlossene Konklusion steht, vor die man häufig noch drei Punkte setzt. Die soeben beschriebenen Regeln der Konjunktionseinführung und Konjunktionsbeseitigung lauten dann: φ∧ψ φ∧ψ φ, ψ ∴φ∧ψ ∴φ ∴ψ 5 Die folgenden Bemerkungen zu den Regeln und zur Gliederung des Kalküls beziehen sich alle auf diesen Abschnitt.
188
Natürliches Schließen: Aussagenlogik
Die Einführungsregel für das Konditional wird häufig Abschwächungsregel genannt, hier mit ‘(As)’ abgekürzt: wenn man eine Formel φ abgeleitet hat, so kann man, falls es erforderlich ist, auch zu der schwächeren Aussage ψ → φ für beliebiges ψ übergehen. Die Regeln der Beseitigung des Konditionals heißen auch Abtrennungsregeln; es sind dies die klassischen Regeln des Modus Ponens (MP) und des Modus Tollens (MT): (MP)
φ, φ → ψ ∴ψ
(MT)
φ → ψ, ¬ψ ∴ ¬φ
Diese Regeln leisten den Übergang von einem (objektsprachlichen) Konditional zu einem (metasprachlichen) Wenn–dann-Schluß. Eine dritte Abtrennungsregel, der Modus Tollendo Ponens (MTP), enthält statt des Konditionals eine Disjunktion. Die übrigen Grundregeln betreffen die Einführung und Beseitigung der doppelten Negation, die Disjunktions-Einführung sowie eine Regel für die Beseitigung einer Disjunktion. Ferner gibt es Regeln für die Beziehung zwischen Konditional und Bikonditional. Die Grundregeln werden vervollständigt durch eine triviale Wiederholungsregel (Wh), die die Wiederverwendung von bereits abgeleiteten Formeln erlaubt.6 Die intuitive Rechtfertigung dieser Regeln erfolgt durch einen semantischen Korrektheitsbeweis, der den vollen Wahrheitstransfer von den Prämissen auf die Konklusion bei jeder Belegung garantiert; es muß also gezeigt werden, daß jedes Modell der Prämissen auch ein Modell der Konklusion ist. Sei z.B. f ein AL-Modell der Formeln φ und φ → ψ, d.h. eine beliebige AL-Belegung, die sowohl φ als auch φ → ψ wahr macht. Dann folgt mit Hilfe der Wahrheitsregel für das Konditional, daß auch ψ bei f wahr ist. Damit ist die Korrektheit des Modus Ponens bewiesen. Auf die gleiche Weise läßt sich mit Hilfe der Wahrheitsregeln für die übrigen Junktoren die Korrektheit der anderen Grundregeln nachweisen. Übung 7.1 Verifizieren Sie die letzte Behauptung ohne die Grundregel der Oder-Beseitigung (diese wird unten über das entsprechende Gesetz semantisch gerechtfertigt). B. Zulässige Regeln. Zulässige Regeln dienen zur Abkürzung von Beweisen, die sonst allein mit Hilfe der Grundregeln geführt werden müßten. Sie sind nach gewissen Typen von Schlußfiguren geordnet. Die Untergliederung 1. bis 6. beginnt mit der Schnittregel , auch Kettenschluß oder hypothetischer Syllogismus genannt (Abkürzung: KS ),7 gefolgt von der Regel des Ex falso quodlibet EFQ, mit der bei einem auftretenden Widerspruch sofort auf eine beliebige Aussage 6 In den in der Einleitung kurz erwähnten substrukturellen Logiken wie Relevanzlogik oder Lineare Logik gelten Prämissen als “Ressourcen”, die verbraucht werden und nicht wie Wahrheiten stets beliebig zur Verfügung stehen. Eine freie Wiederholungsregel gilt in solchen Systemen nicht. 7 Die Schnittregel (engl. cut rule) ist ein zentrales Thema der klassischen Beweistheorie, weil bei einem Kettenschluß das Mittelglied verschwindet und so im Zuge des Beweises Information vernichtet wird. Ein wichtiges Problem für jedes Beweisverfahren ist daher die Frage, ob das Verfahren eine Schnitt-Elimination (engl. cut elimination) zuläßt, d.h. daß jede Herleitung des Verfahrens in eine gültige Herleitung umgebaut werden kann, welche die Schnittregel nicht verwendet. Gentzen hat für den ersten expliziten Kalkül des natürlichen Schließens, den von ihm entwickelten Sequenzenkalkül, die Schnittelimination bewiesen; dies ist der bekannte
189
AL-Beweise
geschlossen werden kann, sowie der Reductio ad absurdum RdA, mit der eine Aussage durch Herleitung eines Widerspruchs widerlegt wird. Die Ziffer 2. enthält die Regel der Fallunterscheidung in ihren verschiedenen Ausprägungen. Es folgen Regeln, in denen Konditionale umgewandelt werden, mit den wichtigen Schlußtypen der Kontraposition sowie Importation und Exportation. Bikonditionale. Die Gruppen unter Ziffer 4. und 5., die de Morgan- und Distributionsregeln, sind die bereits aus Kapitel 3 bekannten Booleschen Strukturregeln. Die de-Morgan-Regeln enthalten dabei die Wirkung der Negation auf die anderen junktorenlogischen Verknüpfungen. Die Substitutionsregel in 6. schließlich besagt, daß man eine Teilformel ψ in einer komplexeren Formel φ durch eine zu ψ logisch äquivalente Formel χ ersetzen kann, ohne die Wahrheit der Gesamtformel zu affizieren.8 Es wäre ein sehr umständliches, wenn auch problemloses Vorgehen, all diese zulässigen Regeln einzeln unter Bezugnahme auf die Semantik als korrekt nachzuweisen. Wir werden stattdessen so vorgehen, daß wir das zu einer solchen Regel gehörende Theorem in konditionaler Form (das zur Regel analoge Theorem, wie wie sagen wollen) im Kalkül beweisen und dann durch einen einfachen (MP)-Schluß die Regel herleiten. Die Theoreme werden dabei allein mit Grundregeln oder mit Hilfe einiger weniger schon früher mit Grundregeln bewiesener Theoreme abgeleitet und sind damit gültig; da nun der Modus Ponens korrekt ist, so ist die neue zulässige Regel ebenfalls korrekt. Bei diesem Vorgehen wird zugleich die Technik des Beweisens im KM-Kalkül anhand von konkreten Fällen illustriert und eingeübt.9 Als einfaches Beispiel für dieses Verfahren betrachten wir das Theorem (A.20 ), mit dessen Hilfe wir die Regel der Abschwächung (As) rechtfertigen können. Wir beweisen zunächst (A.20 ). Das sieht wie folgt aus. 1. 2. 3.
zeige φ → (ψ → φ)
A.20 A-BA
φ zeige ψ → φ
4.
ψ
5.
φ —(2)
A-BA —(2)
2,Wh
Erläuterung. Ein KM-Beweis besteht aus einer untereinander geschriebenen endlichen Folge von Beweiszeilen; zur größeren Übersicht numerieren wir diese Zeilen links durch und kommentieren sie auf der rechten Seite. Nach den Regeln des Kalküls wird die zu beweisende Formel zunächst mit dem Ausdruck ‘zeige’ eingeführt. Das macht die Tatsache augenfällig, daß diese Formel noch nicht bewiesen ist. Da wir sehen werden, daß Beweise sich oft in verschiedene Unterbeweise gliedern, ist es wichtig, gleich unterscheiden zu können, ob eine in einem Gentzensche Hauptsatz in [93]. Die im Beweis des Hauptsatzes benutzte Methode enthält den Kern für Gentzens späteren Beweis der Widerspruchsfreiheit der Zahlentheorie [94]. Eine gute Darstellung zu den Gentzenschen Resultaten findet sich in [142]: Kapitel XV. — Zur Ungültigkeit der Schnittregel in Systemen des plausiblen Schließens wurden in der Einleitung einige Hinweise gegeben. 8 Hier wird die Nennform-Schreibweise für aussagenlogische Formeln verwendet; siehe unten. 9 Die Nummern der folgenden Theoreme beziehen sich auf die Liste von Tautologien in Unterabschnitt 2.3.3.
190
Natürliches Schließen: Aussagenlogik
Beweis weiter oben auftretende Formel als Prämisse zur Verfügung steht; eine Formel, der ein nicht-gestrichenes ‘zeige’ vorangeht, ist noch nicht bewiesen und daher nicht verfügbar. Hat die Formel die Gestalt eines Konditionals, so kann man in der für das natürliche Schließen charakteristischen Weise das Antecedens als Annahme in den Beweis einführen (Kommentar: ‘A-BA’ für “Annahme zur bedingten Ableitung”) und versuchen, das Consequens zu beweisen. Ist das nicht sofort ersichtlich, wird mit ‘zeige’ ein Unterbeweis für das Consequens eröffnet. Im vorliegenden Fall ist das wieder ein Konditional der Form φ → ψ, und man schreibt erneut das Antecedens, diesmal φ, als Annahme hin. Jetzt kann die erste Annahme ψ nach der Regel (Wh) angefügt werden; im Kommentar erscheinen die Zeilen, die die Prämissen enthalten, sowie der Name der Regel. Nun steht das Consequens der Unter-Behauptung da, und damit ist der Unterbeweis abgeschlossen. Um das deutlich zu machen, werden alle Zeilen unter ‘zeige φ → ψ’ eingerahmt und das ‘zeige’ wird gestrichen. Der Rahmen wird mit einer eingeklammerten Zahl dekoriert, die die Nummer der relevanten Schließungsbedingung (siehe unten) bezeichnet. Bei bedingten Ableitungen z.B. ist das die Ziffer (2). Jetzt steht die Formel hinter dem gestrichenen ‘zeige’ für den weiteren Beweis zur Verfügung. In unserem Beispiel ergibt sich, daß diese Formel φ → ψ zugleich das Consequens der obersten Behauptung ist, welche somit ebenfalls als bewiesen gilt. Der gesamte Beweis wird eingerahmt, die Schließungsbedingung angegeben und das erste ‘zeige’ gestrichen. Der Beweis im Kalish-Montague-Kalkül ist erbracht. Da die meisten KM-Beweise komplexer sind, ist es ratsam, sich einen Überblick über einige Grundtypen von Beweisansätzen zu verschaffen. Diese Beweismuster richten sich nach der logischen Gestalt der zu beweisenden Formel. Wie gesehen, beweist man ein Konditional, indem man das Antecedens annimmt und das Consequens herleitet. Eine Konjunktion wird bewiesen, indem man die Konjunktionsglieder einzeln herleitet und mit der Konjunktions-Einführung das Ergebnis bekommt. Derartige Beweispläne sind in Unterabschnitt 7.2.3 aufgeführt. Wir werden im folgenden darauf mit dem Kürzel ‘Hw(n)’ für ‘Hinweis Nummer n’ verweisen. Die Hinweise sind als Empfehlungen zu werten und nicht als zwingende Vorschriften; sie geben den Rahmen für einen erfolgreichen Beweis vor (wenn denn überhaupt eine Beweisidee vorhanden ist), der im konkreten Fall aber auch kürzer oder anders erzielt werden kann. Ferner gibt es feste Bedingungen, unter denen ein Beweis als abgeschlossen gilt und welche die Rahmung und das Streichen des ‘zeige’ erlauben. Dies sind die Schließungsbedingungen, die sich ebenfalls zusammengefaßt in den Hinweisen zur Beweistechnik finden. Ansonsten enthält die Kalkül-Beschreibung eine Definition des Herleitungsbegriffs im Kalish-Montague-Kalkül (Abschnitt 7.2.2); darin wird festgelegt, was ein zulässiger Beweisschritt ist und wann ein Beweis abgeschlossen ist. Wir geben nun einen Beweis der Konklusion der Abschwächungsregel (As) unter der Annahme ihrer Prämisse an. Dabei verwenden wir das oben bewiesene Gesetz der Abschwächung. 1. 2. 3. 4.
As
φ zeige ψ → φ φ → (ψ → φ) ψ → φ —(1)
(A.20 ) 1,3,MP
191
AL-Beweise
Analog können auch Theorem (A.100 ) und die Korrektkeit der zweiten Abschwächungsregel ¬ψ / ∴ ψ → φ bewiesen werden. Das Ziel sei nun, mit dem gleichen Verfahren einige wichtige Theoreme zu beweisen und damit die Korrektheit der zugehörigen Regeln zu etablieren. Wir konzentrieren uns dabei im wesentlichen auf diejenigen Regeln, welche in den Hinweisen zur Beweistechnik auftreten. Wir behandeln die folgenden Regeln: • Kontraposition (Kp) • Klassisches Dilemma (KlD) • Exportation (Exp) und Importation (Imp) • Reductio ad absurdum (RdA) • Oder-Beseitigung (∨B) • Oder-Einführung im Antecedens (∨E.Ante) • De Morgan-Regeln (DM→), (DM∧) und (DM↔) Schließlich sei noch angemerkt, daß die “ungestrichenen” Versionen der Theoreme bewiesen werden; die “Strich”-Versionen lassen sich völlig analog herleiten und gelten jeweils als mitbewiesen. Die Regeln (Kp): Korrektheit mit Theoremen (A.120 ) und (A.130 ) φ→ψ
(Kpp )
∴ ¬φ → ¬ψ
(Kpn )
¬ψ → ¬φ ∴ φ→ψ
Der Beweis von Theorem (A.12) lautet: 1. 2. 3. 4. 5.
zeige (P → Q) → (¬Q → ¬P )
A.12 A-BA
P → Q
zeige ¬Q → ¬P ¬Q ¬P —(2)
—(2)
A-BA 2,4,MT
Bemerkung. Der Beweis für (A.12) ist ein Beispiel für eine “direkte” Lösung ohne den Hinweis (6), der ein Schema zum Beweis von Konditionalen angibt, in denen das Antecedens selbst wieder ein Konditional ist. Da der Beweis hier sehr einfach ist, können wir die Empfehlung des Hinweises ignorieren. Der Beweis für (A.13) wird analog angesetzt. Um beim Unterbeweis von der Annahme P mit MT auf Q schließen zu können, muß genau genommen per doppelter Negation DN erst ¬¬P hergeleitet werden, mit nachfolgendem MT und erneut DN.
192
Natürliches Schließen: Aussagenlogik
Die Regel (KlD): Führen beide Annahmen einer vollständigen Alternative φ, ¬φ zum selben Ergebnis ψ, so gilt dieses unbedingt. Die Korrektheit der Regel folgt mit Theorem (A.150 ) und zweimal MP.
(KlD)
φ → ψ , ¬φ → ψ ∴ ψ
Im zweiten Unterbeweis der folgenden Herleitung findet sich ein neuer Beweisansatz, die Annahme zur indirekten Ableitung, kurz A-IA. Man beweist eine Formel φ, indem man die Negation ¬φ als Zeile einführt und damit dann für eine passende Formel ψ sowohl diese selbst als auch ihre Negation ableitet. Das bedeutet, daß die Annahme des Gegenteils der zu zeigenden Formel zu einem Widerspruch geführt hat.10 An den Rahmen um eine indirekte Ableitung wird die Ziffer (3) als Nummer der entsprechenden Schließungsbedingung angehängt. 1. 2. 3. 4. 5.
zeige (P → Q) → ((¬P → Q) → Q)
A.15 A-BA
P →Q
zeige (¬P → Q) → Q A-BA
¬P → Q zeige Q
6.
A-IA
¬Q
7. 8.
¬P Q —(3) —(2)
2,6,MT 7,4,MP
—(2)
Die Regeln (Exp) und (Imp): Korrektheit mit Theoremen (A.250 ,260 )
(Imp)
φ → (ψ → χ) ∴ φ∧ψ → χ
(Exp)
φ∧ψ → χ ∴ φ → (ψ → χ)
Das folgende Bikonditional begründet, von rechts nach links gelesen, die Regel der Importation (das Vorderglied im Consequens wird ins Antecedens “importiert”), und von links nach rechts gelesen, die Regel der Exportation (ein Konjunktionsglied im Antecedens wird ins Consequens “exportiert”). 10 In unserem Beispiel ist die Widerspruchsformel sogar gleich der zu beweisenden Formel; das ist im allgemeinen jedoch nicht der Fall.
193
AL-Beweise 1. 2. 3. 4. 5. 6.
zeige (P ∧ Q → R) → (P → (Q → R))
A-BA
zeige P → (Q → R) A-BA
P zeige Q → R Q
8. 9.
P ∧Q R —(2) —(2)
11. 12. 13. 14. 15. 16. 17. 18.
Hw(2)
P ∧Q → R
7.
10.
A.25,26
zeige (P ∧ Q → R) ↔ (P → (Q → R))
A-BA 5,7,∧E 8,3,MP
zeige (P → (Q → R)) → (P ∧ Q → R) A-BA
P → (Q → R)
zeige P ∧Q → R A-BA
P ∧Q
13,∧B 14,11,MP
P Q → R Q R
—(2)
13,∧B 16,15,MP
—(2)
(P ∧ Q → R) ↔ (P → (Q → R))
—(1)
2,10,KB
Die Regel (RdA): Korrektheit mit Theorem (A.160 ) φ → ψ , φ → ¬ψ
(RdA)
∴ ¬φ 1. 2. 3. 4. 5. 6. 7. 8.
zeige (P → Q) ∧ (P → ¬Q) → ¬P
A-BA
(P → Q) ∧ (P → ¬Q) zeige ¬P
A-IA 2,∧B
P P → Q
Q P → ¬Q
¬Q
A.16a
4,5,MP 2,∧B —(3)
—(2)
4,7,MP
194
Natürliches Schließen: Aussagenlogik
Diese Regel ist die Reductio ad absurdum. Wenn eine Annahme φ gleichzeitig zu einem Satz ψ und seinem Gegenteil ¬ψ führt, so ist die Annahme widerlegt, d.h. es gilt ¬φ. Das analoge Gesetz selbst wurde hier in importierter Form als Theorem (A.16a) mit einem indirekten Ansatz bewiesen. Die Regel (∨B): Korrektheit mit Theorem (A.340 )
(∨B)
φ ∨ ψ, φ → χ, ψ → χ ∴ χ
Wenn eine Disjunktion gegeben ist und beide Disjunktionsglieder auf dieselbe Aussage führen, so gilt diese Aussage, und die Disjunktion ist als Annahme beseitigt (man denke etwa an das Beispiel mit den beiden Alpenpässen, über die man beide nach Italien gelangt). 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
zeige (P ∨ Q) ∧ (P → R) ∧ (Q → R) → R
A.34 A-BA
(P ∨ Q) ∧ (P → R) ∧ (Q → R) zeige R
A-IA
¬R
2,∧B 5,4,MT
P → R ¬P
2,∧B 7,6,MTP
P ∨Q Q
Q → R R —(3)
2,∧B 8,9,MP
—(2)
Die Regel (∨E.Ant): Korrektheit mit Theorem (A.400 )
(∨E.Ant)
φ → χ, ψ → χ ∴ φ∨ψ →χ
(∨E.Antc )
φ∨ψ →χ ∴ (φ → χ) ∧ (ψ → χ)
Die Regel der ∨-Einführung im Antecedens ist eine wichtige Beweisregel: um ein Konditional mit einer Disjunktion im Antecedens zu beweisen, wird das Consequens aus beiden Disjunktionsgliedern hergeleitet und dann diese Regel angewendet; siehe die Hinweise zur Beweistechnik in Abschnitt 7.2.3. Das zur Begründung herangezogene Theorem (A.40) ist ein Bikonditional und rechtfertigt daher auch die Anwendung der Regel in der umgekehrten Richtung, hier als (∨E.Antc ) bezeichnet. Der Beweis des Theorems benutzt zum ersten Mal nicht nur Grundregeln, sondern auch das zuvor bewiesene Theorem (A.34).
195
AL-Beweise
1.
zeige (P → R) ∧ (Q → R) ↔ (P ∨ Q → R)
2.
zeige (P → R) ∧ (Q → R) → (P ∨ Q → R)
3. 4.
Hw(2) A-BA
(P → R) ∧ (Q → R) zeige P ∨Q → R
5. 6.
P ∨Q (P ∨ Q) ∧ (P → R) ∧ (Q → R)
7.
R
8.
A-BA 5,3,∧E 6,A.34,MP
—(2) —(2)
zeige (P ∨ Q → R) → (P → R) ∧ (Q → R)
9.
A-BA
P ∨Q → R
10.
Hw(3)
zeige P → R
11.
P
12. 13.
P ∨Q R —(2)
14.
zeige Q → R
15. 16.
A-BA
Q P ∨Q
17.
R
18. 19.
A.40
11,∨E 12,9,MP
A-BA 15,∨E 16,9,MP
—(2)
10,14,∧E
(P → R) ∧ (Q → R) —(2) (P → R) ∧ (Q → R) ↔ (P ∨ Q → R)
—(1)
2,8,KB
Wir wollen abschließend die Korrektheit für drei der vier de-MorganRegeln beweisen; es sind dies die folgenden Regeln:
(DM→)
¬ (φ → ψ) ∴ φ ∧ ¬ψ
(DM∧)
¬ (φ ∧ ψ) ∴ ¬φ ∨ ¬ψ
(DM↔)
¬ (φ ↔ ψ) ∴ φ ↔ ¬ψ
Der Doppelstrich soll andeuten, daß die Schlüsse auch in umgekehrter Richtung von unten nach oben gültig sind. Der Nachweis der zugehörigen de-Morgan-Gesetze erfordert einen gewissen Aufwand, da der KM-Kalkül von der Anlage her ein konditionales Schlußverfahren ist, in welches Dualitätsaussagen, wie diese Theoreme es sind, nicht so gut hineinpassen. Wir behandeln zunächst die Regel (DM→) für die Negation eines Konditionals; diese wird jedesmal bei der Falsifikation eines bedingten Allsatzes ∀x(P x → Qx) verwendet: dessen Negation ist mit der Regel der Quantorennegation (DN) (siehe Kapitel 8) und (DM→) äquivalent zu ∃x(P x ∧ ¬Qx).
196
Natürliches Schließen: Aussagenlogik
Die Regel (DM→): Korrektheit mit dem de-Morgan-Gesetz (A.310 ) 1. 2.
zeige ¬(P → Q) ↔ P ∧ ¬Q
A.31
zeige ¬(P → Q) → P ∧ ¬Q
Hw(2)
3. 4.
¬(P → Q) zeige P
A-BA Hw(3)
5. 6.
¬P P → Q
A-IA 5,As
7. 8. 9. 10. 11. 12. 13. 14. 15.
zeige ¬Q Q
A-IA
P → Q ¬(P → Q) —(3)
9,As 3,Wh
P ∧ ¬Q
4,8,∧E
—(2)
zeige P ∧ ¬Q → ¬(P → Q) A-BA
P ∧ ¬Q zeige ¬(P → Q)
16. 17.
P → Q P
18. 19.
Q ¬Q
20.
3,Wh
¬(P → Q) —(3)
A-IA 14,∧B —(3)
17,16,MP 14,∧B
—(2)
¬(P → Q) ↔ P ∧ ¬Q
—(1)
2,13,KB
Übung 7.2 Beweisen Sie im KM-Kalkül die folgenden Formeln aus der Liste der AL-Theoreme in Kapitel 2 unter ausschließlicher Verwendung von Grundregeln. Begründen Sie mit dem vorletzten Theorem (A.45) die Regel (KD), welche im Beweis von (A.38) verwendet werden kann. (A.4); (A.5); (A.6); (A.7); (A.11); (A.13); (A.45); (A.38). Wir fahren fort mit den de-Morgan-Regeln und rechtfertigen als nächstes die Regel (DM∧) für die negierte Konjunktion, indem wir wie in Kapitel 3 die Konjunktion durch ¬ und ∨ ausdrücken, diese Äquivalenz als Theorem (A.47a) beweisen und dann Kontraposition und doppelte Negation anwenden.
197
AL-Beweise
Die Regel (DM∧): Korrektheit mit Theorem (A.470 ), das sich aus dem folgenden Theorem (A.47a) mit (Kp) und (DN) ergibt. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
zeige P ∧ Q ↔ ¬(¬P ∨ ¬Q)
A.47a
zeige P ∧ Q → ¬(¬P ∨ ¬Q)
Hw(2) A-BA
P ∧Q
zeige ¬(¬P ∨ ¬Q) A-IA
¬P ∨ ¬Q
3,∧B 6, DN
P ¬¬P ¬Q Q
—(3)
5,7,MTP 3,∧B
—(2)
zeige ¬(¬P ∨ ¬Q) → P ∧ Q
11. 12.
¬(¬P ∨ ¬Q) zeige P
A-BA Hw(3)
13. 14.
¬P ¬P ∨ ¬Q
A-IA 13,∨E
15. 16. 17. 18. 19. 20. 21.
11,Wh
¬(¬P ∨ ¬Q) —(3) zeige Q
A-IA
¬Q
17,∨E 11,Wh
¬P ∨ ¬Q ¬(¬P ∨ ¬Q) —(3) P ∧Q
12,16,∧E
—(2)
P ∧ Q ↔ ¬(¬P ∨ ¬Q)
—(1)
2,10,KB
Die de-Morgan-Regel (DM↔) für das negierte Bikonditional schließlich zeigt, daß man die Negation vor eines der beiden Glieder des Bikonditionals ziehen kann (dies ist äquivalent zur ausschließenden Disjunktion). Den Beweis für das zugehörige Gesetz (A.74) bereiten wir durch das Theorem (A.68) vor, welches das Bikonditional durch die Disjunktion der beiden positiven und der beiden negativen Fälle der beteiligten Glieder darstellt (vgl. auch Kapitel 2 und 3). Wenn die Beweise länger werden, müssen neben den Grundregeln vermehrt zulässige Regeln sowie bereits bewiesene Theoreme eingesetzt werden, wie dies im folgenden geschieht. Das nächste Theorem (A.68) formuliert die angesprochene Äquivalenz des Bikonditionals mit seiner disjunktiven Normalform; mit seiner Hilfe können das Gesetz der ↔-Einführung im Antecedens sowie die Korrektheit der gleichnamigen Schlußregel nachgewiesen werden (siehe Übung).
198 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32.
Natürliches Schließen: Aussagenlogik zeige (P ↔ Q) ↔ (P ∧ Q) ∨ (¬P ∧ ¬Q) zeige (P ↔ Q) → (P ∧ Q) ∨ (¬P ∧ ¬Q)
Hw(2) A-BA
P ↔ Q
Hw(4)
zeige ¬(P ∧ Q) → ¬P ∧ ¬Q
A-BA
¬(P ∧ Q)
5,DM∧ 3,BK
¬P ∨ ¬Q P → Q
7,Kp A.10
¬Q → ¬P ¬P → ¬P
6,9,8,∨B 3,BK
¬P Q → P
11,Kp A.10
¬P → ¬Q ¬Q → ¬Q
6,12,13,∨B 10,14,∧E
¬Q ¬P ∧ ¬Q —(2)
(P ∧ Q) ∨ (¬P ∧ ¬Q)
4,KD
—(2)
zeige (P ∧ Q) ∨ (¬P ∧ ¬Q) → (P ↔ Q) A-BA
(P ∧ Q) ∨ (¬P ∧ ¬Q) zeige P → Q
Hw(2) A-BA für MTP!
P zeige ¬(¬P ∧ ¬Q) ¬P ∧ ¬Q ¬P P
A-IA 22,∧B 20,Wh
—(3)
P ∧Q Q
18,21,MTP 25,∧B
—(2)
zeige Q → P A-BA für MTP!
Q zeige ¬(¬P ∧ ¬Q) ¬P ∧ ¬Q ¬Q Q
33. 34.
P ∧Q P
35.
P ↔ Q
36.
A.68
A-IA 30,∧B 28,Wh
—(3)
18,29,MTP 33,∧B
—(2)
19,27,KB
—(2)
(P ↔ Q) ↔ (P ∧ Q) ∨ (¬P ∧ ¬Q)
—(1)
2,17,KB
199
AL-Beweise
Die Regel (DM↔): Korrektheit mittels des folgenden de-Morgan-Gesetzes (A.74) für das Bikonditional. Der Beweis verwendet Theorem (A.68) sowie die bereits als korrekt nachgewiesenen Regeln (RdA) und (KlD). 1. 2. 3. 4.
zeige ¬ (P ↔ Q) ↔ (P ↔ ¬Q)
A.74
zeige ¬ (P ↔ Q) → (P ↔ ¬Q)
Hw(2) A-BA Hw(2)
¬ (P ↔ Q) zeige P → ¬Q
5. 6.
P zeige ¬Q
A-BA
7. 8.
Q P ∧Q
A-IA 5,7,∧E
9. 10. 11. 12. 13.
zeige ¬Q → P
22. 23. 24. 25. 26. 27. 28. 29.
12,14,∧E 15,∨E,A.68,BK,MP
¬P ∧ ¬Q P ↔ Q
17.
20. 21.
A-IA
¬P
15. 16.
19.
A-BA
¬Q zeige P
14.
18.
8,∨E,A.68,BK,MP 3,Wh
P ↔ Q ¬(P ↔ Q) —(3) —(2)
3,Wh
¬(P ↔ Q) —(3) —(2)
P ↔ ¬Q
4,11,KB
—(2)
zeige (P ↔ ¬Q) → ¬ (P ↔ Q) A-BA
P ↔ ¬Q zeige ¬ (P ↔ Q)
A-IA
P ↔ Q
22,BK 20,BK
P → Q P → ¬Q
23,24,RdA
¬P
Q → P ¬Q → P P
22,BK 20,BK 26,27,KlD
—(3) —(2)
¬ (P ↔ Q) ↔ (P ↔ ¬Q)
—(1)
2,19,KB
200
Natürliches Schließen: Aussagenlogik
Es dürfte klar geworden sein, wie sich der Korrektheitsbeweis für den aussagenlogischen Teil des KM-Kalküls auch auf die restlichen zulässigen Regeln fortsetzen läßt, zu denen es ein entsprechendes Gesetz in Theorem-Form gibt. Der Leser ist aufgefordert, die noch verbleibenden Regeln dieser Art auf die gleiche Art zu rechtfertigen. Übung 7.3 Beweisen Sie die folgenden Formeln im KM-Kalkül unter Verwendung von Grundregeln und schon bewiesener zulässiger Regeln. (A.78)
(P → R) ∧ (Q → S) → (P ∧ Q → R ∧ S)
(A.79)
(P → Q ∨ R) ↔ (P → Q) ∨ (P → R)
(∧E im Ant+Kons) (DjVtgKons)
Übung 7.4 Zeigen Sie durch den Beweis entsprechender Theoreme (die sich nicht notwendig alle in der obigen Theoreme-Liste finden) die Korrektheit der folgenden Schlußregeln: (i)
(EFQ)
(ii)
(djKsD)
(iii)
(→E.Ant)
(v)
(DM∨)
(vi)
(∧Dt)
(vii)
(∨Dt)
(iv)
(↔E.Ant)
Die letzte zulässige Regel der Aussagenlogik, die Substitutionsregel, wurde bisher ausgespart. Sie ist von einem anderen Typ als die bisherigen Regeln. Sie enthält als komplexes Mitteilungszeichen eine aussagenlogische Nennform, d.h. ein Symbol der Form ‘φ[ψ]’, welches andeuten soll, daß in der Formel φ an einer oder an mehreren Stellen die Formel ψ als Teilformel auftritt. Aussagenlogische Nennformen verhalten sich wie die in der Prädikatenlogik eingeführten Nennformen, außer daß das Nennzeichen statt eines Individuenterms eine Formel vertritt; außerdem sind sie einfacher zu handhaben, da das Problem der Variablenkollision nicht auftritt. Wir halten den neuen Typ von Nennform noch einmal in einer Definition fest. Definition 7.1 Es sei ‘∗’ ein Symbol, Nennzeichen genannt, welches nicht in der Sprache LAL vorkommt, und es sei SK ∗ = SK ∪ {∗}. Eine aussagenlogische Nennform ist ein Ausdruck von LAL ∪{∗}, der wie eine AL-Formel gebildet ist, jedoch mit SK ∗ anstelle von SK , und in dem das Nennzeichen an mindestens einer Stelle wirklich auftritt; in Symbolen: ‘φ[∗]’. Die Vorkommen von ‘∗’ in φ[∗] werden (kollektiv) Nennstelle genannt. Ersetzt man in einer Nennform φ[∗] das Nennzeichen ‘∗’ durch eine Formel ψ, so entsteht die AL-Formel φ, die sich von φ[∗] nur an der Nennstelle unterscheidet und dort ψ enthält. φ wird dann durch das komplexe Symbol ‘φ[ψ]’ mitgeteilt (“φ in Nennform-Schreibweise”). Informelle Bezeichnungen für ‘Nennform’ sind häufig auch Matrix oder einfach Kontext. Kehren wir zur Substitutionsregel zurück. Auch hier könnte man wie oben versuchen, ein entsprechendes Theorem zu formulieren, etwa (φ ↔ ψ) → ( φ[ψ] → φ[χ] )
201
AL-Beweise
Allerdings läßt sich dafür kein KM-Beweis der üblichen Art führen, da wir über den Aufbau der Nennform φ[∗] nichts wissen und daher keine Schlußregeln auf φ[ψ] anwenden können. Wir müssen die Korrektheit also direkt beweisen. Dies geschieht mit Hilfe eines semantischen Substitutionslemmas; da uns ein derartiges Substitutionslemma in der Prädikatenlogik wieder begegnen wird, sei die Struktur seines Beweises im einfacheren Fall der Aussagenlogik vorgeführt. . Es seien also φ = φ[ψ] eine AL-Formel in Nennform-Schreibweise und ψ und χ zwei AL-Formeln, deren Bikonditional bereits hergeleitet wurde. Ferner sei als weitere Prämisse φ[ψ] hergeleitet; dann erlaubt die Substitutionsregel den Übergang zu φ[χ], wo an der Nennstelle ψ durch χ ersetzt wurde. Die intuitive semantische Rechtfertigung für diese Regel liegt auf der Hand: ist das Bikonditional von ψ und χ wahr, so haben sie denselben Wahrheitswert; damit steuern ψ und χ auch denselben Wert zum Gesamt-Wahrheitswert von φ bei; also kann für die Teilformel ψ in φ[ψ] auch die Formel χ salva veritate substitutiert werden. Als Hilfssatz für diesen Sachverhalt formulieren wir das folgende Lemma. In seinem Beweis wird für den Wahrheitswert von Formeln die Normschreibweise verwendet, da es nicht auf die gegebene Belegung ankommt; sie ist gleichbedeutend mit der Notation ‘g(φ)’ etc., wie sie in Kapitel 2 verwendet wurde. Beim Induktionsschritt ist ferner der Wahrheitswert der Negation einer Formel φ als 1− dem Wahrheitswert von φ wiedergegeben. Siehe dazu die Erläuterungen zum aussagenlogischen Koinzidenzlemma in Abschnitt 2.3.1; diese beziehen sich auch auf die Verwendung der Maximum-Funktion bei der Disjunktion und der Minimum-Funktion bei der Konjunktion in den folgenden Fällen. Das Konditional ist semantisch äquivalent zu “nicht – oder” und wird daher mit der Maximum-Funktion und eingebettetem “1−” behandelt. Das Bikonditional schließlich drückt die Gleichheit der Wahrheitswerte aus; dies wurde im letzten Fall des Induktionsschritts verwendet. Lemma 7.1 (Substitutionslemma für die Aussagenlogik) Es seien φ[∗] eine aussagenlogische Nennform und ψ und χ zwei AL-Formeln. Stimmen die Wahrheitswerte kψk und kχk von ψ bzw. χ bei einer beliebig vorgegebenen AL-Belegung überein, so gilt auch kφ[ψ]k = kφ[χ]k Beweis durch Induktion nach dem Aufbau der Nennform φ[∗]; ihr Formelgrad γ sei wie der von Formeln erklärt. . . . 1. γ = 0; dann gilt φ[∗] = ∗, φ[ψ] = ψ und φ[χ] = χ. Das Lemma ist nach Voraussetzung erfüllt. 2. γ > 0, und die I.V. gelte für alle Formelgrade < γ. . (a) φ[∗] = ¬φ1 [∗]; dann gilt nach I.V. kφ1 [ψ]k = kφ1 [χ]k, und damit kφ[ψ]k = 1 − kφ1 [ψ]k = 1 − kφ1 [χ]k = kφ[χ]k
. (b) φ[∗] = φ1 [∗] ∨ φ2 [∗],11 und die I.V. gilt für φ1 [∗] und für φ2 [∗], da beide einen niedrigen Formelgrad als γ haben. Es folgt: kφ[ψ]k = max{ kφ1 [ψ]k, kφ2 [ψ]k } = max{ kφ1 [χ]k, kφ2 [χ]k } = kφ[χ]k 11 Genau genommen muß das Nennzeichen nicht in beiden Teilformeln zugleich auftreten, sondern nur in mindestens einer; das sei im folgenden so verstanden.
202
Natürliches Schließen: Aussagenlogik . (c) φ[∗] = φ1 [∗] ∧ φ2 [∗], und die I.V. gilt für φi [∗] (i = 1, 2). Es folgt: kφ[ψ]k = min{ kφ1 [ψ]k, kφ2 [ψ]k } = min{ kφ1 [χ]k, kφ2 [χ]k } = kφ[χ]k . (d) φ[∗] = φ1 [∗] → φ2 [∗], und die I.V. gilt für φi [∗] (i = 1, 2). Es folgt: kφ[ψ]k = max{ 1−kφ1[ψ]k, kφ2 [ψ]k } = max{ 1−kφ1 [χ]k, kφ2 [χ]k } = kφ[χ]k . (e) φ[∗] = φ1 [∗] ↔ φ2 [∗], und die I.V. gilt für φi [∗] (i = 1, 2). Es folgt: kφ[ψ]k = 1
gdw gdw gdw
kφ1 [ψ]k = kφ2 [ψ]k kφ1 [χ]k = kφ2 [χ]k kφ[χ]k = 1
Es sei nun eine beliebige Belegung gegeben, bei der das Bikonditional ψ ↔ χ und die Formel φ[ψ] wahr sind, d.h. es gilt kψ ↔ χk = 1 und kφ[ψ]k = 1. Also gilt kψk = kχk, und mit dem Substitutionslemma folgt kφ[χ]k = 1. Damit ist die Korrektheit der Substitutionsregel nachgewiesen.
203
Beschreibung des KM-Kalküls
7.2
Der Kalish-Montague-Kalkül: Beschreibung
7.2.1
Schlußregeln
I. Regeln für die Aussagenlogik AL Es seien φ, ψ, χ, θ Formeln einer Sprache, welche die Aussagenlogik umfaßt. Abkürzungen: ‘Kj’: Konjunktion; ‘Dj’: Disjunktion; ‘Kd’: Konditional; ‘Bk’: Bikonditional. A. Grundregeln φ (Wh)
(Wiederholung) ∴ φ φ
¬ψ
∴ ψ→φ
∴ ψ→φ
(As)
(MP)
φ, φ → ψ
(Abschwächung)
(Modus Ponens)
∴ ψ
(MT)
φ → ψ, ¬ψ
(Modus Tollens)
∴ ¬φ
(MTP)
(DN)
φ ∨ ψ, ¬φ
φ ∨ ψ, ¬ψ
∴ ψ
∴ φ
¬¬φ
φ
∴ φ
∴ ¬¬φ
(Modus Tollendo Ponens)
(Doppelte Negation)
φ, ψ (∧E)
(Kj-Einführung) ∴ φ∧ψ
(∧B)
φ∧ψ
φ∧ψ
∴ φ
∴ ψ
(Kj-Beseitigung)
204
Natürliches Schließen
φ
ψ
∴ φ∨ψ
∴ φ∨ψ
(∨E)
(∨B)
(Dj-Einführung)
φ∨ψ, φ → χ, ψ → χ
(Dj-Beseitigung)
∴ χ φ↔ψ
φ↔ψ
∴ φ→ψ
∴ ψ→φ
(BK)
(KB)
(Bk-Kd )
φ → ψ, ψ → φ
(Kd-Bk )
∴ φ↔ψ B. Zulässige Regeln für AL 1. Jedes AL-Theorem in der Strich-Version, das eine konditionale Form pφ → ψq besitzt, kann in die zulässige Schlußregel pφ / ∴ ψq verwandelt werden; trägt das Theorem die Bezeichnung p (B-T) q, so sei die Regel mit (B) bezeichnet. Auf diese Weise erhält man z.B. die Schemata der Konjunktionsbeseitigung (∧B) aus dem AL-Theoremen (∧B-T) = (A.190 ), (A.200 ). 2. Hat ein AL-Theorem mit der Bezeichnung p (B-T) q die Gestalt eines Bikonditionals pφ ↔ ψq, so ergeben sich zwei Regeln mit demselben Namen (B) für die beiden Richtungen, d.h. pφ / ∴ ψq und pψ / ∴ φq. 3. Ist ein AL-Theorem p (B-T) q ein Konditional (oder enthält als Bikonditional eine Richtung) mit einer Konjunktion im Antecedens, so werden die Konjunktionsglieder in der zugehörigen Regel zur Prämissenmenge; nicht aufgelöst werden die Konjunktionen in den Theoremen (∧B-T), (∧Komm-T), (∧Ass-T), (∧Dt-T), (∨Dt-T), (↔E-T) und (↔∗ E-T). Ebenfalls zur Menge der Prämissen zusammengefaßt werden die Antecedentien φ, ψ eines iterierten Konditionals der Form p φ → (ψ → χ) q. Die folgenden zulässigen Regeln werden, in Gruppen unterteilt, wegen ihrer Wichtigkeit explizit angegeben. 1. Kettenschluß; Ex falso quodlibet; Reductio ad absurdum
(KS)
φ→ψ ψ→χ ∴ φ→χ
(EFQ)
φ , ¬φ ∴ ψ
(RdA)
φ→ψ φ → ¬ψ ∴ ¬φ
205
Beschreibung des KM-Kalküls 2. Fallunterscheidungen (FU)
(KlD)
φ → ψ , ¬φ → ψ
φ → ψ , ¬φ → χ
(djKlD)
∴ ψ
(djKsD)
∴ ψ∨χ
φ∨ψ , φ → χ, ψ → θ
φ → χ, ψ → χ
(∨E.Ant)
∴ φ∨ψ →χ
∴ χ∨θ
(→E.Ant)
¬φ → χ , ψ → χ
(↔E.Ant)
∴ (φ → ψ) → χ
φ∧ψ →χ , ¬φ ∧ ¬ψ → χ ∴ (φ ↔ ψ) → χ
3. Umwandlungen von Konditionalen ¬φ ∨ ψ
(DK)
(KD)
∴ φ→ψ
∴ ¬φ ∨ ψ
φ→ψ
(Kpp )
(Kpn )
∴ ¬φ → ¬ψ
(Imp)
φ→ψ
¬ψ → ¬φ ∴ φ→ψ
φ → (ψ → χ) ∴ φ∧ψ → χ
(Exp)
φ∧ψ → χ ∴ φ → (ψ → χ)
4. de Morgan – Regeln
(DM∧)
(DM∨)
¬ (φ ∧ ψ)
¬φ ∨ ¬ψ
∴ ¬φ ∨ ¬ψ
∴ ¬ (φ ∧ ψ)
¬ (φ ∨ ψ)
¬φ ∧ ¬ψ
∴ ¬φ ∧ ¬ψ
∴ ¬ (φ ∨ ψ)
206
Natürliches Schließen
(DM→)
(DM↔)
¬ (φ → ψ)
φ ∧ ¬ψ
∴ φ ∧ ¬ψ
∴ ¬ (φ → ψ)
¬ (φ ↔ ψ)
φ ↔ ¬ψ
∴ φ ↔ ¬ψ
∴ ¬ (φ ↔ ψ)
¬ (φ ↔ ψ)
¬φ ↔ ψ
∴ ¬φ ↔ ψ
∴ ¬ (φ ↔ ψ)
5. Distributionsregeln φ ∧ (ψ ∨ χ)
(φ ∧ ψ) ∨ (φ ∧ χ)
∴ (φ ∧ ψ) ∨ (φ ∧ χ)
∴ φ ∧ (ψ ∨ χ)
(∧Dt)
φ ∨ (ψ ∧ χ)
(φ ∨ ψ) ∧ (φ ∨ χ)
∴ (φ ∨ ψ) ∧ (φ ∨ χ)
∴ φ ∨ (ψ ∧ χ)
(∨Dt)
6. Substitutionsregel
(↔Sub)
φ ↔ ψ , χ[φ] ∴ χ[ψ]
II. PL1: Quantorenregeln Es seien φ eine PL1I-Formel, x, y Variablen, s, t Terme und a eine Konstante, . sowie Q = ∀, ∃. Var(φ) sei die Menge der in φ auftretenden Variablen. A. Grundregeln Vorbemerkung. Der KM-Kalkül weist im folgenden Quantorenteil eine gewisse Asymmetrie auf; sie liegt darin, daß es zwar eine Regel gibt, welche einen Allquantor beseitigt, aber keine, die einen Allquantor einführt. Die Einführungsregel für den Allquantor heißt im axiomatischen Kalkül Generalisierungsregel und ist dort neben dem aussagenlogischen Modus Ponens sogar die einzige Schlußregel. Im KM-Kalkül dagegen wird ein Allsatz abgeleitet, indem vorher eine ‘zeige’-Zeile eingeführt wird und die Matrix des Allsatzes in einem Unterbeweis hergeleitet wird; siehe unten.
207
Beschreibung des KM-Kalküls
∀xφ
(∀B)
(All-Beseitigung)
∴ φxt φxt
(∃E)
∃xφ
(∃B)
(Existenz-Beseitigung)
∴ φxa
∴ ∃xφ
“a neu” gemäß Def. sK:6.5.2
B. Zulässige Regeln Qxφ (AV)
∴ Qyφxy
(QN)
y 6∈ Var (φ)
¬∀xφ
∃x¬φ
∴ ∃x¬φ
∴ ¬∀xφ
¬∃xφ
∀x¬φ
∴ ∀x¬φ
∴ ¬∃xφ
(Alphabetische Varianz )
(Quantoren-Negation)
III. PL1I: Identitätsregeln A. Grundregeln (SI)
(Selbstidentität)
∴ t=t s = t , φ[s]
(Lb) ∴ φ[t]
Fr(s, t; ∗; φ)
(Substitution, Leibniz-Prinzip)
B. Zulässige Regeln s=t (=Sym)
r = s,s = t (=Tr)
∴ t=s
(Symmetrie; ∴ r=t
Transitivität)
208
Natürliches Schließen
7.2.2
Der Ableitungsbegriff
Es seien φ, ψ, χ, ψ1 , ψ2 PL1I-Formeln, x1 , . . . , xk weitere Variablen, a eine Individuenkonstante und Σ eine Menge von Formeln. 1. Eine KM-Schlußregel ist eine der in Unterabschnitt 7.2.1 aufgeführten Grundregeln oder eine abgeleitete zulässige Regel des KM-Kalküls. 2. Eine Zeile (in einer KM-Herleitung) ist eine Formel φ oder ein Ausdruck der Gestalt p zeige φq oder pzeige 6 φ q. φ heißt die Hauptformel der Zeile.
Mitteilungszeichen für Zeilen: ‘ζ’, ‘η’, ‘θ’, auch mit Strichen und Indizes versehen. Eine Konfiguration ist eine vertikal angeordnete Folge von Zeilen, die ganz oder teilweise, einfach oder mehrfach eingerahmt sein kann. Mitteilungszeichen: ‘α’, ‘β’, ‘γ’, auch mit Strichen und Indizes versehen. 3. Eine Zeile ζ heißt verfügbar (Abk.: ‘vfgb’) in einer Konfiguration α, wenn 3.1 ζ ein nicht gerahmtes Folgenglied von α ist, und 3.2 ζ kein ungestrichenes ‘zeige’ enthält. 4. α sei eine Konfiguration und ζ, η seien Zeilen von α; ζ ist früher als η in α, wenn ζ in α “über” η steht, d.h. eine kleinere Nummer als η in der Folge α besitzt. 5. Es seien α, ζ, η wie in 4.; ζ heißt Antecedens-Zeile von η in α, wenn gilt: 5.1 ζ ist früher in α als η; 5.2 ζ ist verfügbar in α. 6. Induktive Definition einer sinnvollen Konfiguration (sK) zu Σ: 6.0 Die leere Konfiguration ist eine sK zu Σ; 6.1 ist α sK zu Σ, so ist p α q eine sK zu Σ (“Ansatz Unterbeweis”); zeige φ 6.2 ist α sK zu Σ und gilt φ ∈ Σ, so ist p α q eine sK zu Σ (“Prämisse”); φ 6.3 ist die Zeilenfolge α sK zu Σ der Form pβ q bzw. zeige φ → ψ pβ q, zeige ∀x1 · · · ∀xk (φ → ψ) so ist p α q eine sK zu Σ (“Bedingte (All-)Ableitung” [BA bzw. BAA]); φ
209
Beschreibung des KM-Kalküls 6.4 ist α sK zu Σ der Form p β q, so ist p α q eine sK zu Σ; zeige φ ¬φ ist α sK zu Σ der Form p β q, so ist p α q eine sK zu Σ zeige ¬φ φ (“Indirekte Ableitung” [IA]);
6.5 Sei α sK zu Σ und β die Konfiguration p α q; φ 6.5.1 folgt φ mit einer KM-Schlußregel aus Antecedens-Zeilen von φ in β, so ist β eine sK zu Σ; . 6.5.2 ist φ = φxa , und folgt φ mit der Schlußregel (∃B) aus einer Antecedens-Zeile von φ in β derart, daß der substituierte Term a in keiner früheren Zeile auftritt, so ist β eine sK zu Σ (“a ist neu”); 6.6 gegeben sei eine sK γ zu Σ der Form p α q, so daß gilt: zeige φ β 6.6.1 keine Zeile von β enthält ein ungestrichenes ‘zeige’; 6.6.2 mindestens eine der folgenden Abschlußbedingungen ist erfüllt: (1) (DA) φ ist verfügbar in β; . (2) (BA) φ = ψ1 → ψ2 , und ψ2 ist verfügbar in β; (3) (IA) χ und ¬χ sind verfügbar in β für ein χ; . (4) (AA) φ = ∀x1 . . . ∀xk ψ, und: a. ψ ist verfügbar in β;
b. kein xi ist frei in Σ oder tritt frei in der Hauptformel einer Antecedenszeile von p zeige φ q in γ auf; Variablen-Bedingung (VB) . (5) (BAA) φ = ∀x1 , . . . , xk (ψ1 → ψ2 ), und: a. ψ2 ist verfügbar in β;
b. wie in (4b); dann ist auch p α q eine sK zu Σ. zeige 6 φ
(VB)
β 7. Eine KM-Herleitung von φ aus Σ ist eine sK α zu Σ, so daß gilt: 7.1 Jede Zeile von α, die nicht mit 6.2 eingeführt wurde, ist eingerahmt oder beginnt mit ‘zeige 6 ’; 7.2 pzeige 6 φ q ist verfügbar in α.
8. φ heißt im KM-Kalkül herleitbar aus Σ (kurz: KM-herleitbar aus Σ), wenn es eine KM-Herleitung von φ aus Σ gibt; in Zeichen: Σ
`KM
φ
9. φ heißt ein KM-Theorem, wenn φ aus der leeren Menge KM-herleitbar ist; in Zeichen: `KM φ
210
7.2.3
Natürliches Schließen
Hinweise zur Beweistechnik
I. Übersicht zur Definition der sinnvollen Konfiguration 1. Eröffnungsregeln • Einführung von p zeige φ q ; φ kann beliebig sein: Eröffnung eines Unterbeweises • Einführung von Prämissen
6.1 6.2
• Eröffnung einer BA oder einer BAA
6.3
• Eröffnung einer IA
6.4
2. Schlußregeln • Anwendung von Kalkülregeln
6.5
Bei (∃B) ist die Bedingung “a neu” zu beachten!
3. Bereits bewiesene Theoreme • Anstelle eines Unterbeweises kann als Abkürzung ein bereits bewiesenes Theorem als Zeile eingefügt werden. 4. SCHLIESSUNGSREGELN . • Schließen der Ableitung bei γ = p α q zeige φ β
6.6.2
(1)
φ verfügbar in β
DA
(2)
. φ = ψ1 → ψ2
BA
(3)
ψ2 verfügbar in β χ und ¬χ verfügbar in β für ein χ
(4)
. φ = ∀x1 . . . ∀xk ψ
(5)
. φ = ∀x1 . . . ∀xk (ψ1 → ψ2 )
ψ verfügbar in β
ψ2 verfügbar in β
(VB)!
(VB)!
IA
AA
BAA
211
Beschreibung des KM-Kalküls (vfgb)
(i) nicht eingerahmt und (ii) nicht hinter einem nicht gestrichenen ‘zeige’
(VB)
Kein xi ist frei in Σ oder tritt frei in der Hauptformel einer Antecedenszeile von p zeige φ q in γ auf
Verwendete Abkürzungen AA
All-Ableitung
DA
Direkte Ableitung
BA
Bedingte Ableitung
A-BA
Annahme zur BA
BAA
Bedingte All-Ableitung
A-BAA
Annahme zur BAA
IA
Indirekte Ableitung
A-IA
Annahme zur IA
Hw(n)
Hinweis Nr. (n) in den Beweisplänen
Bemerkungen. • Alle Hinweise in den Beweisplänen sind lediglich Vorschläge, denen man folgen sollte, falls sich kein kürzerer Weg unmittelbar anbietet. • Direkte Beweise sind indirekten vorzuziehen, wenn beide möglich sind.
• Vor der Eröffnung eines Unterbeweises ist genau zu prüfen, ob ein solcher unvermeidlich ist. Zu viele ‘zeige’-Zeilen erschweren die Übersicht über die Beweisstruktur. Wirklich notwendig ist eine ‘zeige’-Zeile nur für den Beweis eines Allsatzes.
• Wird mit einem Hinweis ‘Hw.(n)’ zur Beweistechnik ein Unterbeweis mit ‘zeige’ eröffnet, so stellt das keinen Ableitungsschritt dar! Der Verweis auf eine frühere Zeile oder die bloße Angabe einer Regel im Kommentar einer solchen Zeile erweckt aber den Eindruck dieses gedanklichen Fehlers und ist daher zu vermeiden. Was hinter dem ungestrichenen ‘zeige’ steht, gilt es ja gerade als Teilbehauptung des Gesamtbeweises noch nachzuweisen. Allerdings kann es hilfreich sein anzumerken, warum man einen Unterbeweis ansetzt, etwa um sich eine Prämisse für die spätere Anwendung einer Regel R zu verschaffen; in diesem Fall kann der Kommentar (anstelle von oder zusätzlich zu ‘Hw.(n)’) kurz lauten: “für R !”. • Hat man eine ‘zeige’-Zeile eingeführt, so muß der zugehörige Unterbeweis zuende geführt und das ‘zeige’ gestrichen werden. • Die in runden Klammern stehende Ziffer an den Rahmen der abgeschlossenen Beweise gibt die Nummer der Schließungsregel in der Klausel 6.6.2 der Definition einer sinnvollen Konfiguration an. • Zu 6.6.2(3): Die Widerspruchsformel χ nimmt auf das zu beweisende φ gar keinen Bezug. Der Beweis ist also auch dann zuende, wenn er gar nicht mit einer indirekten Annahme (A-IA) angesetzt wurde. Aus der Struktur des Diamanten wissen wir, daß aus dem zu χ ∧ ¬χ äquivalenten Falsum ⊥ alles logisch folgt. Die Abschlußbedingung (3) ist daher in jedem Fall semantisch korrekt.
212
Natürliches Schließen
II. Beweispläne A. Aussagenlogik AL
(1)
(2)
Typ der Behauptung
Beweisplan
p zeige φ → ψ q
BA:
wobei φ weder eine Disjunktion, ein Konditional noch ein Bikonditional ist
1. nimm φ an (A-BA) 2. leite ψ her, entweder: a. direkt oder b. mit p zeige ψ q
p zeige φ ↔ ψ q
p zeige φ → ψ q
p zeige ψ → φ q
dann: (KB)
(3)
p zeige φ ∧ ψ q
p zeige φ q p zeige ψ q dann: (∧E)
(4)
(5)
p zeige φ ∨ ψ q
p zeige ¬φ → ψ q
p zeige φ ∨ ψ → χ q
p zeige φ → χ q
dann: (KD)
p zeige ψ → χ q
dann: (∨E.Ant)
(6)
p zeige (φ → ψ) → χ q
p zeige ¬φ → χ q p zeige ψ → χ q
dann: (→E.Ant)
(7)
p zeige (φ ↔ ψ) → χ q
p zeige φ ∧ ψ → χ q
p zeige ¬φ ∧¬ψ → χ q dann: (↔E.Ant)
213
Beschreibung des KM-Kalküls B. Prädikatenlogik PL1
(8)
(9)
Typ der Behauptung
Beweisplan
p zeige ∀x1 . . . ∀xk φ q
AA:
wobei φ kein Konditional ist
leite φ her, entweder: a. direkt oder b. mit p zeige φ q
p zeige ∀x1 . . . ∀xk (ψ1 → ψ2 ) q
BAA: 1. nimm ψ1 an (A-BAA) 2. leite ψ2 her, entweder: a. direkt oder b. mit p zeige ψ2 q
(10)
p zeige ∃xφ q
1. p zeige φxt q dann: (∃E); oder: 2. IA
(11)
p zeige φ q wobei φ nicht vom Typ (1) bis (10) ist
IA oder FU
214
Natürliches Schließen: Prädikatenlogik
Kapitel 8
Kalkül des natürlichen Schließens: Prädikatenlogik Wir wollen uns jetzt einen Überblick über die gültigen Theoreme der Prädikatenlogik mit Identität verschaffen und wenden uns dazu dem KM-Kalkül für PL1I zu. Seine semantische Korrektheit sowohl in der Bewertungssemantik als auch in der modelltheoretischen Semantik bedeutet, daß alle im Kalkül hergeleiteten Theoreme gültig sind. Die prädikatenlogischen Schlußregeln für den PL1I-Kalkül wurden bereits im Abschnitt 7.2.1 angegeben. Es sind dies im wesentlichen die oben diskutierten PL1I-Prinzipien, welche lediglich als Regeln geschrieben sind. Die Grundregeln des Quantorenkalküls sind die folgenden:
(∀B)
∀xφ
(All-Beseitigung)
∴ φxt
(∃E)
φxt ∴ ∃xφ
∃xφ
(∃B)
∴ φxa
(Existenz-Einführung/ Existenz-Beseitigung, mit “a neu”)
Die ersten beiden Regeln sind die Gesetze der Allspezialisierung und der Existenzabschwächung in Regelform. Ihre semantische Korrektheit ergibt sich aus der Gültigkeit der Gesetze, die oben diskutiert wurde. Eine Besonderheit bietet die Regel der Existenz-Beseitigung (∃B). Sie gestattet es, bei einem gegebenen Existenzsatz ∃xφ den Quantor zu beseitigen und in der Matrix für die Variable x eine Konstante a einzusetzen, die allerdings gemäß Schlußregel 6.5.2 in Abschnitt 7.2.2 “neu” sein muß, d.h. im bisherigen Beweis noch nicht verwendet wurde. Der intuitive Grund für diese wesentliche Einschränkung ist dieser: Angenommen, man hat einen Existenzsatz hergeleitet: “es gibt ein x mit der Eigenschaft φ”; dann fährt man im informellen Schließen üblicherweise so fort:
215
216
Natürliches Schließen: Prädikatenlogik
“Sei a ein solches x . . .” Der Vorteil der “Benennung” eines unbestimmten Objekts, von dem man lediglich weiß, daß es die genannte Eigenschaft φ hat, liegt darin, daß man im weiteren Verlauf des Beweises sich darauf zurückbeziehen und weitere Eigenschaften von a nachweisen kann. Doch wird man von a nichts beweisen können, was nicht in der Eigenschaft φ gründet und also auch auf jedes andere a0 mit der Eigenschaft φ ebenso zuträfe; insofern bleibt der Bezug auf jenes existierende x schematisch. Es ist so, als ob die gegebene Eigenschaft φ und alle weiteren für a abgeleiteten Aussagen am Ende des Beweises konjunktiv zusammengefaßt und mit einem großen Existenzquantor abgebunden wären. Das erklärt auch die Variablenbedingung, daß die gewählte Konstante neu sein muß: Einerseits darf sie nicht mit einer Konstante übereinstimmen, die mit einer früheren Existenzbeseitigung eingeführt wurde: auf jene Konstante treffen ja im allgemeinen völlig andere Dinge zu, und wir haben schon gesehen, daß wir die Konjunktion zweier Existenzsätze nicht mit dem Existenzsatz der Konjunktion der beiden Matrix-Sätze verwechseln dürfen. Andererseits verbietet es der schematische Charakter der Verwendung einer solchen Konstante, daß sie mit einer Konstante, etwa b, identifiziert wird, welche an früherer Stelle mittels All-Beseitigung eingeführt wurde: b nämlich liefert intuitiv gesehen wirklich einen Spezialfall, von dem nicht plötzlich erwartet werden kann, auf ihn treffe die Eigenschaft φ des später im Beweis auftretenden Existenzsatzes zu. Die Verwendung des Symbols ‘a’ bei der Existenz-Beseitigung darf also nicht mit dem begrifflich völlig anders gelagerten “Spezialisieren” eines Allsatzes auf einen beliebig gegebenen Individuenterm verwechselt werden. Das in der Regel (∀B) verwendete Mitteilungszeichen ‘t’ deutet darauf hin, daß neben Konstanten auch andere Individuenterme (z.B. Variablen oder komplexe Terme, falls die Sprache sie vorsieht) zur Instanzenbildung herangezogen werden können. Der Unterschied zwischen (∀B) und (∃B) zeigt sich übrigens technisch vor allem darin, daß ein Existenzsatz ∃xφ nach der Anwendung von (∃B) “verbraucht” ist, während die Regel (∀B) auf ein und denselben Allsatz ∀xφ beliebig oft angewendet werden kann: sie läßt sich “recyclen”, und manchmal ist das sogar nötig; siehe unten. Wir wollen an einem intuitiven Beispiel klarmachen, wie die drei Quantorenregeln und die All-Einführung mittels Unterbeweis verwendet werden. Dazu betrachten wir die in der Einleitung angesprochene Teil-Relation ‘v’, von der wir lediglich fordern, daß sie transitiv ist; das ist unsere erste Prämisse. Ferner definieren wir die Überlappungsrelation ‘◦’ mit Hilfe der Teilrelation, indem wir sagen, daß zwei Objekte sich genau dann überlappen, wenn sie einen gemeinsamen Teil haben; dieses Bikonditional ist die zweite Prämisse. Damit können wir prädikatenlogisch beweisen: Wenn ein Objekt x Teil eines Objekts y ist, so wird y von allen Testobjekten z überlappt, die x überlappen. Zunächst werden die einzelnen Beweisschritte informell angegeben. Informeller Beweis: 1. Vor.: Ist x ein Teil von y und y ein Teil von z, so ist x ein Teil von z. 2. Vor.: x überlappt y gdw x und y einen gemeinsamen Teil haben. 3. Beh.: Wenn x Teil von y ist, dann überlappt alles, was x überlappt, auch y.
217
KM-Kalkül 4. Bew. Sei x ein beliebiger Teil von y.
5. Dann ist zu zeigen: ein jedes z, das x überlappt, überlappt auch y. 6. Möge ein beliebiges z also x überlappen. 7. Dann haben z und x nach Vor. 2 einen gemeinsamen Teil. 8. Der gemeinsame Teil möge u0 heißen. 9. u0 ist Teil von x, und x ist nach Annahme Teil von y, also ist mit Vor. 1 u0 auch Teil von y. 10. Damit ist u0 sowohl Teil von z als auch von y. 11. Also haben auch z und y einen gemeinsamen Teil. 12. Damit überlappen sich z und y, was zu zeigen war. Die informelle Praxis der Vergabe eines schematischen “Namens” (hier u0 für ein in Zeile 7 als existent nachgewiesenes Objekt) entspricht der Regel der ExistenzBeseitigung. Der Index 0 signalisiert dabei, daß die Bedeutung dieses Namens für den Rest des laufenden (Unter-)Beweises festgehalten wird. Im formalen Kalkül wird dafür jeweils eine neue Konstante eingeführt (siehe obige Erläuterung). Das formale Gegenstück zu diesem Beweis im Kalish-Montague-Kalkül sieht dann folgendermaßen aus: Formaler Beweis im KM-Kalkül: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
∀x∀y∀z(x v y ∧ y v z → x v z) ∀x∀y ( x ◦ y ↔ ∃u(u v x ∧ u v y ))
Präm. 1 Präm. 2
zeige ∀x∀y (x v y → ∀z (z ◦ x → z ◦ y)) A-BAA
xvy
zeige ∀z(z ◦ x → z ◦ y) A-BAA . 2, 2 × ∀B: t = z, x; BK,6,MP
z◦x ∃u(u v z ∧ u v x)
7,∃B, a neu . 8,4,∧E,1; 3×∀B: t = a, x, y,MP
avz∧avx avy
avz∧avy ∃u(u v z ∧ u v y) z◦y
8,∧B,9,∧E 10,∃E
—(5) —(5)
. 2, 2 × ∀B: t = z, y; BK,11,MP
Die Zeilen im informellen und im formalen KM-Beweis entsprechen sich jeweils; die Formeln im letzteren sind logische Formen der informellen Aussagen gleicher Zeilennummer. Die Quantoren laufen über den intendierten Anwendungsbereich mereologischer Objekte.
218
Natürliches Schließen: Prädikatenlogik
Beweise von Allsätzen müssen im KM-Kalkül grundsätzlich mit einer ‘zeige’Zeile angesetzt werden.1 Die Behauptung in Zeile 3 unter dem zunächst ungestrichenen ‘zeige’ stellt einen (doppelten) bedingten Allsatz dar; sie wird im Kalkül bewiesen durch eine bedingte All-Ableitung BAA, in der das Antecedens der Matrix, x v y, als Annahme zur bedingten All-Ableitung (A-BAA) eingeführt wird. Hier lehnen sich die Kalkül-Regeln an die informelle Beweistechnik in der Mathematik an, wo Beweise von All-Aussagen typischerweise schematisch in freien Variablen geführt werden, d.h. ohne explizite Allquantoren. Der Beweis ist zuende, wenn das Consequens für x, y, hier die Formel ∀z(z ◦ x → z ◦ y), hergeleitet ist. In unserem Fall ist das Consequens selbst wieder ein bedingter Allsatz. Für seinen Beweis müssen wir also erneut eine ‘zeige’-Zeile ansetzen. Wiederum gilt es, unter der Annahme der Bedingung z ◦ x das Consequens z ◦ y herzuleiten. Die Quantifikationsvariable, um die es jetzt geht, ist lediglich z, während x und y als freie “Parameter” aus dem Hauptbeweis mitlaufen. Mit der Prämisse aus Zeile 2 können wir von z ◦ x zu dem Existenzsatz ∃u(u v z ∧ u v x) übergehen; die ausführliche Begründung der Teilschritte findet sich im Kommentar: die Spezialisierung mit der Regel der All-Beseitigung (∀B) erfolgt auf die Variablen z und x, der Rest ist Aussagenlogik, in Zukunft häufig einfach mit “(AL)” kommentiert. Jetzt wird die Existenz-Beseitigung (∃B) angewendet, was die Instanz a v z ∧ a v x ergibt. Dabei wurde als “lokaler Name” für ein solches u eine Konstante a gewählt, die im bisherigen Beweis noch nicht auftrat (Kommentar: “a neu”). Jetzt wird die Transitivität der Teil-Relation aus Zeile 1 verwendet, und es ergibt sich a v y (Zeile 9). Damit bekommen wir aussagenlogisch Zeile 10, und die Regel (∃E) der Existenz-Einführung liefert die Existenz eines gemeinsamen Teils von z und y. Zeile 2, von rechts nach links gelesen, ergibt dann das gewünschte Consequens z ◦ y der bedingten All-Ableitung im Unterbeweis von Zeile 5. Dieser kann nun geschlossen werden. Allerdings muß die damit verbundene Variablenbedingung (VB) verifiziert werden; siehe Schließungsregel 6.6.2 (4) in den Abschnitten 7.2.2, 7.2.3. Sie besagt, daß die Variablen der Quantifikation (hier: z) nicht frei in den Prämissen oder in einer Hauptformel der Antecedens-Zeilen des Beweisansatzes (hier: Zeile 4) auftreten. Das ist aber offensichtlich der Fall. Also kann der Rahmen gesetzt werden, mit dem Vermerk “(5)” für den vorliegenden Fall der Schließungsregel. In Zeile 5 wird das ‘zeige’ gestrichen. Nun steht diese Zeile aber als Beweiszeile zur Verfügung, und damit ist zugleich der Hauptbeweis zuende: die Formel ∀(z ◦ x → z ◦ y) ist die Formel ψ2 der bedingten All-Ableitung. Auch hier ist die Variablenbedingung (VB), diesmal für x und y, erfüllt. Die Schließungsregel ist wieder die Nummer (5), und der Beweis ist vollständig.
8.1
Monadische Prädikatenlogik
Wir werden nun darangehen, einige wichtige Theoreme aus der unten angegebenen Liste von PL1I-Theoremen im KM-Kalkül zu beweisen. Zunächst wenden wir uns solchen Theoremen zu, in denen nur einstellige Prädikate auftreten. Solche Formeln gehören dem monadischen Fragment der Prädikatenlogik an. Ihre 1 Das ist der Grund, weshalb es keine Regel der All-Einführung gibt. Das stellt eine gewisse technisch bedingte Asymmetrie des KM-Kalküls dar, die wir aus [132] mit übernehmen.
219
Monadische Prädikatenlogik Quantorenstruktur ist besonders einfach.
Bei allen folgenden Beweisen müssen bzw. sollten folgende Hinweise beachtet werden (alle bis auf den zweiten und letzten sind obligatorisch): • Quantorenregeln stets von außen nach innen anwenden! Niemals im Bereich eines anderen Quantors spezialisieren. • All-Beseitigung (∀B): Diese Regel ist beliebig oft wiederverwendbar! • Der Beweis einer Allformel muß mit ‘zeige’ angesetzt werden; nur auf diese Weise werden Allquantoren in einen Beweis eingeführt. • Bei Schließungsregeln (4) und (5) Variablenbedingung (VB) beachten! • Existenz-Beseitigung (∃B) mit Konstante a: Beachte a neu ! (auf ein und denselben Existenzsatz nur einmal anwendbar) • “Vorfahrtsregel”: (∃B) (∀B) (∃B) vor (∀B) anwenden, wenn die Wahl besteht Das erste Theorem ist das Gesetz der Quantorendistribution QD. Da es die Gestalt eines iterierten Konditionals hat, wird zunächst zweimal eine bedingte Ableitung eröffnet. Nun ist der Allsatz ∀xQx zu zeigen. Es gilt, in den folgenden Beweiszeilen die Matrix Qx herzuleiten; dabei ist zu beachten, daß die Matrix auch wirklich mit der quantifizierten Variablen (hier x) und nicht mit irgendeiner anderen Variablen erscheint. Nun steht in Zeile 2 der (verfügbare) bedingte Allsatz ∀x(P x → Qx), der im Consequens die herzuleitende Formel Qx enthält. Das für einen (MP)-Schluß erforderliche Antecedens P x steht unter dem Allquantor in Zeile 4. Also spezialisieren wir den Allsatz ∀xP x auf die Variable x und direkt danach die Zeile 2 auf die gleiche Variable. Dies ermöglichst den abschließenden Schluß auf Qx. 1. 2. 3.
zeige ∀x(P x → Qx) → (∀xP x → ∀xQx) ∀x(P x → Qx) zeige ∀xP x → ∀xQx
P.3 A-BA
∀xP x
A-BA
6.
Px
4,∀B
7. 8.
P x → Qx Qx —(4) —(2) —(2)
4. 5.
zeige ∀xQx 2,∀B 6,7,MP
Es ist klar, daß die beiden vorgenommenen All-Beseitigungen bezüglich der Variablen zusammenpassen müssen, da sonst der aussagenlogische Schluß nicht möglich ist. Beim Schließen des innersten Teilbeweises mußte die Variablenbedingung (VB) verifiziert werden; sie ist aber offensichtlich erfüllt.
220
Natürliches Schließen: Prädikatenlogik
Das nächste Theorem demonstriert das Zusammenwirken der beiden Spezialisierungsschlüsse (∃B) und (∀B). 1. 2. 3.
zeige ∀x(P x → Qx) → (∃xP x → ∃xQx)
P.4 A-BA
∀x(P x → Qx)
zeige ∃xP x → ∃xQx
4. 5.
∃xP x Pa
6. 7.
P a → Qa Qa
8.
∃xQx
A-BA 4,∃B, a neu 2,∀B 2,6,MP —(2)
—(2)
7,∃E
In Zeile 5 bestand die Möglichkeit, die “Vorfahrtsregel” zu mißachten und zuerst Zeile 2 mit (∀B) auszuwerten. Das hätte jedoch lediglich den Beweis verlängert, etwa so:
1. 2. 3. 4. 5. 6.
zeige ∀x(P x → Qx) → (∃xP x → ∃xQx) ∀x(P x → Qx)
A-BA
∃xP x P a → Qa
A-BA 2,∀B
zeige ∃xP x → ∃xQx
4,∃B, b neu!
Pb
7. 8.
P b → Qb Qb
9.
∃xQx
8.1.1
P.4
2,∀B 2,6,MP —(2)
—(2)
7,∃E
Monadische Theoreme
Wir geben nun eine Liste von Theoremen der monadischen Prädikatenlogik und werden danach einige ausgewählte Theoreme besprechen. Die folgende Tabelle erklärt die verwendeten Kürzel anhand einiger typischer Fälle. Die Symbole ‘P ’, ‘Q’, ‘R’ stehen in Verbindung mit einer Variablen für einstellige Prädikatkonstanten, ‘Q’ ohne Variable für eine Satzkonstante (= nullstellige Prädikatkonstante; siehe Kapitel 4); ‘t’ sei ein beliebiger Term.
Monadische Prädikatenlogik QD: QN : LQ: GU : Distr [∃; ∧]: Koll [∀; ∨]: BrB [∀; ↔]: BrE [∃; ↔]: BrBE [∀; ∧]: BrBE [∀, ∃; →, Ante]: bdA: bdE :
221
Quantorendistribution von ∀ über → Quantorennegation Leere Quantifikation Gebundene Umbenennung Verteilung (“Distribution”) von ∃ über ∧ Sammlung (“Kollektion”) zweier ∀-Quantoren aus einer Disjunktion Bereichsbeschränkung von ∀ beim Bikonditional Bereichserweiterung von ∃ beim Bikonditional Bereichsbeschränkung und -erweiterung von ∀ bei der Konjunktion Bereichsbeschränkung und -erweiterung von ∀ im Antecedens eines Konditionals, mit Wechsel zu ∃ bedingter Allsatz bedingter Existenzsatz
(P.1)
∀xP x → P t
(Sp)
(P.2)
P t → ∃xP x
(ExAb)
(P.3)
∀x(P x → Qx) → (∀xP x → ∀xQx)
(P.4)
∀x(P x → Qx) → (∃xP x → ∃xQx)
(P.5)
¬∀xP x ↔ ∃x¬P x
(QN )
(P.6)
¬∃xP x ↔ ∀x¬P x
(QN )
(P.7)
∃x(P x ∨ Qx) ↔ ∃xP x ∨ ∃xQx
(Distr,Koll [∃; ∨])
(P.8)
∀x(P x ∧ Qx) ↔ ∀xP x ∧ ∀xQx
(Distr,Koll [∀; ∧])
(P.9)
∃x(P x ∧ Qx) → ∃xP x ∧ ∃xQx
(Distr [∃; ∧])
(QD)
(P.10)
∀xP x ∨ ∀xQx → ∀x(P x ∨ Qx)
(Koll [∀; ∨])
(P.11)
(∃xP x → ∃xQx) → ∃x(P x → Qx)
(P.12)
(∀xP x → ∀xQx) → ∃x(P x → Qx)
(P.13)
∀x(P x ↔ Qx) → (∀xP x ↔ ∀xQx)
(P.14)
∀x(P x ↔ Qx) → (∃xP x ↔ ∃xQx)
(P.15)
∀x(Q ∧ P x) ↔ Q ∧ ∀xP x
(BrBE [∀; ∧])
(P.16)
∃x(Q ∧ P x) ↔ Q ∧ ∃xP x
(BrBE [∃; ∧])
(P.17)
∀x(Q ∨ P x) ↔ Q ∨ ∀xP x
(BrBE [∀; ∨])
(P.18)
∃x(Q ∨ P x) ↔ Q ∨ ∃xP x
(BrBE [∃; ∨])
(P.19)
∀x(Q → P x) ↔ (Q → ∀xP x)
(Koll [∃; →]) (Distr [∀; ↔])
(BrBE [∀; →, Cons ])
222
Natürliches Schließen: Prädikatenlogik
(P.20)
∃x(Q → P x) ↔ (Q → ∃xP x)
(BrBE [∃; →, Cons ])
(P.21)
∀x(P x → Q) ↔ (∃xP x → Q)
(BrBE [∀, ∃; →, Ante])
(P.22)
∃x(P x → Q) ↔ (∀xP x → Q)
(BrBE [∃, ∀; →, Ante])
(P.23)
∀x(P x ↔ Q) → (∀xP x ↔ Q)
(BrB [∀; ↔])
(P.24)
∀x(P x ↔ Q) → (∃xP x ↔ Q)
(P.25)
(∃xP x ↔ Q) → ∃x(P x ↔ Q)
(BrE [∃; ↔])
(P.26)
(∀xP x ↔ Q) → ∃x(P x ↔ Q)
(BrE [∀, ∃; ↔])
(P.27)
∀xQ ↔ Q
(LQ)
(P.28)
∃xQ ↔ Q
(LQ)
(P.29)
∃x(∃xP x → P x)
(P.30)
∃x(P x → ∀xP x)
(P.31)
∀xP x ↔ ∀yP y
(GU )
(P.32)
∃xP x ↔ ∃yP y
(GU )
(P.33)
∀xP x → ∃xP x
(P.34)
∀xP x ∧ ∃xQx → ∃x(P x ∧ Qx)
(P.35)
∀x(P x → Qx) ∧ ∃x(P x ∧ Rx) → ∃x(Qx ∧ Rx)
(P.36)
∀x(P x → Qx ∨ Rx) → ∀x(P x → Qx) ∨ ∃x(P x ∧ Rx)
(P.37)
¬∀x(P x → Qx) ↔ ∃x(P x ∧ ¬Qx)
(Neg bdA)
(P.38)
¬∃x(P x ∧ Qx) ↔ ∀x(P x → ¬Qx)
(Neg bdE )
(P.39)
¬∃xP x → ∀x(P x → Qx)
(P.40)
¬∃xP x ↔ ∀x(P x → Qx) ∧ ∀x(P x → ¬Qx)
(P.41)
¬∃xP x ∧ ¬∃xQx → ∀x(P x ↔ Qx)
(P.42)
∃x(P x → Qx) ↔ ∃x¬P x ∨ ∃xQx
(P.43)
∃xP x ∧ ∃x¬P x ↔ ∀x∃y(P x ↔ ¬P y)
(P.44)
∀x∃z(P x → ∃y(Qy → Rz)) ↔ (∃xP x ∧ ∀xQx → ∃xRx)
(P.45)
∀x∃y(P x → Qy) ↔ ∃y∀x(P x → Qy)
(P.46)
∀x∃y(P x ∧ Qy) ↔ ∃y∀x(P x ∧ Qy)
(P.47)
∀x∃y(P x ∨ Qy) ↔ ∃y∀x(P x ∨ Qy)
(Leeres Ante im bdA)
223
Monadische Prädikatenlogik (P.48)
∀x∀y∃z(P x ∧ Qy → Rz) ↔ ∀y∃z∀x(P x ∧ Qy → Rz)
(P.49)
∀x∀y(P x ↔ Qy) ↔ (∃xP x → ∀xQx) ∧ (∃xQx → ∀xP x)
(P.50)
∀x∃y(P x ↔ Qy) ↔ (∀xP x ∨ ∃x¬Qx) ∧ (∃xQx ∨ ∀x¬P x)
(P.51)
∃x∃y(P x ↔ Qy) ↔ (∃xP x ∧ ∃xQx) ∨ (∃x¬P x ∧ ∃x¬Qx)
(P.52)
∃x∀y(P x ↔ Qy) ↔ (¬∃xP x ∧ ∃x¬Qx) ∨ (∃xQx ∧ ∀xP x)
Ähnlich wie in der Aussagenlogik verabreden wir, daß es zu den obigen Theoremen “gestrichene” Versionen geben soll, allerdings der Einfachkeit halber nur von solchen Theoremen, welche nur Quantifikationen über eine Variable x enthalten. Es werde folgende Ersetzung vorgenommen: P x 7→ φ, Qx 7→ ψ, Q (als Satzkonstante) 7→ φ mit der Bedingung “x 6∈ FV (φ)”. Dabei stehen φ und ψ für beliebige Formeln, die x frei enthalten (können), sofern nicht die Variablenbedingung angefügt ist. Wir notieren die Strichversionen der Theoreme (P.1) und (P.2) sowie der acht BrBE-Theoreme (P.15) – P.22). (P.10 )
∀xφ → φxt
(Sp)
(P.20 )
φxt → ∃xφ
(ExAb)
(P.150 )
∀x(φ ∧ ψ) ↔ φ ∧ ∀xψ
x 6∈ FV (φ)
(P.160 )
∃x(φ ∧ ψ) ↔ φ ∧ ∃xψ
x 6∈ FV (φ)
(P.170 )
∀x(φ ∨ ψ) ↔ φ ∨ ∀xψ
x 6∈ FV (φ)
(P.180 )
∃x(φ ∨ ψ) ↔ φ ∨ ∃xψ
x 6∈ FV (φ)
(P.190 )
∀x(φ → ψ) ↔ (φ → ∀xψ)
x 6∈ FV (φ)
(P.200 )
∃x(φ → ψ) ↔ (φ → ∃xψ)
x 6∈ FV (φ)
(P.210 )
∀x(φ → ψ) ↔ (∃xφ → ψ)
x 6∈ FV (ψ)
(P.220 )
∃x(φ → ψ) ↔ (∀xφ → ψ)
x 6∈ FV (ψ)
Wir geben im folgenden bis auf eine Ausnahme Beweise von ungestrichenen Theoremen; die gestrichenen Versionen sollen dann wie schon in der Aussagenlogik wieder als mitbewiesen gelten. Um nun weitere Theoreme aus der obigen Liste leichter beweisen zu können, benötigen wir zunächst die Regeln der Quantorennegation, deren Korrektheit man durch den Beweis der Theoreme (P.5) und (P.6) einsieht; allerdings stehen dazu (neben beliebigen AL-Regeln) nur die drei quantorenlogischen Grundregeln zu Verfügung. Wir geben einige Hinweise zu (P.5), bei (P.6) argumentiert man ähnlich. Der Beweis für die Formel ¬∀xP x ↔ ∃x¬P x verläuft nach dem Schema, welches im aussagenlogischen Teil des Kalküls vorgegeben ist. In der Richtung von links nach rechts wird das Consequens ∃x¬P x indirekt bewiesen, indem für den Widerspruch in einem Unterbeweis ∀xP x gezeigt wird. Da es keine andere Information gibt, muß die Matrix P x selbst indirekt hergeleitet werden. — Die Rückrichtung ergibt sich aus wenigen naheliegenden Schritten.
224
Natürliches Schließen: Prädikatenlogik
Übung 8.1 Beweisen Sie (P.5) und (P.6) nur mit Grundregeln. Zeigen Sie sodann mit den gestrichenen Versionen die Korrektheit der Regeln (QN) der Quantorennegation. Wir können also in Zukunft die (QN)-Regeln verwenden. Aus der Liste der monadischen Theoreme greifen wir nun exemplarisch fünf spezielle Formeln heraus, die zu verschiedenen Gruppen von Theoremen gehören. Die erste Gruppe, Theoreme (P.7) bis (P.14), betrifft das Zusammenspiel der Quantoren mit den Junktoren, d.h. die Möglichkeiten der Verteilung eines Quantors über einen Junktor . Dabei zeigt sich, daß Existenzquantor und Disjunktion sowie Allquantor und Konjunktion miteinander “kommutieren”: ob man zuerst die eine syntaktische Operation anwendet und dann die andere, oder umgekehrt, führt zu äquivalenten Resultaten. Dies gilt nicht für Allquantor und Disjunktion bzw. Existenzquantor und Konjunktion, wie wir bereits mit Hilfe von Gegenmodellen festgestellt haben, und ebenso nicht für die Interaktion von Konditional und Bikonditional mit den Quantoren. Jedoch läßt sich in diesen Fällen immerhin eine der beiden Richtungen beweisen. Wir beweisen aus dieser Theoremegruppe (P.7). Die Grundstruktur des Beweises hat wieder aussagenlogisches Format. In beiden Beweisrichtungen werden ferner weitere Hinweise aus der aussagenlogischen Beweistechnik verwendet: Beweis einer Disjunktion mittels konditionalem Ansatz (Hinweis (4)) sowie Vorbereitung einer ∨-Einführung im Antecedens (Hinweis (5)). An quantorenlogischen Schlüssen werden in Zeile 6 die Quantoren-Negation sowie in Zeile 7 die Existenz-Beseitigung angewendet, diese unter Beachtung der Vorfahrtsregel. Im zweiten Beweisteil wird Existenz-Beseitigung zweimal in offensichtlicher Weise verwendet, wobei jeweils eine neue Konstante eingeführt wird. Als nächstes geben wir die Ableitung eines Theorems aus der wichtigen Gruppe der Prinzipien der Bereichsbeschränkung und -erweiterung an: Theoreme (P.15) bis (P.22). Mit den gestrichenen Versionen dieser Theoreme zeigt man, daß jede prädikatenlogische Formel φ schrittweise derart äquivalent umgeformt werden kann, daß sich eine Formel in pränexer Normalform PNF ergibt, d.h. eine Formel φ0 , in der alle Quantoren am Anfang stehen, gefolgt von einer quantorenfreien Matrix. Wesentlich für die Gültigkeit dieser Formeln ist der Umstand, daß ein Quantor nur dann über einen Junktor nach außen bewegt werden kann, wenn das andere Junktorenglied die quantifizierte Variable nicht oder jedenfalls nicht frei enthält. In den genannten Theoremen ist dies insbesondere der Fall, da die andere Seite einfach eine Satzkonstante ist. In der allgemeinen Form muß die Variablenbedingung explizit genannt werden (siehe oben). Beachtung verdienen vor allem die ungewöhnlich erscheinenden Gesetze (P.21) und (P.22), in denen sich der Quantor bei der Bewegung nach innen umdreht. Wir betrachten das erste Theorem in der gestrichenen Version, wobei wir die Variable der Deutlichkeit halber in Nennform-Schreibweise notieren: (1)
∀x(φ[x] → ψ) ↔ (∃xφ[x] → ψ)
(x nicht frei in ψ)
Wir erinnern an dieser Stelle an die Ähnlichkeit dieses Prinzips mit dem Problem der Formalisierung natürlichsprachlicher wenn-dann-Aussagen, deren Bedingungssatz oder “Restriktor” eine indefinite Nominalphrase, dem umgangsprachlichen Gegenstück einer Existenz-Quantifikation, enthält. Wird dieser Nominalausdruck im Kernsatz durch ein Pronomen anaphorisch wieder aufgenom-
225
Monadische Prädikatenlogik
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
zeige ∃x(P x ∨ Qx) ↔ ∃xP x ∨ ∃xQx
P.7
zeige ∃x(P x ∨ Qx) → ∃xP x ∨ ∃xQx
Hw(2) A-BA
∃x(P x ∨ Qx)
Hw(4)
zeige ¬∃xP x → ∃xQx
A-BA 5,QN
¬∃xP x ∀x¬P x
3,∃B,a neu . 6,∀B: t = a
P a ∨ Qa ¬P a Qa ∃xQx
7,8,AL 9,∃E
—(2)
∃xP x ∨ ∃xQx
4,AL
—(2)
zeige ∃xP x ∨ ∃xQx → ∃x(P x ∨ Qx) zeige ∃xP x → ∃x(P x ∨ Qx)
Hw(5) A-BA
∃xP x
14,∃B, b neu 15,AL
Pb P b ∨ Qb
16,∃E
∃x(P x ∨ Qx) —(2) zeige ∃xQx → ∃x(P x ∨ Qx)
A-BA
∃xQx
19,∃B, c neu 20,AL
Qc P c ∨ Qc
21,∃E
∃x(P x ∨ Qx) —(2)
13,18,AL
∃xP x ∨ ∃xQx → ∃x(P x ∨ Qx) —(1) ∃x(P x ∨ Qx) ↔ ∃xP x ∨ ∃xQx
—(1)
2,12,AL
men (“Eselsatz”), so sahen wir, daß die logische Form kein Konditional mit einem Existenzsatz im Antecedens sein kann, da dessen Skopus nicht über das Consequens hinwegreicht. Stattdessen bekommen wir einen bedingten Allsatz, in dem die Quantifikation unter Wechsel des Quantors “nach außen” bewegt wurde. Dies ist ein zumindest qualitativ analoges Phänomen zum vorliegenden Fall und kann somit als Motivation für den Quantorwechsel dienen. Die Entsprechung wird exakt, wenn in dem natürlichsprachlichen Konditional kein Bezug zum indefiniten Nominalausdruck im Kern auftritt; in diesem Fall können beide Seiten des Bikonditionals in (P.210 ) als (äquivalente) logische Form fungieren. Dies sei noch einmal an einem Beispiel illustriert.
226 (2)
(3)
Natürliches Schließen: Prädikatenlogik a.
Wenn Detlef eine Aktie kauft, ist er glücklich. (kein anaphorisches Pronomen im Cons)
b.
∃x(Ax ∧ Kdx) → Gd
c.
∀x(Ax ∧ Kdx → Gd)
a.
Wenn Detlefi eine Aktie kauft, spekuliert er mit ihri . (Eselsatz mit anaphorischem Pronomen im Cons)
b.
∀x(Ax ∧ Kdx → Sdx)
Wir geben jetzt den Beweis für (P.210 ), der unter der Bedingung x 6∈ FV (ψ), also x nicht frei in ψ, gilt, mit der Formel φ, die die Variable x enthält, in Nennformschreibweise.2
1. 2.
zeige ∀x(φ[x] → ψ) → (∃xφ[x] → ψ)
3. 4.
∃xφ[x] φ[a]
7. 8.
φ[a] → ψ ψ —(2)
A-BA A-BA 5,∃B, a neu . 3,∀B: t = a 6,7,AL
—(2)
zeige (∃xφ[x] → ψ) → ∀x(φ[x] → ψ)
10. 11.
A-BA
∃xφ[x] → ψ zeige ∀x(φ[x] → ψ)
12. 13.
φ[x] ∃xφ[x]
14. 15.
Hw(2)
∀x(φ[x] → ψ) zeige ∃xφ[x] → ψ
5. 6.
9.
P.210
zeige ∀x(φ[x] → ψ) ↔ (∃xφ[x] → ψ)
ψ
A-BAA 12,∃E —(5)
13,10,AL
—(2)
∀x(φ[x] → ψ) ↔ (∃xφ[x] → ψ)
—(1)
2,9,AL
Für die Richtung von links nach rechts in diesem Beweis ist anzumerken, daß in Zeile 6 die Vorfahrtsregel “(∃B) vor (∀B)” beachtet wurde, und daß, da ψ x . nicht frei enthält, ψax = ψ und also die Spezialisierung von Zeile 3 auf a wie angegeben lautet. In der anderen Richtung muß beim Schließen der bedingten All-Ableitung die Variablenbedingung (VB) beachtet werden. Diese ist nur deshalb erfüllt, weil x in ψ nicht frei auftritt! Sonst käme nämlich in Zeile 10 x frei vor, da der 2 Enthält
auch φ x nicht oder nicht frei, so ist die Aussage wegen (P.27,28) trivial.
Monadische Prädikatenlogik
227
Skopus des Existenzquantors nicht über das Konditional reicht, und (VB) wäre verletzt. Es sei daraufhingewiesen, daß beim Bikonditional die Äquivalenz von engem und weitem Skopus nicht mehr gilt; beim Herstellen der pränexen Normalform umgeht man diese Schwierigkeit, indem man ein Bikonditional zuerst als die Konjunktion der wechselseitigen Konditionale schreibt und dann die Prinzipien der Bereichserweiterung anwendet. Übung 8.2 Beweisen Sie die Theoreme (P.15) bis (P.26). Übung 8.3 Beweisen Sie das Theorem (P.37) über die Negation eines bedingten Allsatzes. Das nächste Theorem, das wir beweisen wollen, gibt ein Kriterium dafür an, daß sowohl die Extension eines Prädikats P als auch seine Koextension, d.h. die Extension von ¬P , nicht-leer ist. Das Kriterium lautet, daß es zu jedem x ein y gibt, so daß entweder P x und ¬P y gilt, oder aber ¬P x und P y.3 Dies ist der Inhalt der einen Richtung von Theorem (P.43). In der anderen Richtung kann man das Theorem so lesen, daß in gewissen Fällen die Quantorenschachtelung “entzerrt” werden kann. Voraussetzung ist, daß in den Formeln nur monadische Prädikate und keine Relationsausdrücke auftreten. Der Beweis von (P.43) findet sich auf der folgenden Seite. Übung 8.4 Annotieren Sie den Beweis zu Theorem (P.43) und identifizieren Sie die Schließungsbedingungen für alle Beweisteile. Das letzte Beispiel (P.45) aus dem Bereich der monadischen Theoreme demonstriert den Fall, in dem die All-Spezialisierung mehr als einmal auf dieselbe Formel angewendet wird, damit weitergeschlossen werden kann. Der Grund liegt in der Schachtelung von Quantoren. Wenn ein Existenzquantor unter einem Allquantor steht, so muß erst der Allquantor beseitigt werden, bevor die Existenz-Beseitigung angewandt werden kann. Wird dann mit dieser eine neue Konstante eingeführt, so muß gegebenfalls der Ausgangs-Allsatz noch einmal und jetzt auf diese Konstante spezialisiert werden. Wir beweisen von Theorem (P.45) nur die eine Richtung. Die andere Richtung folgt aus dem allgemeinen Theorem für die volle Prädikatenlogik; siehe unten. Die wiederholte Anwendung der All-Beseitigung ist durch ein Keilsymbol markiert. Nach der ersten Anwendung (Zeile 7) und einer Existenz-Beweitigung bekommen wir eine “Zwischeninstanz” P a, mit deren Hilfe die Aussage Qb erschlossen werden kann. Die zweite Anwendung von (∀B) führt über eine irrelevante Instanz P c zur Negation von Qb und damit zum gewünschten Widerspruch. 3 Wie erinnerlich, ist dies die ausschließende Disjunktion, also das Bikonditional des einen Disjunktionsgliedes mit der Negation des anderen Disjunktionsglieds.
228
1. 2. 3. 4. 5.
Natürliches Schließen: Prädikatenlogik
zeige ∃xP x ∧ ∃x¬P x ↔ ∀x∃y(P x ↔ ¬P y) zeige ∃xP x ∧ ∃x¬P x → ∀x∃y(P x ↔ ¬P y) ∃xP x ∧ ∃x¬P x
zeige ∀x∃y(P x ↔ ¬P y) zeige P x → ∃y(P x ↔ ¬P y)
6.
Px
7. 8.
∃x¬P x ¬P a
9. 10. 11. 12. 13.
P x ∧ ¬P a P x ↔ ¬P a
∃y(P x ↔ ¬P y) —(
zeige ¬P x → ∃y(P x ↔ ¬P y) ¬P x
14. 15.
∃xP x Pb
16. 17.
¬P x ∧ ¬¬P b P x ↔ ¬P b
18. 19. 20. 21. 22. 23. 24. 25.
∃y(P x ↔ ¬P y) —(
—(
)
zeige ∃xP x ¬∃xP x
∀x¬P x P x ↔ ¬P c
¬P x
—(
)
zeige ∃x¬P x ¬∃x¬P x ∀xP x
32. 33.
P x ↔ ¬P d Px
34. 35.
¬P d Pd
37.
)
∀x∃y(P x ↔ ¬P y)
28.
36.
—(
zeige ∀x∃y(P x ↔ ¬P y) → ∃xP x ∧ ∃x¬P x
¬P c Px
30. 31.
)
∃y(P x ↔ ¬P y)
26. 27. 29.
)
—(
∃xP x ∧ ∃x¬P x
)
—(
)
∃xP x ∧ ∃x¬P x ↔ ∀x∃y(P x ↔ ¬P y)
—(
)
229
Volle Prädikatenlogik
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19.
zeige ∀x∃y(P x → Qy) ↔ ∃y∀x(P x → Qy)
P.45
zeige ∀x∃y(P x → Qy) → ∃y∀x(P x → Qy)
Hw(2) A-BA
∀x∃y(P x → Qy) zeige ∃y∀x(P x → Qy)
A-IA 5,2x QN . I 6,∀B: t = y 7,∃B, a neu . 3,∀B: t = a
¬∃y∀x(P x → Qy) ∀y∃x¬(P x → Qy) ∃x¬(P x → Qy) ¬(P a → Qy) ∃y(P a → Qy)
9,∃B, b neu 8, AL
P a → Qb P a ∧ ¬Qy
11,10,AL . I 6,∀B: t = b
Qb ∃x¬(P x → Qb)
¬(P c → Qb) P c ∧ ¬Qb
¬Qb
13,∃B, c neu 14,AL 15,AL
—(3) —(2)
zeige ∃y∀x(P x → Qy) → ∀x∃y(P x → Qy) P.550 ∀x∃y(P x → Qy) ↔ ∃y∀x(P x → Qy)
—(1)
2,17,AL
Das Theorem (P.45) ist auch noch aus einem anderen, inhaltlichen Grund interessant. Es zeigt nämlich, daß unter speziellen Bedingungen All- und Existenzquantor nicht nur in einer, sondern in beiden Richtungen vertauscht werden können, was im allgemeinen nicht möglich ist. Der allgemeine Fall liegt vor, wenn die quantifizierten Variablen in einem relationalen Prädikat miteinander verbunden sind. Enthält die Matrix der Formel jedoch kein solches relationales Prädikat, sondern die aussagenlogische Verknüpfung zweier monadischer Prädikate mittels ∧, ∨ oder →, so ist die Vertauschbarkeit gegeben. Dies ist die Aussage des obigen Theorems (P.45) sowie der Theoreme (P.46) bis (P.48). Allerdings gilt die Vertauschbarkeit auch im monadischen Fall nicht beim Bikonditional. Übung 8.5 Zeigen Sie durch ein Gegenmodell, daß die folgende Formel kein Theorem ist. (4)
∀x∃y(P x ↔ Qy) → ∃y∀x(P x ↔ Qy)
230
8.2
Natürliches Schließen: Prädikatenlogik
Volle Prädikatenlogik
Wir lassen nun die Beschränkung auf monadische Prädikate fallen und beweisen einige Theoreme, in denen hauptsächlich dyadische Relationssymbole, d.h. zweistellige Prädikatkonstanten auftreten. Der entscheidende Schritt vom entscheidbaren monadischen Fragment zur vollen Prädikatenlogik, die nicht mehr entscheidbar ist, liegt bereits beim Übergang zu den zweistelligen Prädikaten. Wir zeigen zunächst durch einen Beweis von minimaler Länge, daß gleichnamige Quantoren vertauscht werden können.
1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
zeige ∀x∀yP 2 xy ↔ ∀y∀xP 2 xy
P.53
zeige ∀x∀yP 2 xy → ∀y∀xP 2 xy ∀x∀yP 2 xy
zeige ∀y∀xP 2 xy P 2 xy —(4)
. 3,2x∀B: t = x, y
—(2)
zeige ∀y∀xP 2 xy → ∀x∀yP 2 xy ∀y∀xP 2 xy zeige ∀x∀yP 2 xy P 2 xy —(4)
. 7,2x∀B: t = y, x
—(2)
∀x∀yP 2 xy ↔ ∀y∀xP 2 xy
—(1)
Beim Beweis eines Allsatzes kann ein Block gleichnamiger Allquantoren gemäß den Regeln für eine sinnvolle Konfiguration in einem Schritt behandelt werden. Die Variablenbedingungen bei der Schließungsregel (4) sind offensichtlich erfüllt. — Bei der Vertauschung von Existenzquantoren müssen die Quantoren mit (∃B) einzeln abgebaut und in umgekehrter Reihenfolge wieder eingeführt werden:
231
Volle Prädikatenlogik 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
zeige ∃x∃yP 2 xy ↔ ∃y∃xP 2 xy
P.54
zeige ∃x∃yP 2 xy → ∃y∃xP 2 xy ∃x∃yP 2 xy
P 2 ab ∃xP 2 xb
3,2x∃B, a, b neu 4,∃E
∃y∃xP 2 xy —(2)
5,∃E
zeige ∃y∃xP 2 xy → ∃x∃yP 2 xy ∃y∃xP 2 xy P 2 cd
8,2x∃B, c, d neu
2
9,∃E 10,∃E
∃yP cy ∃x∃yP 2 xy —(2) ∃x∃yP 2 xy ↔ ∃y∃xP 2 xy
—(1)
Das nächste Theorem betrifft die Vertauschung ungleichnamiger Quantoren. Diese ist im allgemeinen nur in einer Richtung möglich: von dem ∃∀-Präfix zum ∀∃-Präfix. Wenn es beispielsweise jemanden gibt, der von allen verehrt wird (“Diana-Lesart”), dann gibt es für alle jemanden, den sie verehren; die Umkehrung gilt aber in der Regel nicht. Ein Gegenbeispiel zu dieser umgekehrten Implikation haben wir oben bereits angegeben. Den Beweis für die gültige Richtung führen wir in der allgemeinen Form.
1. 2. 3. 4. 5. 6.
zeige ∃x∀yφ → ∀y∃xφ
P.550
∃x∀yφ
A-BA
∀yφxa
2,∃B, a neu . 4,∀B: t = y 6,∃E
zeige ∀y∃xφ φxa ∃xφ —(4) —(2)
AA
Wir geben hier einige weitere Theoreme ohne Beweis an; lediglich für zwei von ihnen wird unten noch ein Beweis geführt. Die Theoreme besitzen nicht alle ein einfaches Strich-Pendant. Bereits bei den monadischen Theoremen mit mehr als einer Variable haben wir nichts über die allgemeine schematische Version gesagt. Im dyadischen Fall sind die gestrichenen Versionen meist noch weniger erhellend, auch wenn sie formulierbar sind. Wir führen daher nur drei von ihnen an, die wirklich vollkommen schematisch sind. (P.53)
∀x∀yP 2 xy ↔ ∀y∀xP 2 xy
(Vertauschen von Allquantoren)
232
Natürliches Schließen: Prädikatenlogik
(P.54)
∃x∃yP 2 xy ↔ ∃y∃xP 2 xy
(Vertauschen von Existenzquantoren)
(P.55)
∃x∀yP 2 xy → ∀y∃xP 2 xy
(Vertauschen von ∃ und ∀)
(P.530 )
∀x∀yφ ↔ ∀y∀xφ
(Vertauschen von Allquantoren)
(P.540 )
∃x∃yφ ↔ ∃y∃xφ
(Vertauschen von Existenzquantoren)
(P.550 )
∃x∀yφ → ∀y∃xφ
(Vertauschen von ∃ und ∀)
(P.56)
∃x∃yP 2 xy ↔ ∃x∃y(P 2 xy ∨ P 2 yx)
(P.57)
∀x∀yP 2 xy → ∀y∀xP 2 yx
(P.58)
∀x∃y(P 2 xy ∧ Qy) → ∃x∃yP 2 xy ∧ Qx)
(P.59)
∀x(∃yP 2 xy → ∃yQ2 xy) ↔ ∀x∀y∃z(P 2 xy → Q2 xz)
(P.60)
∃y(∃xP 2 xy ↔ Qy) ↔ ∃y∀x∃z((P 2 xy → Qy) ∧ (Qy → P 2 zy))
(P.61)
¬∃y∀x(P 2 xy ↔ P 2 xx)
(P.62)
∀z∃y∀x(P 2 xy ↔ P 2 xz ∧ ¬P 2 xx) → ¬∃z∀xP 2 xz
(P.63)
¬∃y∀x(P 2 xy ↔ ¬∃z(P 2 xz ∧ P 2 zx))
(P.64)
∃y∀x(P 2 xy ↔ P 2 xx) → ¬∀x∃y∀z(P 2 zy ↔ ¬P 2 zx)
Von den letzten Theoremen wollen wir jetzt noch zwei Beweise angeben. Sie sind trotz ihrer Einfachheit dadurch bemerkenswert, daß sie eine Interpretation in der Mengenlehre besitzen. Theorem (P.61) zum Beispiel führt, mengentheoretisch betrachtet, unmittelbar zur Russellschen Antinomie. Wir kommen darauf zurück.
1. 2. 3. 4. 5. 6.
zeige ¬∃y∀x(P 2 xy ↔ ¬P 2 xx) ∃y∀x(P 2 xy ↔ ¬P 2 xx)
A-IA
∀x(P 2 xa ↔ ¬P 2 xx) P 2 aa ↔ ¬P 2 aa ¬(P 2 aa ↔ P 2 aa) P 2 aa ↔ P 2 aa
P.61
2,∃B, a neu . 3,∀B: t = a —(3)
4,AL AL-Thm
233
Volle Prädikatenlogik
1.
zeige ∀z∃y∀x(P 2 xy ↔ P 2 xz ∧ ¬P 2 xx)
P.62
2
→ ¬∃z∀xP xz
∀z∃y∀x(P 2 xy ↔ P 2 xz ∧ ¬P 2 xx) zeige ¬∃z∀xP 2 xz
2. 3.
A-BA
∃z∀xP 2 xz
4.
A-IA
2
5. 6.
4,∃B, a neu . 2,∀B: t = a;∃B, b neu . 6,∀B: t = b . 5,∀B: t = b
∀xP xa ∀x(P 2 xb ↔ P 2 xa ∧ ¬P 2 xx)
P 2 bb ↔ P 2 ba ∧ ¬P 2 bb P 2 ba
7. 8.
zeige P 2 bb
9.
¬P 2 bb
10.
2
11. 12.
A-IA 2
8,10,∧E 11,7,BK,MP
P ba ∧ ¬P bb P 2 bb —(3) ¬P 2 bb
13.
—(3) —(2)
9,7,BK,MP,∧B
Zulässige Regeln zur Beweisverkürzung. In dem Maße, wie die Beweise länger und komplexer werden, ist es wichtig, einfache Zwischenschritte zusammenzufassen. Ein typischer Schritt, der immer wieder vorkommt, besteht etwa darin, daß man eine Zeile durch eine andere ersetzen kann, wenn das Bikonditional der beiden Zeilen hergeleitet hat. Dies ist ein Spezialfall der allgemeineren Regel, daß man in einer Zeile Teilformeln duch äquivalente Formeln ersetzen kann. Ein solches Prinzip der Formel-Substitution gilt auch für die Prädikatenlogik. Wir brauchen das Prinzip jedoch nicht zu den Ableitungsregeln hinzuzunehmen, da wir das bisher nur in der Aussagenlogik verwendete Prinzip (↔Sub) lediglich mit der erweiterten prädikatenlogischen Bedeutung für die darin auftretenden Mitteilungszeichen versehen müssen. (↔Sub)
ψ ↔ χ , φ[ψ]
∴
φ[χ]
Natürlich muß dann der Induktionsbeweis, den wir seinerzeit für diese Regel gegeben haben, ergänzt werden, damit ihre Zulässigkeit gesichert bleibt. Wir nehmen im folgenden die Zulässigkeit ohne Beweis an. Wir wollen ferner zwei Paare von spezifisch prädikatenlogischen Regeln für zulässig erklären, welche auf beiden Seiten eines (Bi-)Konditionals denselben Quantor einfügen, wenn die Formel ein PL1-Theorem ist, d.h. prämissenfrei hergeleitet wurde. Die Regeln nennen wir (Kd∀) und (Kd∃) sowie (Bk∀) und (Bk∃); ihre Zulässigkeit ergibt sich daraus, daß mit einem hergeleiteten Theorem, das noch freie Variablen enthält, auch sein Allabschluß herleitbar ist. Handelt es sich um ein Konditional φ → ψ, so liefert ein Zwei-Zeilen-Beweis auch den Allabschluß ∀x(φ → ψ).4 Mit Quantorendistribution QD bekommt man dann das 4 Dabei
ist das Theorem wegen der Variablenbedingung (VB) erst unter der ‘zeige’-Zeile, die den Beweis des Allabschlusses ansetzt, einzufügen.
234
Natürliches Schließen: Prädikatenlogik
Konditional der Allformeln. Eine analoge Überlegung unter Verwendung des Theorems (P.40 ) gibt die Rechtfertigung für die Regel (Bk∃). Ähnlich argumentiert man im Fall des Bikonditionals, mit Verweis auf die Theoreme (P.130 ) und (P.140 ). Wir bekommen also die zulässigen Regeln: (Kd∀)
`φ → ψ
∴
∀xφ → ∀xψ
(Kd∃)
`φ → ψ
∴
∃xφ → ∃xψ
(Bk∀)
`φ ↔ ψ
∴
∀xφ ↔ ∀xψ
(Bk∃)
`φ ↔ ψ
∴
∃xφ ↔ ∃xψ
Übung 8.6 Beweisen Sie die Theoreme (P.59) und (P.60) sowohl direkt als auch mit Hilfe der Bereichstheoreme und den Regeln (Bk∀) und (Bk∃).
8.3
Identitätslogik
Bisher enthalten unsere prädikatenlogischen Theoreme kein Gleichheitszeichen. Um auch identitätslogische Aussagen herleiten zu können, benötigen wir die in der Kalkül-Beschreibung aufgeführten Identitätsregeln. Es gibt zwei Grundregeln; die erste (SI) besagt, daß die Selbstidentität t = t ohne Voraussetzung in jeden Beweis eingeführt werden kann. Damit ist sie herleitbar, und die Korrektheit von (SI) ist trivial. Die andere Grundregel (Lb) ist das Leibnizsche Substitutionsprinzip in Regelform. Ihre Korrektheit ergibt sich aus der semantischen Korrektheit des Leibniz-Prinzips selbst; diese wird in Kapitel 12 mit Hilfe einer Induktion nach dem Formelgrad bewiesen werden. Mit den Grundregeln lassen sich die Symmetrie sowie die Transitivität der Gleichheit als Gesetze herleiten (siehe die unten angegebenen Identitätstheoreme (I.2) und (I.3)) und liefern die Zulässigkeit der zugehörigen Regeln. Wir nehmen an, daß wir die Zulässigkeit der Symmetrie-Regel gezeigt haben, und geben einen KM-Beweis des Transitivitätsgesetzes.
1. 2.
zeige s=t ∧ t=r → s=r
3. 4.
s=t∧t=r . t = r = φ[t] t=s
5.
s=r
I.3 A-BA 2,AL 2,∧B,=Sym,AL
—(2)
4,3,Lb
Das folgende elementare, aber wichtige Identitätsgesetz besagt, daß die Information, daß t die Eigenschaft P hat, auch durch einen Existenzsatz ausgedrückt werden kann, nämlich daß es ein y gibt, welches gleich t ist und die Eigenschaft P hat. Ohne das Konjunktionsglied y = t wäre die Aussage keine Äquivalenz
235
Identitätslogik
mehr, sondern eine Instanz der Existenzabschwächung. Die quantifizierte Variable y darf nicht gleich t sein, und, wenn in reicheren Systemen t komplex ist, nicht in t frei auftreten. Wir schreiben daher gleich die allgemeinere Bedingung “y 6∈ FV (t)” hin; dasselbe gilt für analoge Variablenbedingungen in den unten aufgelisteten Identitätstheoremen.
1. 2.
zeige P t ↔ ∃y (y = t ∧ P y) Pt
4. 5.
t=t t = t ∧ Pt
7. 8. 9. 10. 11.
I.8
zeige P t → ∃y (y = t ∧ P y)
3.
6.
(y 6∈ FV (t))
A-BA Thm 3,4,AL
. 5,∃E,φ = (y = t ∧ P y)
∃y(y = t ∧ P y) —(2)
zeige ∃y (y = t ∧ P y) → P t A-BA . 8,∃B,t 6= y!
∃y (y = t ∧ P y) a = t ∧ Pa Pt
9,Lb,AL
—(2)
P t ↔ ∃y (y = t ∧ P y)
—(1)
2,7,AL
Mit den Regeln zur Beweisverkürzung geben wir nun einen kompakten Beweis für das Theorem (I.9), welches in der Kennzeichungslogik eine wichtige Rolle spielt. Das Theorem gibt zwei äquivalente Charakterisierungen der Einzigkeit eines Individuums mit der Eigenschaft P an. Die linke Seite ist eine Konjunktion aus der Existenz und der Eindeutigkeit: es gibt (mindestens) ein P , und für je zwei Variablen x und y mit P x und P y gilt bereits x = y. Die rechte Seite dagegen “verschränkt” die beiden Quantifikationen: es gibt ein x, auf das P zutrifft, und wenn ein weiteres y ebenfalls ein P ist, so ist y schon eben dieses x. Intuitiv sind die beiden Bedingungen offensichtlich äquivalent; schauen wir uns kurz an, wie sich diese Äquivalenz auch formal ergibt. In der Richtung von links nach rechts folgt zunächst mit ∧- und ∃-Beseitigung P a für eine (neue) Konstante a. Der Allsatz in Zeile 3 wird auf dieses a spezialisiert; dies ist die Zeile 5. Die Matrix des dortigen Allsatzes ist ein Konditional mit einer Konjunktion im Antecedens; dieses ist aber äquivalent zu seiner “exportierten” Form, und mit der neuen Regel (Bk∀) sind auch ihre Allquantifikationen äquivalent. Mit (↔Sub) — hier in der Annotierung nicht eigens aufgeführt — folgt aus Zeile 5 die Zeile 6. Jetzt haben wir aber einen bedingten Allsatz vor uns, in dessen Antecedens die Quantifikationsvariable nicht (frei) auftritt. Mittels Bereichsbeschränkung (Theorem P.190 ) folgt Zeile 8, und mit (∃E) auch die Behauptung für diese Richtung.
236 1.
Natürliches Schließen: Prädikatenlogik zeige ∃xP x ∧ ∀x∀y(P x ∧ P y → x = y)
I.9
↔ ∃x (P x ∧ ∀y(P y → x = y))
2.
zeige ∃xP x ∧ ∀x∀y(P x ∧ P y → x = y) → ∃x (P x ∧ ∀y(P y → x = y))
3. 4.
∃xP x ∧ ∀x∀y(P x ∧ P y → x = y) Pa
5. 6.
∀y (P a ∧ P y → a = y) ∀y (P a → (P y → a = y))
7. 8. 9. 10.
A-BA 3,∧B,∃B 3,∧B,∀B 5,Exp,Bk∀ 6,BrB 4,7,AL
P a → ∀y(P y → a = y) P a ∧ ∀y(P y → a = y)
∃x (P x ∧ ∀y(P y → x = y))
8,∃E
—(2)
zeige ∃x (P x ∧ ∀y(P y → x = y))
→ ∃xP x ∧ ∀x∀y(P x ∧ P y → x = y)
11. 12. 13. 14. 15.
A-BA
∃x (P x ∧ ∀y(P y → x = y))
11,∃B 12,∧B,∃E
P b ∧ ∀y(P y → b = y) ∃xP x
zeige ∀x∀y (P x ∧ P y → x = y)
BAA A-BAA
Px ∧ Py
16. 17.
Px → b = x b=x
12,∧B,∀B 15,16,AL
18. 19.
Py → b = y b=y
12,∧B,∀B 15,18,AL
20.
x=y
21. 22.
17,19,=Tr
—(5)
13,14,∧E
∃xP x ∧ ∀x∀y (P x ∧ P y → x = y) —(2)
2,10,KB
∃xP x ∧ ∀x∀y(P x ∧ P y → x = y)
↔ ∃x (P x ∧ ∀y(P y → x = y))
—(1)
Ist umgekehrt die rechte Seite gegeben, so bekommen wir mit ExistenzBeseitung und anschließender ∧-Beseitigung eine Instanz P b, die zur Existenz eines P abgeschwächt wird. Die Eindeutigkeitsaussage ist ein doppelter bedingter Allsatz, und sein Beweis muß daher mit einer ‘zeige’-Zeile angesetzt werden. Wir dürfen ferner das Antecedens der Matrix annnehmen. Das zweite Konjunkt in Zeile 12 sagt, daß alle y mit Eigenschaft P gleich b sind, speziell also auch erst x und dann y selbst. Folglich haben wir sowohl x gleich b als auch y gleich b, also mit der Transitivität der Gleichheit x = y. Bei der Schließung dieses Unterbeweises muß die Variablenbedingung für beide Quantifikationsvariablen x und y geprüft werden. Mit ∧-Einführung ist auch die andere Richtung bewiesen. Wie in Kapitel 4 bereits besprochen, ist die Einzigkeitsbedingung für eine
Identitätslogik
237
Eigenschaft P ist nur ein prominentes Beispiel für Anzahl-Aussagen, welche in der Identitätslogik ausgedrückt werden können. Während die Existenz eines P , ∃xP x, eine Aussage der reinen Prädikatenlogik PL1 ist, benötigen wir für die Eindeutigkeit das Identitätssymbol, um formulieren zu können, daß alle weiteren P -Objekte gleich dem als existent behaupteten ersten P -Objekt sind (so wie dies auf der rechten Seite von (I.9) formuliert ist). Wegen der Wichtigkeit der Einzigkeitsbedingung für die Kennzeichnungstheorie sei hier auch noch auf ihre knappste Darstellung in der Form (5)
∃y∀x (P x ↔ x = y)
(Einzigkeit für P )
verwiesen. Theorem (I.10) zeigt die Äquivalenz mit den bisherigen zwei Charakterisierungen. Ohne den Beweis im Detail vorzuführen, sei die Idee skizziert. Die Matrix des Existenzsatzes bezüglich der Variablen y ist ein allquantifiziertes Bikonditional, in dem die Bedingungen der Existenz und Eindeutigkeit eines P versteckt sind. Die Implikation von rechts nach links sagt von allen x, die gleich y sind, daß sie die Eigenschaft P haben, speziell also auch von dem als existent behaupteten y; dieser Schritt folgt formal mit dem unten angegebenen Theorem (I.7). Umgekehrt bedeutet die Implikation von links nach rechts wie schon in Theorem (I.9) die Eindeutigkeit: alle x mit P x sind schon gleich y. Werfen wir noch einmal einen Blick auf die Semantik der Einzigkeitsbedingung für die Eigenschaft P , die wir hier in drei äquivalenten Gestalten betrachtet haben. Ihre Modelle sind diejenigen, in denen die Extension von P genau ein Element enthält. Ist P gleich der universellen Eigenschaft, die auf alle Individuen zutrifft, so ist die Extension von P zugleich der gesamte Individuenbereich, und die Einzigkeitsbedingung charakterisiert die einelementigen Modelle. Da in diesem Fall die Prädikation P x immer erfüllt ist, kann sie in der Formel (5) auch weggelassen werden, und es ergibt sich als Kriterium für die Einelementigkeit des Individuenbereichs: (6)
∃x∀y y = x
(Einelementige Modelle)
Da alle Modelle nicht-leere Individuenbereiche besitzen, ist diese Formel äquivalent zu der unbeschränkten Eindeutigkeit; dies ist der Inhalt des Theorems (I.12): (7)
∃x∀y y = x ↔ ∀x∀y y = x
(I.12)
Wir wollen noch einige weitere Anzahl-Aussagen besprechen. Die Eigenschaft von Modellen, (mindestens) zwei Elemente zu besitzen, wird durch die Formel (8)
∃x∃y x 6= y
(Modelle mit mindestens 2 Individuen)
wiedergegeben,5 was gemäß Theorem (I.13) äquivalent ist zu der Bedingung, daß zu jedem Individuum ein von ihm verschiedenes Objekt existiert. Modelle M = hD, k · ki, die den PL1I-Satz (9) 5 px
∃x∃y∀z (z = x ∨ z = y) 6= yq steht für p¬(x = y)q.
(Modelle mit höchstens 2 Individuen)
238
Natürliches Schließen: Prädikatenlogik
wahr machen, besitzen mindestens ein Element (wegen D 6= ∅) und nicht mehr als zwei Elemente. Dies ist offensichtlich äquivalent dazu, daß in M entweder genau ein Element existiert oder genau zwei Elemente existieren; siehe Theorem (I.15). Das zweite Disjunktionsglied, (10)
∃x∃y (x 6= y ∧ ∀z(z = x ∨ z = y)) (Modelle mit genau 2 Individuen)
gibt das Muster vor für die Anzahlbedingungen an Modelle. Wir geben noch die entsprechenden PL1I-Sätze im Fall n = 3 an. (11)
∃x∃y∃z (x 6= y ∧ x 6= z ∧ y 6= z) (Modelle mit mindestens 3 Individuen)
(12)
∃x∃y∃z (x 6= y ∧ x 6= z ∧ y 6= z ∧ ∀w (w = x ∨ w = y ∨ w = z)) (Modelle mit genau 3 Individuen)
Für alle natürlichen Zahlen n kann eine entsprechende Bedingung formuliert werden. Damit ist es möglich, für jedes feste derartige n die Eigenschaft von Modellen, einen Individuenbereich von n Elementen zu besitzen, in der Prädikatenlogik mit Identität zu charakterisieren. Es ist ein wichtiges metalogisches Resultat, daß die Logik erster Stufe bei der Frage der Charakterisierbarkeit der Größe von Modellen jedoch zugleich an die Grenzen ihrer Ausdruckskraft stößt: zum Beispiel kann der Begriff der Endlichkeit eines Modells (d.h. die Eigenschaft eines Modells, einen endlichen Individuenbereich zu besitzen) in der ersten Stufe nicht ausgedrückt werden. Dieser “negative” Tatbestand ist eine direkte Folge der semantischen Vollständigkeit der Prädikatenlogik, d.h. der Umfangsgleichheit von logischer Folgerung und syntaktischer Herleitbarkeit; siehe Kapitel 12.
8.3.1
Identitätstheoreme
Wir geben nun wieder eine Liste von Theoremen an, die in der Prädikatenlogik mit Identität herleitbar sind. (I.1)
t=t
(I.2)
s=t ↔ t=s
(I.3)
s=t ∧ t=r → s=r
(Transitivität)
(I.4)
s = t → (φ[s] ↔ φ[t])
(Leibniz )
(I.5)
∃x x = x
(I.6)
∃x x = t
(I.7)
P t ↔ ∀y(y = t → P y)
(y 6∈ FV (t))
(I.8)
P t ↔ ∃y(y = t ∧ P y)
(y 6∈ FV (t))
(I.9)
∃xP x ∧ ∀x∀y (P x ∧ P y → x = y) ↔ ∃x (P x ∧ ∀y (P y → x = y))
(I.10)
(Selbstidentität) (Symmetrie)
(nicht-leere Modelle) (x 6∈ FV (t))
(Terme denotieren)
∃xP x ∧ ∀x∀y (P x ∧ P y → x = y) ↔ ∃y∀x(P x ↔ x = y)
239
Kennzeichnungslogik (I.11)
¬∃y∀x (P x ↔ x = y) ↔ ¬∃xP x ∨ ∃x∃y(x 6= y ∧ P x ∧ P y)
(I.12)
∃x∀y y = x ↔ ∀x∀y y = x
(I.13)
∃x∃y x 6= y ↔ ∀x∃y x 6= y
(I.14)
∀x∀y x = y → (∃xP x ↔ ∀xP x)
(I.15)
∃x∃y∀z (z = x ∨ z = y) ↔ ∃x∀y y = x ∨ ∃x∃y (x 6= y ∧ ∀z(z = x ∨ z = y))
(I.16)
∃y∀x(P x ↔ x = y) → (∀x(P x → Qx) ↔ ∃x(P x ∧ Qx))
(I.17)
∃y∀x(P x ↔ x = y) → ∀y(¬P y ↔ ∃z(P z ∧ z 6= y))
Übung 8.7 Drücken Sie die Aussagen der obigen Identitätstheoreme umgangsprachlich aus und machen Sie sich ihren Inhalt klar. Beweisen Sie die nicht gerechneten Theoreme.
8.4
Kennzeichnungslogik
Bevor wir die Prädikatenlogik verlassen, deuten wir noch kurz an, wie eine Kennzeichnungstheorie im Kalish-Montague-Kalkül zu entwickeln ist. Unsere semantischen Überlegungen hatten bereits gezeigt, daß zum Beispiel das Spezialisierungsprinzip zu modifizieren ist, und ferner die Selbstidentität t = t kein gültiges Schema mehr ist, wenn für t Kennzeichnungen zugelassen sind. Damit der Kalkül korrekt bleibt, d.h. nur gültige Formeln herleitet, müssen die Kalkülregeln entsprechend modifiziert werden. Wir hatten unsere PL1I-Sprache L um ‘ι’ und ein Existenzprädikat ‘E!’ erweitert. In einem Modell M der resultierenden PL1IK-Sprache ist E!t wahr für einen Individuenterm t, wenn t in M ein Denotat hat. Unter der Zusatzbedingung E!t ist also die Allspezialisierung gültig. Analoges gilt für die Existenzabschwächung. Dies schlägt sich in den folgenden Quantorenregeln nieder. Die Regel der Existenz-Beseitigung dagegen verändert sich nicht. PL1IK: Quantorenregeln
(∀B)
∀xφ , E!t
(All-Beseitigung)
∴ φxt
(∃E)
φxt , E!t ∴ ∃xφ
(∃B)
∃xφ ∴ φxa
(Existenz-Einführung/ Existenz-Beseitigung, mit “a neu”)
240
Natürliches Schließen: Prädikatenlogik
PL1IK: Spezifische Identitätsregeln
E! t (SIG )
∴ s=s
(s Grundterm)
(Ex) ∴ ∃x x = t
(x 6∈ FV (t))
PL1IK: Regeln der Denotation und Elimination P n t0 . . . tn−1 (DP.1)
s=t (i < n)
(DP.2)
∴ E! ti
(ElKz)
∴ ∀y (y = ιxφ ↔ ∀x(φ ↔ x = y))
∴ E! s
(y 6∈ FV (φ))
Bei den Identitätsregeln bleibt das Leibniz-Prinzip (Lb) in der bisherigen Form erhalten, mit der auf Kennzeichnungen erweiterten Bedeutung für die Mitteilungszeichen s, t. Die Selbstidentität wird auf die stets denotierenden Grundterme eingeschränkt, d.h. auf Variablen und Konstanten. Das Existenzprinzip erlaubt den Schluß von der Existenz-Prädikation E! t für einen Term t auf die Existenz eines x, welches gleich t ist, und umgekehrt (daher der Doppelstrich). Diese Bedingung ist die syntaktische Form der Denotationsbehauptung für t. Damit könnte das Existenzprädikat auch durch die Existenzbedingung ∃x x = t definiert werden. Ferner besagen die Denotationsregeln, daß in einer elementaren Prädikation bzw. einer Identität alle Argumentpositionen existenz-implizierend sind. Das Eliminationsprinzip für Kennzeichnungen schließlich ist die Basis für die Beseitigung von Kennzeichnungen aus allen Kontexten; siehe z.B. Theoreme (K.6) und (K.7). Mit diesen Regeln sind speziell die folgenden Theoreme herleitbar: (K.1)
E! t ↔ ∃x x = t
(x 6∈ FV (t))
(K.2)
E! (ιxφ) ↔ ∃y∀x (φ ↔ x = y)
(x 6∈ FV (φ))
(K.3)
E! (ιxP x) ↔ (ιxP x) = (ιxP x)
(K.4)
E! (ιxP x) ↔ P (ιxP x)
(K.5)
E! (ιxP x) ∧ ∀x(P x ↔ Qx) → (ιxP x) = (ιxQx)
(K.6)
Q (ιxP x) ↔ ∃y (∀x(P x ↔ x = y) ∧ Qy)
(K.7)
(ιxP x) = t → ∀x (P x ↔ x = t)
(x 6∈ FV (t))
241
Kennzeichnungslogik
Wir geben zwei Beispiele für Beweise im Kennzeichnungskalkül. Es sind dies das Einzigkeitstheorem für Kennzeichnungen (K.2) sowie das Eliminationstheorem (K.6). 1. 2. 3. 4. 5.
1. 2.
zeige E!(ιxP x) ↔ ∃y∀x(P x ↔ x = y)
K.2
E!(ιxP x) ↔ ∃y y = (ιxP x)
∀y (y = (ιxP x) ↔ ∀x(P x ↔ x = y)) ∃y y = (ιxP x) ↔ ∃y∀x(P x ↔ x = y) Beh.
K.1 ElKz 3,PL1 2,4,AL
—(1)
zeige Q(ιxP x) ↔ ∃y (∀x(P x ↔ x = y) ∧ Qy)
K.6
zeige Q(ιxP x) ↔ ∃y (∀x(P x ↔ x = y) ∧ Qy)
3.
Q(ιxP x)
4. 5.
∃y y = (ιxP x) a = (ιxP x)
3,DP.1 4,∃B
6. 7.
Qa ∀y (y = (ιxP x) ↔ ∀x(P x ↔ x = y))
5,3,Lb ElKz
8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
A-BA
7,∀B 5,8,AL
a = (ιxP x) ↔ ∀x(P x ↔ x = a) ∀x(P x ↔ x = a)
∀x(P x ↔ x = a) ∧ Qa ∃y (∀x(P x ↔ x = y) ∧ Qy)
9,6,AL 10,∃E
—(2)
zeige ∃y (∀x(P x ↔ x = y) ∧ Qy) → Q(ιxP x) A-BA
∃y (∀x(P x ↔ x = y) ∧ Qy)
13,∃B ElKz
∀x(P x ↔ x = b) ∧ Qb ∀y (y = (ιxP x) ↔ ∀x(P x ↔ x = y)) b = (ιxP x) ↔ ∀x(P x ↔ x = b) b = (ιxP x)
15,∀B 14,16,AL
Qb Q(ιxP x)
14,∧B 17,18,Lb
—(2)
Q(ιxP x) ↔ ∃y (∀x(P x ↔ x = y) ∧ Qy)
—(1)
2,12,AL
Übung 8.8 Beweisen Sie die Theoreme (K.3), (K.4), (K.5) und (K.7) im KM-Kalkül für PL1IK. Übung 8.9 Zeigen Sie durch ein Gegenmodell, daß die Rückrichtung von Theorem (K.7) nicht beweisbar ist.
242
Natürliches Schließen: Prädikatenlogik
Kapitel 9
Mengenlehre im Kalkül I: Axiome, Klassenalgebra Im folgenden werden wir den Kalkül des natürlichen Schließens nach KalishMontague dazu verwenden, um elementare mengentheoretische Tatsachen aus den üblichen Axiomen der Mengenlehre herzuleiten. Die moderne axiomatische Mengenlehre wird heute in der Regel im Rahmen einer Theorie der ersten Stufe erforscht. Wir folgen hier im wesentlichen dem erststufigen Aufbau der Theorie, der auf Zermelo und Fraenkel zurückgeht. Die Sprache LZF der ZermeloFraenkelschen Mengenlehre ist also eine prädikatenlogische Sprache mit Identität von der Art, wie wir sie oben betrachtet haben. Außer dem Identitätssymbol enthält die Sprache allerdings nur eine einzige deskriptive Konstante, das Elementschaftszeichen ‘∈’, als zweistellige Prädikatkonstante bzw. Relationssymbol. Es ist wie folgt zu lesen: (1)
x∈y
für: “x ist ein Element von y”
Der zentrale Begriff der Theorie ist der der Mengenbildung durch Mengenabstraktion der Gestalt (2)
{ x | φ[x] }
für: “die Menge aller x mit der Eigenschaft φ[x]”
Dabei kann φ[x] irgendeine Formel sein, die mit den syntaktischen Regeln der Sprache korrekt gebildet ist. Daß φ[x] eine beliebige Eigenschaft sein kann, wurde zumindest zuerst von den Begründern der Mengenlehre angenommen. Wie in der Einleitung erwähnt, zeigte die berühmte Russellsche Antinomie jedoch bald, daß dies keineswegs der Fall ist: Nicht jeder korrekt gebildete sprachliche Ausdruck hat die Kraft, durch Mengenabstraktion eine Menge zu erzeugen. Das läßt sich, wie Russell zeigte, bereits mit einer sehr einfach konstruierten Eigenschaft zeigen. Der Widerspruch, der sich dann ergibt, folgt bereits aus der reinen Prädikatenlogik . Um das einzusehen, gehen wir auf das Theorem (P.61) zurück, das hier noch einmal angegeben sei: (3)
¬∃y∀x (P 2 xy ↔ ¬P 2 xx)
Liest man das Relationssymbol P 2 xy als “y rasiert x” oder “x wird von y rasiert”, so ergibt sich aus dem Theorem die Aussage, daß es niemanden gibt, der genau 243
244
Mengenlehre I
diejenigen rasiert, die sich nicht selbst rasieren. Dies führt zu der bekannten Geschichte von dem Dorfbabier, der, ohne es zu merken, verzweifelt versucht, den widersprüchlichen Auftrag auszuführen, genau diejenigen im Dorf (zu denen er selbst gehört) zu rasieren, die sich nicht selbst rasieren. Man kann nun dem Relationssymbol P 2 auch eine mengentheoretische Interpretation geben, indem man P 2 xy liest als x ∈ y. Wir benutzen dies zur Herleitung der Russell-Antinomie. Angenommen, es gebe eine Menge y, welche genau diejenigen Mengen enthält, die sich nicht selbst als Element enthalten; nennen wir diese Mengen kurz nicht-selbstelementig. Als Formel geschrieben bedeutet das: (4)
∃y∀x (x ∈ y ↔ x 6∈ x)
Sei nun r ein solches y, d.h. (5)
∀x (x ∈ r ↔ x 6∈ x)
Wir können diesen Allsatz jetzt auf r selbst spezialisieren, und dies ergibt den Widerspruch. (6)
r ∈ r ↔ r 6∈ r
Man beachte, daß dafür keinerlei Mengentheorie benötigt wurde. Der Widerspruch ist rein logischer Natur. Auf die gleiche Weise können wir uns von der Widersprüchlichkeit der Eigenschaft, nicht selbstzutreffend zu sein, überzeugen: sie trifft genau dann auf sich selbst zu, wenn sie nicht auf sich selbst zutrifft. Bleiben wir jedoch im Rahmen der Mengenlehre. Das Ergebnis der Russell-Antinomie ist zunächst, daß der Ausdruck “die Menge der nichtselbstelementigen Mengen” für keine Menge stehen kann, weil diese sonst zum Quantifikationsbereich zählen würde, mit dem widersprüchlichen Ergebnis (6). Diese Einsicht ist dahingehend zu verallgemeinern, daß ähnlich wie bei den Kennzeichnungen sprachliche Ausdrücke mit einer korrekten syntaktischen Gestalt keineswegs Objekte von der mit dieser sprachlichen Form intendierten Art bezeichnen müssen. Die Zusammenfassung von Objekten x mit der Eigenschaft φ[x] “zu einem Ganzen”, wie Cantor die naive Mengenbildung beschrieb, führt also nicht immer zu einer Menge.1 Wie in der Einleitung angesprochen, gibt es verschiedene Wege, um dieses Problem in der Griff zu bekommen. Intuitiv am naheliegendsten ist die Idee, syntaktische Fügungen der Form x ∈ x als nicht wohlgeformt zu verbieten, da die Vorstellung, eine Menge könne sich selbst enthalten oder auch nicht enthalten, gegen die intuitiven Regeln der Verwendung von ‘enthalten’ verstoßen. Diesen Weg hat Russell selbst eingeschlagen und dazu die Theorie der Typen entwickelt, nach der grob gesprochen allen Mengen eine natürliche Zahl als Typ zugeordnet wird. Die Frage, ob eine Menge x vom Typ n in einer Menge y enthalten ist oder nicht, stellt sich damit als sinnvoll nur dann, wenn y vom Typ n + 1 ist; somit scheidet x selbst als ein solches y bereits aus. Die Idee der syntaktischen Einschränkungen durch eine Typisierung wurde aus Gründen der mangelnder Einfachheit jedoch von den meisten Logikern und Mathematikern verworfen. Man schränkt zwar den Mengenbegriff durch das 1 Cantor war sich übrigens der Problematik uneingeschränkter Mengenbildung bewußt; er nannte etwa die Menge aller Mengen eine “inkonsistente Vielheit”.
Axiome
245
Fundierungsaxiom AF (siehe unten) derart ein, daß ein sogenannter ∈-Zyklus wie in x ∈ x nicht auftreten kann (er stünde im Widerspruch zu AF); allerdings läßt man x ∈ x sowie seine Negation x 6∈ x als korrekte syntaktische Gebilde zu und schließt sogar aus der Blockierung von ∈-Zyklen durch AF, daß jede Menge die Eigenschaft hat, sich nicht selbst als Element zu enthalten. Wie die Russellsche Antinomie zeigt, scheitert jedoch der Versuch, alle diese nichtselbstelementigen Mengen zu einer großen Menge zusammenzufassen. Man bildet damit nämlich die Gesamtheit aller Mengen, Allklasse genannt, die selbst keine Menge sein kann. Die Allklasse ist das erste und wichtigste Beispiel einer echten Klasse, die zwar Elemente hat, aber selbst nicht Element einer anderen Klasse ist. Dies führt ganz allgemein zu der Unterscheidung zwischen “kleinen” mengentheoretischen Objekten, den Mengen, deren Größe dadurch begrenzt ist, daß sie Elemente von anderen Mengen sind, und den echten Klassen, die “zu groß” sind, um selbst wieder eine Menge zu sein; kennzeichnend dafür ist gerade, daß sie nicht das Element einer anderen Menge oder Klasse sein können. Terme für echte Klassen treten also nicht links vom ∈-Zeichen auf. Klassen sind der Oberbegriff: alle Mengen sind Klassen, aber eben nicht umgekehrt. Durch diese Aufspaltung in Mengen und echte Klassen kann die Russellsche Antinomie umgangen werden. Der Formalismus der üblichen ZF-Mengentheorie behandelt die Klassenausdrücke der Gestalt { x | φ[x] } als uneigentliche Symbole, die stets eliminierbar sind. Sie stehen also eigentlich gar nicht da, sondern eine Aussage, die eine solchen Klassenausdruck enthält, ist über eine Eliminationsregel als Abkürzung für das Eliminationsresultat zu lesen. Dadurch wird das Problem der Denotationslücken umgangen, das intuitiv dadurch entsteht, daß die intendierten Objekte der Theorie Mengen sind, die Klassenterme jedoch, wie wir sahen, nicht notwendig eine Menge beschreiben. Im Unterschied dazu verfolgen wir hier die enge Analogie zwischen den Klassenausdrücken und den Kennzeichnungstermen einer Kennzeichnungstheorie mit Denotationslücken. Wir behandeln daher die Klassenterme als Teil der formalen Sprache und ziehen den KM-Kalkül für die Mengenlehre im Stil einer freien Logik auf. Das frühere Existenz-Prädikat nimmt hier die Gestalt des Mengenprädikats M für “. . . ist eine Menge” an. Da die Quantoren nur über Mengen laufen, müssen die Quantorenregeln des Kalküls wie für die Sprache PL1IK mit Kennzeichnungen geeignet eingeschränkt werden. Die Existenz-Aussage E!t wird hier ersetzt durch die Aussage M a, daß a eine Menge ist.
9.1
Die Axiome der Mengenlehre
Bevor wir mit dem systematischen Nachweis der elementaren Mengeneigenschaften im Rahmen des Kalküls beginnen, stellen wir die Axiome der Mengenlehre zusammen, damit wir einen ersten Überblick über die Art der Postulate gewinnen, die den Mengenbegriff charakterisieren. Die Axiomenliste ist natürlich als ein Vorgriff zu verstehen. Die volle Bedeutung der Axiome erschließt sich erst in der ausführlichen Entwicklung der Theorie. Zunächst sei die obige Charakterisierung der Mengeneigenschaft in formaler Gestalt wiedergegeben, nach der a eine Menge ist, wenn es eine andere Menge
246
Mengenlehre I
gibt, die a zu ihren Elementen zählt. Diese Aussage wird später als ZF-Theorem bewiesen werden. (7)
M a ↔ ∃x a ∈ x
(x 6∈ FV (a))
Die Klasse a ist eine Menge genau dann, wenn es eine Menge x gibt, so daß a ein Element von x ist.
Ferner geben wir die Definition der leeren Klasse an; dass diese eine Menge ist, ist etwas, was wir weiter unten ebenfalls beweisen müssen. (8)
(def)
∅ := { x | x 6= x }
Die leere Klasse ∅ ist definiert als die Klasse aller x, die nicht mit sich selbst identisch sind. Die leere Menge tritt an einigen Stellen in den Axiomen auf, und zwar in zweierlei Kontexten. Einmal wird von einer anderen Menge a gesagt, sie sei nicht leer, d.h. a 6= ∅, und das andere Mal ist ∅ selbst Element einer anderen Menge. Nun sollten Axiome in Grundnotation eigentlich keine definierten Zeichen enthalten; daher seien hier diese beiden Typen von Kontexten in einem (beweisbaren) Bikonditional “paraphrasiert”, so daß die eine Seite jederzeit für die andere stehen kann. Die rechten Seiten werden dann in den Axiomen in Grundform auftreten. (9)
a 6= ∅ ↔ ∃x(x ∈ a)
(10)
∅ ∈ y ↔ ∀x( ∀z(z ∈ x ↔ ¬(z = z)) → x ∈ y )
(x 6∈ FV (a))
Die Axiome gliedern sich in verschiedene Gruppen. Die ersten drei Axiome sind von logischem Charakter. Das erste Axiom der Mengenexistenz besagt, daß es mindestens ein Menge gibt. Diese Forderung folgt sich aus späteren komplexeren Axiomen, aber es ist praktisch, es gleich zur Verfügung zu haben. Es folgt das Axiom der Mengen-Komprehension, welches schon in der Einleitung angesprochen wurde, allerdings nun nicht in der “naiven” widersprüchlichen Form, sondern geeignet abgeschwächt: etwas ist nur dann ein Element einer Klasse, wenn es auf jeden Fall eine Menge ist. Das dritte Axiom der Extensionalität ist das entscheidende Identitätskriterium für Klassen und damit auch für Mengen: zwei Klassen a und b sind gleich, wenn sie dieselben Elemente enthalten. Es folgt die Gruppe von Mengenaxiomen, in denen relative Existenzaussagen für Mengen gemacht werden: wenn man schon weiß, daß eine oder mehrere Klassen Mengen sind, dann führen die wichtigsten Klassenoperationen wieder zu Mengen. Diese Operationen sind die Aussonderung, die Paarmengenbildung, die Operationen der (großen) Vereinigung und der Ersetzung sowie die Potenzmengen-Operation. Die letzte etwas heterogene Gruppe enthält zunächst das entscheidende (und nicht bedingte) Existenz-Axiom der Unendlichkeit: es ist so formuliert, daß jedes Modell, das es erfüllt, mindestens eine unendliche Menge enthält, sogar, wie sich zeigt, eine Menge von unendlichem Rang, d.h. mit unendlicher Klammeroder Komprehensionstiefe. Damit ergibt sich speziell die Existenz der kleinsten unendlichen Ordinalzahl ω. Das nächste Axiom der Fundierung formuliert eine Bedingung an die Elementschaftsrelation: diese darf im Einklang mit der iterativen Mengenkonzeption, nach der man sich die Mengenbildung in Stufen
247
Axiome
vorstellt, die einen “Anfang” haben, nicht unendliche, nach “unten” absteigende ∈-Ketten enthalten, speziell auch keine “∈-Zyklen” beliebiger Länge. Damit kann also für keine Menge die Beziehung x ∈ x gelten. Genauer besagt das Axiom, daß jede nicht-leere Menge ein Element besitzt, das bezüglich der ∈Relation ein “erstes” oder “unterstes” Element in dieser Menge darstellt. Das Auswahlaxiom (AC) schließlich besagt, daß zu jeder Menge (von Mengen) eine sogenannte Auswahlfunktion existiert, welche aus jedem ihrer nicht-leeren Elemente ein Objekt “simultan herausgreift”. Wir geben die Liste der relativen Existenzaxiome sowie (Inf) und (AF) in zwei äquivalenten Versionen an. In der ersten “Kurzform” verwenden wir die den verschiedenen Mengenoperationen entsprechenden Klassenterme, während in der zweiten Version die Axiome in der Grundform angegeben werden: diese enthalten dann außer den logischen Zeichen, der Identität und dem ∈-Symbol keine weiteren Zeichen. Zur Besonderheit der schematischen Axiome (Aus) und (Ers) siehe am Ende des Abschnitts. In der Kurzform sind für das Aussonderungsaxiom (Aus) zwei äquivalente Formulierungen aufgeführt. Vor allem die zweite Formulierung, nach der Teilklassen von Mengen wieder Mengen sind, ist in der Praxis besonders wichtig: beim Übergang zu einer Teilklasse bleibt die Mengeneigenschaft erhalten. Da in der Mengenlehre die Mitteilungszeichen für Objekte beliebiger Komprehensionsstufen stehen, ergibt die Unterscheidung zwischen Groß- und Kleinbuchstaben wenig Sinn. In der unten vorzustellenden Sprache der Mengenlehre werden also meist lateinische Kleinbuchstaben auf beiden Seiten des ∈-Symbols verwendet. Der Deutlichkeit halber kommen bisweilen jedoch auch Großbuchstaben zum Einsatz, z.B. bei den Theoremen der Klassenalgebra. Zur Formulierung der Axiome wurde aber die allgemeine Notation verwendet. Demnach sind ‘a’ und ‘b’ Mitteilungszeichen für beliebige Mengen- oder Klassenterme, während die Kleinbuchstaben des hinteren Alphabets für Mengen-Variablen stehen. Die Termsymbole ‘a’ und ‘b’ bezeichnen also Klassen, die nicht notwendig Mengen sind; die Aussage ‘Ma’ für einen Klassenterm a ist daher nicht redundant. Dagegen laufen die Quantoren nur über Mengen; der Quantor ‘∀x’ ist also zu lesen als “für alle Mengen x”. Zu allen Axiomen ist eine umgangsprachliche Paraphrase angegeben. Axiome in Kurzform (MEx)
∃x x = x
(Mengenexistenz )
a ∈ { x | φ[x] } ↔ M a ∧ φ[a]
(Komprehension)
∀x (x ∈ a ↔ x ∈ b) → a = b
(Extensionalität)
Es gibt eine Menge, die mit sich selbst identisch ist, d.h. (da alle Mengen mit sich selbst identisch sind): es gibt mindestens eine Menge.
(Kph)
Eine Klasse a ist genau dann ein Element der Klasse aller x mit der Eigenschaft φ[x], wenn a eine Menge ist und die Eigenschaft φ hat.
(Ext)
Gilt für Klassen a und b, daß jede Menge x genau dann ein Element von a ist, wenn x ein Element von b ist, so ist a gleich b. Oder kürzer: Klassen, die dieselben Elemente enthalten, sind gleich.
248 (Aus)
Mengenlehre I M a → M { x ∈ a | φ[x] }
(Aussonderung)
Ma ∧ b ⊆ a → Mb
(Aussonderung)
Ist a eine Menge, so ist die Klasse aller x in a mit der Eigenschaft φ[x] ebenfalls eine Menge. (Aus0 )
Ist a ein Menge und b eine Teilklasse von a, so ist b eine Menge.
(Paar)
(Vng)
(Ers)
(Paarmenge)
M a ∧ M b → M { a, b }
Sind a und b Mengen, so ist auch die Paarklasse { a, b } eine Menge. S M a → M ( a) (Vereinigungsmenge) S Ist a eine Menge, so ist auch die Vereinigungsklasse a eine Menge. Fkt[f ] ∧ M Dom[f ] → M Ran[f ]
(Ersetzung)
Ist f eine Funktion, deren Definitionsbereich eine Menge ist, so ist auch ihr Wertebereich eine Menge. (Pot)
M a → M (Pa)
mit Pa = { x | x ⊆ a }
(Potenzmenge)
Ist a eine Menge, so ist auch die Potenzklasse Pa eine Menge.
(Inf)
∃y ( ∅ ∈ y ∧ ∀x (x ∈ y → Sx ∈ y) )
mit Sx = x ∪ {x} (Unendlichkeit)
Es gibt eine Menge y, die die leere Klasse enthält und mit jedem ihrer Elemente x auch dessen mengentheoretischen “Nachfolger” Sx = x∪{x} (AF)
M a ∧ a 6= ∅ → ∃y (y ∈ a ∧ y ∩ a = ∅)
(Fundierung)
Ist a eine nicht-leere Menge, so enthält a ein Element y, welches einen leeren Durchschnitt mit a hat. d.h. derart daß kein anderes Element von a zugleich ein Element von y, also ein “∈-Vorgänger” von y ist.
(AC)
∀x∃f ( Fkt[f ] ∧ Dom[f ] = x ∧ ∀y(y ∈ x ∧ y 6= ∅ → f (y) ∈ y) )
(Auswahlaxiom)
Zu jeder Menge x gibt es eine Auswahlfunktion, d.h. eine Funktion f mit dem Definitionsbereich x, so daß der Wert von f bei einem nichtleeren Argument y ∈ x ein Element aus y ist. Wir fügen nun noch die oben bezeichneten Axiome in ihrer Grundform an. Anstelle der Angabe eines speziellen Klassenterms, von dem die Mengeneigenschaft ausgesagt wird, enthält die Grundform einen Existenzquantor (hier: ∃y) für die als existent geforderte Menge, deren Elemente durch die nachfolgende Bedingung beschrieben werden. Dabei sind die relativen Existenzaxiome nicht direkt das Ergebnis der syntaktischen Elimination definierter Ausdrücke in den Kurzformen, sondern geringfügig schwächer formuliert. Statt einem Bikonditional, welches diejenigen Elemente z von y genau abgrenzt, die die interessierende Bedingung erfüllen, wird nur gefordert, daß y jene z enthält. Es ergibt sich also die charakteristische Form: . . . ∃y∀z . . . ( . . . → z ∈ y).2 Die Äquivalenz von Grundform und Kurzform kann dann später mit Hilfe von (Aus) bewiesen werden. Es sei noch einmal darauf hingewiesen, daß der Existenzquantor wie 2 Das
Axiom (Paar) wird dadurch sogar noch einfacher.
249
Axiome
der Allquantor nur über Mengen läuft und daher bereits die Mengeneigenschaft “beinhaltet”. Axiome in Grundform (Aus)
(Aussonderung)
∀x∃y∀z (z ∈ y ↔ z ∈ x ∧ φ[z])
Zu jeder Menge x gibt es eine Menge y, so daß für alle z gilt: z ist genau dann Element von y, wenn z Element von x ist und die Eigenschaft φ besitzt. (Paar)
(Paarmenge)
∀x∀y∃z(x ∈ z ∧ y ∈ z)
Sind x und y Mengen, so gibt es eine Menge z, die sowohl x als auch y als Elemente enthält. (Vng)
∀x∃y∀z∀u (z ∈ u ∧ u ∈ x → z ∈ y)
(Vereinigungsmenge)
Zu jeder Menge x gibt es eine Menge y, so daß für alle z und für alle u gilt: ist z in u und u in x, so ist z Element von y; m.a.W., y enthält die Elemente von Elementen von x. (Ers)
∀x [ ∀x∀y∀z(φ[x, y] ∧ φ[x, z] → y = z) →
(Ersetzung)
∃y∀z∀u ( u ∈ x ∧ φ[u, z] → z ∈ y) ]
Wenn x eine Menge ist, und wenn die Formel φ bezüglich zweier Nennstellen eine rechtseindeutige Relation, also eine Funktion beschreibt (das bedeutet gerade die Teilformel, daß für alle x, y, z, wenn x sowohl mit y als auch mit z in der Relation φ steht, dann y gleich z ist), dann gibt es eine Menge y, so daß für alle z und alle u gilt: ist u in x und steht u mit z in der Relation φ, so ist z ein Element von y. Die Menge y enthält also alle Mengen z, die als “Werte” der Elemente von x unter der durch φ beschriebenen Funktion auftreten. (Pot)
∀x∃y∀z ( ∀u(u ∈ z → u ∈ x) → z ∈ y )
(Potenzmenge)
Zu jeder Menge x gibt es eine Menge y, so daß für alle z gilt: sind alle Elemente u von z auch Elemente von x, so ist z Element von y. Damit befinden sich unter den Elementen von y alle Teilmengen von x, d.h. y umfaßt die Potenzmenge von x. (Inf)
∃y ( ∀x( ∀z(z ∈ x ↔ ¬(z = z)) → x ∈ y ) ∧ ∀x (x ∈ y → ∃z (z ∈ y ∧ ∀u(u ∈ z ↔ u ∈ x ∨ u = x))) )
(Unendlichkeit)
Es gibt eine Menge y, die die leere Menge enthält und für die gilt: mit jedem ihrer Elemente x enthält y zugleich eine weitere Menge z, die genau die Mengen u enthält, die entweder ein Element von x oder gleich x sind; diese Menge z ist gerade die “Nachfolgermenge” von x. (AF)
∀x [ ∃u(u ∈ x) → ∃y (y ∈ x ∧ ∀z(z ∈ y → ¬(z ∈ x))) ] (Fundierung)
Ist x eine Menge und enthält mindestens ein Element, dann gibt es ein Element y von x, so daß für alle seine Elemente z gilt, daß z kein Element von x ist; damit ist y gerade das bezüglich ∈ “erste” Element von x.
250
Mengenlehre I
Eine letzte Bemerkung zu einer Besonderheit von (Aus) und (Ers). Diese Axiome enthalten das Mitteilungszeichen ‘φ’, welches für beliebige Formeln der mengentheoretischen Sprache steht. Damit handelt es sich genau genommen um Axiomenschemata, die die unendlich vielen möglichen Instanzen derselben passenden Gestalt zusammenfassen. Die Theorie ZF besitzt also unendlich viele Axiome. Man kann zeigen, daß diese Axiomenmenge durch keine endliche Menge von Axiomen ersetzt werden kann: ZF ist nicht endlich axiomatisierbar. Diese Eigenschaft teilt ZF mit der Peano-Arithmetik PA; siehe Kapitel 17. Das Formelschema φ wurde in Nennformschreibweise mitgeteilt, in (Aus) als φ[x] und in (Ers) als φ[x, y]. Dabei ist zugelassen, daß φ außer den genannten Variablen weitere freie Variablen als Parameter enthält. Will man an der üblichen Definition von Theorien als Mengen von Sätzen festhalten, so ist bei den Instanzen von (Aus) und (Ers) jeweils ihr Allabschluß hinzuzudenken. Das Schema (Ers) ist das einzige Axiom, welches von A. Fraenkel den Zermeloschen Axiomen hinzugefügt wurde. Wir werden sehen, daß (Aus) mit (Ers) beweisbar und daher in ZF redundant ist; betrachtet man dagegen die Zermelosche Theorie Z = ZF − (Ers) allein, dann ist (Aus) zur Generierung neuer Mengen natürlich wesentlich. Die hier zusammengestellten Axiome von ZF(C) sind von außerordentlicher Stärke. Es kann nicht die Aufgabe der folgenden Ausführungen sein, diese Stärke auch nur im Ansatz sichtbar zu machen. Stattdessen begnügen wir uns zunächst mit den einfachsten Axiomen und machen schrittweise nur von denjenigen unter ihnen Gebrauch, die für den Nachweis der elemenaren Mengeneigenschaften gerade benötigt werden.
9.2 9.2.1
Der formale Rahmen für die freie Mengenlehre Die mengentheoretische Sprache
Wir beschreiben nun eine Sprache L∗ZF der ZF-Mengenlehre im Detail. L∗ZF ist eine Sprache der Prädikatenlogik erster Stufe mit Identität. Der Stern soll andeuten, daß L∗ZF anders als die übliche Sprache der Mengenlehre, häufig LZF genannt, zusätzlich das einstellige Prädikatsymbol M für die Mengenexistenz sowie das komplexe geschweifte Klammersymbol der Klassenabstraktion als Zeichen enthält; also gilt: L∗ZF = LZF [M, { · | · · · }]. Definition 9.1 Das Vokabular von L∗ZF besteht aus den folgenden Grundsymbolen: 1. eine Menge von abzählbar vielen Variablen; MZ: ‘u’, ‘v’, ‘w’, ‘x’, ‘y’, ‘z’ (StI), nach Bedarf auch weitere (Groß- und Klein-)Buchstaben; 2. die zweistelligen Prädikatsymbole ‘=’ (Identität) und ‘∈’ (Elementschaft); 3. das einstellige Prädikatsymbol M (für Mengenexistenz ); 4. die logischen Konstanten ‘¬’, ‘∨’, ‘∀’ mit der üblichen Bedeutung;
251
Der logische Rahmen 5. das Symbol der Klassenabstraktion ‘{ · | · · · }’; 6. die Klammersymbole ‘(’, ‘)’, ‘[’, ‘]’.
Definition 9.2 Ein Ausdruck der Sprache L∗ZF (kurz: ZF-Ausdruck ) ist eine endliche Kette von Grundsymbolen von L∗ZF . Das formale System enthält komplexe wohlgeformte Ausdrücke aus zweierlei syntaktischen Kategorien: Formeln und Mengen- bzw. Klassenterme. Letztere sind Individuenterme im Sinne der Prädikatenlogik. Ganz ähnlich wie in der Kennzeichnungstheorie bauen sich Formeln und Terme im wechselnden Zugriff aufeinander auf, so daß eine simultane induktive Definition erforderlich wird. Definition 9.3 Simultane induktive Definition von Formel und Term von L∗ZF : 1. Jede Variable ist ein Term; 2. ist a ein Term, so ist pM a q eine Formel; 3. sind a und b Terme, so sind p(a = b)q und p(a ∈ b)q Formeln; 4. sind φ und ψ Formeln, so sind auch p¬φq und p(φ ∨ ψ)q Formeln; 5. ist φ eine Formel und ist x eine Variable, so ist p∀xφq eine Formel; 6. ist φ[x] eine Formel (mit mindestens x frei in φ), so ist { x | φ[x] } ein Term. Mitteilungszeichen für Terme sind ‘a’, ‘b’, ‘c’ (StI); für Formeln ‘φ’, ‘ψ’, ‘χ’ (StI); für wohlgeformte Ausdrücke (Terme und Formeln) ‘ζ’, ‘η’. Nach Bedarf können weitere Buchstaben hinzugenommen werden. Klammern können weggelassen werden, wenn die eindeutige Lesbarkeit garantiert ist. ‘a ∈ b’
ist zu lesen als:
“a ist Element von b”
‘M a’
ist zu lesen als:
“a ist eine Menge”
‘{ x | φ[x] }’
ist zu lesen als:
“die Klasse der x mit der Eigenschaft φ[x]”
Wir verwenden die folgenden Abkürzungen: φ∧ψ
φ→ψ
φ↔ψ
∃xφ
a 6= b
a 6∈ b
{ x ∈ a | φ[x] } ∀x ∈ a (φ)
∃x ∈ a (φ)
∃!xφ
:≡ :≡ :≡ :≡ :≡ :≡ := :≡ :≡ :≡
¬(¬φ ∨ ¬ψ)
(11)
(φ → ψ) ∧ (ψ → φ)
(13)
¬(a = b)
(15)
¬φ ∨ ψ
¬∀x¬φ
¬(a ∈ b)
{ x | x ∈ a ∧ φ[x] }
(12) (14) (16) (17)
∀x (x ∈ a → φ)
(18)
∃x∀y (φ ↔ y = x)
(20)
∃x (x ∈ a ∧ φ)
(19)
252
Mengenlehre I
Weitere syntaktische Begriffe werden wie üblich verwendet; speziell: freies und gebundenes Vorkommen einer Variable x in einem wohlgeformten Ausdruck ζ (x ist außer in ∀xφ und ∃xφ auch in { x | φ[x] } gebunden); frei in ζ; offener und geschlossener wohlgeformter Ausdruck (Term oder Formel ); Term a ist frei für die Variable x in dem wohlgeformten Ausdruck ζ, bzw. frei für die Nennstelle ‘∗’ in der Nennform φ[∗]. Konvention. Die Nennform φ[∗] sei so verwendet, daß nur solche Terme a in die Nennstelle eingesetzt werden, die dort frei für ∗ sind. Dies kann durch gebundene Umbenennung in φ[∗] stets erreicht werden. Also: Kommt der Ausdruck ‘φ[a]’ vor, so sei a automatisch frei für ∗ in φ[∗].
9.2.2
Schließen im freien KM-Kalkül
Im folgenden werden Kalkülregeln für eine freie Logik der Mengenlehre angegeben. Wie bereits angesprochen, spielt das definierte Mengenprädikat M dabei eine ähnliche Rolle wie das Existenz-Prädikat in der Logik mit Kennzeichnungen. Genau wie in der Logik PL1IK die Kennzeichnungen ein Teil der Sprache sind und damit für Denotationslücken sorgen, so werden auch hier die Klassenterme der Form { x | φ[x] } in die Sprache selbst eingeführt. Da die intendierte Interpretation des Quantifikationsbereichs die Mengen sind, kann es vorkommen, wie das Beispiel der Russell-Klasse zeigt, daß es Klassenterme gibt, die für keine Menge stehen. Allsätze, die eine Aussage über alle Mengen machen, können dann auf solche Terme nicht spezialisiert werden. Die Spezialisierungsregel und andere Regeln des Kalküls sind also auf die gleiche Weise einzuschränken, wie das in der freien Logik für die Kennzeichnungen geschah. Ferner müssen die Bestimmungen für den Aufbau eines Beweises leicht abgeändert werden, um an den nötigen Stellen die Mengenartigkeit zu garantieren. Die Einschränkung der Quantorenregeln mag einerseits als Komplikation angesehen werden; auf der anderen Seite besitzt die Entscheidung, das zentrale Element der Mengenlehre, die Klassenabstraktion, nicht als reine façon de parler aufzufassen, sondern in die mengentheoretische Sprache aufzunehmen, eine große intuitive Natürlichkeit; sie schärft zugleich sozusagen an jeder Stelle des praktischen Beweisgeschäfts die Wahrnehmung der konstitutiven MengenKlassen-Unterscheidung. Der Kalkül des natürlichen Schließens besitzt keine Axiome im eigentlichen Sinne. Wir betrachten daher die ZF-Axiome als Theoreme, die jederzeit in einen Beweis eingeführt werden können. Das gleiche gilt wie bisher für Formeln, die tautologische Schemata der Aussagenlogik darstellen. Der freie KM-Kalkül für ZF enthält damit als spezielle Theoreme: • Jedes Formelschema, das eine AL-Tautologie darstellt;
(AL)
• jedes Formelschema, welches die Gestalt eines der obigen Axiome von ZF (ohne AC) hat. (ZF-Ax) Die Schlußregeln des Kalküls sind die folgenden: I. Alle aussagenlogischen Schlußregeln
253
Der logische Rahmen II. Prädikatenlogische Schlußregeln der freien Mengenlehre:3
(∀B)
∀xφ , M a
(All-Beseitigung)
∴ φxa
(∃E)
φxa , M a
(∃B)
∃xφ ∴ φxa
∴ ∃xφ
(Existenz-Einführung/ Existenz-Beseitigung, mit a neu)
III. Identitätsregeln a=b
a = b , φ[a] (LbT)
(Lb)
∴ c[a] = c[b]
∴ φ[b]
Die frühere Gleichheitsregel (SI), die es gestattet, jederzeit eine Selbstidentität in einen Beweis einzuführen, braucht nicht unter die Schlußregeln aufgenommen zu werden, da das Schema a = a beweisbar ist; siehe (M.4). (Lb) ist die übliche Leibniz-Regel, jetzt als Substitutionsregel für koreferentielle Klassenterme. Wir formulieren ferner den Spezialfall der Ersetzung solcher Terme füreinander an . der Nennstelle eines komplexeren Terms c = c[∗]. Diese Regel ist zulässig, mit c[a] = c[a] nach (M.4) und (Lb). Wie bei (Lb) nehmen wir dabei stets an, daß in (LbT) die Terme a, b frei für die jeweilige Nennstelle in der Nennform c[∗] sind. Schließlich können wir die übrigen PL1I-Regeln (AV), (QN), (=Sym) und (=Tr) als zulässig übernehmen; wir führen sie deshalb hier nicht mehr auf. Sie sind jetzt mit den Mitteilungszeichen für ZF-Terme ‘a’, ‘b’, ‘c’, zu lesen statt der bisherigen Symbole ‘s’, ‘t’, ‘r’. Bemerkung. Es sei ferner darauf hingewiesen, daß die Beweisbarkeit der uneingeschränkten Selbstidentität a = a nicht nur für Mengen, sondern auch für beliebige Klassenterme a von der Intuition abweicht, die uns im PL1IK-Kalkül bei der Einschränkung dieser Regel auf Grundterme geleitet hat. Der Grund liegt darin, daß das Extensionalitätsaxiom die Selbstidentität auch von NichtMengen liefert, z.B. die der Allklasse V ; wir haben damit speziell: `ZF V = V Während man also im Fall nicht-denotierender Kennzeichnungen in keinem Sinn davon sprechen kann, daß sie etwas bezeichnen, und damit auch ihre Selbstidentität falsch wird, ist die “Existenz” echter Klassen ja in einem gewissen Sinn gegeben; sie sind lediglich zu groß, um als Mengenobjekte aufgefaßt werden zu können. Dies führt dazu, daß auf sie zwar das Mengenprädikat nicht zutrifft, 3 Die
Mitteilungszeichen ‘a’, ‘b’, ‘c’ spielen im KM-Kalkül für die Mengenlehre jetzt eine doppelte Rolle: einerseits stehen sie für beliebige Klassenterme, andererseits sind sie die alten Spezialisierungsparameter des Kalküls.
254
Mengenlehre I
die Selbstidentität jedoch weiterhin gilt. Die quantifizierte Form ∀x(x = x) gilt dann natürlich ebenso wie in der normalen freien Logik. Schließlich modifizieren wir geringfügig den Ansatz zur (bedingten) AllAbleitung; Beweise unter ‘zeige’-Zeilen mit Allsätzen werden wie folgt angesetzt: zeige
∀x φ
zeige
Mx .. .
∀x (φ → ψ)
Mx ∧ φ .. .
Wir können die Prämisse M x einführen, da die zu beweisende Eigenschaft nur von Mengen x behauptet wird: der Quantor läuft nur über Mengen. Das Ziel des Beweises ist dann wie bisher, im Fall des Allsatzes die Matrix φ und beim bedingten Allsatz das Konsequens der Matrix, ψ, herzuleiten. Mit dieser Änderung werden die unter (M.1) und (M.2) aufgeführten Quantorengesetze der freien Mengenlehre trivial beweisbar. Im nächsten Abschnitt wird es erst einmal nur darum gehen, Theoreme aus den beiden Axiomen der Komprehension (Kph) und der Extensionalität (Ext) abzuleiten. Wir führen vorher ferner einige identitätslogische Theoreme in ZF auf.4
9.3
Theoreme von Kph und Ext
(M.1)
∀xφ ↔ ∀x(M x → φ)
(M.2)
∃xφ ↔ ∃x(M x ∧ φ)
(M.3)
Ma ∧ a = b → Mb
(M.4)
a=a
(M.5)
M a ↔ ∃x(x = a)
(x 6∈ FV (a))
(M.6)
M a → (φxa ↔ ∃x(x = a ∧ φ))
(x 6∈ FV (a))
(M.7)
∃x(x = a ∧ φ) ↔ M a ∧ φxa
(x 6∈ FV (a))
(M.8)
M a → (φxa ↔ ∀x(x = a → φ))
(x 6∈ FV (a))
(Lb)
Wir beweisen (M.4), (M.5) und als Beispiel für die anderen Theoreme (M.6). 4 Für
die Zählung der mengentheoretischen Theoreme benutzen wir den Buchstaben ‘M’.
255
Theoreme von Kph und Ext
1. 2. 3. 4. 5. 6.
zeige a=a
M.4
zeige ∀x (x ∈ a ↔ x ∈ a)
für Ext! A-AA
Mx
AL
x ∈ a ↔ x ∈ a —(4) ∀x (x ∈ a ↔ x ∈ a) → a = a a=a —(1)
Ext 2,5,MP
Das nächste Theorem zeigt, daß das Mengenprädikat M wirklich die Eigenschaft der Mengenexistenz ausdrückt. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
zeige M a ↔ ∃x(x = a)
M.5
zeige M a → ∃x(x = a)
Hw(2) A-BA
Ma
(M.4) 3,4,∃E
a=a ∃x(x = a) —(2) zeige ∃x(x = a) → M a
A-BA
∃x(x = a)
7,∃B,b neu 10,(M.3)
Mb ∧ b = a Ma —(2)
M a ↔ ∃x(x = a)
—(1)
2,5,AL
Wird von einem Klassenterm a die Eigenschaft φ ausgesagt, so kann a nur dann mittels einer Existenzaussage “isoliert” werden, wenn a eine Menge ist. Das sagt das nächste Theorem. Analoges gilt für die Allversion (M.8). Der Grund ist stets, daß die Quantoren nur über Mengen laufen.
256 1. 2. 3.
Mengenlehre I zeige M a → (φxa ↔ ∃x(x = a ∧ φ))
φxa
5. 6.
a=a a = a ∧ φxa
8. 9. 10. 11. 12.
(M.9)
1. 2. 3. 4. 5. 6. 7.
A-BA Hw(2)
Ma zeige φxa → ∃x(x = a ∧ φ)
4.
7.
M.6
A-BA (M.4) 4,5,AL 6,2,∃E
∃x(x = a ∧ φ) —(2)
zeige ∃x(x = a ∧ φ) → φxa A-BA
∃x(x = a ∧ φ)
9,∃B,∧B
b = a ∧ φxb φxa
—(2)
10,Lb
M a → (φxa ↔ ∃x(x = a ∧ φ)) —(1)
2,8,AL
a = {x | x ∈ a} zeige a = {x | x ∈ a}
M.9
zeige ∀y (y ∈ a ↔ y ∈ { x | x ∈ a })
für Ext! A-AA
My
Kph 4,AL
y ∈ {x | x ∈ a} ↔ My ∧ y ∈ a M y → (y ∈ a ↔ y ∈ { x | x ∈ a }) y ∈ a ↔ y ∈ {x | x ∈ a}
a = {x | x ∈ a}
—(4)
3,5,AL 2,Ext,MP
Bemerkung. Die Gleichheit zweier Klassen wird wie in (M.9) generell dadurch bewiesen, daß man das Antecedens des Extensionalitätsaxioms herleitet; dieses besagt aber gerade, daß die beteiligten Klassen dieselben Elemente enthalten. (M.10)
{ x | φ[x] } = { y | φ[y] }
Beweis. Kph,Ext
Das nächste Theorem kann als Denotationsprinzip für die freie Mengenlehre aufgefaßt werden. Die linke Position der ∈-Relation ist existenzimplizierend. Anders als in der obigen freien Logik für Kennzeichnungen gilt dies für die rechte Position jedoch nicht: wir werden sogleich sehen, daß für alle Mengen a gilt a ∈ V . (M.11)
a ∈ b → Ma
Theoreme von Kph und Ext
1. 2. 3. 4. 5.
zeige a ∈ b → Ma a∈b b = {x | x ∈ b}
a ∈ {x | x ∈ b} Ma —(2)
(M.12)
a ∈ a → Ma
(M.13)
¬M a → a 6∈ a
257
M.11 A-BA M.9 3,2,Lb 4,Kph,AL
Dieses Theorem sagt, daß echte Klassen sich nicht als Element enthalten können. Wir geben die Definition der Allklasse als die Klasse aller Mengen x, die mit sich selbst identisch sind. Aus logischen Gründen gilt die Selbstidentität aber für alle Mengen. Wir wiederholen die duale Definition der leeren Klasse als der Klasse aller Mengen, die nicht mit sich selbst identisch sind; diese Bedingung kann auf keine Menge zutreffen. (21)
(def)
V
(22)
(def)
∅ = { x | x 6= x }
= {x | x = x}
(M.14)
a ∈ V → Ma
(M.15)
Ma → a ∈ V
1.
zeige Ma → a ∈ V
2. 3.
Ma a=a
4. 5.
a ∈ {x | x = x} a∈V —(2)
(M.16)
Ma ↔ a ∈ V
(M.17)
a∈b → a∈V
Beweis. M.11, M.15 (M.18)
∃y a ∈ y → a ∈ V
Beweis. M.17
(Allklasse) (leere Klasse)
M.15 A-BA (M.4) 2,3,Kph,AL 4,def V
(y 6∈ FV (a))
Bemerkung. Mit (Paar) folgt auch die Umkehrung von (M.18); siehe unten. Also gilt mit (M.16), wobei y 6∈ FV (a):
258
Mengenlehre I
(M.19)
∃y a ∈ y ↔ a ∈ V
(M.20)
∀x (x ∈ a ↔ x ∈ b) ↔ a = b
(Mengen sind “kleine” Klassen) (Ext0 )
Beweis. Ext, Lb. (M.21)
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
(M.22)
a = { x | φ[x] } ↔ ∀x (x ∈ a ↔ φ[x]) zeige a = { x | φ[x] } ↔ ∀x (x ∈ a ↔ φ[x]) zeige a = { x | φ[x] } → ∀x (x ∈ a ↔ φ[x]) A-BA AA
a = { x | φ[x] } zeige ∀x (x ∈ a ↔ φ[x])
A-AA 3,Ext0 ,∀B
Mx x ∈ a ↔ x ∈ { x | φ[x] }
x ∈ { x | φ[x] } ↔ φ[x] ∧ M x x ∈ a ↔ φ[x] —(4)
A-BA
∀x (x ∈ a ↔ φ[x])
zeige ∀x (x ∈ a ↔ x ∈ { x | φ[x] })
10,12,∀B Kph
x ∈ a ↔ φ[x] x ∈ { x | φ[x] } ↔ φ[x] ∧ M x
x ∈ a ↔ x ∈ { x | φ[x] }
f. Ante-Ext! A-AA
Mx
—(4)
a = { x | φ[x] } a = { x | φ[x] } ↔ ∀x (x ∈ a ↔ φ[x])
12,13,14,AL 11,Ext,AL 2,10,AL
∃y y = { x | φ[x] } ↔ ∃y∀x(x ∈ y ↔ φ[x])
M { x | φ[x] } ↔ ∃y∀x(x ∈ y ↔ φ[x])
Beweis. M.22, def M. (M.24)
Kph 5,6,7,AL
zeige ∀x (x ∈ a ↔ φ[x]) → a = { x | φ[x] }
. Beweis. M.21 mit a = y; (Bk∃) (M.23)
M.21
{ x | φ[x] } ∈ V ↔ ∃y∀x(x ∈ y ↔ φ[x])
Beweis. M.23, M.16, AL.
259
Theoreme von Kph und Ext
Bemerkung. Damit gilt: Die Klasse { x | φ[x] } ist eine Menge genau dann, wenn eine der folgenden äquivalenten Eigenschaften erfüllt ist: M { x | φ[x] } (i) (ii) { x | φ[x] } ∈ V (iii) ∃y y = { x | φ[x] } (23) (Mng) (iv) ∃y∀x(x ∈ y ↔ φ[x]) (v) ∃y { x | φ[x] } ∈ y (mit Paar) Ist a ein beliebiger Klassenterm, so gilt: a ist eine Menge genau dann, wenn eine der folgenden äquivalenten Eigenschaften erfüllt ist: (i) Ma (ii) a ∈ V (24) (Mng 0 ) (iii) ∃y (y = a) (iv) ∃y (a ∈ y) (mit Paar) Wir definieren nun die folgenden speziellen Typen von Klassentermen:
(25) (26) (27)
{ a, b } := { x | x = a ∨ x = b } S a := { x | ∃z(x ∈ z ∧ z ∈ a) }
Pa := { x | ∀z(z ∈ x → z ∈ a) }
(Paarklasse) (Vereinigungsklasse) (Potenzklasse)
Mit den Äquivalenzen (i) und (iv) in (Mng) lassen sich die Vereinfachungen der mengentheoretischen Axiome begründen, wie sich oben bereits angegeben wurden (“Axiome in Kurzform”). Speziell gilt: (Aus)
M a → M { x ∈ a | φ[x] }
(Paar)
M a ∧ M b → M { a, b }
(Vng) (Pot)
S M a → M ( a)
M a → M (Pa)
(Aussonderung) (Paarmenge) (Vereinigungsmenge)
mit Pa = { x | x ⊆ a }
(Potenzmenge)
Wir beweisen jetzt einige Eigenschaften der leeren Klasse ∅ = { x | x 6= x }. (M.25)
1. 2. 3. 4. 5.
a 6∈ ∅ zeige a 6∈ ∅
M.25 A-IA
a∈∅
def ∅,Kph 3,AL
M a ∧ a 6= a a 6= a a=a
—(3)
(M.4)
260 (M.26)
Mengenlehre I ∀x x 6∈ ∅
. Beweis. M.25 mit a = x. (M.27) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
(M.28)
a = ∅ ↔ ∀x x 6∈ a zeige a = ∅ ↔ ∀x x 6∈ a
M.27
zeige a = ∅ → ∀x x 6∈ a A-BA
a=∅
M.26 3,4,Lb
∀x x 6∈ ∅ ∀x x 6∈ a —(2) zeige ∀x x 6∈ a → a = ∅
A-BA
∀x x 6∈ a
f. Ante-Ext!
zeige ∀x (x ∈ a ↔ x ∈ ∅)
A-AA
Mx
7,∀B M.25
x 6∈ a x 6∈ ∅
10,11,AL
x ∈ a ↔ x ∈ ∅ —(4) a=∅ a = ∅ ↔ ∀x x 6∈ a
8,Ext,AL
—(2) —(1)
2,6,AL
a = ∅ ↔ ¬∃x x ∈ a
Beweis. M.27, QN. (M.29)
a 6= ∅ ↔ ∃x x ∈ a
Beweis. M.28, AL.
Bemerkung. Die modelltheoretische Semantik ordnet den Prädikaten der logischen Sprache gewisse Mengen als deren Extensionen zu, etwa den einstelligen Prädikatkonstanten Mengen von Objekten des zugehörigen Individuenbereichs. Die Vorstellung ist dabei, daß die Elemente solcher Extensionen selbst keine Mengen sind, sondern konkrete oder abstrakte Objekte aus den Bereichen möglicher Anwendungen. Zum Beispiel enthalten die Modelle formaler Theorien ökonomischen Verhaltens entscheidungsfähige Subjekte in ihrem Individuenbereich; die Theorie eines klassischen Zentralkraftfeldes besitzt als Interpretation etwa die Sonne zusammen mit den Planeten des Sonnensystems. In der Mathematik spricht die Arithmetk über natürliche Zahlen und die Analysis über reelle Zahlen, wobei diese Zahlen vom Mathematiker traditionell nicht als Mengen, sondern als vorgegebene (abstrakte) Objekte eigener Art aufgefaßt werden. All die Elemente solcher “Nicht-Mengen” heißen Urelemente. Von Mengen unterscheiden sie sich dadurch, daß sie keine anderen Mengen mehr enthalten. Wir definieren also:
261
Algebra der Klassen (28)
(def)
UR(a) :↔ ∀x x 6∈ a
(a ist Urelement)
Offensichtlich ist nach dieser Definition die leere Menge ein Urelement. Nun erzwingt das Extensionalitätsaxiom, daß es außer der leeren Menge keine weiteren Urelemente gibt (sieh M.30 unten). Die Mengentheorie mit der leeren Menge als einzigem Urelement wird auch als reine Mengenlehre bezeichnet. Die reine Mengenlehre reicht im folgenden Sinn für alle üblichen mathematischen Zwecke aus: in ihr lassen sich alle Zahlenklassen der Mathematik definieren: die natürlichen Zahlen, die ganzen Zahlen, die rationalen Zahlen, die reellen Zahlen, die komplexen Zahlen. Mengen, Funktionen, Mengen von Mengen, Mengen von Funktionen etc. über diesen Zahlenmengen können dann ebenfalls in der reinen Mengenlehre ausgedrückt werden. Traditionelle mathematische wie auch philosophische Intuitionen lassen es jedoch als wünschenwert erscheinen, mit eigentlichen Urelementen zu arbeiten, die von der leeren Menge verschieden sind. So betrachten Mathematiker die natürlichen oder reellen Zahlen meist als axiomatisch gegeben und nicht als mengentheoretisch konstruiert; und philosophisch kann man argumentieren, daß es hieße, die Natur der natürlichen Zahlen “einzuengen”, wenn man sie per Definition mit speziellen Mengen identifizieren würde, und sei es nur aufgrund der Tatsache, daß es mehrere nicht-äquivalente Möglichkeiten einer solchen Definition gibt.5 Will man also an nicht-trivialen Urelementen festhalten, so ist allerdings das Extensionalitätsaxiom geeignet zu modifizieren. Man kann einfach fordern, daß es nur für nicht-leere Klassen gelten soll: (ExtU r )
a 6= ∅ ∧ ∀x (x ∈ a ↔ x ∈ b) → a = b
Wir seigen jetzt wie angekündigt, daß es in der reinen Mengenlehre nur ein Urelement geben kann. (M.30) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
UR(a) ∧ UR(b) → a = b zeige UR(a) ∧ UR(b) → a = b
A-BA
UR(a) ∧ UR(b)
def Ur
∀x x 6∈ a ∀x x 6∈ b
zeige ∀x (x ∈ a ↔ x ∈ b)
AnteExt! A-AA
Mx
3,∀B 4,∀B
x 6∈ a x 6∈ b
7,8,AL 9,AL
x 6∈ a ∧ x 6∈ b x ∈ a ↔ x ∈ b —(4) a=b
M.30
—(2)
5,Ext,AL
5 Zwei verschiedene Definitionen der natürlichen Zahlen, die zugleich die bekanntesten sind, wurden von Zermelo und von Neumann angegeben. Zum Problem derartiger Identifizierungen siehe [18]
262
9.4
Mengenlehre I
Die Algebra der Klassen
Wir wollen nun die wichtigsten Gesetze der Klassenalgebra in unserer Mengentheorie herleiten. Nach wie vor benötigen wir dazu an mengentheoretischen Axiomen lediglich Komprehension und Extensionalität. Im Einklang mit den üblichen Darstellungen der Mengenalgebra verwenden wir in diesem Abschnitt neben den bisherigen Mitteilungszeichen für Klassenterme auch lateinische Großbuchstaben ‘A’, ‘B’, ‘C’ (StI). Wir beginnen mit der Definition der mengentheoretischen Operationen. (29)
A ⊆ B :≡ ∀x (x ∈ A → x ∈ B)
(A ist Teilklasse von B)
(30)
A ∩ B := { x | x ∈ A ∧ x ∈ B }
(Durchschnitt von A und B)
(31)
A ∪ B := { x | x ∈ A ∨ x ∈ B }
(Vereinigung von A und B)
(32)
A¯ := { x | x 6∈ A }
(33)
A \ B := { x | x ∈ A ∧ x 6∈ B }
(34)
A M B := (A \ B) ∪ (B \ A) (symmetrische Differenz von A und B) S A := { x | ∃z (z ∈ A ∧ x ∈ z) } (Vereinigung von A) T A := { x | ∀z (z ∈ A → x ∈ z) } (Durchschnitt von A)
(35) (36) (37)
{ a, b } := { x | x = a ∨ x = b }
(38)
{a} := { x | x = a }
(Komplement von A) (Differenz von A und B)
(Paarklasse von a und b)
(Einerklasse von a)
Die Relation ⊆ wird auch (mengentheoretische) Inklusion genannt. Übung 9.1 Stellen Sie die mengentheoretischen Operationen mit Hilfe von Venn-Diagrammen graphisch dar. Ein Blick auf die definierenden Klassenterme zeigt, daß die logischen Operationen konstitutiv für die Mengenoperationen sind: jeder logischen Konstante entspricht eine Mengenoperation. Daraus folgt, daß sich die algebraische Struktur einer Booleschen Algebra, die der klassischen Logik aufgeprägt ist, wie wir in der Aussagenlogik sahen, auf die Gesamtheit der Mengen und Klassen überträgt. Allerdings ist diese Gesamtheit keine Boolesche Algebra im Sinne der Definition 3.3 von Kapitel 2, da eine Boolesche Algebra dort als Menge mit einer gewissen Struktur definiert wurde, und die Mengen und Klassen können in keiner Menge zusammengefaßt werden. Strukturell gesehen besteht jedoch kein Unterschied: wir sind in der Lage, die Gesetze der Booleschen Algebra auch für die Klassenterme zu verifizieren. In der Algebra beweist man, daß man zu denselben Strukturen kommt, wenn man zweistellige Operationen t und u einführt, die zusammen mit der Komplementoperation eine Boolesche Algebra ergeben, oder wenn man, ausgehend von einer Halbordnung v, die Operationen t und u als kleinste obere Schranke (Supremum) bzw. größte untere Schranke (Infimum) bezüglich dieser Halbordnung
263
Algebra der Klassen
definiert und die entsprechenden Gesetze verifiziert. Der erste Ansatz ist algebraisch in einem engeren Sinne, während der zweite ein ordnungstheoretischer Ansatz ist. Strukturen mit einer Halbordnung, in denen Suprema und Infima stets existieren, heißen Verbände. Ein Verband mit einem größten und einem kleinsten Element, der die Distributivgesetze erfüllt und komplementär ist, d.h. zu jedem seiner Elemente ein eindeutiges Komplement besitzt, heißt Boolescher Verband . Die obige Aussage läßt sich dann kurz so formulieren, daß Boolesche Algebren und Boolesche Verbände dieselben Strukturen darstellen. In der Aussagenlogik haben wir die Axiome der Booleschen Algebra für die Gesamtheit der (Äquivalenzklassen von) aussagenlogischen Formeln verifiziert. Wir wollen dasselbe nun für die Mengen und Klassen tun und darüber hinaus zeigen, daß sich einerseits die Inklusionsbeziehung durch Vereinigung bzw. Durchschnitt definieren läßt und andererseits die Vereinigung (der Durchschnitt) zweier Klassen ihr Supremum (Infimum) bezüglich der Inklusion darstellt. Dies gilt sogar in noch allgemeinerer Form: das Supremum bezüglich der Inklusion einer beliebig vorgegebenen Klasse von Mengen ist gleich ihrer Vereinigungsklasse, und das Infimum gleich ihrer Durchschnittsklasse. Diese Eigenschaft der verbandstheoretischen Vollständigkeit für Klassen von Mengen ist von großer Bedeutung in der Theorie der Ordinalzahlen. Satz 9.1 Die Gesamtheit aller Mengen und Klassen besitzt die Struktur einer Booleschen Algebra bzw. eines Booleschen Verbandes. Die Struktur ist ferner verbandstheoretisch vollständig für Klassen von Mengen. Der Beweis für diesen Satz besteht in der Verifikation der Eigenschaften einer Booleschen Algebra und der darüber hinausgehenden verbandstheoretischen Axiome. Zunächst gilt es, die Operationen und die ausgezeichneten Objekte der Booleschen Struktur im gegenwärtigen Kontext zu identifizieren; für sie werden dann die einzelnen Gesetze bewiesen. AtB
AuB
AvB
:= := :≡
A∪B
A∩B
(39) (40)
A⊆B A¯
(41) (43)
A∗
:=
0
:=
1
∅
:=
V
(42) (44)
Wir zeigen zunächst, daß ⊆ eine Halbordnung ist. (M.31)
A⊆A
(Refl ⊆)
Wegen der Definition der Inklusion ist die zu beweisende Formel ein bedingter Allsatz der Form ∀x(x ∈ a → . . .), und die Annahme für die bedingte Allableitung lautet M x ∧ x ∈ a. Nun steht x links vom ∈-Symbol, und mit (M.11) folgt M x. Wir werden bei derartigen Beweisansätzen die Bedingung M x also häufig weglassen und haben sie dennoch zur Verfügung, wenn sie wie etwa bei den Quantorenregeln benötigt wird.
264
1. 2. 3. 4. 5.
(M.32)
Mengenlehre I
zeige A⊆A
M.31
zeige ∀x (x ∈ A → x ∈ A)
für def ⊆ ! A-BAA
x∈A
3,AL
x ∈ A —(5) A⊆A
2,def ⊆
—(1)
(Trans⊆)
A⊆B ∧ B⊆C → A⊆C
Beweis. Def ⊆, (A.50 ), Imp. (M.33)
(Antisym⊆)
A⊆B ∧ B⊆A →A=B
Beweis. Def ⊆, (A.670 )←, Ext. (M.34)
A=B ↔A⊆B ∧ B⊆A
Beweis. M.33, Ext0 , (A.670 )→, Def ⊆. (M.35)
(⊆ ist Halbordnung)
HO[⊆]
Beweis. ⊆ ist reflexiv, transitiv und antisymmetrisch.
Bemerkung. Um eine mengentheoretische Inklusion A ⊆ B zu beweisen, gibt man sich üblicherweise ein x ∈ A vor und versucht, x ∈ B abzuleiten. Die Definition der Inklusion liefert hierfür die Rechtfertigung. Mit dem Nachweis von x ∈ B hat man nämlich: 1. 2. 3. 4. 5. 6.
zeige A⊆B zeige ∀x (x ∈ A → x ∈ B) x∈A .. . x∈B A⊆B
Zum Nachweis der Gleichheit A = B zweier Klassen kann man wie oben das Antecedens des Extensionalitätsaxioms herleiten. Im Hinblick auf die Antisymmetrie der Inklusion genügt es jedoch ebenfalls, die beiden Inklusionen A⊆B
und
B⊆A
zu beweisen und dann mit der Antisymmetrie auf die Gleichheit zu schließen. Wir beweisen im folgenden für die Klassenalgebra die “Brückenprinzipien”, die die algebraische und die ordnungstheoretische Sicht der Booleschen Strukturen miteinander verbinden. Es gilt zum Beispiel:
265
Algebra der Klassen (M.36) 1. 2. 3. 4. 5.
A ⊆B ↔ A∪B =B zeige A⊆B ↔ A∪B =B zeige A ⊆B → A∪B =B A⊆B ∀x (x ∈ A → x ∈ B)
zeige ∀x (x ∈ A ∪ B ↔ x ∈ B)
6. 7.
Mx x ∈ A ∪ B ↔ (x ∈ A ∨ x ∈ B)
8. 9.
x∈A→x∈B x∈B→x∈B
10. 11.
x ∈A∨x ∈B → x ∈B x∈B → x∈A ∨ x∈B
12. 13. 14. 15. 16. 17. 18.
x∈A ∨ x∈B ↔ x∈B x ∈A∪B ↔ x ∈B A∪B =B A∪B =B
∀x (x ∈ A ∪ B ↔ x ∈ B) zeige ∀x (x ∈ A → x ∈ B) x∈A
20. 21.
x ∈A∪B → x ∈B x ∈ A ∪ B ↔ M x ∧ (x ∈ A ∨ x ∈ B)
22. 23.
x ∈A∨x ∈B → x ∈B x∈A → x∈B
24.
26.
—(2)
zeige A∪B =B → A⊆B
19.
25.
—(4)
x∈B
A⊆B
—(5) —(2)
A⊆B ↔ A∪B =B
—(1)
Analog zeigt man: (M.37)
A ⊆B ↔ A∩B =A
Allgemein kann man zeigen: sind die Booleschen Operationen t und u gegeben, so läßt sich die Halbordnung der Struktur wahlweise definieren durch a v b :≡ a t b = b oder durch a v b :≡ a u b = a
266
Mengenlehre I
Ist umgekehrt die Halbordnung v gegeben, so werden die algebraischen Operationen t und u als Supremum bzw. Infimum bezüglich v definiert: a t b := supv (a, b) a u b := infv (a, b)
Die Supremums- bzw. Infimums-Eigenschaft wird weiter unten gezeigt. Die zuerst genannten Äquivalenzen sind in der Mengenlehre gerade die letzten beiden Theoreme. Wir weisen jetzt die Eigenschaften der Booleschen Algebra aus Definition 3.3 für die mengentheoretischen Operationen nach. Zunächst gilt, daß das Einselement V verschieden ist von dem Nullelement ∅: (M.38) 1. 2. 3. 4. 5. 6.
V 6= ∅
(1 6= 0)
zeige V 6= ∅ ∃x x = x a = a ∧ Ma
a ∈ V ∧ Ma ∃x x ∈ V
V 6= ∅
Hier wurden das Existenzaxiom für Mengen (MEx) sowie M.29 benutzt. Als Vorbereitung für die ersten Booleschen Eigenschaften zeigen wir die Verbandseigenschaften von ∅ und V : ∅ ist das kleinste Objekt im Klassenverband bezüglich der Inklusion, und V ist das größte Objekt. Also gilt für alle Klassen A: (M.39) 1. 2. 3.
∅⊆A zeige ∅⊆A zeige ∀x (x ∈ ∅ → x ∈ A) x∈∅
4. 5.
x 6= x x=x
6.
x∈A
7.
(∅ ist kleinstes Objekt bzgl. ⊆)
∅⊆A
Dabei wurde mit EFQ geschlossen. (M.40)
A⊆V
(V ist größtes Objekt bzgl. ⊆)
267
Algebra der Klassen
1. 2. 3. 4. 5.
(M.41)
zeige A⊆V zeige ∀x (x ∈ A → x ∈ V ) Mx ∧ x ∈ A x∈V A⊆V A∪V =V
A∩V =A
(V ist Einselement)
Beweis. M.40, M.36, M.37. (M.42)
A∪∅=A
A∩∅=∅
(∅ ist Nullelement)
Beweis. M.39, M.36, M.37. (M.43) 1. 2. 3. 4. 5. 6. 7. 8. 9.
A ∪ A¯ = V
(Boolesches Komplement)
zeige A ∪ A¯ = V zeige ∀x (x ∈ A ∪ A¯ ↔ x ∈ V ) Mx x ∈ A ∨ x 6∈ A x ∈ A ∪ A¯
x=x x∈V
x ∈ A ∪ A¯ ↔ x ∈ V
A ∪ A¯ = V
Hier wurde mit (A.420 ) und (A.650 ) geschlossen. (M.44)
A ∩ A¯ = ∅
(Boolesches Komplement)
Beweis. (A.280 ), (M.270 ). (M.45) 1.
V¯ = ∅ zeige V¯ = ∅
2.
zeige ∀x (x ∈ V¯ ↔ x ∈ ∅)
3. 4.
Mx x ∈ V¯ ↔ M x ∧ x 6= x
5. 6. 7.
x ∈ ∅ ↔ M x ∧ x 6= x x ∈ V¯ ↔ x ∈ ∅
V¯ = ∅
∗
(1 = 0)
268
Mengenlehre I
Analog ergibt sich: (M.46)
¯ ∅=V
(M.47)
A¯ = A
(0∗ = 1) ((a∗ )∗ = a)
Beweis. Mit doppelter Negation DN: (A.80 ), (A.80 ). (M.48)
¯ A ∪ B = A¯ ∩ B
(De Morgan)
Beweis. Mit dem de Morgan – Gesetz (A.480 ). (M.49)
¯ A ∩ B = A¯ ∪ B
(De Morgan)
Beweis. Mit dem de Morgan – Gesetz (A.470 ). (M.50)
(Idempotenz von ∪)
A∪A=A
Beweis. (A.350 ). (M.51)
(Idempotenz von ∩)
A∩A=A
Beweis. (A.220 ). (M.52)
(Kommutativität von ∪)
A∪B =B∪A
Beweis. (A.360 ). (M.53)
(Kommutativität von ∩)
A∩B =B∩A
Beweis. (A.230 ). (M.54)
(Assoziativität von ∪)
(A ∪ B) ∪ C = A ∪ (B ∪ C)
Beweis. (A.370 ). (M.55)
(Assoziativität von ∩)
(A ∩ B) ∩ C = A ∩ (B ∩ C)
Beweis. (A.240 ).
Ähnlich wie bei Junktoren erlaubt die Assoziativität das Weglassen von Klammern. Wir kürzen ab: ∩
∩
∩
∩
(45)
A ∪ B ∪ C : = A ∪ (B ∪ C)
(46)
A1 ∪ . . . ∪ An : = A1 ∪ (A2 ∪ . . . ∪ (An−1 ∪ An ) . . .)
∩
∩
∩
∩
∩
∩
(n ≥ 3)
(M.56)
A ∪ (A ∩ B) = A
(Absorption)
(M.57)
A ∩ (A ∪ B) = A
(Absorption)
Beweis. Die Absorptionsgesetze folgen mit (A.510 ), (A.520 ). (M.58)
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
(Distributivität)
269
Algebra der Klassen (M.59)
(Distributivität)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Beweis. Die Distributivitätsgesetze folgen mit (A.570 ), (A.580 ).
Wir zeigen nun, daß die Vereinigung A ∪ B zweier Klassen A und B das Supremum der Klassen bezüglich der Inklusion darstellt; dies heißt zweierlei: (47)
(i) (ii)
A ∪ B ist eine obere Schranke für A und B: sowohl A als auch B sind Teilklassen von A ∪ B;
A ∪ B ist kleinste obere Schranke für A und B: sind sowohl A als auch B Teilklassen einer weiteren Klasse C, so ist auch A ∪ B Teilklasse von C.
Analoge Eigenschaften gelten für den Durchschnitt A ∩ B zweier Klassen A und B: dieser ist das Infimum von A und B bezüglich der Inklusion, d.h. ihre größte untere Schranke. Dies führt zu den folgenden Theoremen: (M.60)
A⊆A∪B
(A ∪ B ist obere Schranke)
B ⊆A∪B
Beweis. Mit ∨-Einführung. (M.61)
A ⊆ C ∧ B ⊆ C → A ∪ B ⊆ C (A ∪ B ist kleinste obere Schranke)
Beweis. Mit (∨E-Ant): (A.400 ). (M.62)
A∩B ⊆A
(A ∩ B ist untere Schranke)
A∩B ⊆B
Beweis. Mit ∧-Beseitigung. (M.63)
C ⊆ A ∧ C ⊆ B → C ⊆ A ∩ B (A ∩ B ist größte untere Schranke)
Beweis. Mit ∧-Einführung im Konsequens: (A.270 ).
Zusammenfassend gilt: (M.64)
A ∪ B = sup⊆ (A, B)
(M.65)
A ∩ B = inf⊆ (A, B)
(A ∪ B ist Supremum von A und B) (A ∩ B ist Infimum von A und B)
Übung 9.2 Zeigen Sie: Das Komplement A¯ einer Klasse A ist eindeutig bestimmt; d.h.: (M.66)
A ∩ B = ∅ ∧ A ∪ B = V → B = A¯
Ferner haben wir für zwei Klassen A und B: (M.67)
¯=∅ A ⊆B ↔ A∩B
(M.68)
¯ A\B = A∩B
(48)
(def)
A & B :≡ A ⊆ B ∧ A 6= B
(M.69)
A & B ↔ A ⊆ B ∧ ¬B ⊆ A
(M.70)
A & B → ∃x (x ∈ B ∧ x 6∈ A)
270 (M.71)
Mengenlehre I A & B → B ∩ A¯ 6= ∅
Wir setzen nun die “kleinen” und die “großen” Mengenoperationen miteinander in Beziehung. Sind A und B Mengen, so ist ihre Vereinigung gleich der Vereinigung der Paarklasse bestehend aus A und B. Analoges gilt für den Durchschnitt. S (M.72) M A ∧ M B → A ∪ B = { A, B } 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23.
zeige MA ∧ MB → A ∪ B = MA ∧ MB
zeige A∪B ⊆
S
S
{ A, B }
A-BA für Antisym⊆!
{ A, B }
A-BAA,Kph
x ∈ A ∪ B, x ∈ A ∨ x ∈ B S zeige x ∈ A → x ∈ { A, B }
Hw(5) A-BA 2,AL
x∈A MA
6,7,M.7
∃z (z = A ∧ x ∈ z)
8,∃B 9,AL
Ma ∧ a = A ∧ x ∈ a M a ∧ (a = A ∨ a = B)
10,Kph,9,AL S 11,∃E,def
a ∈ { A, B } ∧ x ∈ a S x ∈ { A, B } S zeige x ∈ B → x ∈ { A, B }
dto. S x ∈ { A, B } S zeige { A, B } ⊆ A ∪ B S x ∈ { A, B } ∃z (z ∈ { A, B } ∧ x ∈ z)
M.72
—(5)
5,13,∨E-Ant,4,AL
A-BAA S 17,def
18,∃B 19,def Paarkl
M b ∧ b ∈ { A, B } ∧ x ∈ b b=A ∨ b=B
Hw(4)
zeige x 6∈ A → x ∈ B
A-BA
x 6∈ A
19,AL
x∈b
24. 25.
b 6= A b=B
22,23,Lb,AL 20,24,AL
26.
x∈B
23,25,Lb
27. 28.
x∈A∪B S A ∪ B = { A, B }
—(5)
21,17,Kph,AL 3,16,Antisym⊆
271
Algebra der Klassen
(M.73) (M.74)
Idem(∨)
{a} = { a, a } Ma → a =
S
{a}
. . Beweis. Mit (M.72) für A = B = a, (LbT), (M.50) und (=Tr). (M.75) (M.76)
MA ∧ MB → A ∩B = T M a → a = {a}
T
mit M.8
{ A, B }
Wir beweisen jetzt die Supremum-Eigenschaft (Infimum-Eigenschaft) für die große Vereinigungsoperation (Durchschnittsoperation) auf einer Klasse a. Dazu sind für jede der beiden Operationen zwei Behauptungen zu zeigen: (i) die Operation liefert eine obere (untere) Schranke für a bezüglich ⊆, und (ii) sie liefert die kleinste obere Schranke (größte untere Schranke) für a. Dies ist in den folgenden vier Theoremen formuliert. (M.77) (M.78) (M.79) (M.80)
∀x (x ∈ a → x ⊆
S
a)
∀x (x ∈ a → x ⊆ b) → T ∀x (x ∈ a → a ⊆ x)
S
a⊆b (
∀x (x ∈ a → b ⊆ x) → b ⊆
Zusammengefaßt haben wir damit: S (M.81) a = sup⊆ a T (M.82) a = inf⊆ a
T
a
( S
(
(
S
T
a ist obere Schranke von a)
a ist kleinste obere Schranke) T ( a ist untere Schranke) a ist größte untere Schranke)
S
a ist das ⊆-Supremum von a) T ( a ist das ⊆-Infimum von a)
Wir geben hier Beweise für die Infimum-Eigenschaften des Durchschnitts. Speziell beim Nachweis der größten unteren Schranke zeigt sich, wie übersichtlich die hierarchisch gegliederte Struktur eines Beweises im Kalish-Montague-Kalkül ist. Das Theorem (M.80) wird in der verstärkten bikonditionalen Form bewiesen. T zeige ∀x (x ∈ a → a ⊆ x) 1. M.79 2. 3. 4. 5. 6. 7. 8.
Mx ∧ x ∈ a
T zeige ∀y (y ∈ a → y ∈ x) T My ∧ y ∈ a ∀z (z ∈ a → y ∈ z) x∈a → y∈x
y∈x T a⊆x
272
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28.
Mengenlehre I
zeige ∀x (x ∈ a → b ⊆ x) ↔ b ⊆
T
zeige ∀x (x ∈ a → b ⊆ x) → b ⊆ ∀x (x ∈ a → b ⊆ x) T zeige ∀x (x ∈ b → x ∈ a)
a T
M.800 a A-BA def⊆ f.Kons! A-BAA
x∈b
def
zeige ∀y (y ∈ a → x ∈ y) y∈a y∈a → b⊆y
T
f.Kons! A-BAA 3,∀B 7,8,AL 9,def⊆
b⊆y ∀z (z ∈ b → z ∈ y)
10,∀B
x∈b → x∈y
x∈y —(5) T x∈ a —(5) T b⊆ a T zeige b ⊆ a → ∀x (x ∈ a → b ⊆ x) T b⊆ a T ∀x (x ∈ b → x ∈ a)
5,11,AL T 6,def ,Kph 4,def⊆
A-BA 16,def⊆
zeige ∀x (x ∈ a → b ⊆ x)
A-BAA
x∈a
zeige ∀y (y ∈ b → y ∈ x) y∈b
A-BAA T
17,∀B
y∈b → y∈ a T y∈ a ∀z (z ∈ a → y ∈ z) x∈a → y∈x y∈x
21,22,AL T 23,def
24,∀B 19,25,AL
—(5)
b⊆x ∀x (x ∈ a → b ⊆ x) ↔ b ⊆
T
—(5)
20,def⊆
a
2,15,AL
273
Algebra der Klassen (M.83)
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
(M.84)
S zeige
∅ = ∅ S
∅ = ∅
zeige ∀x (x ∈ Mx x 6∈ ∅
S
∅ ↔ x ∈ ∅)
zeige ¬∃y (y ∈ ∅ ∧ x ∈ y) ∃y (y ∈ ∅ ∧ x ∈ y)
a ∈ ∅ ∧ x ∈ a ∧ Ma a∈∅
a 6∈ ∅ S x 6∈ ∅ S x∈ ∅ ↔ x∈∅ S
—(3) —(4) —(1)
V ⊆V
M.40
Mit dem Paarmengenaxiom folgt: S (M.85) V = V T (M.86) ∅ = V
. Beweis. Die Eigenschaft φ[x] = ∀y (y ∈ ∅ → x ∈ y) trifft auf alle Mengen x zu, da das Antecedens wegen (M.25) leer ist. T (M.87) M∅ → V = ∅ Beweis. Ist ∅ eine Menge, so gilt ∅ ∈ V , und es gibt keine Menge, die in jedem Element von V liegt.
Bemerkung. Mit dem Aussonderungsaxiom folgt M ∅ und damit: T (M.88) V = ∅ Relative Klassenbildungen. In Anwendungen der Mengenlehre hat man häufig ein Mengensystem C, von dem man den Durchschnitt nehmen möchte. Wenn der Durchschnitt leer werden kann, so erhält man in diesem Fall mit V eine echte Klasse, was zu lästigen Sonderbetrachtungen führt. Meist sind jedoch die Elemente von C Teilmengen einer fest vorgegebenen Menge A, und in diesem Fall erklärt man den Durchschnitt über C als A. Man hat dann den relativen Durchschnitt von C in A gebildet, der wie folgt definiert ist: Tb T (49) (def) a := b ∩ a (relativer Durchschnitt von a in b),
274
Mengenlehre I
Tb Bemerkung. Ist a = ∅, so gilt a = b. Ist speziell eine Menge A mit ihrer Potenzmenge PA gegeben, und ist C ⊆ PA ein System von Teilmengen von A, so gilt für C = ∅: \ A C = A
Normalerweise wird auch das Komplement A¯ einer Menge A nicht in ganz V gebildet, sondern bezüglich einer gegebenen Rahmenmenge M , die A enthält. Als Komplement von A wird dann nicht A¯ angesehen, sondern die Menge M \ A, die ebenfalls eine Teilmenge von M ist. Man definiert mit Bourbakis stilisiertem Komplementsymbol für A ⊆ M : (50)
(def)
{M A := M \ A
(Komplement von A in M )
Die Potenzmenge PM ist mit ∪, ∩ und mit dieser auf M bezogenen Komplement-Operation { = {M eine reguläre Boolesche Algebra, da das Gesamtsystem selbst eine Menge ist. Es gelten die üblichen Gesetze der Klassenalgebra, speziell für beliebige A, B ⊆ M : (51)
a.
{({A) = A
b.
{M = ∅
c. d. e.
{∅ = M
{(A ∩ B) = {A ∪ {B
{(A ∪ B) = {A ∩ {B
A⊆B
gdw
{B ⊆ {A
Wir wollen noch eine verallgemeinerte Notation für Klassenterme erklären, die in der mengentheoretischen Symbolik ständig benützt wird. Bisher hatte ein Klassenterm die Form ‘{x | φ}’, wobei hinter dem Strich zwar eine beliebige Formel stehen kann, vor dem Strich jedoch nur eine Variable: die geschweifte Klammer spielte ähnlich wie der ι-Operator die Rolle eines Variablen bindenden Operators. Nun betrachtet man etwa in der mathematischen Analysis häufig die Menge der Funktionswerte f (x) einer reellen Funktion f auf einer gegebenen Menge A, welche notiert wird als { f (x) | x ∈ A }. Hier steht vor dem Mengenstrich keine reine Variable, sonder der komplexe Term f (x), in dem die gebundene Variable lediglich vorkommt. Diese Schreibweise gilt es mit Hilfe der Grundnotation zu definieren. Die Wertemenge, sie heiße B, besteht aber gerade aus denjenigen Elementen y, zu denen es ein x ∈ A gibt mit y = f (x); damit gilt: B = { y | ∃x( y = f (x) ∧ x ∈ A) } Dieses Muster verallgemeinern wir jetzt auf folgende Weise.
Definition 9.4 (Allgemeine Klassen-Notation) Gegeben seien n paar. weise verschiedene Variablen x0 , . . . , xn−1 (n > 0). Ferner seien t = . t[x0 , . . . , xn−1 ] ein Term und φ = φ[x0 , . . . , xn−1 ] eine Formel, beide in n-stelliger Nennform-Schreibweise. Dann ist der Klassenterm { t | φ } wie folgt definiert: (52)
{ t | φ } := { y | ∃x0 . . . ∃xn−1 (y = t ∧ φ) }
(y nicht frei in t, φ)
Wir geben als Anwendung dieser Notation den Beweis für das erste der unten aufgeführten allgemeinen Distributivgesetze, Theorem (M.89).
275
Algebra der Klassen
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34.
zeige Ma → a ∪ Ma
T
b=
T
{a ∪ u|u ∈ b}
T
zeige ∀x(x ∈ a ∪ b → x ∈ T x∈a∪ b x ∈ a ∨ ∀z(z ∈ b → x ∈ z)
M.89 A-BA
T
{a ∪ u|u ∈ b})
zeige ∀y(y ∈ {a ∪ u|u ∈ b} → x ∈ y) y ∈ {a ∪ u|u ∈ b}
∃u(u ∈ b ∧ y = a ∪ u) u0 ∈ b ∧ y = a ∪ u 0
für Antisym ⊆ ! A-BAA T 4, Kph, def , AL T für def ! A-BAA
7, def {t|φ}, Kph 8, ∃B: u0 neu
x ∈ a → x ∈ a ∪ u0
Taut, def ∪, Kph
∀z(z ∈ b → x ∈ z)
A-BA
x∈a→x∈y zeige ∀z(z ∈ b → x ∈ z) → x ∈ y u0 ∈ b → x ∈ u 0 x ∈ u0 x ∈ a ∪ u0 x∈y
x∈y T x ∈ {a ∪ u|u ∈ b} T T zeige ∀x(x ∈ {a ∪ u|u ∈ b} → x ∈ a ∪ b) T x ∈ {a ∪ u|u ∈ b} ∀y(y ∈ {a ∪ u|u ∈ b} → x ∈ y) T zeige x∈ /a→x∈ b x∈ /a zeige ∀v(v ∈ b → x ∈ v) v∈b a∪v =a∪v
∃u(u ∈ b ∧ a ∪ v = a ∪ u) a ∪ v ∈ {a ∪ u|u ∈ b} x∈ a∪v
x∈v T x∈ b T x∈a∪ b T T a ∪ b = {a ∪ u|u ∈ b}
9, ∧B, 10, Lb für KlD!
9: Mu0 ; ∧B, ∀B 9: ∧B, 14, MP
Tt,def ∪,Kph,15,MP
9, ∧B, 16, Lb
11, 12, 5, KlD 6, def ∪ A-BAA T 21, def Hw(4) A-BA T für def !
A-BAA M.4
26: Mv; 26,27,∧E, ∃E
28, def {t|φ}, Kph 2,26,Vng; 22,∀B,29,MP 30, Kph, 24, AL T 25, def
23,KD,def∪,Kph 6,19,def⊆; Antisym⊆
276
(M.89) (M.90)
Mengenlehre I
Ma → a ∪ Ma → a ∩
T
S
b = b =
T
S
{a∪ u | u ∈ b} {a∩ u | u ∈ b}
Schließlich gelten die folgenden allgemeinen de-Morgan-Theoreme: T S a = {x | x ∈ a} (M.91) S T (M.92) a = {x | x ∈ a} Übung 9.3 Beweisen Sie die Theoreme (M.90)–(M.92).
9.4.1
Die Russell-Klasse
Wir definieren jetzt die Russell-Klasse R und zeigen, daß die RussellAntinomie “entschärft” ist und lediglich zu dem Ergebnis führt, daß R keine Menge, sondern eine echte Klasse ist. (53) (M.93) (M.94) 1. 2. 3. 4. 5.
(M.95) (M.96)
(def)
R := { x | x 6∈ x }
R⊆V
(Russell-Klasse) M.40 (R ist eine echte Klasse)
¬M R zeige ¬M R MR
R ∈ R ↔ M R ∧ R 6∈ R M R → (R ∈ R ↔ R 6∈ R) R ∈ R ↔ R 6∈ R
¬M V V 6∈ V
—(3)
M.94, (Aus): s.u. M.95, M.13
Mit dem Fundierungsaxiom (AF) folgt, daß die Russell-Klasse mit der Allklasse zusammenfällt. (M.97)
R = V
Es gilt schließlich für beliebige Mengen A, daß ihr Komplement A¯ keine Menge ist. Wäre das Komplement ebenfalls eine Menge, so wäre die Vereinigung A ∪ A¯ = V eine Menge, im Widerspruch zu (M.95). (M.98)
M A → ¬M A¯
Es gibt also gewissermaßen mindestens “genau so viele” echte Klassen wie Mengen. Zusätzlich gibt es echte Klassen, deren Komplement wieder eine echte Klasse ist. Dies verhält sich ganz analog zu den unbeschränkten Teilmengen der natürlichen Zahlen, deren Komplement in N wieder unbeschränkt ist, wie z.B. die geraden Zahlen.
Weitere Axiome
9.5 9.5.1
277
Weitere Axiome Das Aussonderungsaxiom
Das Aussonderungsaxiom (Aus) wurde von Zermelo eingeführt, um die Mengen-Komprehension von Widersprüchen wie der Russell-Antinomie freizuhalten. Das Axiom besagt, daß man aus einer gegebenen Menge a weitere Mengen erhält, indem man für jede Eigenschaft φ[x] die Klasse aller derjenigen Elemente von a betrachtet, die die Eigenschaft φ[x] besitzen. Kurz ausgedrückt: Teilklassen von Mengen sind wieder Mengen. In der Axiomenliste lautete das Aussonderungsaxiom in Grundform: (54)
∀x∃y∀z (z ∈ y ↔ z ∈ x ∧ φ[z])
(Aus)
Mit dem Denotationsprinzip für Mengen (Mng) ist (Aus) äquivalent zu (55)
M a → M { x ∈ a | φ[x] }
(Aus00 )
Eine weitere äquivalente Form ist (56)
Ma ∧ b ⊆ a → Mb
(Aus0 )
Wir beweisen die Äquivalenz von (Aus00 ) mit (Aus0 ). (M.99) 1. 2. 3. 4. 5. 6.
Aus00 ` Aus0 zeige Ma ∧ b ⊆ a → Mb Ma ∧ b ⊆ a
M{x ∈ a | x ∈ b} b∩ a = {x ∈ a | x ∈ b} b∩a=b Mb
. Dabei wurde in der 3. Zeile (Aus00 ) mit φ[x] = x ∈ b verwendet. (M.100)
1. 2. 3. 4.
Aus0 ` Aus00 zeige M a → M { x ∈ a | φ[x] } Ma
{ x ∈ a | φ[x] } ⊆ a M { x ∈ a | φ[x] }
Wir können jetzt beweisen, daß die leere Klasse eine Menge ist. Mit der Mengenexistenz (MEx) gibt es nämlich mindestens eine Menge, etwa a. Mit Klassenalgebra gilt ∅ ⊆ a, und mit (Aus0 ) folgt M ∅.
278 (M.101) (M.102) (M.103) 1. 2. 3. 4. 5.
(M.104)
1. 2. 3. 4. 5. 6. 7.
Mengenlehre I M∅ T V = ∅
M.101,M.87
¬M V
zeige ¬M V MV
R⊆V MR
¬M R —(3) a 6= ∅ → M
T
zeige a 6= ∅ → M a 6= ∅
a
T
a
∃x x ∈ a
b∈a Mb T a⊆b T M a
T Hier wurde verwendet, daß a eine Teilmenge eines jeden Elements von a ist T (M.79). Wir bemerken, daß a 6= ∅ für die Mengeneigenschaft von a notwendig ist; andernfalls ist der Durchschnitt wegen M.86 gleich V , und es gilt ¬M V . Übung 9.4 Beweisen Sie für die ZF-Axiome die Äquivalenz von Grundform und zugehöriger Kurzform.
9.5.2
Paarmenge, Vereinigungsmenge, Potenzmenge
Wir betrachten jetzt einige Theoreme der folgenden Axiome: (Paar)
M a ∧ M b → M { a, b } S
(Vng)
Ma → M
(Pot)
M a → M Pa
a mit Pa = { x | x ⊆ a }
Wir erweiteren zunächst die Definition der Paarklasse auf n Elemente für beliebiges endliches n > 0. (57)
(def)
{a1 , . . . , an } := { x | x = a1 ∨ . . . ∨ x = an }
(n > 0)
279
Weitere Axiome Für n = 1 haben wir: (58)
(Einerklasse von a)
{a} = { x | x = a }
Bemerkung. Die Klasse {a1 , . . . , an } ist wegen der Kommutativität der Disjunktion unabhängig von der Reihenfolge der Nennung ihrer Elemente. Also gilt, wenn σ eine Permutation der Zahlen 1, . . . , n ist: {a1 , . . . , an } = { aσ1 , . . . , aσn } (M.105)
a ∈ {a} ↔ M a
mit (58),Kph,M.4,AL
Bemerkung. Als Folgerung ergibt sich, daß V 6∈ {V }! (M.106)
M a → M {a}
(M.107)
M a 1 ∧ . . . ∧ M a n → M { a 1 , . . . , an }
(Paar),M.105,LbT
Beweis. Mit vollständiger Induktion nach n; man benutzt (M.106) für den Induktionsanfang n = 1 und schließt für den Induktionsschritt mit (Paar) und (Vng). (M.108)
M a ∧ b = {a} → a ∈ b
(M.109)
a ∈ b → ∃y a ∈ y
(M.110) (M.111)
M.106,M.108,∃E
a ∈ V ↔ ∃y a ∈ y
M.18,M.109
M a ↔ ∃y a ∈ y
M.16,M.110
Bemerkung. Wie oben angekündigt, ist unter Verwendung des Paarmengenaxioms gezeigt, daß die Existenzbedingung von Mengen im Sinne der freien Logik, d.h. M a ↔ ∃x x = a
äquivalent ist mit der Bedingung der Größenbeschränkung für Mengen, nämlich Element einer anderen Menge zu sein. S S (M.112) V = V “⊆”: M.84; “⊇”: M.110,def
9.5.3
Geordnete Paare
Eine Relation ist in der Mengenlehre eine Menge von geordneten Paaren. Durch diese Festsetzung gelingt es, den Begriff der Relation (und dadurch auch den der Funktion) auf den Begriff der Menge zu reduzieren. Dies setzt natürlich voraus, daß geordnete Paare selbst Mengen einer speziellen Form sind. Die heute übliche Definition des geordneten Paares geht auf Wiener und Kuratowski zurück. Das Entscheidende an dieser Definition ist, daß die Positionen oder Komponenten im geordneten Paar unterschieden werden können und in einer festen Reihenfolge auftreten (siehe Theorem M.115). Ein geordnetes Paar
280
Mengenlehre I
bestehend aus zwei Objekten a und b ist für a 6= b verschieden von dem geordneten Paar bestehend aus b und a. Dies entspricht dem Verständnis des allgemeinen Begriffs der Relation: bei einer asymmetrischen Relation wie “ist größer als” etwa kommt es darauf an, ob das Paar a, b in der Relation steht oder das Paar b, a. Die Identifizierbarkeit der Komponenten unterscheidet das geordnete Paar von der Paarklasse, bei der zwei Objekte ohne Beachtung der Reihenfolge zusammengefaßt werden. (59)
(def)
ha, bi := { {a}, { a, b } }
(geordnetes Paar von a und b nach Wiener-Kuratowski)
Mit Hilfe des geordneten Paares definieren wir allgemeiner den Begriff des nTupels, in dem n Objekte in fester Reihenfolge angeordnet sind (n > 2). Ferner identifizieren wir das Einstupel eines Objekts mit dem Objekt selbst und das leere Tupel mit der leeren Menge. (60)
(def)
h i := ∅
(61)
(def)
hai := a
(62)
(def)
ha1 , . . . , an i := hha1 , . . . , an−1 i, an i
(n > 2; n-Tupel von a1 . . . an )
Das Paarmengenaxiom garantiert, daß geordnete Paare Mengen sind, falls ihre Komponenten Mengen sind. (M.113) 1. 2. 3. 4. 5. 6.
(M.114) 1. 2. 3. 4. 5. 6. 7. 8.
M a ∧ M b → M ha, bi zeige M a ∧ M b → M ha, bi Ma∧ Mb M {a} M { a, b }
M { {a}, { a, b } } M ha, bi M b ∧ M c ∧ { a, b } = { a, c } → b = c
zeige M b ∧ M c ∧ { a, b } = { a, c } → b = c M b ∧ M c ∧ { a, b } = { a, c } b ∈ { a, c } ∧ c ∈ { a, b } b=a ∨ b=c
c=a ∨ c=b (b = a ∧ c = a) ∨ b = c b=c ∨ b=c b=c
Weitere Axiome
281
Es folgt nun der Beweis für die zentrale Eigenschaft des geordneten Paares: Gegeben seien vier Mengen a, b, c, d; dann ist das geordnete Paar bestehend aus a und b genau dann gleich dem geordneten Paar bestehend aus c und d, wenn a gleich c und b gleich d ist. Mit anderen Worten: zwei geordnete Paare sind genau dann gleich, wenn sie komponentenweise übereinstimmen. (M.115) 1.
M a ∧ M b ∧ M c ∧ M d → ( ha, bi = hc, di ↔ a = c ∧ b = d ) zeige Ma∧ Mb∧ Mc∧ Md
→ ( ha, bi = hc, di ↔ a = c ∧ b = d )
2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
Ma ∧ Mb ∧ Mc ∧ Md
A-BA
zeige a = c ∧ b = d → ha, bi = hc, di a=c ∧ b=d ha, bi = hc, bi hc, bi = hc, di ha, bi = hc, di
A-BA 4,∧B,LbT 4,∧B,LbT 5,6,=Tr
zeige ha, bi = hc, di → a = c ∧ b = d ha, bi = hc, di
Ma ∧ Mb M {a} ∧ M { a, b } T { {a}, { a, b } } = {a} ∩ { a, b } T ha, bi = {a} ST ha, bi = a ST hc, di = c
A-BA 2,AL 10,M.106,Paar,AL 11,M.75,AL 12,dfhA, bi,M.37 13,LbT,M.74,=Tr wie 11–14
a=c S ha, bi = { a, b } S ha, di = { a, d }
9,LbT,=Tr 10,M.72,M.36
{ a, b } = { a, d } b=d
20,17,18,=Tr 2,21,M.114
ha, bi = ha, di S S ha, bi = ha, di a=c ∧ b=d
ha, bi = hc, di ↔ a = c ∧ b = d
analog 16,9,Lb 19,LbT
16,22,AL 3,8,AL
Für die Richtung von rechts nach links im zu beweisenden Bikonditional wurde nur die Ersetzbarkeit von koreferentiellen Termen in größeren Kontexten von Termgestalt benötigt, also die abgeleitete Regel (LbT). Der Beweis für die interessante Richtung von links nach rechts geht in zwei Schritten vor. Zunächst wird die Gleichheit der ersten Komponenten a und c hergeleitet. Dazu wird a aus dem Wiener-Kuratowski-Paar { {a}, { a, b } } erst durch Schnittbildung
282
Mengenlehre I
(Ergebnis: {a}) und dann durch Vereinigung, welche die Komprehensionsstufe erniedrigt, herausisoliert; dasselbe geschieht mit c aus dem Wiener-KuratowskiPaar { {c}, { c, d } }. Da aber die Ausgangspaare nach Voraussetzung identisch sind und sie identischen Operationen unterworfen werden, folgt a = c. Nun werden umgekehrt die Vereinigungen der Wiener-Kuratowski-Paare { {a}, { a, b } } und { {a}, { a, d } } gebildet; das liefert die Paarmengen { a, b } und { a, d }, die wiederum gleich sein müssen, da Ergebnis derselben Operation. Damit ist auch das zweite Element der ersten mit dem zweiten Element der zweiten Paarmenge identisch, also b = d. Es sei betont, dass alle Operationen nur unter der Voraussetzung der Mengeneigenschaft durchführbar sind.
9.5.4
Potenzmenge
Faßt man das Potenzmengensymbol P als einen Operator auf den Klassen auf, so stellt sich die Frage, wie sich dieser Operator zu den anderen mengentheoretischen Operationen verhält. Dazu folgen hier einige Theoreme. (M.116)
a ⊆ b → Pa ⊆ Pb
(M.117)
Pa ∩ Pb = P(a ∩ b)
(M.118)
Pa ∪ Pb ⊆ P(a ∪ b)
(M.119)
a 6⊆ b ∧ b 6⊆ a → Pa ∪ Pb $ P(a ∪ b)
mit den Def’n
M.62,M.63
M.60,∨E-Ant
Beweis. Das Antecedens liefert ein c ∈ a \ b und ein d ∈ b \ a. Damit gilt zwar { c, d } ∈ P(a ∪ b), aber zugleich sowohl { c, d } 6∈ Pa als auch { c, d } 6∈ Pb. (M.120)
a ⊆ b ∨ b ⊆ a → Pa ∪ Pb = P(a ∪ b)
M.36,M.116
Die Operationen der Potenzmengenbildung und der großen Vereinigung sind in gewissem Sinne invers zueinander. Es gilt: S (M.121) a⊆P a M.77 S (M.122) a = Pa
283
Weitere Axiome
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
zeige a =
S
Pa
zeige ∀x (x ∈ a → x ∈ x∈a M{x} ∧ {x} ⊆ a
{x} ∈ Pa S x ∈ Pa S a ⊆ Pa S zeige Pa ⊆ a
S
Pa)
—(5)
∀x (x ∈ Pa → x ⊆ a) S Pa ⊆ a —(1) S a = Pa —(1)
Hier wurde für die Richtung von rechts nach links Theorem M.78 benutzt, daß a nach Definition der Potenzklasse eine obere Schranke bezüglich ⊆ für alle Elemente von Pa ist. Übung 9.5 Kommentieren Sie den letzten Beweis zeilenweise.
284
Mengenlehre II
Kapitel 10
Mengenlehre im Kalkül II: Relationen, Funktionen 10.1
Relationen
Der Begriff des geordneten Paares bildet den Kern des mengentheoretischen Relationsbegriffs. Relationen sind einfach Klassen von geordneten Paaren. Betrachtet man für zwei gegebene Klassen A und B die Klasse der geordneten Paare hx, yi so daß x ∈ A und y ∈ B, so ergibt sich das “kartesische Produkt” aus A und B, welches wir sogleich definieren werden. Ist A = B = V , so sind offensichtlich alle geordneten Paare Elemente des kartesischen Produkts von V mit sich selbst. Man definiert dann eine Klasse R als Relation, wenn R eine Teilklasse dieses kartesischen Produkts ist. Die einzige Bedingung an R ist damit, daß R als Relation ausschließlich geordnete Paare enthalten darf. Der Name “kartesisch” ist in Analogie zum kartesischen Koordinatensystem gebildet. Die reelle Zahlenebene etwa ist die Menge der geordneten Paare von reellen Zahlen und damit das kartesische Produkt der reellen Zahlenmenge mit sich selbst. Definition 10.1 Es seien A und B beliebige Klassen. (1)
(def)
A × B := { z | ∃x∃y (x ∈ A ∧ y ∈ B ∧ z = hx, yi) } (kartesisches Produkt von A und B )
Mit Hilfe der allgemeinen Klassen-Notation gemäß Definition 9.4 kann das kartesische Produkt in der üblicheren Form geschrieben werden als A × B = { hx, yi | x ∈ A ∧ y ∈ B }
(2)
. Hier hat der Klassenterm t die Form t[x, y] = hx, yi. Wir werden im folgenden in der Regel die abgekürzte Schreibweise verwenden, und ebenso die Abkürzung x, y ∈ A
für
x∈A ∧ y∈A
Wird das kartesische Produkt einer Klasse A mit sich selbst genommen, so schreibt man statt A × A häufig auch A2 ; also: 285
286 (3)
Mengenlehre II
A2 := A × A = { hx, yi | x, y ∈ A } . Für A = V ergibt sich die Klasse aller geordneten Paare:
(4)
V × V = { hx, yi | x, y ∈ V } Wir definieren dann für einen beliebigen Term R:
(5)
(def)
Rel[R]
:↔
(R ist Relation)
R ⊆V ×V
Mitteilungszeichen für Relationen sind ‘R’, ‘S’, ‘T ’ (StI). (M.123)
Rel[∅]
(M.124)
Rel[R] ↔ ∀z (z ∈ R → ∃x∃y z = hx, yi)
(M.125)
Rel[A × B]
∅ ⊆ V × V : KlA
A×B ⊆V ×V
Jeder Faktor eines kartesischen Produkts muß mindestens ein Element beisteuern können, da sich sonst keine geordneten Paare bilden lassen. Ist also ein Faktor leer, so ist das kartesische Produkt ebenfalls leer, und umgekehrt: (M.126)
A=∅ ∨ B =∅ ↔ A×B =∅
Wir beweisen die Richtung von links nach rechts: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
zeige A=∅ ∨ B =∅ → A×B =∅ zeige A=∅ → A×B =∅ A=∅
zeige A×B =∅ A × B 6= ∅
∃z z ∈ A × B Ma ∧ a ∈ A ×B
∃x∃y (x ∈ A ∧ y ∈ B ∧ a = hx, yi) M b ∧ M c ∧ b ∈ A ∧ c ∈ B ∧ a = hb, ci ∃x x ∈ A
A 6= ∅ A=∅
—(3) —(2)
zeige B =∅ → A×B =∅ dto. (mit ∨E-Ant:
A = ∅ ∨ B = ∅ → A × B = ∅) —(3) —(1)
Wenn eine Person a zu einer anderen Person b in der Kindschaftsbeziehung steht, dann steht umgekehrt b zu a in der Beziehung “Elternteil von”; ist a größer als b, so ist b kleiner als a. In diesen Beispielen ist jeweils die erste Beziehung die genaue Umkehrung der zweiten Beziehung, technisch gesprochen: die konverse Relation.
287
Relationen, Funktionen (6)
(def)
R−1 := { hy, xi | hx, yi ∈ R }
(konverse Relation zu R)
Bemerkung. Wir wollen die Definition in etwas allgemeinerer Form zulassen als für ihren Hauptanwendungsfall, die Relationen. Wir definieren allgemeiner für beliebige Terme A: (7)
(def)
A−1 := { hy, xi | hx, yi ∈ A }
(konverse Relation zu A)
Ist A keine Relation, d.h. besteht A nicht ausschließlich aus geordneten Paaren, so “ignoriert” A−1 die Elemente von A, die keine geordneten Paare sind, und dreht nur die geordneten Paare in A um. Analoge Bemerkungen gelten für die folgenden Definitionen. Eine weitere Operation auf Relationen ist die Verknüpfung oder “Komposition” von zwei gegebenen Relationen. (8)
(def)
R ◦ S := { hx, yi | ∃z (hx, zi ∈ S ∧ hz, yi ∈ R) } (Komposition von R und S )
Ist a etwa der Freund eines Freundes von b, so gibt es ein Zwischenglied c zwischen a und b derart daß a ein Freund von c und c ein Freund von b ist. Natürlich braucht dabei a kein Freund von b zu sein, was zeigt, daß Freundschaft keine “transitive” Relation ist, oder anders gesagt, daß die Komposition einer Relation mit sich durchaus verschieden ist von der Relation selbst. Ein anderes bekanntes Beispiel einer Komposition von Relationen ist die Enkelbeziehung, die Verknüpfung der Kindschaftsrelation mit sich. Die Kind-Beziehung ist ebenfalls nicht transitiv, auch wenn es mitunter den Fall gibt, daß ein Kindeskind zugleich Kind ist: Antigone ist Kind von Jokaste und ihr Enkel zugleich. Die “kleiner”-Beziehung zwischen natürlichen Zahlen dagegen ist transitiv: Ist a kleiner als b und b kleiner als c, so ist auch a kleiner als c. Damit gilt für transitive Relationen R: Gibt es zwischen zwei Objekten a und c ein Zwischenglied b, so daß R zwischen a und b sowie zwischen b und c besteht, so gilt R auch zwischen a und c. Mit anderen Worten: ein Paar ha, bi, welches in der Kompositionsrelation R ◦ R steht, steht schon in der Relation R selbst. Diese Eigenschaft ist zugleich charakteristisch für transitive Relationen (siehe unten). In der allgemeineren Fassung setzen wir für beliebige Terme A, B: (9)
(def)
A ◦ B := { hx, yi | ∃z (hx, zi ∈ A ∧ hz, yi ∈ B) } (Komposition von A und B )
(M.127)
Rel[A−1 ]
(M.128)
Rel[A ◦ B]
(M.129)
(A−1 )−1 ⊆ A
(M.130)
Rel[A] → (A−1 )−1 = A
Wir nehmen weitere elementare Begriffsbildungen im Zusammenhang mit Relationen vor. (10)
(def)
A B := A ∩ (B × V )
(Einschränkung von A auf B )
288
Mengenlehre II
(11)
(def)
Dom(A) = D1 (A) := { x | ∃y hx, yi ∈ A } (Vorbereich (domain) von A)
(12)
(def)
Ran(A) = D2 (A) := { y | ∃x hx, yi ∈ A } (Nachbereich (range) von A)
(13)
(def)
Fld (A) := Dom(A) ∪ Ran(A)
(14)
(def)
A“B := Ran(A B)
(das Bild von B unter A)
(M.131)
Dom(A−1 ) = Ran(A)
(M.132)
Ran(A−1 ) = Dom(A)
(M.133)
A B = { hx, yi ∈ A | x ∈ B }
(M.134)
Rel[A B]
(M.135)
Dom(A B) = Dom(A) ∩ B
(M.136)
A“B = { y | ∃x (x ∈ B ∧ hx, yi ∈ A) }
(M.137)
B 6= ∅ → Dom(A × B) = A
(M.138)
A 6= ∅ → Ran(A × B) = B
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19.
(Feld von A)
zeige B 6= ∅ → Dom(A × B) = A B 6= ∅
∃x x ∈ B zeige ∀x (x ∈ A → x ∈ Dom(A × B)) Mx ∧ x ∈ A Ma ∧ a ∈ B M hx, ai
hx, ai ∈ A × B ∃y hx, yi ∈ A × B
x ∈ Dom(A × B) —(5)
A ⊆ Dom(A × B)
zeige ∀x (x ∈ Dom(A × B) → x ∈ A) M x ∧ x ∈ Dom(A × B) ∃y hx, yi ∈ A × B hx, bi ∈ A × B x∈A ∧ b∈B x∈A
—(5)
Dom(A × B) ⊆ A
Dom(A × B) = A
—(2)
289
Relationen, Funktionen
Wir verallgemeinern jetzt das kartesische Produkt von zwei auf endlich viele Klassen. Es seien A1 , . . . , An beliebige Klassen für n > 0. (def)
n Y
i=1
Ai = A1 × . . . × An := { hx1 , . . . , xn i | xi ∈ Ai (1 ≤ i ≤ n) } (15) (kartesisches Produkt von A1 , . . . , An )
Für n = 1 ist das kartesische Produkt gleich der Klasse der 1-tupel von Elementen von A1 , also gleich A1 selbst. Wir erweitern die Definition auf 0 Faktoren und setzen das Produkt als die Menge aller 0-tupel fest. Da es aber nur ein 0-tupel, nämlich h i = ∅ gibt, ist das “0-fache kartesische Produkt” stets gleich der Einermenge {∅}. Sind alle Ai gleich derselben Klasse A, so schreibt man:
(16)
(def)
An := A × . . . × A
(n-mal)
Wiederum setzen wir A0 = {∅}.
Teilklassen von n-fachen kartesischen Produkten heißen n-stellige Relationen. Ihre Elemente sind n-tupel und als solche (geschachtelte) geordnete Paare. Also ist jede n-stellige Relation eine Relation im ursprünglichen Sinn. Sind alle Faktoren gleich ein und derselben Klasse A, so heißt eine Teilklasse R von An n-stellige Relation in A.
Beispiel 10.1 Es sei D der Individuenbereich eines Modells einer prädikatenlogischen Sprache L; dann sind die Teilmengen R von D n , die n-stelligen Relationen in D, die Extensionen der n-stelligen Prädikatkonstanten von L; also gilt: kP n k ⊆ Dn . Speziell ist der Wert kP 0 k einer 0-stelligen Prädikatkonstante P 0 , also einer Satzkonstante, eine Teilmenge von {∅}. Davon gibt es aber genau zwei: die Menge {∅} selbst und die leere Menge, die Teilklasse einer jeden Klasse ist. Nun werden in der Mengenlehre die leere Menge ∅ mit der Zahl 0 und die Einermenge {∅} mit der Zahl 1 identifiziert (siehe unten), welche wiederum die Wahrheitswerte falsch und wahr repräsentieren. Also sind auch in der modelltheoretischen Semantik der Prädikatenlogik die Werte von Satzkonstanten Wahrheitswerte.
10.2
Ordnungsrelationen
Wir betrachten jetzt ausschließlich zweistellige Relationen, mit den Mitteilungszeichen ‘R’ und ‘S’ (StI); die folgenden Definitionen gelten jedoch auch, wenn R und S beliebige Klassen sind. Für zweistellige Relationen ist es üblich, die Infix-Notation zu verwenden, d.h. wir schreiben xRy
für
hx, yi ∈ R
Definition 10.2 Es seien A und R Klassen. R ist eine Relation in A, wenn gilt: R ⊆ A × A. Nach dieser Definition ist R eine Relation in einer Klasse A, wenn die Komponenten eines jeden R-Paares Elemente von A sind. Zum Beispiel sind die
290
Mengenlehre II A ∆A hx, xi
x
x
A
Abbildung 10.1: Diagonale der Klasse A
Extensionen zweistelliger Prädikate Relationen in dem Individuenbereich D des gegebenen Modells. Dabei ist es durchaus zugelassen, daß nicht alle Elemente von D in der Relation R zu einem anderen Element stehen. Im allgemeinen kann das Feld von R aber auch über eine gegebene Klasse A hinausgehen. Besitzt R jedoch für die Elemente von A eine spezifische Eigenschaft E, etwa reflexiv zu sein, so sagen wir, R sei E auf A, in Zeichen: E[R, A]. Hat die Relation R die fragliche Eigenschaft schlechthin, also auf ihrem Feld Fld (R), so schreiben wir: (17)
E[R] :↔ E[R, Fld [R]]
Eigenschaften von Relationen vererben sich offensichtlich auf Teilklassen; es gilt: (18)
E[R, A] ∧ B ⊆ A → E[R, B]
Es werden nun der Reihe nach einige wichtige Eigenschaften zweistelliger Relationen definiert und mit Beispielen illustriert. Wir beginnen mit der Diagonalen einer Klasse A, so genannt nach der offensichtlichen graphischen Veranschaulichung in Figur 10.1. Die Diagonale von A stellt die Gleichheitsrelation auf A dar. (19)
∆A := { hx, xi | x ∈ A }
(Diagonale von A)
Für die Diagonale von A gilt also x∆A x für alle x ∈ A. Damit ist sie eine reflexive Relation im Sinne der folgenden Definition und zugleich (bezüglich der Inklusion) die kleinste reflexive Relation. (20)
Refl[R, A] :↔ ∀x (x ∈ A → xRx)
(M.139)
Refl[R, A] ↔ ∆A ⊆ R
(M.140)
Refl[R] ↔ ∆Fld (A) ⊆ R
(R ist reflexiv auf A)
Beispiel 10.2 Reflexiv sind die Gleichheit und die Ähnlichkeit von Objekten: jedes Objekt ist mit sich selbst identisch und ähnlich zu sich selbst. Die logische Folgerung zwischen Formeln ist reflexiv: jede Formel folgt aus sich selbst.
291
Relationen, Funktionen
Die Inklusion zwischen Klassen ist reflexiv: es gilt A ⊆ A für alle Klassen A (M.31). Die kleiner-oder-gleich-Relation ≤ und die größer-oder-gleich-Relation ≥ zwischen Zahlen sind reflexiv: x ≤ x und x ≥ x gilt für alle Zahlen x. Die Teilbarkeitsrelation zwischen natürlichen Zahlen ist reflexiv: jede Zahl ist durch sich selbst teilbar. (21)
(R ist irreflexiv auf A)
Irrefl[R, A] :↔ ∀x (x ∈ A → ¬xRx)
(M.141)
Irrefl[R, A] :↔ ∆A ∩ R = ∅
(M.142)
Irrefl[R] :↔ ∆Fld (A) ∩ R = ∅
Beispiel 10.3 Die Relation der Ungleichheit ist trivialerweise irreflexiv. Die echte kleiner -Relation < und die echte größer -Relation > zwischen Zahlen sind irreflexiv: für alle Zahlen x gilt ¬(x < x) und ¬(x > x). Unter Zugrundelegung des Fundierungsaxioms (AF) ist die Elementschaftsrelation der Mengenlehre irreflexiv: für alle Mengen und Klassen a gilt a 6∈ a. (22)
Trans[R, A] :↔ ∀x∀y∀z (x, y, z ∈ A ∧ xRy ∧ yRz → xRz) (R ist transitiv auf A)
(M.143)
R ⊆ A × A → (Trans[R, A] ↔ R ◦ R ⊆ R)
(M.144)
Trans[R] ↔ R ◦ R ⊆ R
Beispiel 10.4 Die Gleichheit ist transitiv. Die Relation der logischen Folgerung ist transitiv. Die mengentheoretische Inklusion ist transitiv (M.32). Relationen des kleiner (gleich) (< bzw. ≤) sowie des größer (gleich) (> bzw. ≥) sind transitiv. Die Teilbarkeitsrelation auf den natürlichen Zahlen ist transitiv. Die Freundschaftsbeziehung und die Kindesbeziehung sind nicht transitiv (siehe oben). Die Elementschaftsrelation ist ebenfalls nicht transitiv: im allgemeinen gilt nicht x ∈ z falls x ∈ y ∈ z. Allerdings sind spezielle Klassen in der Mengenlehre “transitiv” in dem Sinne, daß jedes Element eines Elements der Klasse wieder ein Element der Klasse ist. Die wichtigsten Beispiele für transitive Mengen liefern die Ordinalzahlen: jede Ordinalzahl ist eine Menge mit dieser Transitivitätseigenschaft; die Klasse aller Ordinalzahlen ist eine transitive (echte) Klasse. (23)
Sym[R, A] :↔ ∀x∀y (x, y ∈ A ∧ xRy → yRx) (R ist symmetrisch auf A)
(M.145)
R ⊆ A × A → (Sym[R, A] ↔ R−1 = R)
(M.146)
Sym[R] ↔ R−1 = R
Beispiel 10.5 Die Gleichheit und die Ungleichheit sind symmetrisch. Die logische Äquivalenz ist symmetrisch. Allgemeiner ist jede Äquivalenzrelation symmetrisch. Die logische Folgerung ist nicht symmetrisch. Die Inklusion und die Ordnnungsrelationen ≤ und ≥ auf den Zahlen sind nicht symmetrisch. (24)
Asym[R, A] :↔ ∀x∀y (x, y ∈ A ∧ xRy → ¬yRx)
(R ist asymmetrisch auf A)
292
Mengenlehre II
(M.147)
R ⊆ A × A → (Asym[R, A] ↔ R−1 ∩ R = ∅)
(M.148)
Asym[R] ↔ R−1 ∩ R = ∅
Bemerkung. Asymmetrische Relationen sind nicht nur nicht symmetrisch; in einer solchen Relation R gilt vielmehr für kein Paar xRy und yRx. Beispiel 10.6 Die echte größer -Relation > und die echte kleiner -Relation < auf Zahlen sind asymmetrisch. Die ∈-Relation ist asymmetrisch. Wäre für zwei Mengen x ∈ y und y ∈ x, so würde sich ein “∈-Zyklus” x ∈ y ∈ x ergeben, was dem Fundierungsaxiom widerspricht. (25)
Antisym[R, A] :↔ ∀x∀y (x, y ∈ A ∧ xRy ∧ yRx → x = y) (R ist antisymmetrisch auf A)
(M.149)
R ⊆ A × A → (Antisym[R, A] ↔ R−1 ∩ R ⊆ ∆A )
(M.150)
Antisym[R] ↔ R−1 ∩ R ⊆ ∆Dom(R)
(26)
PrO[R, A] :↔ Refl[R, A] ∧ Trans[R, A]
(R ist Präordnung auf A)
Beispiel 10.7 Ein wichtiges Beispiel für eine Präordnung ist die logische Folgerung. Die logische Folgerung ist nicht antisymmetrisch: aus der wechselseitigen logischen Folgerung ergibt sich nicht die Gleichheit zweier Formeln, sondern nur ihre logische Äquivalenz. Ein anderes Beispiel für eine Präordnung ist die Relation, von kleinerer oder gleicher Körpergröße zu sein; auch diese Relation ist nicht antisymmetrisch: besteht die Relation wechselseitig zwischen zwei Personen, so besitzen sie zwar die gleiche Körpergröße, sind damit aber natürlich noch lange nicht identisch. (27)
HO[R, A] :↔ Refl[R, A] ∧ Trans[R, A] ∧ Antisym[R, A]
(R ist Halbordnung auf A)
(28)
¨ Aq[R, A] :↔ Refl[R, A] ∧ Trans[R, A] ∧ Sym[R, A]
(R ist Äquivalenzrelation auf A)
Eine Halbordnung wird auch partielle Ordnung (engl. partial order ) genannt. Beispiel 10.8 Das Standardbeispiel für eine Halbordnung ist die mengentheoretische Inklusion ⊆. Die Teilbarkeit zwischen natürlichen Zahlen ist ebenfalls eine Halbordnung.1 Die kleiner-gleich-Beziehung ≤ zwischen reellen Zahlen ist eine Halbordnung, aber zugleich noch linear geordnet (siehe unten). Betrachten wir jedoch geordnete Paare hx, yi von reellen Zahlen und erklären eine Ordnungsrelation auf dem kartesischen Produkt R × R der Menge R der reellen Zahlen mit sich selbst (der reellen Zahlenebene) komponentenweise, d.h. hx1 , y1 i ≤2 hx2 , y2 i 1 Vgl.
gdw
x1 ≤ x2 und y1 ≤ y2
den Teilerverband und seine graphische Darstellung als “Diamant”.
293
Relationen, Funktionen
so ist ≤2 eine Halbordnung, die nicht zugleich eine lineare Ordnung ist. Die Gleichheit ist eine Äquivalenzrelation und zugleich die kleinste auf einer gegebenen Klasse. Die logische Äquivalenz ist eine Äquivalenzrelation. Allgemeiner ergibt für jedes fest vorgegebene Merkmal µ die Gleichheit von Objekten bezüglich µ eine Äquivalenzrelation. So sind Personen gleicher Körpergröße äquivalent bezüglich des Merkmals “Körpergröße”. Man spricht dann auch einer Relation der Ähnlichkeit bezüglich des Merkmals µ oder kurz µ-Ähnlichkeit. Man beachte, daß Ähnlichkeit bezüglich irgendeines Merkmals keine Äquivalenzrelation liefert; eine solche Beziehung ist im allgemeinen nicht transitiv. Wenn sich etwa a und b µ1 -ähnlich bezüglich eines Merkmals µ1 sind, und b und c µ2 -ähnlich bezüglich eines Merkmals µ2 , so kann es sein, daß a und c sich bezüglich keines Merkmals mehr ähnlich sind. Der Merkmalsparameter muß bei der Ähnlichkeitsbeziehung also festgehalten werden. Bemerkung. Die Definitionen zeigen, daß Präordnungen und Äquivalenzrelationen beide reflexiv und transitiv sind und sich nur in der dritten Eigenschaft unterscheiden: die Symmetrie führt zur Äquivalenzrelation, die Antisymmetrie zur Halbordnung. Da der Charakter von Äquivalenzrelationen und Halbordnungen vollkommen verschieden ist, ist die dritte Eigenschaft entscheidend für diese Weichenstellung; siehe Bild. Präordnungen Refl + Trans HH HH
Äquivalenzrelationen
HH Halbordnungen
Refl + Trans + Sym
Refl + Trans + Antisym
Standardbeispiele:
Standardbeispiele:
“Ähnlichkeiten”
Inklusion ⊆ kleiner-gleich ≤ größer-gleich ≥
Gleichheiten bzgl. eines festen Merkmals
Mit dem Begriff der Äquivalenzrelation ist der Begriff der disjunkten und vollständigen Zerlegung einer Klasse oder Menge (Partition) verbunden. Es ist üblich, Äquivalenzrelationen mit einer Tilde (‘∼’) oder Doppeltilde (‘≈’) mitzuteilen. Sei also A eine Klasse und ∼ eine Äquivalenzrelation auf A. Für ein a ∈ A bezeichnen wir die Klasse [a]∼ := { x ∈ A | x ∼ a } als die Äquivalenzklasse von a bezüglich ∼. Wegen Refl[∼] gilt x ∼ x oder x ∈ [x]∼ für alle x ∈ A; damit liegt jedes x in mindestens einer Äquivalenzklasse, d.h. ∀x(x ∈ A → ∃y(y ∈ A ∧ x ∈ [y]∼ ))
294
Mengenlehre II
Die Äquivalenzklassen “überdecken” also ganz A. Ferner sind die Äquivalenzklassen paarweise disjunkt, d.h. je zwei von ihnen haben schon einen leeren Durchschnitt, wenn sie nicht identisch sind: ∀x∀y( x ∈ A ∧ y ∈ A ∧ [x]∼ 6= [y]∼ → [x]∼ ∩ [y]∼ = ∅ ) Die Äquivalenzklassen von A bezüglich ∼ bilden damit eine Partition von A. Wir definieren allgemein für Mengen A: Definition 10.3 Es sei A eine Menge. Ein nicht-leeres System Z nichtleerer Teilmengen von A (also Z ⊆ PA, Z 6= ∅, und x 6= ∅ für alle x ∈ Z) heißt vollständige Zerlegung oder Partition von A, wenn gilt: S (i) Z = A (vollständig) (ii) ∀x∀y( x ∈ Z ∧ y ∈ Z ∧ x 6= y → x ∩ y = ∅ )
(paarweise disjunkt)
Da für eine Menge A und x ∈ A jede Äquivalenzklasse [x]∼ eine Teilmenge von A ist, ist die Menge Z∼ := { [x]∼ | x ∈ A } eine nicht-leeres System nicht-leerer Teilmengen. Es gilt: Z∼ ist eine Partition von A. Genauer: S ¨ (M.151) MA ∧ Aq[∼, A] → A = { [x]∼ | x ∈ A } (M.152)
¨ MA ∧ Aq[∼, A] → ∀x∀y( x ∈ A ∧ y ∈ A ∧ [x]∼ 6= [y]∼ → [x]∼ ∩ [y]∼ = ∅ )
Wir verlassen die Äquivalenzrelationen und kehren zu den Präordnungen zurück. Während die Eigenschaft der Symmetrie eine Präordnung zu einer Äquivalenzrelation macht und den Anordnungscharakter der Relation verwischt, tritt ihr ordnungstheoretischer Charakter von Anfang an deutlicher hervor, wenn die Präordnung in ihrer strikten Version genommen wird, d.h. statt reflexiv irreflexiv ist. Dies entspricht beim Standardbeispiel der Inklusion dem Übergang zur echten Inklusion & und bei der kleiner-gleich-Relation (bzw. größer-gleich-Relation) dem Übergang zur echten kleiner-Relation < (bzw. zur echten größer-Relation >). (29)
SPrO[R, A] :↔ Irrefl[R, A] ∧ Trans[R, A]
(R ist strikte Präordnung auf A)
Eine strikte Präordnung R muß zugleich asymmetrisch sein, weil im anderen Fall für mindestens ein Paar x, y wegen der Transitivität xRx gilt, im Widerspruch zur Irreflexivität. Eine solche asymmetrische Präordnung ist die kleiner-Relation auf den natürlichen Zahlen (siehe oben). Diese Relation hat allerdings noch eine weitere wichtige Eigenschaft: je zwei verschiedene Elemente sind vergleichbar , d.h. entweder gilt x < y oder aber y < x. Solche Relationen heißen konnex : (30)
Knx [R, A] :↔ ∀x∀y (x, y ∈ A → x = y ∨ xRy ∨ yRx)
(R ist konnex auf A)
Konnexe Halbordnungen heißen lineare oder totale Ordnungen und in ihrer strikten Version strikte lineare (bzw. totale) Ordnungen. In beiden Fällen spricht man auch von Ketten.
295
Relationen, Funktionen
(R ist lineare Ordnung auf A)
(31)
LO[R, A] :↔ HO[R, A] ∧ Knx [R, A]
(32)
SLO[R, A] :↔ SPrO[R, A] ∧ Knx [R, A]
(R ist strikte lineare Ordnung auf A)
Beispiel 10.9 Die
View more...
Comments