Beitragsseiten

 Pearl macht in seiner Darstellung klar: die bisherigen Möglichkeiten der mathematischen Sprache haben nicht ausgereicht, um solch komplexe Zusammenhänge überhaupt ausdrücken zu können. Insofern erscheint es wenig überraschend, dass die Statistik diese Probleme nicht inhaltlich angehen konnte, wenn schon ihre Sprache nicht die Chance bietet, sie überhaupt zu formulieren. Pearl führt deshalb eine Ergänzung ein und nennt dies Do-Calculus. Er entwickelt dabei ein formales System, das mit der bisherigen mathematischen Weise der Formulierung kompatibel ist und alle Anforderungen an Beweisbarkeit erfüllt. Um dies verstehen zu können, muss man sich die bisherige Mathematik bzw. Statistik ansehen. Von zentraler Bedeutung sind dabei konditionale Wahrscheinlichkeiten. Dies bedeutet: wie hoch ist die Wahrscheinlichkeit für Ereignis X, wenn wir wissen, dass zudem (bereits) das Ereignis Y eingetreten ist? Kommen wir auf das Beispiel des Hahns und der Sonne zurück. Wir können zwei Wahrscheinlichkeiten ausdrücken:

P(S) = Wahrscheinlichkeit, dass die Sonne aufgeht. (F#1 = Formel #1)

P(H) = Wahrscheinlichkeit, dass der Hahn kräht. (F#2)

Eine konditionale Wahrscheinlichkeit verknüpft nun diese Ereignisse:

P(S | H) = Wahrscheinlichkeit, dass die Sonne aufgeht, wenn der Hahn kräht. (F#3) Das Ereignis hinter dem Trennstrich gibt immer die Bedingung, also die Kondition an. Wem diese Schreibweise neu ist, kann auf der Wikipedia nachlesen. Wir können nun unser Beispiel inhaltlich weiter ausbauen. Wir wissen aus Erfahrung vom Bauernhof: wenn der Hahn kräht, dann geht demnächst die Sonne auf. Wir wissen also: das Krähen ist ein starkes Anzeichen, dass den Sonnenaufgang ankündigt (wenn nicht sogar auslöst). Wir können also sagen, dass das Krähen uns Informationen über die Situation liefert. Ist es dunkel und der Hahn kräht nicht, wird es wohl nicht hell werden. Die Wahrscheinlichkeit für einen Sonnenaufgang ist also größer, nachdem der Hahn gekräht hat. Formal sieht das so aus:

P(S | K) > P(S | ~K). (F#4) Die Tilde "~" steht dabei für das Logische "NICHT" (Negation).

Diese Darstellung ist bereits sehr alt und in der Statistik Standard. Leider hilft sie uns in keiner Weise bei unserer Suche nach der Kausalität. Wie wir bereits vorher festgestellt haben, können wir den Hahn manipulieren und finden dabei heraus, dass er wohl den Sonnenaufgang nicht auslöst, also in Wahrheit keine Kausalität vorliegt. Dennoch ist die Formel F#4 mathematisch gültig. Sie verknüpft die Ereignisse und zeigt uns an, dass die beiden Ereignisse häufig gemeinsam auftreten, allerdings haben wir keine Möglichkeit, eine kausale Richtung oder Verknüpfung damit anzugeben. Hier behindert die klassische Formulierung die Erforschung der Kausalität. Pearl hat aus diesem Grund einen neuen Operator entwickelt, den Do-Operator. Er versucht mathematisch zu formalisieren, was wir "Manipulation" genannt haben, also, dass eine bestimmte Situation aktiv verändert wird, um zu prüfen, was sich dadurch im Modell ändert. Do(H) soll dabei bedeuten, dass wir den Hahn manipulieren, also ihn beispielsweise zum Krähen bringen. Genauer formuliert:

P(S | H) = Wahrscheinlichkeit, dass die Sonne aufgeht, wenn beobachtet wird, dass der Hahn kräht. (F#5)

P(S | Do(H)) = Wahrscheinlichkeit, dass die Sonne aufgeht, wenn wir den Hahn zum Krähen bringen. (F#6)

Unsere empirischen Beobachtungen werden nun folgende sein: wir werden den Hahn traktieren können wie wir wollen, auch wenn er kräht wird dabei nicht immer die Sonne aufgehen. Wie nun genau dieser neue Operator in die bekannte Sprache übersetzt wird, ist sehr technisch und auf Beweisbarkeit ausgelegt. In der praktischen Anwendung werden wir den Operator an sich auch nicht weiter benötigen, er illustriert aber, dass erst mit ihm gewisse Konzepte der Forschung in die Sprache der Statistik übersetzt werden können. Für genauere Informationen zu der Thematik siehe [Pearl 2000: 85].