In einer sehr aktuellen Arbeit, die eher philosophischen als spezifisch mathematischen Anspruch stellt (und im übrigen als wissenschaftliche Studie peer-reviewed, also kein "Privatpapier mit Meinungen" ist) und jüngst veröffentlicht wurde (link zum pdf hier), macht ein Dreigestirn der Statistik - William Briggs, H. T. Nguyen, D. Trafimow - auf eines der dringendsten Probleme der Modell- und Hypothesenverifikation aufmerksam: Das Unwesen, zu dem sich Wahrscheinlichkeitswerte entwickelt haben, muß dringend abgestellt werden. P-Werte, also Wahrscheinlichkeitswerte, haben sich nämlich zu einem Krebsgeschwür entwickelt.
Es wird heute völlig übersehen, daß sie keinerlei Tauglichkeit haben, Realitäten zu beschreiben. Sie setzen nämlich genaue Kenntnis der Realität voraus. Keine noch so perfekt ausgebaute mathematische Rechnung vermag Ursache und Wirkung zu identifizieren. Vielmehr braucht es ERST Kenntnis von Wirkzusammenhängen. Es braucht also eine Umkehrung der Paradigmen. Die Wissenschaft muß wieder zu dem Punkt kommen, wo ERST eine Hypothese aufgestellt und verifiziert oder falsifiziert wird, die dann durch (teilweise erst noch zu findende) Verfahren belegt oder in ihrer Plausibilität und Relevanz untermauert werden kann.
Die klassische Methode der Überprüfung von Hypothesen, egal ob mit P-Werten (Wahrscheinlichkeiten) oder Bayes-Faktoren, führt zu einer Über-Sicherheit und erzeugt die falsche Idee, daß Ursachen über statistische Methoden identifiziert worden sind. Die Begrenztheiten und Mißbräuche speziell von Wahrscheinlichkeitswerten sind so gut bekannt und ungeheuerlich, daß es dringend einer neuen Methode bedarf. Wir schlagen dazu die Rückkehr zu der alten Idee vor, Vorhersagen nur anhand von Modellen mit beobachtbaren Tatsachen zu machen, und beobachtbare Fakten (Evidenzen) als Maßstab heranzuziehen, um Vorhersagen zu überprüfen. Um dann, nötigenfalls, Vorhersagen zugunsten der Evidenzen auszuscheiden. Gerade dieser letzte Schritt müßte dringend wieder eingeführt werden.
P-Werte (Wahrscheinlichkeitswerte) sollten überhaupt nicht benutzt werden, heißt es da im Abstrakt der Arbeit weiter. Sie haben innerhalb von komplexen Theorien keinerlei Wert, denn sie sind pure Akte der Willkür. Sie dürfen nicht dazu benützt werden, innerhalb von Modellen Entscheidungen zu treffen (wie in den Klimamodellen, Anm.), wo in einigen oder vielen Fällen Wahrscheinlichkeiten durch festzulegende Parameter ersetzt werden müssen. Die Überprüfung von Hypothesen durch diese Methoden kann niemals zu Aussagen über Ursachen führen. Modelle, die auf Wahrscheinlichkeitswerten beruhen, können so gut wie nie auf ihren Realitätsgehalt geprüft werden. P-Werte sind niemals einzigartig oder signifikant. Sie bewirken aber, daß Modelle realer wirken als die Wirklichkeit. Denn sie führen zu magischem oder ritualisiertem Denken. Sie dürften deshalb niemals die Basis für reale Entscheidungen bilden. Wenn P-Werte dennoch so aussehen, als würden sie tauglich sein, dann tun sie das, weil sie wie ungefähre Grundlagen zu Vorhersagen über Möglichkeiten wirken, die selbst aber jeden statistischen Wahrscheinlichkeitswert paradigmatisch vorherbestimmen (also ein Zirkelschluß sind).
Kurz gesagt: Hypothesen ergeben sich nicht aus Wahrscheinlichkeiten, sondern sie legen die Wahrscheinlichkeiten in Systemen mit mehreren oder vielen Variablen selbst fest. Deshalb haben Wahrscheinlichkeitswerte keinen wissenschaftlichen Wert, wenn es um die Frage geht, wie ein System sich zukünftig verhalten wird.
Natürlich hat diese Studie mehr philosophischen als technisch-mathematischen Charakter. Aber das ist auch richtig so. Denn aller Mathematik und aller Methodik liegt ein philosophisches Gerüst zugrunde. Wenn innerhalb dieser philosophischen Voraussetzungen einer naturwissenschaftlichen Methode aber ein Fehler vorliegt, dann müssen auch sämtliche noch so genaue Ableitungen daraus fehlerhaft und damit irrelevant sein.
Kurz gesagt: Die Überlegungen, aus denen heraus Wirkfaktoren bewertet werden, die in Wahrscheinlichkeitsrechnungen einfließen, werden aus philosohphischen Gründen VOR jeder Hypothesenprüfung angestellt. Simples Beispiel: Daß an der Ausbreitung einer Krankheit nicht die Farbe der Socken der Probanden Ursache sind, ist keine Entscheidung, die aus statistischen Gründen erfolgt, sondern aus ganz anderen Wissens- und Urteilsbereichen heraus. Sind diese Urteile aber falsch, dann ist jede Wahrscheinlichkeitsrechnung irrelevant.
Das heißt etwa im konkreten Fall "Klimakatastrophe durch CO2-Austoß", daß so lange nicht die genaue Ursache-Wirkungs-Logik des "Weltklimas" (in allen Einflußbereichen) bekannt ist, und das ist bei weitem nicht der Fall, ist auch jede Berechnung der Wahrscheinlichkeit einer angeblich drohenden "Katastrophe" (und deren Auswirkungen) vollkommen irrelevant und haltlose, subjektive Behauptung.
Kurz gesagt: Die Überlegungen, aus denen heraus Wirkfaktoren bewertet werden, die in Wahrscheinlichkeitsrechnungen einfließen, werden aus philosohphischen Gründen VOR jeder Hypothesenprüfung angestellt. Simples Beispiel: Daß an der Ausbreitung einer Krankheit nicht die Farbe der Socken der Probanden Ursache sind, ist keine Entscheidung, die aus statistischen Gründen erfolgt, sondern aus ganz anderen Wissens- und Urteilsbereichen heraus. Sind diese Urteile aber falsch, dann ist jede Wahrscheinlichkeitsrechnung irrelevant.
Das heißt etwa im konkreten Fall "Klimakatastrophe durch CO2-Austoß", daß so lange nicht die genaue Ursache-Wirkungs-Logik des "Weltklimas" (in allen Einflußbereichen) bekannt ist, und das ist bei weitem nicht der Fall, ist auch jede Berechnung der Wahrscheinlichkeit einer angeblich drohenden "Katastrophe" (und deren Auswirkungen) vollkommen irrelevant und haltlose, subjektive Behauptung.
*080119*