Es ist im Sinne einer besseren Auseinandersetzung, Fehler in Argumentationen zu entlarven, die auf fehlenden Statistikkenntnissen basieren. Ein Aufklären über solche Irrtümer ist weltanschaulich neutral. Selbst wenn konkrete Beispiele als Aufhänger dienen, kann die zugrundeliegende Logik von jedem verwendet werden. Nachdem es bereits um die Mythen „Gender Pay Gap“ sowie „Jede dritte Frau in der EU von Gewalt betroffen“ ging, möchte ich heute etwas trockener beginnen, nur um danach aufzuzeigen, an welchen Stellen der Denkfehler auftaucht.
Nehmen wir an, wir haben eine Menge („Grundgesamtheit“) von Menschen, sagen wir 20 Millionen. Diese sind hinsichtlich eines Merkmals, das zwei Ausprägungen („0“ und „1“) hat, genau in zwei Hälften aufteilbar.
Hin und wieder verüben einige Mitglieder dieser Grundgesamtheit schreckliche Verbrechen. In einem bestimmten Zeitraum gibt es 100 Täter. Der Einfachheit halber gehe ich in diesem fiktiven Beispiel davon aus, dass jeder Täter identifiziert wird und es keine Justizirrtümer gibt. Eine demographische Untersuchung zeigt, dass 99 der Täter bezüglich des erwähnten Merkmals die Ausprägung „0“ haben und nur einer „1“.
Die absolute Wahrscheinlichkeit sieht also so aus:
20.000.000 Menschen, davon 100 Verbrecher – also 0,0005% Verbrecher
Die meisten Leute sind also – hinsichtlich dieses Verbrechens – unschuldig.
Nun gibt es auch die bedingte Wahrscheinlichkeit: Wenn ich weiß, dass eine Person in eine bestimmte Gruppe gehört ( = ein bestimmtes Merkmal aufweist), wie wahrscheinlich ist dann, dass sie bezüglich eines anderen Merkmals eine bestimmte Ausprägung hat?
Zunächst einmal ausgehend des Merkmals mit den Ausprägungen „0“ und „1“:
10.000.000 „0“-Menschen, davon 99 Verbrecher – also 0,00099% Verbrecher
10.000.000 „1“-Menschen, davon 1 Verbrecher – also 0,00001% Verbrecher
Die Verbrecher sind in beiden Untergruppen eine verschwindend kleine Minderheit.
Jetzt umgekehrt gedacht, ausgehend von den Verbrechern:
99%, dass er zur „0“-Gruppe gehört
1%, dass er zur „1“-Gruppe gehört
Eine so ungleiche Verteilung läßt einen natürlich aufmerken. Das kann doch kein Zufall sein!
Wenn sie sich nur die letzten beiden Wahrscheinlichkeiten ansehen, ohne die absoluten Zahlen zu kennen, erliegen manche Leute dem Trugschluss, dass aus der Merkmalsausprägung „0“ folgt, dass jemand zum Verbrechen neigt, und/oder dass mit Leuten aus der Gruppe „0“ ja wohl etwas grundsätzlich nicht in Ordnung sein muss, wenn sie so oft in der Liste der Verbrecher auftauchen.
Dabei können sie letzteres, ohne insgesamt besonders verbrecherisch zu sein und die Idee, mit einer kleinen Minderheit von Verbrechern das Wesen einer größeren Menschenmenge zu erklären, aus der sie kommen, führt in die Irre. Das hält Leute dennoch nicht davon ab, genauso zu argumentieren (siehe die bereits zitierte Anleitung für ein Hassblog).
Mit ein wenig Nachdenken läßt sich erkennen, wie unwichtig die bedingte Wahrscheinlichkeit ist, mit der ich ausgehend vom Verbrecher „0“ oder „1“ erwarten kann. Denn im normalen Leben werde ich meistens nicht von Verbrechern umgeben sein und mir dann Sorgen machen, ob es ein „0“-Mensch oder ein „1“-Mensch ist. Der Alltag sieht eher so aus, dass ich irgendwelchen Leuten der Grundgesamtheit über den Weg laufe und ich mich dann frage, wie wahrscheinlich es ist, dass jemand von ihnen ein Verbrecher ist.
Nach diesem allgemein gehaltenen Modell nun einige Beispiele:
1. „(Fast) alle Amokläufer waren Männer. Es muss daher an toxischer Männlichkeit liegen, d.h. Männlichkeit ist definitiv schlecht bzw. mit unseren Männern stimmt etwas nicht.“
Zu den „Klassikern“ bei Fehlerklärungen von Amokläufen zählen außerdem bestimmte Musikrichtungen, Bands oder Computerspiele, die der Täter bevorzugt konsumiert hat. Ferner gehört auch „unfreiwilliger Mangel an sexueller Erfahrung“ dazu, was dazu führt, dass sich Menschen ohne Beziehungserfahrung Sorgen machen, sie würden als potentielle Amokläufer verdächtigt. Als absolut seriöser Küchenpsychologe kann ich natürlich solide einschätzen, dass die hektischen Bemühungen, nach solchen Verbrechen die Täter als „fremdartig“ darzustellen, offenbar dem Bedürfnis entspringen, sich von ihm abzugrenzen, also zu zeigen „der war keiner von uns“.
2. „Ein Großteil der Menschen, die mit dem Darwin Award prämiert wurden, waren Männern. Daraus läßt sich offensichtlich ableiten, dass Männer Idioten sind.“
(Viel einleuchtender fällt mir als Erklärung die Theorie ein, dass Intelligenz bei Männern breiter gestreut ist. Wenn das stimmt, gibt es neben mehr Ausreißern nach oben natürlich auch mehr absolute Vollidioten.)
3. „Nicht jeder Moslem ist Terrorist, aber fast alle Terroristen waren Moslems.“ (Im Sinne von „Das sagt etwas über den Islam oder Moslems allgemein aus“.)
Nachwort à la „Ich musste es mal loswerden“
Eigentlich sollte es Vorgeplänkel werden. Da jedoch die ersten Sätze eines Artikels als Ausriss benutzt werden und das hier nicht der wesentliche Teil ist, habe ich es lieber hintenangestellt.
Nachdem ich im Dezember richtig losgelegt und einen Artikel nach dem anderen geschrieben hatte (so Christian Schmidt von Alles Evolution), war ich zuletzt doch etwas müde geworden. So sehr ich mich über ein großes Lob freue und es als Erfolg werte, einen ungewöhnlichen und bewegenden Gastartikel von Emannzer bekommen zu haben: Ich musste mich in den etwas ruhigeren Momenten fragen, was ich eigentlich bewirke mit meinem Geschreibsel.
Vielleicht lag es daran, dass ich viele Dinge, die mir noch unter den Nägeln brannten, abgearbeitet hatte. Therapeutisches Schreiben sozusagen. Andererseits bin ich längst nicht durch. Themen habe ich noch, aber das alles mühsam zusammenzuschreiben wird Zeit kosten.
Ich war versucht, mal wieder eines der „Medial hofierte radikale Feministinnen sind ziemlich bescheuert“-Videos als Fundstück zu verwenden. Von denen gibt es einen konstanten Nachschub, wenn man nur eine Handvoll Quellen kennt, und viele bieten mir angemessene Unterhaltung. Aber irgendwie erscheint es mir abgelutscht und Zeitverschwendung, das jetzt und hier zu verbreiten. Ich denke, in dieser Blogblase kommt man schon auf anderem Wege daran.
Dann meldete sich vor einigen Tagen die Realität und ich hatte mein Thema. Ursprünglich wollte ich daraus einen Artikel machen, jetzt werden es mehrere. Der Teil, den ich heute veröffentliche, passt zu den aktuellen Debatten.
Popkultur
Was wäre ein Blogeintrag ohne Popkultur? Diesmal rappen die Beastie Boys über eine Welt, die anscheinend verrückt geworden ist. (Es gibt von dem Lied auch eine neuere Version, die schön funkig ist.)
Beastie Boys: In A World Gone Mad
Naja.
Wenn 90% aller Amokläufer Männer sind oder 90% aller Terroristen Muslime, dann lässt sich das Geschlecht bzw. die Religionszugehörigkeit als kausaler Faktor so einfach nicht vom Tisch wischen angesichts der Basisraten.
Gerade bei diesen Beispielen ist die Frage nach einem ursächlichen Zusammenhang völlig legitim und statistisch begründbar, da signifikant. Das statistische Maß ist hierbei die Odds Ratio.
Dein Beispiel ist ein wenig irreführend, da sich Einzelfälle (n=1) prinzipiell nicht für die Inferenzstatistik eignen. 4-Felder-Tests haben üblicherweise eine Mindest-Fallgröße von n=5 zur Voraussetzung.
@David
Die Aussage, wonach „90% aller Terroristen Muslime“ ist deshalb als Aussage generell mit keiner Quelle versehen, weil sie nachweislich falsch ist.
Was natürlich niemanden daran hindert, diese Aussage immer wieder von sich zu geben (vergleichbar mit dem gender pay gap von 23% – dieser Zombie läuft ja immer noch durch die Gazetten).
Gruß, crumar
Ich dachte das wäre klar, dass es sich um ein veranschaulichendes Beispiel handeln soll, nicht um eine Aussage. Hätte ich vielleicht deutlicher kennzeichnen sollen.
Natürlich ist das statistisch signifikant. Es hatte aber keine Aussage Kraft in die umgekehrte Richtung, für die man es häufig verwendet. Das ist der Fehler, den ich kritisiere.
Du schneidest mit diesem Post ein generelleres wichtiges Thema an: welche mathematischen Grundkenntnisse braucht man, um in bestimten Themen der Geschlechterdebatte auf verschiedenen Professionalitätsstufen mitreden zu können und – für Personen, die die Kenntnisse nicht haben – wie kann man die Lücken ad hoc auffüllen oder wenigstens im konkreten Anwendungsfall die Unhaltbarkeit von Argumentationen verdeutlichen.
Ich hatte aus ähnlichen Gründen schon vor längerem einen Crash-Kurs Deterministische und statistische Aussagen und deren Beweisbarkeit geschrieben, weil viele den Charakter von statistische Aussagen nicht erkennen und die Aussagekraft überschätzen.
Noch schlimmer ist es beim Lieblingsthema (un)bereinigtes pay gap und den „Gehaltsdifferenzen“, die auf 2 Stellen hinter dem Komma angegeben werden. Die „Differenzen“ werden i.d.R. nach der Oaxaca-Blinder Komponenten-Zerlegungsmetode berechnet. In diese Methode gehen mehrere Annahmen aus, die man durchaus infrage stellen kann, obendrauf kommen zusätzliche die potentiellen Schätzfehler der angewandten statistischen Analysen. Generell gesagt diese Lohndifferenzkomponenten nicht zuverlässig, das ist auch den meisten MRAs nicht ausreichend klar. Dies nur als Beispiel, wo es mMn an mathematischer Bildung fehlt.
Positiv gewendet wäre es ein wünschenswertes Unterfangen, die für bestimmte Themenstellungen notwendigen Mathe-Kenntnisse zu benennen und gute Quellen zusammenzustellen, wo man sie bei Bedarf schnell nachlesen kann. Ich kann die Ergebnisse auch gerne auf meinem Blog einbauen.
Noch ein Nachtrag: das Thema Gehaltsdifferenzen wird in nächster Zeit noch hochkochen, wenn Gleichmachungsministerin Schwesig ihr Lohngleichheitsgesetz verabschiedet (ich bin über den Stand der Dinge nicht auf dem laufenden).
Bin mal gespannt, ob nur noch ganz wenige Merkmale zur Gehaltsdifferenzierung herangezogen werden dürfen, die unserer Diktatorin recht sind, das wäre eine weitere Grundrechtsverletzung, oder eben ziemlich viele, dann kann man eben i.d.R. keine geschlechtsbezogenen Differenzen mehr finden.
Das Lohngleichheitsgesetz könnte interessant werden. Ist doch dieser Ansatz hier oder?:
https://allesevolution.wordpress.com/2013/09/07/entgeldgleichheitsgesetz-der-spd-zur-beseitigung-von-lohnunterschieden-zwischen-mann-und-frau/
Wäre doch mal ein interessantes Ergebnis, wenn man dann feststellt, dass da die Differenz recht gering ist oder erklärbar ist.
Wird Feministinnen natürlich nicht abhalten dennoch eine strukturelle Diskriminierung anzuführen, in der eben die „Verteilung“ der Jobs bzw. deren angemessene Bezahlung ungerecht ist
@mitm
„Ich hatte aus ähnlichen Gründen schon vor längerem einen Crash-Kurs Deterministische und statistische Aussagen und deren Beweisbarkeit geschrieben, weil viele den Charakter von statistische Aussagen nicht erkennen und die Aussagekraft überschätzen.“
Bei dir bekommt man leider immer vieles nicht mit, was du so schreibst, weil du es in Seiten machst.
Wäre vielleicht interessant es zusätzlich noch mal als Artikel im Blog zu veröffentlichen, nur mal als Anregung
Ich habe noch einige Statistik-Irrtümer auf Lager, über die ich hier schreiben möchte. Ich bin kein Pädagoge, glaube aber, dass es möglich ist, das in verdaubaren Happen zu präsentieren.
Das Problem liegt wohl eher darin, dass du kein Statistiker bist 😉
Ich muss dir erneut widersprechen. Wenn Gruppenzugehörigkeit mit einem erhöhten Risiko für ein bestimmtes negatives Ereignis assoziiert ist, dann ist es völlig legitim das auch anzusprechen, unter Berücksichtigung der relativen Wahrscheinlichkeit und ohne Simplifizierung oder Pauschalisierung, die falsche Kausalzusammenhänge suggerieren.
Nehmen wir mal Ehrenmorde in D als Beispiel und wieder die Korrelation mit Geschlecht und Religionszugehörigkeit.
Hier werden sehr oft weibliche Opfer hervorgehoben, obwohl das Opfergeschlecht unabhängig verteilt ist! Ein Chi-Quadrat-Test wird nicht signifikant, Männer werden annähernd gleich oft Opfern und somit ist es sogar ein männerrechtliches Anliegen, der Propaganda entgegenzutreten, die dieses Phänomen gendert.
Ehrenmorde sind auf der anderen Seite sehr deutlich mit muslimischer Religionszugehörigkeit und männlichem Tätergeschlecht korreliert. Hier kommt die bedingte Wahrscheinlichkeit ins Spiel, und man kann natürlich mit Recht sagen, dass die allerwenigsten Muslime und auch unter Muslimen nur ein winziger Bruchteil der Männer Ehremorde begehen.
Dennoch braucht man hier nichts verschleiern, die Odds Ratio dürfte für muslimische Männer um ein vielfaches erhöht sein, Ehrenmorde sind damit eben kein Problem der deutschen Mehrheitsgesellschaft, sondern ein spezifisches Problem der muslimischen Minderheit, was auch so kommuniziert werden muss. Die Tragweite solcher Taten ist so groß, dass hier auch schon eine geringe Zahl das Aufzeigen solcher Zusammenhänge legitimiert.
Wer allerdings eine faire Ursachenforschung betreibt, wird feststellen müssen, dass das Tätergeschlecht hier kein Kausalfaktor ist, sondern kulturelle Eigenheiten die Ursache sind, warum meist Sohn oder Cousin mit der Aufgabe der Ausführung bedacht werden.
Es wäre also grob unbillig, hier toxische Männlichkeit ins Feld zu führen.
Allerdings ist der Zusammenhang zwischen islamischer Religionszugehörigkeit und Ehrenmorden absolut nicht zu vernachlässigen, selbst wenn 99% aller Muslime damit nichts am Hut haben.
Inhaltlich müsste man jedoch immernoch prüfen, ob hier der Glaube (Rechtfertigungen im Koran) überhaupt inhaltlich den Zusammenhang verursacht oder ob nicht vielmehr anderweitige kulturelle Faktoren innerhalb der muslimischen Minderheit wirksam sind.
„Wenn Gruppenzugehörigkeit mit einem erhöhten Risiko für ein bestimmtes negatives Ereignis assoziiert ist, dann ist es völlig legitim das auch anzusprechen, unter Berücksichtigung der relativen Wahrscheinlichkeit und ohne Simplifizierung oder Pauschalisierung, die falsche Kausalzusammenhänge suggerieren.“
Das sehe ich absolut genauso. Was ich in meinem Artikel kritisiere, ist das Verwechseln der bedingten Wahrscheinlichkeiten ( Täter -> Merkmal 0 vs. Merkmal 0 -> Täter) und die dadurch erfolgende Verallgemeinerung auf die Gruppe, aus der überdurchschnittlich häufig die Täter kommen.
Ich empfinde als sehr erfrischend, dass von mehreren Kommentatoren über Statistik geschrieben wird. Ich dachte, ich würde da ein zu trockenes Thema anreißen, das keinen interessiert.
Ich denke, daß dies hier:
„Wenn sie sich nur die letzten beiden Wahrscheinlichkeiten ansehen, ohne die absoluten Zahlen zu kennen, erliegen manche Leute dem Trugschluss, dass aus der Merkmalsausprägung “0” folgt, dass jemand zum Verbrechen neigt, und/oder dass mit Leuten aus der Gruppe “0” ja wohl etwas grundsätzlich nicht in Ordnung sein muss, wenn sie so oft in der Liste der Verbrecher auftauchen.“
NICHT die Pointe ist. Denn was man sehr wohl korrekt aus der bedingten Wahrscheinlichkeit folgern kann, ist, daß – deine Zahlen und Annahmen vorausgesetzt – die 0-Gruppe sehr viel stärker zu Verbrechen neigt, als die 1-Gruppe.
Stattdessen lautet die Pointe, daß diese Tatsache, daß sie stärker zum Verbrechen neigt, für die 0-Gruppe nicht charakteristisch ist. Genauer: Die Verbrechensneigung ist überhaupt kein Merkmal, daß man benutzen kann, um die 0-Gruppe von der 1-Gruppe zu unterscheiden – es ist uninformativ im Sinne statistischer Diskrimination, weil alle Verbrecher sog. Ausreißer sind und zwar sowohl für die 0-Gruppe als auch für die 1-Gruppe.
Sehr richtig.
Dichotome Variablen können ja korrelieren, ein Mann hat ein deutliches höheres Risiko Amok zu laufen (schätzungsweise 10-fach erhöht) bzw. Amokläufer sind mit sehr hoher Wahrscheinlichkeit männlich.
Solche Zusammenhänge braucht man auch nicht verschleiern wie es in diesem Artikel (und auch im Zusammenhang mit Kriminalstatistiken häufig) passiert, man darf halt nur keine monokausale Ursachenforschung betreiben.
Entscheidendes Stichwort ist hier die BASISrate, mit der sich zeigen lässt, ob eine bestimmte Ausprägung für die Gruppe charakteristisch ist oder nicht. Wobei eine problematische Delinquenzrate natürlich auch nicht erst bei 50% beginnt, sondern je nach Phänomen auch schon viel früher.
Korrekt.
„Denn was man sehr wohl korrekt aus der bedingten Wahrscheinlichkeit folgern kann, ist, daß – deine Zahlen und Annahmen vorausgesetzt – die 0-Gruppe sehr viel stärker zu Verbrechen neigt, als die 1-Gruppe.“
Vielleicht sind es nur sprachliche Details, über die wir diskutieren. „Neigen“ heißt für mich: Das machen sie durchaus häufig. „Stärker neigen“ heißt für mich: Das machen sie häufiger als die andere Gruppe. Letzteres läßt sich selbstverständlich aus dem Beispiel entnehmen.
Das „stärker neigen“ ist natürlich ebenfalls fatal, wenn die absoluten Wahrscheinlichkeiten nicht kennt. Wenn die Wahrscheinlichkeit, dass ich morgen in meiner Straße von einem Auto überfahren werde, 1:1 Milliarde beträgt, und die Wahrscheinlichkeit in der Nebenstraße 1:2 Milliarden, dann klingt das sehr unwahrscheinlich. „In meiner Straße habe ich ein doppelt so hohes Risiko, überfahren zu werden!“ klingt dramatisch.
Ich finde es immer etwas problematisch, Belege anzubringen in Form von selbst ausgedachten Zitaten. Das liest sich zwar gut (und ist rhetorisch geschickt), macht aber schnell den Eindruck einer Strohmanndiskussion.
Findet man ohnehin schon genug bei unseren Alltags-Femsen.
Vernünftige Kritik. Den Schuh muss ich mir anziehen. Vor allem habe ich natürlich noch im Kopf, dass ich so etwas gehört oder gelesen habe, aber für jeden Leser muss das nicht gelten.
„Findet man ohnehin schon genug bei unseren Alltags-Femsen.“
So eine Aussage ist natürlich viel besser als ein ausgedachtes Zitat.
Warum?
Femsen ist ein wenig polemisch, allerdings auch nicht mehr als Maskus.