Revision 119485121 of "Benutzer:Sigbert/Korrelationstest" on dewiki

{{Dieser Artikel|behandelt die Beziehung zwischen Messgrößen bzw. Funktionen. Zu gleichnamigen Abbildungen in der projektiven Geometrie siehe [[Korrelation (Projektive Geometrie)]].}}

Eine '''Korrelation''' (vom mittellateinischen ''correlatio'' für „<small>(die)</small> Wechselbeziehung“) beschreibt eine Beziehung zwischen zwei oder mehreren Merkmalen, Ereignissen, Zuständen oder Funktionen. 
Zwischen Merkmalen, Ereignissen oder Zuständen braucht keine [[Kausalität|kausale Beziehung]] zu bestehen: manche Elemente eines Systems beeinflussen sich gegenseitig nicht; oder es besteht eine [[stochastisch]]e (= vom [[Zufall]] beeinflusste) Beziehung zwischen ihnen. 

* In der [[Statistik]] wird der Zusammenhang zwischen zwei [[Statistische Variable|statistischen Variablen]] mit verschiedenen [[Zusammenhangsmaß]]en gemessen. Ein bekanntes Zusammenhangsmaß ist der [[Korrelationskoeffizient]] von Bravais-Pearson.
* 
* In der [[Signalanalyse]] bzw. [[Bildanalyse]] wird zur Beschreibung des Zusammenhangs zweier Signale mit unterschiedlichen Zeit- bzw. Ortverschiebungen die [[Kreuzkorrelation]]sfunktion eingesetzt. Für Details siehe [[Korrelation (Signalverarbeitung)]].
* In der [[Informationstheorie]] wird die Korrelation zweier Zufallsgrößen mit Hilfe der [[Transinformation]] und der [[Kullback-Leibler-Divergenz]] gemessen.
* In der [[Softwaretechnik]] bezeichnet der [[Korrelationstest]] ein Verfahren, in dem nicht nur einzelne [[Parameter (Informatik)|Parameter]] einer [[Funktion (Programmierung)|Funktion]] auf Plausibilität (zum Beispiel in [[Datentyp]] oder Wertebereich) geprüft werden, sondern auch Kombinationen dieser Parameter berücksichtigt werden.

== Beschreibung ==

Eine Korrelation als Maß des Zusammenhangs soll zwei Fragen klären:

;Wie stark ist der Zusammenhang? 
:Die Maßzahlen der Korrelation liegen meist in einem Bereich von Null bis Eins oder von Minus Eins bis Plus Eins. Betrachtet man die Haar- und Augenfarbe von Studenten, so ergibt sich ein [[Kontingenzkoeffizient#Korrigierter_Kontingenzkoeffizient|korrigierter Kontingenzkoeffizient]] von 0,55. Da dieser im Bereich von Null und Eins liegt, haben wir einen mittelstarken Zusammenhang vorliegen.
;Falls möglich, welche Richtung hat der Zusammenhang?
:Ein Beispiel für eine positive Korrelation (wenn mehr, dann mehr) ist: ''„Mehr Futter, dickere Kühe.“'' Ein Beispiel für eine negative Korrelation (wenn mehr, dann weniger) ist: ''„Mehr zurückgelegte Strecke mit dem Auto, weniger Treibstoff im Tank.“''

Oft gibt es Sättigungsgrenzen. Beispiel: Wenn ich mehr Gas gebe, fährt mein Auto schneller (aber nicht schneller als seine technisch bedingte Maximalgeschwindigkeit). In vielen Korrelationen gilt: die [[Grenzkosten]] steigen und der [[Grenznutzen]] sinkt. 

== Korrelation und Kausalzusammenhang ==

=== Von der Korrelation zum Kausalzusammenhang ===

Eine Korrelation beschreibt jedoch keine [[Kausalität|Ursache-Wirkungs-Beziehung]] in die eine und/oder andere Richtung, d.h. aus einem starken Zusammenhang folgt nicht, dass auch eine eindeutige Ursache-Wirkungs-Beziehung gibt.

Beispiele:
* Aus der Tatsache, dass in Sommern mit hohem Speiseeisumsatz viele Sonnenbrände auftreten, kann man nicht schlussfolgern, dass Eisessen Sonnenbrand erzeugt (und auch nicht, dass es Sonnenbrandbeschwerden lindert). 
* Zwischen dem Rückgang der [[Störche]] im [[Burgenland]] und einem Rückgang der Anzahl Neugeborener kann es durchaus eine Korrelation geben, aber weder bringen Störche Kinder noch umgekehrt.

In beiden Beispielen hängen die jeweiligen Messgrößen allerdings über eine ''dritte Größe'' als Ursache kausal zusammen. Im ersten Fall ist es die Sonneneinstrahlung, die sowohl Eisverkauf als auch Sonnenbrand bewirkt, im zweiten Fall die Verstädterung, die sowohl Nistplätze vernichtet als auch begünstigt, dass mehr Paare kinderlos sind bzw. nur ein Kind haben (siehe [[Vereinbarkeit von Familie und Beruf]]). Korrelationen dieser Art werden [[Scheinkorrelation]]en genannt.

In der Presse werden Korrelationen oft in einer Weise berichtet, die eine direkte Kausalität suggeriert, obwohl eine [[Gemengelage]] direkter und indirekter Zusammenhänge besteht. 
Beispiele für Schlagzeilen:
* ''CO<sub>2</sub> erklärt Nahtoderfahrung''<ref>http://www.aerzteblatt.de/nachrichten/40757/Herzstillstand_Hyperkapnie_erklaert_Nahtod-Erfahrungen.htm, 8. April 2010</ref>
* ''Größere Leute verdienen mehr''<ref>[http://www.baz.ch baz], 25. Oktober 2003</ref>
* ''Je mehr Lärm im Haus, desto dümmer die Kinder''<ref>[http://www.baz.ch baz], 4. September 2004</ref>
* ''Rauchen schadet Ihrer Intelligenz''<ref>[http://www.20min.ch 20min], 17. Dezember 2004</ref>
* ''Kreative haben mehr Sex''<ref>[http://www.tagblatt.ch/ St. Galler Tagblatt], 1. Dezember 2005</ref>
* ''Glückliche Menschen sind gesünder''<ref>[http://www.20min.ch/ 20min], 19. April 2005</ref>
* ''Sozial engagierte Menschen haben einen besseren Gesundheitszustand''<ref>benevol SPECTRUM, Mai 2006</ref>
* ''Senkung der Arbeitslosigkeit erfordert starkes Wirtschaftswachstum''<ref>Schlussfolgerung aus der konjunkturellen Korrelation Wirtschaftswachstum/Arbeitslosigkeit – [[Okunsches Gesetz]]</ref>

=== Vom Kausalzusammenhang zur Korrelation ===

Liegt allerdings tatsächlich eine Ursache-Wirkungs-Beziehung vor, dann erwartet man eine Korrelation von Ursache und Wirkung. Daher benutzt man häufig die Korrelation, um einen Hinweis darauf zu bekommen, ob zwei statistische Größen ursächlich miteinander zusammenhängen ''könnten''. 

Das funktioniert immer dann besonders gut, wenn beide Größen durch eine „Je … desto“-Beziehung miteinander zusammenhängen und eine der Größen ''nur'' von der anderen Größe abhängt.

Beispielsweise kann man nachweisen, dass Getreide unter bestimmten Bedingungen besser gedeiht, wenn man es mehr bewässert. Diese Erkenntnis beruht auf dem Wissen über das Getreide – zum Beispiel durch Erfahrung oder wissenschaftliche Überlegungen. Die Korrelation unterscheidet nicht, ob das Wasser auf das Wachstum des Getreides wirkt, oder etwa das Getreide auf die Menge des Wassers. Eine Ursache-Wirkung-Beziehung kann nur unterstellen, wer einer Seite (hier dem Wasser) eine Wirkung (das Wachstum des Getreides) ''zuschreibt''. Gibt es mehrere Einflussfaktoren auf das Wachstum des Getreides (beispielsweise die Temperatur, den Nährstoffgehalt des Bodens, das einfallende Licht usw.), ist die Menge des Wassers nicht mehr die einzige Erklärung für das Wachstum des Getreides. Die Erklärungskraft reduziert sich somit. Die Korrelation zwischen der Menge des Wassers und dem Wachstum des Getreides bleibt unverändert; sie ist ein tatsächlicher Zusammenhang (den man aber nicht immer beweisen bzw. vollständig beschreiben kann). Beispiel: der Vollmond oder ein anderer (bislang) unbekannter Faktor wie die Konstellation von Sonne und Mond könnte das Getreidewachstum auch beeinflussen.

=== Cum hoc ergo propter hoc ===

Der Fehlschluss von Korrelation auf Kausalität wird auch als ''{{lang|la|[[Cum hoc ergo propter hoc]]}}'' bezeichnet. Um Kausalitäten wirklich herstellen und Kausalitätsrichtungen definieren zu können, ist grundsätzlich eine substanzwissenschaftliche Betrachtung notwendig. Die Frage „warum wirkt sich Lärm im Haus negativ auf die Intelligenz der Kinder aus?“ kann in diesem Fall nur von Personengruppen mit entsprechendem Fachwissen, wie zum Beispiel Psychologen, erklärt werden. 

Zur Beurteilung der [[Hypothese]]n wären im Grunde [[Experiment]]e nötig, bei denen ein Faktor experimentell festgelegt wird (z. B. der ''Lärm im Haus'') und der andere Faktor gemessen wird (z. B. ''Intelligenz der Kinder''). Solche Experimente würden mithilfe der [[Regressionsanalyse]] oder [[Varianzanalyse]] evaluiert. Eine Regression dagegen ''beschreibt'' den Zusammenhang, kann ihn aber nicht ''erklären''. Viele derartige Experimente sind nicht durchführbar: 
* zu lange Dauer  und/oder 
* zu hohe Kosten  und/oder 
* unethisch.

Aufgrund ihres Fokus auf den Menschen sind für viele sozialwissenschaftliche und medizinische Fragestellungen nur korrelative Studien ethisch rechtfertigbar. Um Korrelationsergebnisse als kausal interpretieren zu können, sind weitere Untersuchungen erforderlich (dabei können z. B. langzeitige Zusammenhänge hilfreich sein; dazu macht man [[Längsschnittstudie]]n). Teilweise werden korrelative Studien fälschlicherweise wie [[Experiment]]e interpretiert.

== Mathematische Darstellung ==

Im Gegensatz zur [[Proportionalität]] ist die Korrelation nur ein statistischer Zusammenhang. Häufig wird der ''[[Linearität|lineare]]'' oder ''[[Monotonie (Mathematik)|monotone]]'' Zusammenhang zweier Variablen bestimmt. Das bedeutet in diesen Fällen, dass die Korrelation zwischen '''X''' und '''Y''' dieselbe ist wie zwischen '''Z = c + t · X''' und '''Y''' für '''t > 0'''.<ref>[http://www.statistik.lmu.de/~walter/lehre/Stat1Soz_0910/material/Stat1Soz0910-Kap6-1.pdf www.statistik.lmu.de] (PDF; 415&nbsp;kB)</ref> Aus dieser Eigenschaft folgt, dass bei einer unterstellten Beziehung zwischen '''X''' und '''Y''' in der Form '''Y = a + b · X ''' mit '''b > 0''' die Korrelation zwischen '''X''' und '''Y''' identisch ist mit der Korrelation von '''Y''' und beispielsweise '''2·X'''. Das bedeutet, dass selbst bei Kenntnis der Korrelation keine Prognose von '''Y''' ohne die Kenntnis der Parameter '''a''' und '''b''' möglich ist. Die Parameter für den unterstellten linearen Zusammenhang können mittels einer [[Lineare Regression|linearen Regression]] bestimmt werden.

Die Verwechslung von Korrelation und direktem Kausalzusammenhang wird dadurch gefördert, dass bei Berechnung der [[Korrelationskoeffizient#Empirischer_Korrelationskoeffizient|Korrelationskoeffizienten]] '''r''' nach [[Karl Pearson|Pearson]] und bei der linearen Regression mit einer unabhängigen Variablen mathematisch ganz ähnliche Verfahren zum Tragen kommen. In Regressionsanalysen wird das [[Bestimmtheitsmaß]] '''R<sup>2</sup>''' angegeben; es ist gleich dem quadrierten Korrelationskoeffizienten '''r<sup>2</sup>''' und beschreibt die erklärte Varianz des einfachen Regressionsmodells. Dies fördert die falsche Vermutung, die beiden Verfahren mit ihren jeweiligen Interpretationsmöglichkeiten seien austauschbar. Die Korrelation beschreibt die Stärke des Zusammenhangs, während die Regression eine unterstellte Kausalrichtung des Zusammenhangs misst.

== Anwendung ==

Der Korrelationsbegriff ist von erheblicher Bedeutung bei [[Kapitalanlage]]n. Es gilt: Das Gesamtrisiko des gesamten Portfolios ist umso geringer, je geringer die einzelnen Anlagen (Assets) miteinander korrelieren.

Beispiel für positive Korrelation: Besteht ein Portfolio nur aus vielen einzelnen Aktien, so führt der Kursrückgang von Aktie 1 auch zum Wertverlust von Aktie 2 und auch Aktie 3 in einem bestimmten Verhältnis. Besteht das Portfolio jeweils zur Hälfte aus Aktien und Renten, so ist der Verlust geringer, da nur eine geringfügige Korrelation Aktien-Renten besteht.

Allerdings gibt es auch (negative) Korrelationen, wenn auch geringere, bezüglich Aktie-Rente. Ist der [[Aktienmarkt]] schwach, so wird tendenziell in Renten investiert (Kapitalflucht in den ''sicheren Hafen''). Die [[Rentenrechnung|Rentenkurse]] steigen. Dies fängt jedoch nicht den Komplettverlust im Aktienbereich auf. Daher ist es sinnvoll, noch in weitere Anlagen zu diversifizieren als nur in Renten und Aktien (siehe auch [[Diversifikation]]). Die Risikominderung durch Diversifikation oder Investition in negativ korrelierte Assets bezeichnet man als [[Hedging]]. Dem ist allerdings eine natürliche Grenze dadurch gegeben, dass, wenn zwei Assets negativ korreliert sind, ein dritter nicht mit beiden negativ korreliert sein kann, sondern nur mit dem einen negativ in dem Maße, in dem er mit dem anderen positiv korreliert ist.

Die ideale Diversifikation ist so umfassend, dass keine Korrelationen zwischen den einzelnen Assets existieren. Erwirtschaften zudem die einzelnen, nicht korrelierenden Assets noch eine maximale Rendite, so ergibt sich das ideale, jedoch in Realität nie existierende Portfolio.

Reduktion der Korrelation des Gesamtportfolios im Verhältnis zu seinen Einzelanlagen verbessert nach dem [[Harry Markowitz|Markowitz]]-Modell das Rendite-Risiko-Verhältnis. Auf langfristiger Basis wird damit prinzipiell eine höhere Rendite bei geringerem Risiko erzielt (siehe auch [[Portfoliotheorie]]).

Die Korrelation macht in erster Linie Aussagen über die Richtung des Verlaufs von Aktien und Index, nicht jedoch über das Ausmaß der jeweiligen Veränderung. Aus einer positiven Korrelation von 0,8 lässt sich beispielsweise nicht erkennen, um wie viel der Aktienkurs bei einem 3-%-Anstieg des DAX steigt. Auch besagt die Korrelation nicht, ob der DAX auf die Aktie wirkt, oder die Aktie auf den DAX. Für die Analyse von Wertpapieren hat sich das [[Capital Asset Pricing Model]] entwickelt, dort kommt der [[Betafaktor]] als wichtige Kennzahl ins Spiel.

== Siehe auch ==

* [[Konfundierungseffekt]]
* [[Kovarianz (Stochastik)|Kovarianz]]
* [[Kollinearität]] als Fehlermöglichkeit oder Entgleisungsmöglichkeit
* [[Stochastische Unabhängigkeit]]

== Literatur ==

* David G. Myers: ''Psychologie'', Springer, 2. Auflage, ISBN 3540213589, Seiten 30-35

== Einzelnachweise ==

<references/>

[[Kategorie:Deskriptive Statistik]]