Revision 119484620 of "Benutzer:Sigbert/Korrelationstest" on dewiki

Die '''Korrelation''' ist eine Beziehung zwischen zwei oder mehr [[Statistische Variable|statistischen Variablen]]. Es gibt positive und negative Korrelationen.

Ein Beispiel für eine positive Korrelation (je mehr, desto mehr) ist:
''Je mehr Futter, desto dickere Kühe.'' 

Ein Beispiel für eine negative Korrelation (je mehr, desto weniger) ist:
''Je mehr Verkauf von Regenschirmen, desto weniger Verkauf von Sonnencreme.''

Die Korrelation beschreibt nicht unbedingt eine [[Kausalität|Ursache-Wirkungs-Beziehung]] in die eine oder andere Richtung. So darf man über die Tatsache, dass man [[Feuerwehr]]en oft bei Bränden findet, nicht folgern, dass sie sie legt. Die direkte Kausalität kann auch gänzlich fehlen. So kann es durchaus eine Korrelation zwischen dem Rückgang der [[Störche]] im [[Burgenland]] und einem Rückgang der Anzahl Neugeborener geben, aber diese Ereignisse haben natürlich direkt nichts miteinander zu tun (weder bringen Störche Kinder noch umgekehrt), das heißt, sie haben kausal allenfalls über eine dritte Größe etwas miteinander zu tun, etwa über die Verstädterung, die Nistplätze vernichtet. 

Im Gegensatz zur [[Proportionalität]] ist die Korrelation nur ein stochastischer Zusammenhang, das heißt, es kann nur eine ungefähre Zu- oder Abnahme prognostiziert werden. Zum Beispiel kann eine 200-prozentige Steigerung der Futtermenge mal eine Gewichtszunahme der Kühe von 10%, mal von 20% bewirken, wohingegen eine Verdoppelung des Gewichts eines Hammers bei gleicher Beschleunigung ''immer'' eine Verdoppelung der Kraft bewirkt, da hier ein proportionaler Zusammenhang besteht.

== Der verallgemeinerte mathematische Korrelationsbegriff ==
Die Korrelation ist mathematisch durch das [[Korrelationsintegral]] für Zeitfunktionen beschrieben:

:<math>\rho(\tau)= K\int_{-\infty}^\infty x(t) m(t + \tau) dt</math>

Für komplexe Zeitfunktionen gilt: 

:<math>\rho(\tau)= K\int_{-\infty}^\infty x(t) m^*(t + \tau) dt</math>

Der Wert K und die Integralgrenzen müssen den entsprechenden Funktionen angepasst werden:
 - K = 1:              bei aperiodischen Signalen
 - K = 1/2T:           bei periodischen Signalen. Die Integralgrenzen verlaufen dann von -T bis T
 - K = lim(T>Inf)1/2T: bei Zufallssignalen 

x(t) ist die zu analysierende Funktion
m(t) ist die Musterfunktion.

=== Musterfunktion m(t) ===
m(t) kann jede beliebige Musterfunktion sein. Sie sollte jedoch sinnvoll angepasst werden.

Das Korrelationsintegral geht je nach Musterfunktion m(t) über in:
* [[Fourier-Transformation]]: <math>m(t) = e^{-i \omega t}</math>
* Hilbert-Transformation: <math>m(t) = \frac{1}{t \pi}</math>
* [[Autokorrelation]]: <math>m(t) = x(t)</math>
* [[Kreuzkorrelation]]: <math>m(t) = y(t)</math>
* Flächenberechnung: <math>m(t) = 1</math>
* [[Walsh-Hadamard-Transformation]]
* [[Wavelet]]-Transformation

Der Einsatz des Korrelationsintegrals (Integraltransformation) erlaubt je nach Musterfunktion verschiedene Einsatzmöglichkeiten.

===Statistische Informationsverarbeitung===
In der statistischen Informationsverarbeitung sind die Auto- und Kreuz-
Korrelationsfunktionen von großer Bedeutung:

====Autokorrelation====
Die Autokorrelations-Funktionen beschreiben die Ähnlichkeit eines Signals bzw.
einer Zeitfunktion mit sich selbst.

====Kreuzkorrelation====
Die Kreuzkorrelations-Funktion hingegen beschreibt die Ähnlichkeit eines Signals bzw.
einer Zeitfunktion mit einer anderen.

== Verwendung bei Kapitalanlagen ==
Der Korrelationsbegriff ist von erheblicher Bedeutung bei [[Kapitalanlage|Kapitalanlagen]]. Es gilt: Das Gesamtrisiko des gesamten Portfolios ist umso geringer je geringer die einzelnen Anlagen (Assets) miteinander korrelieren. 

Beispiel für positive Korrelation: Besteht ein Portfolio nur aus vielen einzelnen Aktien, so führt der Kursrückgang von Aktie 1 auch zum Wertverlust von Aktie 2 und auch Aktie 3 in einem bestimmten Verhältnis. Besteht das Portfolio jeweils zur Hälfte aus Aktien und Renten, so ist der Verlust geringer, da nur eine geringfügige Korrelation Aktien-Renten besteht. 

Allerdings gibt es auch (negative) Korrelationen, wenn auch geringere, bezüglich Aktie-Rente. Ist der [[Aktienmarkt]] schwach, so wird tendenziell in Renten investiert (Kapitalflucht in den ''sicheren Hafen''). Die [[Rentenkurs]]e steigen. Dies fängt jedoch nicht den Komplettverlust im Aktienbereich auf. Daher ist es sinnvoll noch in weitere Anlagen zu diversifizieren als nur in Renten und Aktien (siehe auch [[Diversifikation]]). Die Risikominderung durch [[Diversifikation]] oder Investition in negativ korrelierte Assets bezeichnet man als [[Hedging]]. Dem ist allerdings eine natürliche Grenze dadurch gegeben, dass, wenn zwei Assets negativ korreliert sind, ein dritter nicht mit beiden negativ korreliert sein kann, sondern nur mit dem einen negativ in dem Maße, in dem er mit dem anderen positiv korreliert ist.

Die ideale Diversifikation ist so umfassend, dass keine Korrelationen zwischen den einzelnen Assets existieren. Erwirtschaften zudem die einzelnen, nicht korrelierenden Assets noch eine maximale Rendite, so ergibt sich das ideale, jedoch in Realität nie existierende Portfolio.

Reduktion der Korrelation des Gesamtportfolios im Verhältnis zu seinen Einzelanlagen, verbessert nach dem [[Markowitz]]-Modell das Rendite-Risiko-Verhältnis. Auf langfristiger Basis wird damit prinzipiell eine höhere Rendite bei geringerem Risiko erzielt (siehe auch [[Portfoliotheorie]]).

== Verwendung in der Softwaretechnik ==

Ein '''Korrelationstest''' bezeichnet in der [[Softwaretechnik]] ein Verfahren, in dem nicht nur einzelne [[Parameter (Informatik)|Parameter]] einer [[Funktion (Programmierung)|Funktion]] auf Plausibilität (zum Beispiel in [[Datentyp]] oder [[Wertebereich]]) geprüft werden, sondern auch Kombinationen dieser Parameter berücksichtigt werden. Es ist möglich, dass zwar jeder Parameter für sich einen gültigen Wert besitzt, diese in Kombination jedoch ein fehlerhaftes Verhalten der zu testenden Funktion hervorrufen, nämlich wenn diese Parameter durch die Funktion '''korreliert''' werden.

Beispiel: Ein rechteckiges Objekt soll auf dem Bildschirm dargestellt werden. Hierzu existiert eine Funktion, die in den Parametern ''X'',''Y'',''SX'',''SY'' die Dimension des Rechtecks entgegennimmt.

* Parameter ''X'' gibt die X-Position der linken oberen Ecke an. Es muss geprüft werden, ob ''X'' im gültigen Anzeigebereich liegt.

* Parameter ''SX'' gibt die X-Kantenlänge (Breite des Rechteckes) an. Hier muss zunächst geprüft werden, ob ''SX'' die zulässige Anzeigebreite nicht überschreitet.

* Bei einem ''Korrelationstest'' wird nun zusätzlich geprüft ob, ''X + SX'' im gültigen Wertebereich liegt.

== Quantifizierung der Korrelation ==

Der Ausdruck Korrelation wird oft auf spezielle Weise auf den statistischen Zusammenhang zweier Ereignisse bezogen. Zur Quantifizierung der statistischen Korrelation dienen unter anderem der [[Korrelationskoeffizient]] oder – aus der Informationstheorie stammend – die [[Transinformation]] und die [[Kullback-Leibler Distanz]].

Hinweis/ Warnungen: 
*Fehler- und Entgleisungsmöglichkeiten: [[Kollinearität]]
*Vorsicht bei Korrekturformeln: [[Attenuitäts-Korrektur]]

''Siehe auch:'' [[Kovarianz]] , Wiktionary:[[wikt:Korrelation|Korrelation]]

== Weblinks ==
{{Wiktionary1|Korrelation}}
*Achtung bei der Interpretation: http://www.sgipt.org/wisms/statm/kor/kurkor.htm

[[Kategorie:Statistik]]
[[Kategorie:Wissenschaftstheorie]]

[[en:Correlation]]
[[fr:Corrélation (mathématiques)]]
[[it:Correlazione]]
[[nl:Correlatiecoëfficiënt]]
[[pl:Korelacja]]
[[su:Correlation]]