Mathematik

Steigung der Regressionslinie und Korrelationskoeffizient

Beim Studium der Statistik ist es oft wichtig, Verbindungen zwischen verschiedenen Themen herzustellen. Wir werden ein Beispiel dafür sehen, in dem die Steigung der Regressionslinie direkt mit dem Korrelationskoeffizienten zusammenhängt. Da diese Konzepte beide gerade Linien beinhalten, ist es nur natürlich, die Frage zu stellen: „Wie hängen der Korrelationskoeffizient und die Linie der kleinsten Quadrate zusammen?“

Zunächst werden wir einige Hintergrundinformationen zu diesen beiden Themen betrachten.

 

Details zur Korrelation

Es ist wichtig, sich an die Details zu erinnern, die sich auf den Korrelationskoeffizienten beziehen, der mit r bezeichnet ist . Diese Statistik wird verwendet, wenn wir quantitative Daten gepaart haben . Aus einem Streudiagramm gepaarter Daten können wir nach Trends in der Gesamtverteilung der Daten suchen. Einige gepaarte Daten weisen ein lineares oder geradliniges Muster auf. In der Praxis fallen die Daten jedoch nie genau auf eine gerade Linie.

Mehrere Personen, die dasselbe Streudiagramm gepaarter Daten betrachten, sind sich nicht einig darüber, wie nahe es an der Darstellung eines linearen Gesamttrends liegt. Schließlich können unsere Kriterien dafür etwas subjektiv sein. Die von uns verwendete Skala kann sich auch auf unsere Wahrnehmung der Daten auswirken. Aus diesen und weiteren Gründen benötigen wir eine Art objektives Maß, um festzustellen, wie nahe unsere gepaarten Daten an der Linearität liegen. Der Korrelationskoeffizient erreicht dies für uns.

Einige grundlegende Fakten zu r sind:

  • Der Wert von r liegt zwischen einer reellen Zahl von -1 bis 1.
  • Werte von r nahe 0 bedeuten, dass zwischen den Daten nur eine geringe bis keine lineare Beziehung besteht.
  • Werte von r nahe 1 implizieren, dass zwischen den Daten eine positive lineare Beziehung besteht. Dies bedeutet, dass mit zunehmendem x auch y zunimmt.
  • Werte von r nahe -1 implizieren, dass zwischen den Daten eine negative lineare Beziehung besteht. Dies bedeutet, dass mit zunehmendem x das y abnimmt.

 

Die Steigung der Linie der kleinsten Quadrate

Die letzten beiden Elemente in der obigen Liste weisen uns auf die Steigung der Linie der kleinsten Quadrate mit der besten Anpassung hin. Denken Sie daran, dass die Steigung einer Linie ein Maß dafür ist, wie viele Einheiten sie für jede Einheit, die wir nach rechts bewegen, nach oben oder unten bewegt. Manchmal wird dies als Anstieg der Linie geteilt durch den Lauf oder als Änderung der y- Werte geteilt durch die Änderung der x- Werte angegeben.

Im Allgemeinen haben gerade Linien Steigungen, die positiv, negativ oder null sind. Wenn wir unsere Regressionslinien der kleinsten Quadrate untersuchen und die entsprechenden Werte von r vergleichen würden, würden wir feststellen, dass jedes Mal, wenn unsere Daten einen negativen Korrelationskoeffizienten haben. die Steigung der Regressionslinie negativ ist. In ähnlicher Weise ist für jedes Mal, wenn wir einen positiven Korrelationskoeffizienten haben, die Steigung der Regressionslinie positiv.

Aus dieser Beobachtung sollte ersichtlich sein, dass definitiv ein Zusammenhang zwischen dem Vorzeichen des Korrelationskoeffizienten und der Steigung der Linie der kleinsten Quadrate besteht. Es bleibt zu erklären, warum dies wahr ist.

 

Die Formel für die Piste

Der Grund für die Verbindung zwischen dem Wert von r und der Steigung der Linie der kleinsten Quadrate hat mit der Formel zu tun, die uns die Steigung dieser Linie gibt. Für gepaarte Daten ( x, y ) bezeichnen wir die Standardabweichung der x- Daten mit s x und die Standardabweichung der y- Daten mit s y .

Die Formel für die Steigung a der Regressionslinie lautet:

  • a=r (s y / s x )

Bei der Berechnung einer Standardabweichung wird die positive Quadratwurzel einer nichtnegativen Zahl gezogen. Infolgedessen dürfen beide Standardabweichungen in der Formel für die Steigung nicht negativ sein. Wenn wir davon ausgehen, dass unsere Daten variieren, können wir die Möglichkeit außer Acht lassen, dass eine dieser Standardabweichungen Null ist. Daher ist das Vorzeichen des Korrelationskoeffizienten dasselbe wie das Vorzeichen der Steigung der Regressionslinie.

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.