Mathematik

Wie berechnet man den Korrelationskoeffizienten?

Beim Betrachten eines Streudiagramms sind viele Fragen zu stellen. Eine der häufigsten Fragen ist die Frage, wie gut sich eine gerade Linie den Daten annähert. Um dies zu beantworten, gibt es eine beschreibende Statistik, die als Korrelationskoeffizient bezeichnet wird. Wir werden sehen, wie diese Statistik berechnet wird.

 

Der Korrelationskoeffizient

Der mit r bezeichnete Korrelationskoeffizient gibt an , wie genau Daten in einem Streudiagramm entlang einer geraden Linie fallen. Je näher der Absolutwert von r an eins liegt, desto besser werden die Daten durch eine lineare Gleichung beschrieben. Wenn r=1 oder r=-1 ist, ist der Datensatz perfekt ausgerichtet. Datensätze mit Werten von r nahe Null zeigen wenig bis keine geradlinige Beziehung.

Aufgrund der langwierigen Berechnungen ist es am besten, r mit einem Taschenrechner oder einer Statistiksoftware zu berechnen. Es lohnt sich jedoch immer zu wissen, was Ihr Rechner beim Rechnen tut. Was folgt, ist ein Prozess zum Berechnen des Korrelationskoeffizienten hauptsächlich von Hand mit einem Rechner, der für die routinemäßigen arithmetischen Schritte verwendet wird.

 

Schritte zur Berechnung von r

Wir beginnen mit der Auflistung der Schritte zur Berechnung des Korrelationskoeffizienten. Die Daten, mit denen wir arbeiten, sind gepaarte Daten. von denen jedes Paar mit ( x i , y i ) bezeichnet wird.

  1. Wir beginnen mit einigen vorläufigen Berechnungen. Die Mengen aus diesen Berechnungen werden in den folgenden Schritten unserer Berechnung von r verwendet :
    1. Berechnen Sie x̄, den Mittelwert aller ersten Koordinaten der Daten x i .
    2. Berechnen Sie ȳ, den Mittelwert aller zweiten Koordinaten der Daten
    3. y i .
    4. Berechnen Sie s x die Standardabweichung der Stichprobe aller ersten Koordinaten der Daten x i .
    5. Berechnen Sie s y die Stichprobenstandardabweichung aller zweiten Koordinaten der Daten y i .
  2. Verwenden Sie die Formel (z x ) i=( x i – x̄) / s x und berechnen Sie für jedes x i einen standardisierten Wert .
  3. Verwenden Sie die Formel (z y ) i=( y i – ȳ) / s y und berechnen Sie für jedes y i einen standardisierten Wert .
  4. Multiplizieren Sie entsprechende standardisierte Werte: (z x ) i (z y ) i
  5. Fügen Sie die Produkte aus dem letzten Schritt zusammen.
  6. Teilen Sie die Summe aus dem vorherigen Schritt durch n – 1, wobei n die Gesamtzahl der Punkte in unserem Satz gepaarter Daten ist. Das Ergebnis all dessen ist der Korrelationskoeffizient r .

Dieser Prozess ist nicht schwer und jeder Schritt ist ziemlich routinemäßig, aber die Erfassung all dieser Schritte ist ziemlich aufwendig. Die Berechnung der Standardabweichung allein ist langwierig genug. Die Berechnung des Korrelationskoeffizienten beinhaltet jedoch nicht nur zwei Standardabweichungen, sondern eine Vielzahl anderer Operationen.

 

Ein Beispiel

Um genau zu sehen, wie der Wert von r erhalten wird, sehen wir uns ein Beispiel an. Auch hier ist es wichtig zu beachten, dass wir für praktische Anwendungen unseren Taschenrechner oder unsere Statistiksoftware verwenden möchten, um r für uns zu berechnen .

Wir beginnen mit einer Auflistung gepaarter Daten: (1, 1), (2, 3), (4, 5), (5,7). Der Mittelwert der x- Werte, der Mittelwert von 1, 2, 4 und 5 ist x̄=3. Wir haben auch ȳ=4. Die Standardabweichung der

x- Werte sind s x=1,83 und s y=2,58. Die folgende Tabelle fasst die anderen für r erforderlichen Berechnungen zusammen . Die Summe der Produkte in der Spalte ganz rechts beträgt 2,969848. Da es insgesamt vier Punkte und 4 – 1=3 gibt, teilen wir die Summe der Produkte durch 3. Dies ergibt einen Korrelationskoeffizienten von r=2,969848 / 3=0,989949.

 

Tabelle für ein Beispiel zur Berechnung des Korrelationskoeffizienten

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.