Mathematik

Freiheitsgrade für die Unabhängigkeit in der Zwei-Wege-Tabelle

Die Anzahl der Freiheitsgrade für die Unabhängigkeit zweier kategorialer Variablen wird durch eine einfache Formel angegeben: ( r – 1) ( c – 1). Hier ist r die Anzahl der Zeilen und c die Anzahl der Spalten in der Zwei-Wege-Tabelle der Werte der kategorialen Variablen. Lesen Sie weiter, um mehr über dieses Thema zu erfahren und zu verstehen, warum diese Formel die richtige Zahl angibt.

 

Hintergrund

Ein Schritt im Prozess vieler Hypothesentests ist die Bestimmung der Anzahl der Freiheitsgrade. Diese Zahl ist wichtig, da für Wahrscheinlichkeitsverteilungen. an denen eine Verteilungsfamilie beteiligt ist, wie z. B. die Chi-Quadrat-Verteilung, die Anzahl der Freiheitsgrade die genaue Verteilung aus der Familie festlegt, die wir in unserem Hypothesentest verwenden sollten.

Freiheitsgrade repräsentieren die Anzahl der freien Entscheidungen, die wir in einer bestimmten Situation treffen können. Einer der Hypothesentests, bei denen wir die Freiheitsgrade bestimmen müssen, ist der Chi-Quadrat- Test für die Unabhängigkeit zweier kategorialer Variablen.

 

Unabhängigkeitstests und Zwei-Wege-Tabellen

Der Chi-Quadrat-Test für die Unabhängigkeit erfordert, dass wir eine Zwei-Wege-Tabelle erstellen, die auch als Kontingenztabelle bezeichnet wird. Dieser Tabellentyp hat r Zeilen und c Spalten, die die r Ebenen einer kategorialen Variablen und die c Ebenen der anderen kategorialen Variablen darstellen. Wenn wir also die Zeile und Spalte, in der wir Summen aufzeichnen, nicht zählen, enthält die Zwei-Wege-Tabelle insgesamt RC- Zellen.

Der Chi-Quadrat-Test für die Unabhängigkeit ermöglicht es uns, die Hypothese zu testen, dass die kategorialen Variablen unabhängig voneinander sind. Wie oben erwähnt, geben uns die r Zeilen und c Spalten in der Tabelle ( r – 1) ( c – 1) Freiheitsgrade. Es ist jedoch möglicherweise nicht sofort klar, warum dies die richtige Anzahl von Freiheitsgraden ist.

 

Die Anzahl der Freiheitsgrade

Um zu sehen, warum ( r – 1) ( c – 1) die richtige Zahl ist, werden wir diese Situation genauer untersuchen. Angenommen, wir kennen die Grenzsummen für jede Ebene unserer kategorialen Variablen. Mit anderen Worten, wir kennen die Summe für jede Zeile und die Summe für jede Spalte. In der ersten Zeile befinden sich c Spalten in unserer Tabelle, also c Zellen. Sobald wir die Werte aller bis auf eine dieser Zellen kennen, ist es ein einfaches Algebra-Problem, den Wert der verbleibenden Zelle zu bestimmen, da wir die Summe aller Zellen kennen. Wenn wir diese Zellen unserer Tabelle ausfüllen würden, könnten wir c – 1 von ihnen frei eingeben , aber dann wird die verbleibende Zelle durch die Summe der Zeilen bestimmt. Somit gibt es c – 1 Freiheitsgrade für die erste Reihe.

Wir fahren auf diese Weise für die nächste Reihe fort, und es gibt wieder c – 1 Freiheitsgrade. Dieser Prozess wird fortgesetzt, bis wir zur vorletzten Zeile gelangen. Jede der Zeilen mit Ausnahme der letzten trägt c – 1 Freiheitsgrade zur Gesamtsumme bei. Wenn wir alle bis auf die letzte Zeile haben, können wir, da wir die Spaltensumme kennen, alle Einträge der letzten Zeile bestimmen. Dies gibt uns r – 1 Zeilen mit jeweils c – 1 Freiheitsgraden für insgesamt ( r – 1) ( c – 1) Freiheitsgrade.

 

Beispiel

Wir sehen dies anhand des folgenden Beispiels. Angenommen, wir haben eine Zwei-Wege-Tabelle mit zwei kategorialen Variablen. Eine Variable hat drei Ebenen und die andere zwei. Angenommen, wir kennen die Zeilen- und Spaltensummen für diese Tabelle:

Die Formel sagt voraus, dass es (3-1) (2-1)=2 Freiheitsgrade gibt. Wir sehen dies wie folgt. Angenommen, wir füllen die obere linke Zelle mit der Nummer 80 aus. Dadurch wird automatisch die gesamte erste Zeile der Einträge bestimmt:

Wenn wir nun wissen, dass der erste Eintrag in der zweiten Zeile 50 ist, wird der Rest der Tabelle ausgefüllt, da wir die Summe jeder Zeile und Spalte kennen:

Die Tabelle ist vollständig ausgefüllt, aber wir hatten nur zwei freie Entscheidungen. Sobald diese Werte bekannt waren, wurde der Rest der Tabelle vollständig bestimmt.

Obwohl wir normalerweise nicht wissen müssen, warum es so viele Freiheitsgrade gibt, ist es gut zu wissen, dass wir das Konzept der Freiheitsgrade wirklich nur auf eine neue Situation anwenden.

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.