Mathematik

So finden Sie Freiheitsgrade in der Statistik

Bei vielen statistischen Inferenzproblemen müssen wir die Anzahl der Freiheitsgrade ermitteln. Die Anzahl der Freiheitsgrade wählt eine einzige Wahrscheinlichkeitsverteilung aus unendlich vielen aus. Dieser Schritt ist ein oft übersehener , aber entscheidendes Detail sowohl in der Berechnung der Vertrauensintervalle und die Funktionsweise von Hypothesentests .

Es gibt keine einzige allgemeine Formel für die Anzahl der Freiheitsgrade. Es gibt jedoch spezifische Formeln, die für jede Art von Prozedur in der Inferenzstatistik verwendet werden. Mit anderen Worten, die Umgebung, in der wir arbeiten, bestimmt die Anzahl der Freiheitsgrade. Was folgt, ist eine unvollständige Liste einiger der häufigsten Inferenzverfahren zusammen mit der Anzahl der Freiheitsgrade, die in jeder Situation verwendet werden.

 

Standardnormalverteilung

Verfahren zur Standardnormalverteilung  werden der Vollständigkeit halber und zur Beseitigung einiger Missverständnisse aufgeführt. Diese Verfahren erfordern nicht, dass wir die Anzahl der Freiheitsgrade ermitteln. Der Grund dafür ist, dass es eine einzige Standardnormalverteilung gibt. Diese Arten von Verfahren umfassen solche, an denen ein Bevölkerungsmittel beteiligt ist, wenn die Populationsstandardabweichung bereits bekannt ist, sowie Verfahren, die Bevölkerungsanteile betreffen.

 

Ein Beispiel T-Verfahren

Manchmal erfordert die statistische Praxis, dass wir die T-Verteilung des Schülers verwenden. Bei diesen Verfahren, z. B. bei Verfahren mit einem Populationsmittelwert mit unbekannter Populationsstandardabweichung, ist die Anzahl der Freiheitsgrade um eins geringer als die Stichprobengröße. Wenn also die Stichprobengröße n ist , gibt es n – 1 Freiheitsgrade.

 

T Prozeduren mit gepaarten Daten

Oft ist es sinnvoll, Daten als gepaart zu behandeln. Die Paarung wird typischerweise aufgrund einer Verbindung zwischen dem ersten und dem zweiten Wert in unserem Paar durchgeführt. Oft haben wir uns vor und nach den Messungen gepaart. Unsere Stichprobe gepaarter Daten ist nicht unabhängig. Der Unterschied zwischen jedem Paar ist jedoch unabhängig. Wenn also die Stichprobe insgesamt n Paare von Datenpunkten hat (für insgesamt 2 n Werte), gibt es n – 1 Freiheitsgrade.

 

T Verfahren für zwei unabhängige Populationen

Für diese Art von Problemen verwenden wir immer noch eine T-Verteilung. Diesmal gibt es eine Stichprobe aus jeder unserer Populationen. Obwohl es vorzuziehen ist, dass diese beiden Stichproben dieselbe Größe haben, ist dies für unsere statistischen Verfahren nicht erforderlich. Somit können wir zwei Stichproben der Größe n 1 und n 2 haben . Es gibt zwei Möglichkeiten, die Anzahl der Freiheitsgrade zu bestimmen. Die genauere Methode ist die Verwendung der Welch-Formel, einer rechenintensiven Formel, die die Stichprobengrößen und Stichprobenstandardabweichungen umfasst. Ein anderer Ansatz, der als konservative Näherung bezeichnet wird, kann verwendet werden, um die Freiheitsgrade schnell abzuschätzen. Dies ist einfach die kleinere der beiden Zahlen n 1 – 1 und n 2 – 1.

 

Chi-Platz für die Unabhängigkeit

Eine Verwendung des Chi-Quadrat-Tests besteht darin, festzustellen, ob zwei kategoriale Variablen mit jeweils mehreren Ebenen unabhängig voneinander sind. Die Informationen zu diesen Variablen werden in einer Zwei-Wege-Tabelle mit r Zeilen und c Spalten protokolliert . Die Anzahl der Freiheitsgrade ist das Produkt ( r – 1) ( c – 1).

 

Chi-Quadrat-Passgenauigkeit

Die Chi-Quadrat-Anpassungsgüte beginnt mit einer einzelnen kategorialen Variablen mit insgesamt n Ebenen. Wir testen die Hypothese, dass diese Variable mit einem vorgegebenen Modell übereinstimmt. Die Anzahl der Freiheitsgrade ist eins weniger als die Anzahl der Ebenen. Mit anderen Worten, es gibt n – 1 Freiheitsgrade.

 

Ein Faktor ANOVA

Eine Faktoranalyse der Varianz. ANOVA. ermöglicht es uns, Vergleiche zwischen mehreren Gruppen anzustellen, wodurch die Notwendigkeit mehrerer paarweiser Hypothesentests entfällt. Da der Test erfordert, dass wir sowohl die Variation zwischen mehreren Gruppen als auch die Variation innerhalb jeder Gruppe messen, erhalten wir zwei Freiheitsgrade. Die F-Statistik. die für eine Faktor-ANOVA verwendet wird, ist ein Bruchteil. Der Zähler und der Nenner haben jeweils Freiheitsgrade. Sei c die Anzahl der Gruppen und n die Gesamtzahl der Datenwerte. Die Anzahl der Freiheitsgrade für den Zähler ist eins weniger als die Anzahl der Gruppen oder c – 1. Die Anzahl der Freiheitsgrade für den Nenner ist die Gesamtzahl der Datenwerte abzüglich der Anzahl der Gruppen oder nc .

Es ist klar, dass wir sehr vorsichtig sein müssen, um zu wissen, mit welchem ​​Inferenzverfahren wir arbeiten. Dieses Wissen informiert uns über die richtige Anzahl von Freiheitsgraden.

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.