Mathematik

Konfidenzintervall für einen Bevölkerungsanteil

Konfidenzintervalle können verwendet werden, um mehrere Populationsparameter zu schätzen. Eine Art von Parameter, die mithilfe von Inferenzstatistiken geschätzt werden kann, ist ein Bevölkerungsanteil. Zum Beispiel möchten wir vielleicht wissen, wie viel Prozent der US-Bevölkerung ein bestimmtes Gesetz unterstützen. Für diese Art von Frage müssen wir ein Konfidenzintervall finden.

In diesem Artikel werden wir sehen, wie ein Konfidenzintervall für einen Bevölkerungsanteil erstellt wird, und einige der dahinter stehenden Theorien untersuchen.

 

Gesamtrahmen

Wir beginnen mit einem Blick auf das Gesamtbild, bevor wir uns mit den Einzelheiten befassen. Die Art des Konfidenzintervalls, die wir berücksichtigen werden, hat folgende Form:

Schätzung +/- Fehlerquote

Dies bedeutet, dass wir zwei Zahlen bestimmen müssen. Diese Werte sind eine Schätzung für den gewünschten Parameter zusammen mit der Fehlerquote.

 

Bedingungen

Bevor Sie statistische Tests oder Verfahren durchführen, müssen Sie sicherstellen, dass alle Bedingungen erfüllt sind. Für ein Konfidenzintervall für einen Bevölkerungsanteil müssen wir sicherstellen, dass Folgendes gilt:

  • Wir haben eine einfache Zufallsstichprobe der Größe n aus einer großen Population
  • Unsere Personen wurden unabhängig voneinander ausgewählt.
  • In unserer Stichprobe gibt es mindestens 15 Erfolge und 15 Misserfolge.

Wenn der letzte Punkt nicht erfüllt ist, kann es möglich sein, unsere Stichprobe geringfügig anzupassen und ein Konfidenzintervall von plus vier zu verwenden. Im Folgenden wird davon ausgegangen, dass alle oben genannten Bedingungen erfüllt sind.

 

Stichproben- und Bevölkerungsanteile

Wir beginnen mit der Schätzung unseres Bevölkerungsanteils. So wie wir einen Stichprobenmittelwert verwenden, um einen Bevölkerungsdurchschnitt zu schätzen, verwenden wir einen Stichprobenanteil, um einen Bevölkerungsanteil zu schätzen. Der Bevölkerungsanteil ist ein unbekannter Parameter. Der Stichprobenanteil ist eine Statistik. Diese Statistik wird ermittelt, indem die Anzahl der Erfolge in unserer Stichprobe gezählt und dann durch die Gesamtzahl der Personen in der Stichprobe dividiert wird.

Der Bevölkerungsanteil wird mit p bezeichnet und ist selbsterklärend. Die Notation für den Stichprobenanteil ist etwas komplizierter. Wir bezeichnen einen Stichprobenanteil als p̂ und lesen dieses Symbol als „p-hat“, da es wie der Buchstabe p mit einem Hut oben aussieht .

Dies wird der erste Teil unseres Konfidenzintervalls. Die Schätzung von p ist p̂.

 

Stichprobenverteilung des Stichprobenanteils

Um die Formel für die Fehlergrenze zu bestimmen, müssen wir über die Stichprobenverteilung von p̂ nachdenken . Wir müssen den Mittelwert, die Standardabweichung und die bestimmte Verteilung kennen, mit der wir arbeiten.

Die Stichprobenverteilung von p̂ ist eine Binomialverteilung mit Erfolgswahrscheinlichkeit von p- und n- Versuchen. Diese Art von Zufallsvariablen hat einen Mittelwert von p und eine Standardabweichung von ( p (1 – p ) / n ) 0,5 . Hierbei gibt es zwei Probleme.

Das erste Problem ist, dass es sehr schwierig sein kann, mit einer Binomialverteilung zu arbeiten. Das Vorhandensein von Fakultäten kann zu einigen sehr großen Zahlen führen. Hier helfen uns die Bedingungen. Solange unsere Bedingungen erfüllt sind, können wir die Binomialverteilung mit der Standardnormalverteilung abschätzen.

Das zweite Problem ist, dass die Standardabweichung von in seiner Definition p verwendet . Der unbekannte Populationsparameter ist zu schätzen, indem derselbe Parameter als Fehlergrenze verwendet wird. Diese Zirkelschlussfolgerung ist ein Problem, das behoben werden muss.

Der Ausweg aus diesem Rätsel besteht darin, die Standardabweichung durch ihren Standardfehler zu ersetzen. Standardfehler basieren auf Statistiken, nicht auf Parametern. Ein Standardfehler wird verwendet, um eine Standardabweichung zu schätzen. Was diese Strategie lohnenswert macht, ist, dass wir den Wert des Parameters p nicht mehr kennen müssen .

 

Formel

Um den Standardfehler zu verwenden, ersetzen wir den unbekannten Parameter p durch die Statistik p̂. Das Ergebnis ist die folgende Formel für ein Konfidenzintervall für einen Bevölkerungsanteil:

p̂ +/- z * (p̂ (1 – p̂) / n ) 0,5 .

Hier wird der Wert von z * durch unser Konfidenzniveau C bestimmt.  Für die Standardnormalverteilung liegen genau C Prozent der Standardnormalverteilung zwischen -z * und z *. Übliche Werte für z * sind 1,645 für 90% Konfidenz und 1,96 für 95% Konfidenz.

 

Beispiel

Lassen Sie uns anhand eines Beispiels sehen, wie diese Methode funktioniert. Angenommen, wir möchten mit 95% iger Sicherheit wissen, wie viel Prozent der Wähler in einem Landkreis sich als demokratisch ausweisen. Wir führen eine einfache Zufallsstichprobe von 100 Personen in diesem Landkreis durch und stellen fest, dass 64 von ihnen sich als Demokraten identifizieren.

Wir sehen, dass alle Bedingungen erfüllt sind. Die Schätzung unseres Bevölkerungsanteils beträgt 64/100=0,64. Dies ist der Wert des Stichprobenanteils p̂ und der Mittelpunkt unseres Konfidenzintervalls.

Die Fehlerquote besteht aus zwei Teilen. Der erste ist z *. Wie gesagt, für 95% iges Vertrauen ist der Wert von z *=1,96.

Der andere Teil der Fehlerquote ergibt sich aus der Formel (p̂ (1 – p̂) / n ) 0,5 . Wir setzen p̂=0,64 und berechnen=den Standardfehler mit (0,64 (0,36) / 100) 0,5=0,048.

Wir multiplizieren diese beiden Zahlen miteinander und erhalten eine Fehlerquote von 0,09408. Das Endergebnis ist:

0,64 +/- 0,09408,

oder wir können dies als 54,592% auf 73,408% umschreiben. Wir sind daher zu 95% zuversichtlich, dass der wahre Bevölkerungsanteil der Demokraten irgendwo im Bereich dieser Prozentsätze liegt. Dies bedeutet, dass unsere Technik und Formel auf lange Sicht den Bevölkerungsanteil von 95% der Zeit erfassen wird.

 

Verwandte Ideen

Es gibt eine Reihe von Ideen und Themen, die mit dieser Art von Konfidenzintervall verbunden sind. Zum Beispiel könnten wir einen Hypothesentest durchführen, der sich auf den Wert des Bevölkerungsanteils bezieht. Wir könnten auch zwei Anteile aus zwei verschiedenen Populationen vergleichen.

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.