Mathematik

Empirische Regel für Mittelwert, Median und Modus

Innerhalb von Datensätzen gibt es eine Vielzahl von beschreibenden Statistiken. Der Mittelwert, der Median und der Modus geben alle Maße für die Mitte der Daten an, berechnen diese jedoch auf unterschiedliche Weise:

  • Der Mittelwert wird berechnet, indem alle Datenwerte addiert und dann durch die Gesamtzahl der Werte dividiert werden.
  • Der Median wird berechnet, indem die Datenwerte in aufsteigender Reihenfolge aufgelistet und dann der mittlere Wert in der Liste ermittelt wird.
  • Der Modus wird berechnet, indem gezählt wird, wie oft jeder Wert auftritt. Der Wert, der mit der höchsten Frequenz auftritt, ist der Modus.

An der Oberfläche scheint es keinen Zusammenhang zwischen diesen drei Zahlen zu geben. Es stellt sich jedoch heraus, dass zwischen diesen zentralen Maßen ein empirischer Zusammenhang besteht.

 

Theoretisch vs. empirisch

Bevor wir fortfahren, ist es wichtig zu verstehen, wovon wir sprechen, wenn wir uns auf eine empirische Beziehung beziehen und diese mit theoretischen Studien kontrastieren. Einige Ergebnisse in der Statistik und in anderen Wissensgebieten können theoretisch aus früheren Aussagen abgeleitet werden. Wir beginnen mit dem, was wir wissen, und verwenden dann Logik, Mathematik und deduktives Denken, um zu sehen, wohin uns dies führt. Das Ergebnis ist eine direkte Folge anderer bekannter Tatsachen.

Im Gegensatz zur Theorie steht der empirische Weg des Wissenserwerbs. Anstatt aus bereits etablierten Prinzipien zu argumentieren, können wir die Welt um uns herum beobachten. Aus diesen Beobachtungen können wir dann eine Erklärung für das formulieren, was wir gesehen haben. Ein Großteil der Wissenschaft wird auf diese Weise betrieben. Experimente geben uns empirische Daten. Ziel ist es dann, eine Erklärung zu formulieren, die zu allen Daten passt.

 

Empirische Beziehung

In der Statistik gibt es eine Beziehung zwischen Mittelwert, Median und Modus, die empirisch basiert. Beobachtungen von unzähligen Datensätzen haben gezeigt, dass die Differenz zwischen dem Mittelwert und dem Modus meistens dreimal so groß ist wie die Differenz zwischen dem Mittelwert und dem Median. Diese Beziehung in Gleichungsform ist:

Mittelwert – Modus=3 (Mittelwert – Median).

 

Beispiel

Um die obige Beziehung zu Daten aus der realen Welt zu sehen, werfen wir einen Blick auf die US-Bundesstaaten im Jahr 2010. In Millionen waren die Populationen: Kalifornien – 36,4, Texas – 23,5, New York – 19,3, Florida – 18,1, Illinois – 12,8, Pennsylvania – 12,4, Ohio – 11,5, Michigan – 10,1, Georgia – 9,4, North Carolina – 8,9, New Jersey – 8,7, Virginia – 7,6, Massachusetts – 6,4, Washington – 6,4, Indiana – 6,3, Arizona – 6,2, Tennessee – 6,0, Missouri – 5,8, Maryland – 5,6, Wisconsin – 5,6, Minnesota – 5,2, Colorado – 4,8, Alabama – 4,6, South Carolina – 4,3, Louisiana – 4,3, Kentucky – 4,2, Oregon – 3,7, Oklahoma – 3,6, Connecticut – 3,5, Iowa – 3,0, Mississippi – 2,9, Arkansas – 2,8, Kansas – 2,8, Utah – 2,6, Nevada – 2,5, New Mexico – 2,0, West Virginia – 1,8, Nebraska – 1,8, Idaho – 1,5, Maine – 1,3, New Hampshire – 1,3, Hawaii – 1.3, Rhode Island – 1.1, Montana – .9, Delaware – .9, South Dakota – .8, Alaska – .7, North Dakota – .6, Vermont – .6, Wyoming – .5

Die Durchschnittsbevölkerung beträgt 6,0 Millionen. Die Durchschnittsbevölkerung beträgt 4,25 Millionen. Der Modus ist 1,3 Millionen. Nun werden wir die Unterschiede zu den oben genannten berechnen:

  • Mittelwert – Modus=6,0 Millionen – 1,3 Millionen=4,7 Millionen.
  • 3 (Mittelwert – Median)=3 (6,0 Millionen – 4,25 Millionen)=3 (1,75 Millionen)=5,25 Millionen.

Diese beiden Differenzzahlen stimmen zwar nicht genau überein, liegen jedoch relativ nahe beieinander.

 

Anwendung

Es gibt einige Anwendungen für die obige Formel. Angenommen, wir haben keine Liste von Datenwerten, kennen aber zwei der Mittelwerte, den Median oder den Modus. Die obige Formel könnte verwendet werden, um die dritte unbekannte Menge zu schätzen.

Wenn wir zum Beispiel wissen, dass wir einen Mittelwert von 10 haben, einen Modus von 4, wie hoch ist der Median unseres Datensatzes? Da der Mittelwert – Modus=3 (Mittelwert – Median) ist, können wir sagen, dass 10 – 4=3 (10 – Median). Durch eine Algebra sehen wir, dass 2=(10 – Median) ist, und daher ist der Median unserer Daten 8.

Eine andere Anwendung der obigen Formel ist die Berechnung der Schiefe. Da die Schiefe die Differenz zwischen dem Mittelwert und dem Modus misst, könnten wir stattdessen 3 (Mittelwert – Modus) berechnen. Um diese Größe dimensionslos zu machen, können wir sie durch die Standardabweichung dividieren, um ein alternatives Mittel zur Berechnung der Schiefe zu erhalten, als Momente in der Statistik zu verwenden .

 

Ein Wort der Vorsicht

Wie oben gesehen, ist das Obige keine exakte Beziehung. Stattdessen ist es eine gute Faustregel, ähnlich der der Bereichsregel. die eine ungefähre Verbindung zwischen der Standardabweichung und dem Bereich herstellt. Der Mittelwert, der Median und der Modus passen möglicherweise nicht genau in die obige empirische Beziehung, aber es besteht eine gute Chance, dass sie einigermaßen nahe beieinander liegen.

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.