Verschil tussen gemiddeld, mediaan en modus

Gemiddelde versus mediaan vs. modus
 

Gemiddelde, mediaan en modus zijn de primaire maatregelen van centrale tendens gebruikt in beschrijvende statistieken. Ze zijn compleet verschillend van elkaar en de gevallen waarin ze worden gebruikt om de gegevens samen te vatten, zijn ook verschillend.

Gemiddelde

Het rekenkundig gemiddelde is de som van de gegevenswaarden gedeeld door het aantal gegevenswaarden, d.w.z..

 

Als de gegevens uit een steekproefruimte komen, wordt dit een steekproefgemiddelde genoemd (), wat een beschrijvende statistiek van het monster is. Hoewel dit de meest gebruikte beschrijvende maat is voor een steekproef, is het geen robuuste statistiek. Het is erg gevoelig voor uitschieters en oscillaties.

Beschouw bijvoorbeeld het gemiddelde inkomen van de burgers van een bepaalde stad. Aangezien alle gegevenswaarden worden opgeteld en vervolgens worden gedeeld, beïnvloedt het inkomen van een zeer rijke persoon het gemiddelde aanzienlijk. Daarom zijn de gemiddelde waarden niet altijd een goede weergave van de gegevens.

Ook varieert in het geval van een alternerend signaal de stroom die door een element loopt periodiek van de positieve richting naar de negatieve richting en vice versa. Als we de gemiddelde stroom nemen die door het element gaat in een enkele periode, geeft het een 0, wat betekent dat er geen stroom door het element is gegaan, wat uiteraard niet waar is. Daarom is ook in dit geval het rekenkundig gemiddelde geen goede maatregel.

Het rekenkundig gemiddelde is een goede indicator wanneer de gegevens gelijkmatig worden verdeeld. Voor een normale verdeling is het gemiddelde gelijk aan de modus en mediaan. Het heeft ook de laagste residuen bij het beschouwen van de root mean squared error; daarom de beste beschrijvende meetwaarde wanneer het nodig is om een ​​gegevensset voor een enkel getal weer te geven.

Mediaan

De waarden van het middelste gegevenspunt na het rangschikken van alle gegevenswaarden in oplopende volgorde is gedefinieerd als de mediaan van de gegevensset. Mediaan is het 2e kwartiel, 5e deciel en 50e percentiel.

• Als het aantal waarnemingen (gegevenspunten) oneven is, dan is de mediaan de waarneming precies in het midden van de geordende lijst.

• Als het aantal waarnemingen (gegevenspunten) gelijk is, dan is de mediaan het gemiddelde van de twee middelste waarnemingen in de geordende lijst.

Mediaan verdeelt de waarneming in twee groepen; d.w.z. een groep (50%) van waarden hoger en een groep (50%) van waarden lager dan de mediaan. Medianen worden specifiek gebruikt in scheve distributies en vertegenwoordigen gegevens die redelijk beter zijn dan het rekenkundig gemiddelde.

mode

Modus is het meest voorkomende getal in een reeks waarnemingen. De modus van een dataset wordt berekend door de frequentie van elk element in de set te vinden.

• Als er geen waarde meer dan één keer voorkomt, heeft de dataset geen modus.

• Anders is elke waarde die optreedt met de hoogste frequentie een modus van de dataset.

Er kan meer dan 1 modus bestaan ​​in een set; Daarom is modus geen unieke statistiek van een gegevensset. In een uniforme verdeling is er één modus. De modus van een discrete kansverdeling is het punt waar de kansmassafunctie het hoogste punt bereikt. Uitgaande van interpretaties van bovenaf, kunnen we dat zeggen globale maxima zijn modi.

Overweeg de toepassing van alle drie de metingen op de volgende dataset.

DATA: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15

Gemiddelde = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8.12

Mediaan = 9 (13e element)

Modus = 9 (frequentie van 9 = 5)

Wat is het verschil tussen gemiddeld, mediaan en modus?

• Rekenkundig gemiddelde is de som van de waarden (waarnemingen) gedeeld door het aantal waarnemingen. Het is geen robuuste statistiek en sterk afhankelijk van het normale verspreidingskarakter binnen de beschouwde distributie. Een enkele uitbijter kan een significante verschuiving van het gemiddelde veroorzaken, waardoor er relatief misleidende waarden worden verkregen. Het concept kan worden uitgebreid tot geometrisch gemiddelde, harmonisch gemiddelde, gewogen gemiddelde enzovoort.

• Mediaan is de middelste waarde van de reeks waarnemingen en deze wordt relatief minder beïnvloed door uitbijters. Het kan een goede schatting geven als de samenvattende statistiek in zeer scheve gevallen.

• Modus is de meest voorkomende waarnemingswaarden in de gegevensset. Als de verdeling positief scheef is, ligt de modus links naar de mediaan en, indien negatief scheef, ligt de modus precies bij de mediaan.

• Als het positief scheef is, is het gemiddelde gelijk aan de mediaan; als negatief verstoord middel links van de mediaan ligt.

• In de normale verdeling zijn alle drie, het gemiddelde, de modus en de mediaan gelijk.