Gemiddeld versus mediaan

Gemiddelde (of gemiddeld) en mediaan- zijn statistische termen die een enigszins vergelijkbare rol hebben in termen van het begrijpen van de algemene drang van een reeks statistische scores. Hoewel een gemiddelde van oudsher een populaire maatstaf voor een middelpunt in een monster is, heeft het het nadeel dat het wordt beïnvloed door een enkele waarde die te hoog of te laag is in vergelijking met de rest van het monster. Daarom wordt een mediaan soms als een betere maat voor een middelpunt genomen.

Vergelijkingstabel

Gemiddelde versus mediaan vergelijkingsgrafiek
GemiddeldeMediaan
Definitie Het gemiddelde is het rekenkundig gemiddelde van een reeks getallen of verdeling. De mediaan wordt beschreven als de numerieke waarde die de hogere helft van een steekproef, een populatie of een waarschijnlijkheidsverdeling van de onderste helft scheidt.
toepasselijkheid Het gemiddelde wordt gebruikt voor normale distributies. De mediaan wordt over het algemeen gebruikt voor scheve verdelingen.
Relevantie voor de dataset Het gemiddelde is geen robuust hulpmiddel omdat het grotendeels wordt beïnvloed door uitbijters. De mediaan is beter geschikt voor scheve verdelingen om op centrale neiging af te leiden, omdat het veel robuuster en verstandiger is.
Hoe te berekenen Een gemiddelde wordt berekend door alle waarden bij elkaar op te tellen en die score te delen door het aantal waarden. De mediaan is het getal dat precies in het midden van de reeks waarden wordt gevonden. Een mediaan kan worden berekend door alle getallen in stijgende volgorde weer te geven en vervolgens het nummer in het midden van die verdeling te lokaliseren.

Inhoud: gemiddeld versus mediaan

  • 1 Definities van gemiddelde en mediaan
  • 2 Hoe te berekenen
    • 2.1 Voorbeeld
  • 3 Nadelen van rekenkundige gemiddelden en medianen
  • 4 Andere soorten middelen
    • 4.1 Geometrisch gemiddelde
    • 4.2 Harmonisch gemiddelde
    • 4.3 Pythagoras betekent
  • 5 Andere betekenissen van de woorden
  • 6 Referenties

Definities van gemiddelde en mediaan

In de wiskunde en statistiek, het gemiddelde of de rekenkundig gemiddelde van een lijst met getallen is de som van de volledige lijst gedeeld door het aantal items in de lijst. Wanneer we naar symmetrische verdelingen kijken, is het gemiddelde waarschijnlijk de beste maatstaf om tot centrale tendens te komen. In kansrekening en statistiek, a mediaan- is dat getal dat de hogere helft van een steekproef, een populatie of een waarschijnlijkheidsverdeling van de onderste helft scheidt.

Hoe te berekenen

De Gemiddelde of gemiddeld is waarschijnlijk de meest gebruikte methode om centrale tendentie te beschrijven. Een gemiddelde wordt berekend door alle waarden bij elkaar op te tellen en die score te delen door het aantal waarden. De rekenkundig gemiddelde van een monster is de som van de gesamplede waarden gedeeld door het aantal items in de steekproef:

De Mediaan is het getal dat precies in het midden van de reeks waarden wordt gevonden. Een mediaan kan worden berekend door alle getallen in stijgende volgorde weer te geven en vervolgens het nummer in het midden van die verdeling te lokaliseren. Dit is van toepassing op een lijst met oneven nummers; in het geval van een even aantal waarnemingen is er geen enkele middelste waarde, dus het is gebruikelijk om het gemiddelde te nemen van de twee middelste waarden.

Voorbeeld

Laten we zeggen dat er negen studenten in een klas zitten met de volgende scores op een toets: 2, 4, 5, 7, 8, 10, 12, 13, 83. In dit geval de gemiddelde score (of de gemiddelde) is de som van alle scores gedeeld door negen. Dit komt overeen met 144/9 = 16. Merk op dat hoewel 16 het rekenkundig gemiddelde is, het wordt vervormd door de ongebruikelijk hoge score van 83 in vergelijking met andere scores. Bijna alle scores van de studenten zijn beneden het gemiddelde. Daarom is het gemiddelde in dit geval geen goede vertegenwoordiger van de algemene drang van dit monster.

De mediaan-, aan de andere kant, is de waarde zodanig dat de helft van de scores erboven en de helft van de scores hieronder zijn. Dus in dit voorbeeld is de mediaan 8. Er zijn vier scores hieronder en vier boven de waarde 8. Dus 8 staat voor het middelpunt of de centrale tendens van het monster.

Vergelijking van gemiddelde, mediaan en modus van twee lognormale verdelingen met verschillende scheefheid.

Nadelen van rekenkundige gemiddelden en medianen

Mean is geen robuuste statistische tool omdat het niet op alle distributies kan worden toegepast, maar het eenvoudig de meest gebruikte statistische tool is om de centrale tendens te ontlenen. De reden dat gemiddelde niet op alle distributies kan worden toegepast, is omdat het te veel wordt beïnvloed door waarden in de steekproef die te klein zijn om te groot.

Het nadeel van mediaan is dat het theoretisch moeilijk te behandelen is. Er is geen eenvoudige wiskundige formule om de mediaan te berekenen.

Andere soorten middelen

Er zijn veel manieren om de centrale tendens, of het gemiddelde, van een reeks waarden te bepalen. Het hierboven besproken gemiddelde is technisch het rekenkundig gemiddelde en is de meest gebruikte statistiek voor het gemiddelde. Er zijn andere soorten middelen:

Geometrisch gemiddelde

Het geometrische gemiddelde wordt gedefinieerd als het nde wortel van het product van n getallen, d.w.z. voor een reeks getallen X1,X2,... ,Xn, het geometrische gemiddelde is gedefinieerd als

Geometrische middelen zijn beter dan rekenkundige middelen om proportionele groei te beschrijven. Een goede toepassing voor geometrisch gemiddelde is bijvoorbeeld het berekenen van de samengestelde jaarlijkse groeisnelheid (CAGR).

Harmonisch gemiddelde

Het harmonische gemiddelde is het omgekeerde van het rekenkundig gemiddelde van de reciprocals. Het harmonische gemiddelde H van de positieve reële cijfers X1,X2,... ,Xn is

Een goede toepassing van harmonische middelen is het middelen van veelvouden. Het is bijvoorbeeld beter om gewogen harmonisch gemiddelde te gebruiken bij het berekenen van de gemiddelde koers-winstverhouding (P / E). Als P / E-verhoudingen worden gemiddeld met behulp van een gewogen rekenkundig gemiddelde, krijgen hoge gegevenspunten oneven grotere gewichten dan lage gegevenspunten.

Pythagoras betekent

Het rekenkundig gemiddelde, het geometrische gemiddelde en het harmonische gemiddelde vormen samen een reeks middelen die de middelen van Pythagoras worden genoemd. Voor elke getallenreeks is het harmonische gemiddelde altijd de kleinste van alle Pythagorische gemiddelden, en het rekenkundig gemiddelde is altijd het grootste van de 3 gemiddelden. d.w.z. Harmonisch gemiddelde ≤ Geometrisch gemiddelde ≤ rekenkundig gemiddelde.

Andere betekenissen van de woorden

Gemiddelde kan worden gebruikt als een beeldspraak en bevat een literaire referentie. Het wordt ook gebruikt om slecht te impliceren of niet groot te zijn. Mediaan, in een geometrische referentie, is een rechte lijn die van een punt in de driehoek naar het midden van de andere kant loopt.

Referenties

  • wikipedia: Mean
  • wikipedia: Median
  • Modi, medianen en middelen: een verenigend perspectief
  • Pythagorean betekent