Standaarddeviatie versus gemiddeld
In beschrijvende en inferentiële statistiek worden verschillende indices gebruikt om een dataset te beschrijven die overeenkomt met zijn centrale neiging, dispersie en scheefheid. In statistische gevolgtrekking zijn deze algemeen bekend als schatters omdat ze de populatieparameterwaarden schatten.
Centrale tendens verwijst naar en lokaliseert het centrum van de verdeling van waarden. Gemiddelde, modus en mediaan zijn de meest gebruikte indices bij het beschrijven van de centrale tendens van een gegevensverzameling. Dispersie is de hoeveelheid verspreiding van gegevens vanuit het midden van de distributie. Bereik en standaarddeviatie zijn de meest gebruikte maten voor dispersie. De scheefheidcoëfficiënten van Pearson worden gebruikt om de scheefheid van een gegevensdistributie te beschrijven. Scheefheid verwijst hier naar de vraag of de gegevensset symmetrisch is rond het midden of niet en zo niet hoe scheef het is.
Wat is gemeen?
Gemiddelde is de meest gebruikte index van centrale tendentie. Gegeven een gegevensset wordt het gemiddelde berekend door de som van alle gegevenswaarden te nemen en deze vervolgens te delen door het aantal gegevens. De gewichten van 10 personen (in kilogram) worden bijvoorbeeld gemeten als 70, 62, 65, 72, 80, 70, 63, 72, 77 en 79. Dan kan het gemiddelde gewicht van de tien mensen (in kilogram) worden berekend berekend als volgt. Som van de gewichten is 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Gemiddelde = (som) / (aantal gegevens) = 710/10 = 71 (in kilogram).
Net als in dit specifieke voorbeeld is de gemiddelde waarde van een gegevensset mogelijk geen gegevenspunt van de set, maar is deze uniek voor een gegeven dataset. Gemiddelde heeft dezelfde eenheden als de originele gegevens. Daarom kan het worden gemarkeerd op dezelfde as als de gegevens en kan het worden gebruikt in vergelijkingen. Er is ook geen tekenbeperking voor het gemiddelde van een gegevensverzameling. Het kan negatief zijn, nul of positief, omdat de som van de gegevensverzamelingen negatief, nul of positief kan zijn.
Wat is standaarddeviatie?
Standaarddeviatie is de meest gebruikte spreidingsindex. Om de standaardafwijking te berekenen, worden eerst de afwijkingen van gegevenswaarden van het gemiddelde berekend. Het wortelvierkant van afwijkingen wordt de standaarddeviatie genoemd.
In het vorige voorbeeld zijn de respectieve afwijkingen van het gemiddelde (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 en (79-71) = 8. De som van vierkanten van afwijking is (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. De standaarddeviatie is √ (366/10) = 6.05 (in kilogram). Hieruit kan worden geconcludeerd dat de meerderheid van de gegevens in het interval 71 ± 6,05 ligt, op voorwaarde dat de gegevensverzameling niet sterk scheef staat, en het is inderdaad zo in dit specifieke voorbeeld.
Omdat de standaardafwijking dezelfde eenheden heeft als de oorspronkelijke gegevens, geeft dit ons een indicatie van de mate waarin de gegevens afwijken van het centrum; hoe groter de standaarddeviatie, hoe groter de spreiding. De standaardafwijking is ook een niet-negatieve waarde, ongeacht de aard van de gegevens in de gegevensverzameling.
Wat is het verschil tussen standaardafwijking en gemiddelde? • Standaardafwijking is een maat voor spreiding vanuit het midden, terwijl gemiddelde de locatie van het midden van een gegevensset meet. • Standaardafwijking is altijd een niet-negatieve waarde, maar gemiddelde kan elke reële waarde aannemen.
|