Bevolking versus standaardafwijking van steekproef
In de statistieken worden verschillende indices gebruikt om een dataset te beschrijven die overeenkomt met zijn centrale neiging, dispersie en scheefheid. Standaardafwijking is een van de meest voorkomende maten van spreiding van gegevens uit het midden van de gegevensverzameling.
Vanwege praktische problemen zal het niet mogelijk zijn om gegevens uit de hele populatie te gebruiken wanneer een hypothese wordt getest. Daarom gebruiken we gegevenswaarden uit steekproeven om conclusies te trekken over de populatie. In een dergelijke situatie worden deze schattingen genoemd omdat ze de populatieparameterwaarden schatten.
Het is uiterst belangrijk om onbevooroordeelde schatters te gebruiken in afleiding. Een schatter is onbevooroordeeld als de verwachte waarde van die schatter gelijk is aan de populatieparameter. We gebruiken het steekproefgemiddelde bijvoorbeeld als een zuivere schatter voor het populatiegemiddelde. (Wiskundig gezien kan worden aangetoond dat de verwachte waarde van het steekproefgemiddelde gelijk is aan het populatiegemiddelde). In het geval van het schatten van de standaardafwijking van de populatie, is de standaarddeviatie van het monster ook een zuivere schatter.
Wat is standaardafwijking van de populatie?
Wanneer gegevens van de hele populatie ter verantwoording worden geroepen (bijvoorbeeld in het geval van een telling), is het mogelijk om de standaarddeviatie van de populatie te berekenen. Om de standaarddeviatie van de populatie te berekenen, worden eerst de afwijkingen van gegevenswaarden van het populatiegemiddelde berekend. Het kwadratisch gemiddelde (kwadratisch gemiddelde) van afwijkingen wordt de standaarddeviatie van de populatie genoemd.
In een klas van 10 studenten kunnen gegevens over de studenten gemakkelijk worden verzameld. Als een hypothese op deze populatie van studenten wordt getest, is het niet nodig om steekproefwaarden te gebruiken. De gewichten van de 10 studenten (in kilogram) worden bijvoorbeeld gemeten als 70, 62, 65, 72, 80, 70, 63, 72, 77 en 79. Dan is het gemiddelde gewicht van de tien mensen (in kilogram) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, wat 71 (in kilogram) is. Dit is het populatiegemiddelde.
Om nu de standaardafwijking van de populatie te berekenen, berekenen we afwijkingen van het gemiddelde. De respectieve afwijkingen van het gemiddelde zijn (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 en (79 - 71) = 8. De som van de kwadraten van afwijking is ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. De standaarddeviatie van de populatie is √ (366/10) = 6.05 (in kilogram). 71 is het exacte gemiddelde gewicht van de studenten van de klas en 6,05 is de exacte standaardafwijking van het gewicht van 71.
Wat is standaardafwijking van het monster?
Wanneer gegevens uit een steekproef (van grootte n) worden gebruikt om de parameters van de populatie te schatten, wordt de standaarddeviatie van het monster berekend. Eerst worden de afwijkingen van gegevenswaarden van het steekproefgemiddelde berekend. Aangezien het steekproefgemiddelde wordt gebruikt in plaats van het populatiegemiddelde (wat onbekend is), is het nemen van het kwadratische gemiddelde niet geschikt. Om het gebruik van het steekproefgemiddelde te compenseren, wordt de som van kwadraten van afwijkingen gedeeld door (n-1) in plaats van n. De standaarddeviatie van het monster is de vierkantswortel hiervan. In wiskundige symbolen, S = √ Σ (xik-X)2 / (n-1), waarbij S de standaardafwijking van het monster is, ẍ is het steekproefgemiddelde en xik's zijn de gegevenspunten.
Stel nu dat de populatie in het vorige voorbeeld de leerlingen van de hele school is. Dan zal de klas slechts een voorbeeld zijn. Als dit monster bij de schatting wordt gebruikt, is de standaarddeviatie van het monster √ (366/9) = 6,38 (in kilogram), aangezien 366 is gedeeld door 9 in plaats van 10 (de steekproefomvang). Het feit om waar te nemen is dat dit niet gegarandeerd de exacte standaardafwijkingswaarde van de populatie is. Het is slechts een schatting ervoor.
Wat is het verschil tussen standaardafwijking van de populatie en standaardafwijking van het monster? • Standaardafwijking van de populatie is de exacte parameterwaarde die wordt gebruikt om de spreiding uit het midden te meten, terwijl de standaardafwijking van het monster een zuivere schatter is. • Standaardafwijking van de populatie wordt berekend wanneer alle gegevens met betrekking tot elk individu van de populatie bekend zijn. Anders wordt de standaarddeviatie van het monster berekend. • Standaardafwijking van de populatie wordt gegeven door σ = √ Σ (xi-μ)2/ n waarbij μ het populatiegemiddelde is en n de populatiegrootte is, maar de standaarddeviatie van het monster wordt gegeven door S = √ Σ (xi-ẍ)2 / (n-1) waarbij ẍ het steekproefgemiddelde is en n de steekproefomvang is.
|