Afwijking versus standaarddeviatie
Afwijking versus standaarddeviatie
In beschrijvende en inferentiële statistiek worden verschillende indices gebruikt om een dataset te beschrijven die overeenkomt met zijn centrale neiging, dispersie en scheefheid. In statistische gevolgtrekking zijn deze algemeen bekend als schatters omdat ze de populatieparameterwaarden schatten.
Dispersie is de maat voor de gegevensverspreiding rond het midden van de gegevensverzameling. Standaardafwijking is een van de meest gebruikte maten voor dispersie. De afwijkingen van elk gegevenspunt ten opzichte van het gemiddelde worden in aanmerking genomen bij het berekenen van de standaarddeviatie. Vandaar dat men kan stellen dat de standaarddeviatie samen met het gemiddelde een bijna voldoende beeld geeft van een dataset.
Beschouw de volgende dataset. De gewichten van 10 personen (in kilogram) worden gemeten als 70, 62, 65, 72, 80, 70, 63, 72, 77 en 79. Dan is het gemiddelde gewicht van de tien mensen (in kilogram) 71 (in kilogram) ).
Wat is afwijking?
In statistiek betekent afwijking de hoeveelheid waarmee een enkel gegevenspunt verschilt van een vaste waarde zoals het gemiddelde. Over het algemeen, laat k een vaste waarde en x zijn1,X2,..., xn duid een dataset aan. Dan is de afwijking van xj van k wordt gedefinieerd als (xj- k).
In de bovenstaande dataset zijn de respectieve afwijkingen van het gemiddelde bijvoorbeeld (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 en (79 - 71) = 8.
Wat is standaarddeviatie?
Wanneer gegevens van de hele populatie in aanmerking kunnen worden genomen (bijvoorbeeld in het geval van een telling), is het mogelijk om de standaarddeviatie van de populatie te berekenen. Om de standaarddeviatie van de populatie te berekenen, worden eerst de afwijkingen van gegevenswaarden van het populatiegemiddelde berekend. Het kwadratisch gemiddelde (kwadratisch gemiddelde) van afwijkingen wordt de standaarddeviatie van de populatie genoemd. In symbolen, σ = √ Σ (xik-μ)2 / n waarbij μ het populatiegemiddelde is en n de populatiegrootte is.
Wanneer gegevens uit een steekproef (van grootte n) worden gebruikt om de parameters van de populatie te schatten, wordt de standaarddeviatie van het monster berekend. Eerst worden de afwijkingen van gegevenswaarden van het steekproefgemiddelde berekend. Aangezien het steekproefgemiddelde wordt gebruikt in plaats van het populatiegemiddelde (wat onbekend is), is het nemen van het kwadratische gemiddelde niet geschikt. Om het gebruik van het steekproefgemiddelde te compenseren, wordt de som van kwadraten van afwijkingen gedeeld door (n-1) in plaats van n. De standaarddeviatie van het monster is de vierkantswortel hiervan. In wiskundige symbolen, S = √ Σ (xik-X)2 / (n-1), waarbij S de standaardafwijking van het monster is, ẍ is het steekproefgemiddelde en xi's zijn de gegevenspunten.
In de vorige dataset is de som van de kwadraten van de afwijking (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. De standaarddeviatie van de populatie is dus √ (366/10) = 6,05 (in kilogram). (Ervan uitgaande dat de beschouwde populatie bestaat uit de 10 personen van wie de gegevens zijn overgenomen).
Wat is het verschil tussen afwijking en standaarddeviatie? • Standaardafwijking is een statistische index en een schatter, maar afwijking is dat niet. • Standaardafwijking is een maat voor de spreiding van een gegevenscluster uit het centrum, terwijl afwijking verwijst naar de hoeveelheid waarmee een enkel gegevenspunt verschilt van een vaste waarde. |