Verschil tussen steekproefvariantie en populatievariantie

Uitleg

In Statistieken verwijst de term steekproef naar de selectie van een deel van statistische statistische gegevens met het doel relevante informatie over het geheel te verkrijgen. Het geheel of de gehele statistische informatie over een bepaald karakter van alle leden waarop het onderzoek betrekking heeft, wordt 'populatie' of 'universum' genoemd. (Das, N.G., 2010). Het geselecteerde deel van de populatie dat wordt gebruikt om de kenmerken van de populatie of het universum te verkrijgen, wordt aangeduid als 'steekproef'. Er wordt verondersteld dat de populatie bestaat uit individuele eenheden of leden, en enkele van de eenheden zijn opgenomen in de steekproef. Het totale aantal eenheden van de populatie wordt de populatiegrootte genoemd en die van het monster wordt de steekproefomvang genoemd. Bevolking en steekproef kunnen eindig of oneindig zijn en op dezelfde manier kunnen ze existent of hypothetisch zijn.

variantie: Variantie is een numerieke waarde die laat zien hoe breed de individuele cijfers in een set gegevens zich over het gemiddelde verdelen. Dat is hoe ver elk getal van het gemiddelde en dus van elkaar verwijderd is. Een variatie van nulwaarde betekent dat alle gegevens identiek zijn. Meer de variantie, meer zijn de waarden verspreid over het gemiddelde, dus van elkaar. Minder de variantie, minder zijn de waarden verspreid over het gemiddelde, dus van elkaar, en de variantie kan niet negatief zijn.

Verschil tussen populatievariantie en steekproefvariantie

Het belangrijkste verschil tussen populatievariantie en steekproefvariantie heeft betrekking op de variantieberekening. Variantie wordt in vijf stappen berekend. Eerste gemiddelde wordt berekend, vervolgens berekenen we afwijkingen van het gemiddelde en ten derde worden de afwijkingen gekwadrateerd, ten vierde worden de gekwadrateerde afwijkingen opgeteld en uiteindelijk wordt deze som gedeeld door het aantal items waarvoor de variantie wordt berekend. Dus variantie = Σ (xi-x -) / n. Waar xi = ith. Getal, x- = gemiddelde en n = aantal items ...

Wanneer de variantie moet worden berekend uit bevolkingsgegevens, is n gelijk aan het aantal items. Dus als de variantie in de bloeddruk van alle 1000 mensen moet worden berekend op basis van gegevens over de bloeddruk van alle 1000 mensen, dan is n = 1000. Wanneer de variantie echter wordt berekend op basis van steekproefgegevens 1 moet deze worden afgetrokken van n voordat de som van de gekwadrateerde afwijkingen. Dus in het bovenstaande voorbeeld als de steekproefgegevens uit 100 items bestaan, is de noemer 100 - 1 = 99.

Als gevolg hiervan is de variantiewaarde die wordt berekend op basis van steekproefgegevens hoger dan de waarde die kon worden gevonden door bevolkingsgegevens te gebruiken. De logica om dat te doen is om ons gebrek aan informatie over de bevolkingsgegevens te compenseren. Het is onmogelijk om variantie van hoogten in mensen te vinden, voor ons absoluut gebrek aan informatie over hoogten van alle levende mensen, niet om over de toekomst te praten. Zelfs als we één gematigd voorbeeld nemen, zoals populatiegegevens over hoogten van alle levende mannen in de VS, is het fysiek mogelijk, maar de kosten en tijd die hiermee gemoeid zijn, zouden het doel van de berekening verslaan. Dit is de reden dat de steekproefgegevens voor de meeste statistische doeleinden worden genomen, en dit gaat gepaard met een gebrek aan informatie over de meerderheid van de gegevens. Om dit te compenseren, zijn de variantie- en standaardafwijking, die gekwadrateerde variantie is, hoger in het geval van steekproefgegevens dan variantie van bevolkingsgegevens.

Dit fungeert als een automatisch schild voor de analisten en besluitvormers. De logica is van toepassing op beslissingen over kapitaalbegroting, persoonlijke en zakelijke financiering, constructie, verkeersbeheer en vele toepasselijke velden. Dit helpt de stakeholder om aan de veilige kant te blijven tijdens het nemen van een beslissing of voor andere gevolgtrekkingen.

Samenvatting: Populatievariantie verwijst naar de variantiewaarde die wordt berekend op basis van bevolkingsgegevens en steekproefvariantie is de variantie die wordt berekend op basis van steekproefgegevens. Vanwege deze waarde van de noemer in de variantieformule in het geval van voorbeeldgegevens is 'n-1' en is het 'n' voor populatiegegevens. Dientengevolge zijn zowel de variantie als de standaarddeviatie afgeleid van voorbeeldgegevens groter dan die welke uit populatiegegevens blijken.