Stratified Sampling vs Cluster Sampling
In statistieken, vooral bij het uitvoeren van enquêtes, is het belangrijk om een onbevooroordeelde steekproef te verkrijgen, zodat het resultaat en de voorspellingen die met betrekking tot de populatie zijn gedaan, nauwkeuriger zijn. Maar bij de eenvoudige willekeurige bemonstering bestaat de mogelijkheid om de leden van het monster te selecteren die vooringenomen zijn; met andere woorden, het vertegenwoordigt de bevolking niet eerlijk. Daarom worden gestratificeerde steekproeven en clusterbemonstering gebruikt om de bias- en efficiëntieproblemen van de eenvoudige willekeurige bemonstering te ondervangen.
Gestratificeerde steekproef
Gestratificeerde aselecte steekproef is een steekproefmethode waarbij de populatie voor het eerst wordt onderverdeeld in strata (een laag is een homogene deelverzameling van de populatie). Vervolgens wordt een eenvoudig willekeurig monster genomen uit elk stratum. De resultaten van elke strata samen vormen het monster. Hieronder volgen voorbeelden van mogelijke lagen in populaties
• Voor een populatie van een staat, mannelijke en vrouwelijke lagen
• Voor mensen die in een stad werken, ingezeten en niet-ingezeten lagen
• Voor studenten in een hogeschool, witte, zwarte, Spaanse en Aziatische strata
• Voor een publiek van een debat over theologie, protestantse, katholieke, joodse, islamitische strata
In dit proces, in plaats van willekeurig monsters te nemen uit de populatie, wordt de populatie gescheiden in groepen met behulp van een inherent kenmerk van de elementen (homogene groepen). Vervolgens worden willekeurige steekproeven uit de groep genomen. Het aantal willekeurige steekproeven uit elke groep is afhankelijk van het aantal elementen binnen de groep.
Dit maakt bemonsteren mogelijk zonder dat het monster van één groep groter is dan het aantal monsters dat vereist is van die specifieke groep. Als het aantal elementen van een bepaalde groep groter is dan de vereiste hoeveelheid, kan een scheefheid in de distributie leiden tot onjuiste interpretaties.
Gestratificeerde bemonstering maakt het gebruik van verschillende statistische methoden voor elk stratum mogelijk, wat helpt bij het verbeteren van de efficiëntie en nauwkeurigheid van de schatting.
Cluster Sampling
Cluster-aselecte steekproef is een steekproefmethode waarbij de populatie voor het eerst wordt onderverdeeld in clusters (een cluster is een heterogene deelverzameling van de populatie). Vervolgens wordt een eenvoudige willekeurige steekproef van clusters gemaakt. Alle leden van de geselecteerde clusters vormen samen het monster. Deze methode wordt vaak gebruikt als natuurlijke groepen duidelijk en beschikbaar zijn.
Neem bijvoorbeeld een enquête voor het evalueren van de betrokkenheid van middelbare scholieren bij buitenschoolse activiteiten. In plaats van het selecteren van willekeurige studenten uit de studentenpopulatie, is het selecteren van een klasse als de steekproeven voor de enquête clusterbemonstering. Vervolgens wordt elk lid van de klas geïnterviewd. In dit geval zijn klassen clusters van de studentenpopulatie.
Bij clusterbemonstering zijn het de clusters die willekeurig worden geselecteerd, niet de individuen. Er wordt verondersteld dat elk cluster op zich een onbevooroordeelde representatie van de populatie is, wat impliceert dat elk van de clusters heterogeen is.
Wat is het verschil tussen Stratified Sampling en Cluster Sampling?
• Bij gestratificeerde steekproeven wordt de populatie opgedeeld in homogene groepen die strata worden genoemd, met behulp van een attribuut van de steekproeven. Vervolgens worden leden van elk stratum geselecteerd en het aantal monsters uit die strata is evenredig met de aanwezigheid van de lagen binnen de populatie.
• Bij clusterbemonstering is de populatie gegroepeerd in clusters, voornamelijk op basis van locatie, en vervolgens wordt willekeurig een cluster geselecteerd.
• Bij clusterbemonstering wordt een cluster willekeurig geselecteerd, terwijl in gestratificeerde steekproefleden willekeurig worden geselecteerd.
• Bij gestratificeerde steekproeven omvatten alle gebruikte groepen (strata) homogene leden, terwijl bij clusterbemonstering een cluster heterogeen is.
• Gestratificeerde bemonstering is langzamer, terwijl clusterbemonstering relatief sneller is.
• Gestratificeerde monsters hebben minder fouten door factoring in de aanwezigheid van elke groep binnen de populatie en passen de methoden aan om een betere schatting te verkrijgen.
• Clusterbemonstering heeft inherent hoger foutenpercentage.