Bij een representatieve steekproef zorgt men ervoor dat de klassen in dezelfde verhouding in de steekproef vertegenwoordigd zijn als in de populatie. Bij een gelaagde of gestratificeerde steekproef wordt de steekproef gevormd door steekproeven uit elk van de klassen.
Er kan zowel een tweetrapssteekproef genomen worden als een drietrapssteekproef. Voorbeeld: bij een getrapte steekproef is er bijvoorbeeld een lijst waaruit in eerste instantie scholen worden getrokken, waarna vervolgens binnen die scholen leraren aselect worden geselecteerd.
Een representatieve steekproef is een subset met gegevens, meestal van een grotere groep, die vergelijkbare eigenschappen hebben. Met een representatieve steekproef kunt u grotere populaties analyseren, omdat de gegenereerde gegevens kleinere versies van de grotere groep bevatten die beter kunnen worden verwerkt.
Bij een geclusterde steekproef (cluster sampling) delen onderzoekers een populatie op in kleinere groepjes. Deze worden clusters genoemd. Vervolgens selecteren ze willekeurig clusters om een steekproef te vormen. Een geclusterde steekproef valt onder aselecte steekproeven.
Bij een enkelvoudige aselecte steekproef (ook wel random sampling) kies je willekeurig een groep mensen uit de populatie als steekproef.Elk lid van de populatie heeft evenveel kans om voor de steekproef geselecteerd te worden. Dit is de simpelste manier om een aselecte steekproef te trekken.
Een voorbeeld van cluster sampling zou een enquête zijn die door een bedrijf wordt uitgevoerd om de voorkeuren en behoeften van hun klanten beter te begrijpen . Het bedrijf zou zijn klantenbestand kunnen verdelen in clusters op basis van leeftijd, geslacht, locatie, etc., en vervolgens een willekeurige steekproef uit elke cluster selecteren voor verdere analyse.
Voor populaties onder de 1.000 is een minimumverhouding van 30 procent (300 individuen) aan te raden om representativiteit van de steekproef te garanderen. Voor grotere populaties, zoals een populatie van 10.000, is een relatief kleine minimumverhouding van 10 procent (1.000) individuen vereist om representativiteit van de steekproef te garanderen.
Bij een gestratificeerde steekproef zorgt u ervoor dat u uit elk stratum of groep een aantal respondenten haalt. Zo voorkomt u dat een bepaalde groep niet (of onvoldoende) vertegenwoordigd wordt in de resultaten. Deze vorm van steekproef wordt soms ook een gestratificeerde random steekproef genoemd.
Als je bijvoorbeeld een betrouwbaarheidsinterval met een betrouwbaarheidsniveau van 95% kiest, betekent dit dat je ervan overtuigd bent dat de schatting 95 van de 100 keer tussen de bovenste en onderste waarden van het betrouwbaarheidsinterval zal vallen.
Bij een getrapte steekproef of meertrapssteekproef (multistage sampling) trek je een steekproef uit een populatie met in elke fase kleinere groepen (steekproefeenheden). Deze methode wordt vaak gebruikt om gegevens te verzamelen voor een grote, geografisch verspreide groep mensen.
Bij multistage sampling kunt u waarschijnlijkheids- of niet-waarschijnlijkheidssteekproefmethoden gebruiken . Voor een waarschijnlijkheidssteekproef moet u in elke fase waarschijnlijkheidssteekproeven uitvoeren.
Convenience sampling wordt gedefinieerd als een methode die onderzoekers gebruiken om gegevens voor marktonderzoek te verzamelen uit een gemakkelijk beschikbare groep respondenten. Het is de meest gebruikte bemonstering omdat het ongelooflijk snel, ongecompliceerd en economisch is.
Statistici zijn gek op kanssteekproeven. Maar voor mensen die enquêtes in de echte wereld uitvoeren, zijn selecte steekproeven een stuk praktischer. Als ze goed worden uitgevoerd, kunnen selecte steekproeven u dezelfde (of betere) kwaliteit gegevens opleveren als bij een echte kanssteekproef.
Er zijn in principe twee soorten steekproeven: waarschijnlijkheidssteekproeven en niet-waarschijnlijkheidssteekproeven . 1. Waarschijnlijkheidssteekproeven/willekeurige steekproeven: Waarschijnlijkheidssteekproeven worden gedefinieerd als een steekproeftechniek waarbij de onderzoeker steekproeven kiest uit een grotere populatie met behulp van een methode die is gebaseerd op de waarschijnlijkheidstheorie.
Interne validiteit is de mate waarin je met zekerheid kunt stellen dat een vastgestelde oorzaak-gevolgrelatie (causaal verband) niet door andere factoren kan worden verklaard. Externe validiteit is de mate waarin je je resultaten kunt generaliseren naar andere omstandigheden of groepen.
Gestratificeerde steekproeven worden gebruikt wanneer een populatie kan worden verdeeld in afzonderlijke subgroepen, of strata, zoals leeftijdsgroep, geslacht of opleidingsniveau. De steekproefgrootte voor elke stratum kan worden bepaald door het gebruik van proportionele toewijzing: nh = N h N × n Waarbijn = totale steekproefgrootte .
Onafhankelijkheid: De steekproeven moeten onafhankelijk van elkaar zijn verkregen, wat betekent dat de resultaten van de ene steekproef geen invloed hebben op de resultaten van de andere.
Een representatieve steekproef zou een onpartijdige weerspiegeling moeten zijn van hoe de populatie eruitziet . Er zijn veel manieren om representativiteit te evalueren: geslacht, leeftijd, sociaaleconomische status, beroep, opleiding, chronische ziekte, zelfs persoonlijkheid of huisdierbezit.
Als je 10 mensen vraagt, is dat waarschijnlijk niet representatief voor zo'n grote groep. Maar als je wilt weten hoeveel van je 50 collega's dat doen, zijn 10 respondenten misschien genoeg om het juiste idee te krijgen . Dat is in een notendop wat een steekproefomvang is.
Het responspercentage ligt meestal rond de 20%. Een voorbeeld ter indicatie: als je een uitspraak wil doen over de gemiddelde Nederlander, met een foutenmarge van 2% en 95% betrouwbaarheidsniveau, heb je 2.401 respondenten nodig.
Stap 1: Verdeel de populatie in kleinere groepen. Zoek naar natuurlijk voorkomende groepen die de gehele populatie vertegenwoordigen. Stap 2: Gebruik eenvoudige willekeurige steekproeven om de clusters te selecteren die u voor de studie zult gebruiken. Stap 3: Voer het benodigde onderzoek uit op elk lid van de geselecteerde clusters.
Bij time-sampling of ook wel interval- sampling, kan een duidelijke scheiding tussen gedragseenheden of een duidelijk patroon, niet gemaakt worden. In zulke gevallen neemt men een onnatuurlijker eenheid van observatie, te weten een tijdseenheid.
Cluster sampling heeft de voorkeur als de populatie homogeen is en de clusters geschikt zijn voor de dataverzameling. Multistage sampling heeft de voorkeur als de populatie complex is en het sampling frame onvolledig of niet beschikbaar is.