N N is de populatie. De populatie is de groep mensen die wordt onderzocht. z z is de standaardafwijking van het betrouwbaarheidspercentage.
Populatie (N) en steekproef (n)
De term 'populatie' verwijst naar de totale groep mensen waarover statistische uitspraken worden gedaan (bijvoorbeeld alle Nederlanders, alle basisscholieren). De term 'steekproef' verwijst naar een selecte groep mensen uit deze populatie, die deel heeft genomen aan het onderzoek.
n = het aantal benodigde respondenten. Altijd naar boven afronden. z = de standaardafwijking bij een bepaald betrouwbaarheidspercentage.
Er zijn verschillende manieren om de steekproefgrootte te berekenen, afhankelijk van het onderzoeksdoel en de grootte van de populatie (de grotere groep waaruit de steekproef wordt gekozen). Hieronder staan een paar veelgebruikte methoden: De formule voor de steekproefomvang: N = (Z^2 * p * (1-p)) / E^2.
Bijvoorbeeld: bij een steekproefomvang van n=100, is de maximale nauwkeurigheidsmarge 9,8%. Dat betekent dat als uit het onderzoek blijkt dat 50% van de respondenten man is, het werkelijke percentage mannen in de populatie tussen de 40, 2% en 59, 8% ligt.
Bij steekproeven gebruiken we n – 1 in de formule, omdat het gebruik van n een vertekende schatting zou geven, waarbij de spreiding wordt onderschat. De steekproefvariantie is normaal gesproken lager dan de werkelijke populatievariantie.
Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.
De exponentiële formule heeft de vorm van N = gt · b.
De hoofdletter N wordt meestal gebruikt om het aantal waarnemingen in een populatie aan te duiden. Een steekproef is een al dan niet op basis van vastgestelde criteria aantal trekkingen uit de gehele populatie en beoogt beschrijvend te zijn voor het gedrag van de gehele populatie.
Natuurlijke getallen zijn de getallen 0,1,2,3,4,... We spreken dus over alle positieve gehele getallen en het getal nul. De verzameling van natuurlijke getallen wordt aangeduid met het symbool N.
Bij kwalitatief onderzoek heb je geen grote steekproef nodig, maar je wilt natuurlijk wel dat je resultaten betrouwbaar en valide zijn. Vaak zie je bij kwalitatief onderzoek dat er 12, 15 of maximaal 20 respondenten worden benaderd voor het onderzoek.
De verhouding deelnemers/niet-deelnemers moet voldoende hoog zijn. Als je bijvoorbeeld 100 klanten hebt uitgenodigd om deel te nemen en 40 hebben daadwerkelijk deelgenomen, dan heb je een respons van 40 procent. Dit is vrijwel in alle gevallen voldoende om de resultaten als representatief te kenmerken.
Een representatieve steekproef is een steekproef waarbij de groep mensen die jij geselecteerd hebt, daadwerkelijk iets zegt over de gehele populatie. Anders geformuleerd, wil je dat de steekproef een goede indicatie geeft van de aard van de populatie dan is het van belang dat de steekproef representatief van aard is.
Er zijn twee soorten steekproeven: de selecte en de aselecte steekproef. Een aselecte steekproef is gebaseerd op random sampling. Iedereen uit de populatie heeft evenveel kans om in de steekproef opgenomen te worden. Aselecte steekproeven worden vaak gebruikt bij kwantitatief onderzoek.
Bij een gerichte steekproef selecteren onderzoekers zelf (in plaats van willekeurig) een subpopulatie die naar verluidt representatief is voor de populatie als geheel. Bij dit type steekproef, dat ook wel een 'expertsteekproef' wordt genoemd, kiest iemand die de groep en zijn basiseigenschappen kent, de steekproef.
, symbool voor de verzameling van positieve gehele getallen ofwel natuurlijk getallen.
De standaarddeviatie of standaardafwijking geeft de mate van spreiding aan in bepaalde data. Het geeft aan hoezeer de geobserveerde waardes afwijken van het gemiddelde.
De beschrijvende statistiek is een hulpmiddel om gegevens op een overzichtelijke manier samen te vatten en om de verdeling van gegevens zo goed mogelijk weer te geven. Welke methoden hiervoor gebruikt kunnen worden, is onder meer afhankelijk van het meetniveau van de gegevens of de variabelen.
Als een examen heel moeilijk blijkt, wordt de N-term iets hoger gemaakt. Daardoor vallen de cijfers dan ook hoger uit. Een N-term hoger dan 1,0 betekent dat de cijfers worden opgehoogd. Een N-term lager dan 1,0 betekent juist dat de cijfers worden verlaagd.
Een lineair verband is een relatie die continu toe- of afneemt. Dit houdt in dat bij dezelfde stapgrootte in de x-richting dezelfde hoeveelheid toe- of afneemt in de y-richting. Als de grafiek een lineaire relatie heeft, is het een rechte lijn met een bijbehorende lineaire functie.
Meestal hanteert men het 95%-betrouwbaarheidsinterval (95%-BI) rond een steekproefgemiddelde, wat aangeeft dat met een waarschijnlijkheid van 95% het ware populatiegemiddelde zich in dit interval bevindt.
Als je betrouwbaarheidsinterval voor een correlatie of regressie nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert. In beide gevallen zul je ook een hoge p-waarde vinden bij je statistische test.
Confidence interval is de Engelse term voor betrouwbaarheidsinterval. Dit interval is het waardebereik waarbinnen je geschatte waarde naar verwachting een bepaald percentage van de keren ligt als je het experiment of de steekproef hetzelfde zou herhalen.