De foutmarge is eigenlijk een manier om te meten hoe effectief uw enquête is. Hoe kleiner de foutmarge, hoe meer u op de resultaten kunt vertrouwen. Hoe groter de foutmarge, hoe minder zeker het is dat u de mening van de totale populatie hebt.
5% is de meestgebruikte foutmarge maar u kunt een marge gebruiken van 1-10%, afhankelijk van uw enquête. We raden niet aan om een foutmarge te nemen die hoger is dan 10%.
Een betrouwbaarheidsniveau van 95% is gangbaar, en betekent dat je in 95 van de 100 gevallen goed zit met de uitkomst, maar dus ook in 5 van de 100 gevallen fout. LET OP: Een hoger percentage qua betrouwbaarheidsniveau, zorgt ervoor dat de steekproefomvang groter moet zijn. Standaard kies je voor: 95 (ofwel 95%).
Een Type I-fout is een fout-positieve conclusie (false positive), terwijl een Type II-fout een fout-negatieve conclusie (false negative) is. Als je een Type I-fout maakt, verwerp je de nulhypothese ten onrechte. Als je een Type II-fout maakt, verwerp je de nulhypothese ten onrechte niet.
Zo berekent u het responspercentage voor enquêtes: neem het aantal voltooide enquêtes en deel dit door het totale aantal mensen naar wie u de enquête hebt verzonden. Vermenigvuldig dit met 100 om het responspercentage van de vragenlijst uitgedrukt als een percentage te krijgen.
Over het algemeen wordt een responspercentage van 20-25% als acceptabel beschouwd voor online enquêtes . Voor interne enquêtes ligt een acceptabel responspercentage tussen de 10% en 30%. Interne enquêtes zijn bedoeld om feedback te krijgen van mensen binnen uw bedrijf, zoals werknemers, over zaken als werktevredenheid en bedrijfscultuur.
Gemiddeld is een response rate tussen de 35% – 50%.
Een type I-fout (vals-positief) treedt op als een onderzoeker een nulhypothese verwerpt die in de populatie feitelijk waar is. Een type II-fout (vals-negatief) treedt op als de onderzoeker een nulhypothese niet verwerpt die in de populatie feitelijk onjuist is.
Wat is een p-waarde (p-value)? De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is.
De power is de mate waarin een toets een daadwerkelijk bestaand effect correct kan detecteren. Om het risico op een Type II-fout (indirect) te verkleinen, kun je de steekproef vergroten of het significantieniveau verhogen, omdat je zo de statistische power vergroot.
Een vuistregel die je kunt gebruiken is dat bij continue data de steekproef minstens 30 tot 40 moet zijn.Bij discrete data (geheeltallig) moet de steekproefomvang minstens 100 zijn, waarbij er minimaal 5 defecten moeten zijn.
Veel statistici zijn het erover eens dat een steekproefomvang van 100 het minimum is dat u nodig hebt voor zinvolle resultaten . Als uw populatie kleiner is, moet u proberen alle leden te ondervragen. Dezelfde bron stelt dat het maximale aantal respondenten 10% van uw populatie moet zijn, maar niet meer dan 1000.
Een voorbeeld ter indicatie: als je een uitspraak wil doen over de gemiddelde Nederlander, met een foutenmarge van 2% en 95% betrouwbaarheidsniveau, heb je 2.401 respondenten nodig.
Voor een verkennend onderzoek is bijvoorbeeld een foutmarge van ±10% misschien prima acceptabel . Een onzekerheidsmarge van 10% kan worden bereikt met een steekproef van slechts 100. Om echter een foutmarge van 5% te bereiken, is een steekproef van 384 (vier keer zo groot) nodig.
Zoals de naam al aangeeft, is de foutmarge een waardebereik boven en onder de feitelijke enquêteresultaten. Als 60% 'ja' antwoordt bij een foutmarge van 5%, betekent dit dat tussen de 55% en 65% van de mensen in de algehele populatie van mening is dat het antwoord 'ja' moet zijn.
Ondernemingen met lage marges hebben doorgaans hoge bedrijfskosten of verkopen producten met lage prijzen. 10% wordt als een gezonde marge gezien. Dit geeft aan dat een onderneming haar kosten effectief beheert en een behoorlijke winst genereert. 20% is een hoge marge.
Gewoonlijk hanteert men p=0,05 als grens van statistische significantie. Indien p≤0,05, dan is de kans dat het gevonden resultaat aan het toeval is te wijten (en we de nulhypothese ten onrechte verwerpen) kleiner of gelijk aan 5%, dit noemt men 'statistisch significant'.
Een Type I-fout betekent dat de nulhypothese wordt verworpen, terwijl deze eigenlijk waar is. Je concludeert dat resultaten statistisch significant zijn, terwijl ze in werkelijkheid puur door toeval of door niet-gerelateerde factoren zijn veroorzaakt.
Wat is de P-waarde? De P-waarde betekent de waarschijnlijkheid, voor een gegeven statistisch model, dat, wanneer de nulhypothese waar is, de statistische samenvatting gelijk zou zijn aan of extremer dan de werkelijk waargenomen resultaten [2].
In de statistiek betekent een Type I-fout het verwerpen van de nulhypothese terwijl deze in werkelijkheid waar is, terwijl een Type II-fout betekent dat de nulhypothese niet wordt verworpen terwijl deze in werkelijkheid onwaar is . Hoe verklein je het risico op een Type I-fout?
De F-waarde is een belangrijke statistiek bij ANOVA die wordt gebruikt om te bepalen of er significante verschillen zijn tussen de gemiddelden van twee of meer groepen. Het wordt berekend door het gemiddelde kwadraat tussen groepen te delen door het gemiddelde kwadraat binnen groepen.
Een type III-fout treedt op wanneer men de nulhypothese dat er geen verschil is terecht verwerpt, maar dit om de verkeerde reden doet . [ 4 ] Men kan ook het juiste antwoord geven op de verkeerde vraag.
Wat precies een 'goede' responspercentage is, kan verschillen. Maar over het algemeen ligt een acceptabel responspercentage van een enquête tussen de 5% en 30% . Alles boven de 30% wordt als uitstekend beschouwd. Nogmaals, het is belangrijk om te benadrukken dat er geen universeel gedefinieerde drempel is voor een 'goede' responspercentage.
Over het algemeen wordt er gezegd dat 2% tot 5% gemiddeld een goed conversiepercentage is. Zit jij tussen de 1,5% tot 2%? Schrik daar dan niet van, want dat een uitstekend gemiddelde als je online onderneemt. Onthoud ook dat je percentage lager ligt als je net begint.
Het betrouwbaarheidsniveau (confidence level) is het percentage van de keren dat je verwacht in de buurt van dezelfde schatting te komen als je je experiment nog een keer uitvoert of opnieuw op dezelfde manier een steekproef uit de populatie haalt.