De 95% regel is de standaard bij significantie
De meest gehanteerde regel ten aanzien van significantie is de 95% regel. Dit betekent dat wanneer we met 95% zekerheid kunnen zeggen dat een effect niet ontstaan is door toeval, we mogen aannemen dat het effect werkelijk bestaat.
Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans). Statistische significantie is enigszins willekeurig, omdat je zelf de drempelwaarde (alfa) kiest. De meest voorkomende drempel is p < 0.05, wat betekent dat de kans 5% is dat de resultaten worden gevonden terwijl de nulhypothese waar is.
Wanneer de gevonden waarde in belangrijke mate afwijkt van de onder de nulhypothese verwachte waarde kunnen we de nulhypothese verwerpen. De gevonden associatie of het gevonden verschil wordt dan statistisch significant genoemd.
Het aantal significante cijfers van een getal is het aantal cijfers waaruit dit getal bestaat, waarbij nullen aan de linkerkant van het getal niet worden meegeteld. Significante cijfers moeten niet verward worden met decimalen (het aantal cijfers achter de komma).
De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.
Gewoonlijk hanteert men p=0,05 als grens van statistische significantie. Indien p≤0,05, dan is de kans dat het gevonden resultaat aan het toeval is te wijten (en we de nulhypothese ten onrechte verwerpen) kleiner of gelijk aan 5%, dit noemt men 'statistisch significant'.
Het betrouwbaarheidsinterval (Engels confidence interval (CI)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Het is een interval waar binnen je verwacht dat de werkelijke waarde ligt.
Maak een lijst van alle scores en vind het gemiddelde. Trek het gemiddelde af van iedere score om de afstand (afwijking) tot het gemiddelde te berekenen. Bereken voor iedere afwijking het kwadraat. Tel alle gekwadrateerde afwijkingen bij elkaar op.
Je vergelijkt de twee gemiddelden met een statistische toets (t-toets) en je vindt een eenzijdige p-waarde 0,001 (1 op de 1000). Wat betekent dit? De p-waarde geeft de kans aan dat we dit verschil in lengte of groter vinden als we ervan uit gaan dat de nulhypothese waar is.
Een hoge p-waarde betekent dat heel veel deelnemers de vraag correct beantwoord hebben. Dit kan betekenen dat veel deelnemers deze vraag goed beheersen. Dat kan ook komen doordat de vraag té makkelijk is geformuleerd, waarbij je bijvoorbeeld slechte afleiders hebt geschreven.
In wetenschappelijke artikelen is geregeld te lezen dat de resultaten 'net niet significant' waren. Meestal betekent dit dat de waarde van de statistische grootheid p vlak boven de 0,05 lag.
De standaardregels voor significante cijfers zijn als volgt. Alle cijfers behalve voorafgaande nullen zijn significant: 87,636 heeft bijvoorbeeld vijf significante cijfers; 7,636 heeft er vier; 0,636 heeft er drie; en 0,036 heeft er twee.
Het uitvoeren van de chi-kwadraat toets: Analyze > Descriptive Statistics > Crosstabs. Zet de variabele waarvan je de groepen wilt vergelijk in de box 'Column(s)'; in dit geval is dat de variabele conditie. Zet de variabele waarop je wilt vergelijken in de box 'Row(s)'; in dit voorbeeld geslacht.
De nulhypothese (H0) kan worden getoetst door statistische toetsing. Als de gevonden waarde significant verschilt van de verwachte waarde onder de nulhypothese, kunnen we de nulhypothese verwerpen. De nauwkeurigheid van statistisch significante resultaten worden doorgaans weergegeven door de p-waarde.
Meestal wordt een waarschijnlijkheid van 95% gebruikt. Dit betekent dat, wanneer we het onderzoek 100 maal in dezelfde populatie met verschillende steekproeven zouden herhalen, 95 van de herhalingen een resultaat geven dat binnen het interval ligt. Dit noemen we een 95% betrouwbaarheidsinterval (95% BI).
Als je betrouwbaarheidsinterval voor een correlatie of regressie nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert. In beide gevallen zul je ook een hoge p-waarde vinden bij je statistische test.
Meestal hanteert men het 95%-betrouwbaarheidsinterval (95%-BI) rond een steekproefgemiddelde, wat aangeeft dat met een waarschijnlijkheid van 95% het ware populatiegemiddelde zich in dit interval bevindt.
Bij hypothese toetsen wordt een hypothese H0 getest tegen een hypothese Ha. H0 is de nulhypothese en Ha is de alternatieve hypothese. Ha wordt ook wel H1 genoemd. De alternatieve hypothese is meestal de onderzoekshypothese, die alleen aangenomen (ondersteund) wordt door de nulhypothese te verwerpen.
Een t-toets is een parametrische statistische toets die onder andere gebruikt kan worden om na te gaan of het (populatie)gemiddelde van een normaal verdeelde grootheid afwijkt van een bepaalde waarde, dan wel of er een verschil is tussen de gemiddelden van twee groepen in de populatie.
is de kans dat de hypothese die wordt getest ten onrechte wordt verworpen. Voor deze grenswaarde wordt vaak 0,05 gekozen, al is dit arbitrair, aangezien significantie een continuüm is.
De pil is een zeer betrouwbare anticonceptiemethode. Hoewel de kans dat je zwanger wordt bij de pil zeer klein is, geeft geen enkele vorm van anticonceptie 100% garantie. Wanneer je de pil netjes elke dag slikt dan is de kans op een zwangerschap kleiner dan ongeveer 1%. De meeste pillen bevatten 21 pillen per strip.
De nullen, die links staan in tiendelige breuken tellen dus niet mee als significante cijfers. 0,00123 heeft 3 significante cijfers. 0,010 heeft 2 significante cijfers. 0,2 heeft 1 significant cijfer.
Als een resultaat statistisch significant is, betekent dit dat het onwaarschijnlijk is dat het alleen door toeval of willekeurige factoren kan worden verklaard. Met andere woorden: er is slechts een zeer kleine kans dat een statistisch significant resultaat voorkomt als er geen echt effect zou zijn in het onderzoek.