De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.
Gewoonlijk hanteert men p=0,05 als grens van statistische significantie. Indien p≤0,05, dan is de kans dat het gevonden resultaat aan het toeval is te wijten (en we de nulhypothese ten onrechte verwerpen) kleiner of gelijk aan 5%, dit noemt men 'statistisch significant'.
Een p-waarde, die staat voor kans, is een statistische maat tussen 0 en 1. Het wordt gebruikt voor het testen van hypothesen. In klinische onderzoeken wordt de p-waarde gebruikt om aan te duiden of een waargenomen resultaat het gevolg kan zijn van toeval of niet.
Je vergelijkt de twee gemiddelden met een statistische toets (t-toets) en je vindt een eenzijdige p-waarde 0,001 (1 op de 1000). Wat betekent dit? De p-waarde geeft de kans aan dat we dit verschil in lengte of groter vinden als we ervan uit gaan dat de nulhypothese waar is.
Vinden we een p-waarde van 0,01, dan is er toch nog 1% kans dat er sprake is van toeval. In het medisch onderzoek wordt doorgaans een p-waarde van 0,05 als afkappunt aangehouden. Is de p-waarde kleiner dan 0,05 dan spreken we van 'statistisch significant'.
De p-waarde geeft aan hoe extreem de gevonden waarde voor de toetsingsgrootheid in de verdeling onder de nulhypothese is. Hoe kleiner de p-waarde, hoe extremer de uitkomst. In de praktijk worden waarden van 5% en 1% aangehouden als grens; is de p-waarde kleiner, dan spreekt men van een significante, resp.
De meest gehanteerde regel ten aanzien van significantie is de 95% regel. Dit betekent dat wanneer we met 95% zekerheid kunnen zeggen dat een effect niet ontstaan is door toeval, we mogen aannemen dat het effect werkelijk bestaat. We staan dus 5% kans op toeval toe.
Als een resultaat statistisch significant is, betekent dit dat het onwaarschijnlijk is dat het alleen door toeval of willekeurige factoren kan worden verklaard. Met andere woorden: er is slechts een zeer kleine kans dat een statistisch significant resultaat voorkomt als er geen echt effect zou zijn in het onderzoek.
Bij statistische analyses voorspelt de nulhypothese (H0) altijd dat er geen effect of relatie tussen variabelen is, terwijl de alternatieve hypothese (H1) je verwachting van een effect of relatie uitdrukt.
In wetenschappelijke artikelen is geregeld te lezen dat de resultaten 'net niet significant' waren. Meestal betekent dit dat de waarde van de statistische grootheid p vlak boven de 0,05 lag.
De p-waarde geeft aan hoe waarschijnlijk het is dat de data die je hebt gevonden zouden voorkomen als de nulhypothese waar zou zijn. Als de p-waarde onder je grenswaarde (vaak p < 0.05) valt, kun je de nulhypothese verwerpen, maar dit betekent niet per se dat je alternatieve hypothese waar is.
Wanneer de gevonden waarde in belangrijke mate afwijkt van de onder de nulhypothese verwachte waarde kunnen we de nulhypothese verwerpen. De gevonden associatie of het gevonden verschil wordt dan statistisch significant genoemd.
Een t-toets is een parametrische statistische toets die onder andere gebruikt kan worden om na te gaan of het (populatie)gemiddelde van een normaal verdeelde grootheid afwijkt van een bepaalde waarde, dan wel of er een verschil is tussen de gemiddelden van twee groepen in de populatie.
Een oplossing is om positieve t-waarden altijd negatief te maken voordat je de p-waarde erbij zoekt. Verder moet je deze p-waarden altijd verdubbelen, omdat je altijd tweezijdig toetst (zie de uitleg in andere vragen in dit systeem).
is de kans dat de hypothese die wordt getest ten onrechte wordt verworpen. Voor deze grenswaarde wordt vaak 0,05 gekozen, al is dit arbitrair, aangezien significantie een continuüm is.
Meestal wordt een waarschijnlijkheid van 95% gebruikt. Dit betekent dat, wanneer we het onderzoek 100 maal in dezelfde populatie met verschillende steekproeven zouden herhalen, 95 van de herhalingen een resultaat geven dat binnen het interval ligt. Dit noemen we een 95% betrouwbaarheidsinterval (95% BI).
Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans). Statistische significantie is enigszins willekeurig, omdat je zelf de drempelwaarde (alfa) kiest. De meest voorkomende drempel is p < 0.05, wat betekent dat de kans 5% is dat de resultaten worden gevonden terwijl de nulhypothese waar is.
Bij hypothese toetsen wordt een hypothese H0 getest tegen een hypothese Ha. H0 is de nulhypothese en Ha is de alternatieve hypothese. Ha wordt ook wel H1 genoemd. De alternatieve hypothese is meestal de onderzoekshypothese, die alleen aangenomen (ondersteund) wordt door de nulhypothese te verwerpen.
Daarbij zijn F({A}, {B}) de vrijheidsgraden: {A} staat voor het aantal verklarende variabelen en {B} het aantal observaties minus het aantal verklarende variabelen minus één.
Tussen de haakjes (achter t bij t-test en achter X² bij Chi kwadraat test (ook wel 'Chi-squared) vul je de 'degrees of freedom' (vrijheidsgraden) in. Deze kun je vinden onder kolom 'df' in de SPSS output). Na het '=' teken komt de daadwerkelijke test-value, ook deze vind je in de SPSS output.
Het aantal significante cijfers van een getal is het aantal cijfers waaruit dit getal bestaat, waarbij nullen aan de linkerkant van het getal niet worden meegeteld. Significante cijfers moeten niet verward worden met decimalen (het aantal cijfers achter de komma).
De F-toets is een statistische toets om na te gaan of van twee normale verdelingen de varianties verschillen. De F-toets wordt gebruikt bij variantie-analyse en is een parametrische toets omdat de verdeling normaal moet zijn.
Wat is een gepaarde t-test (paired samples t-test)? Je gebruikt een gepaarde t-test (paired samples t-test) om twee gemiddelden van gepaarde steekproeven met elkaar te vergelijken. Gepaarde steekproeven zijn afhankelijk van elkaar.