Hoe bereken je een p-waarde (p-value)? Je berekent p-waarden meestal automatisch met het programma dat je gebruikt voor je statistische analyse (zoals SPSS of R). Je kunt de p-waarde ook schatten met behulp van tabellen voor de teststatistiek die je gebruikt.
Gewoonlijk hanteert men p=0,05 als grens van statistische significantie. Indien p≤0,05, dan is de kans dat het gevonden resultaat aan het toeval is te wijten (en we de nulhypothese ten onrechte verwerpen) kleiner of gelijk aan 5%, dit noemt men 'statistisch significant'.
De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.
Als de kans, dat een verschil door toeval ontstaan is, kleiner is dan 5% (p = 0.05), dan noemt men het verschil significant (betekenisvol). Als de kans, dat het verschil door toeval ontstaan is, kleiner is dan 1% (p = 0.01 ) dan noemt men het verschil zeer significant (zeer betekenis vol).
Je vergelijkt de twee gemiddelden met een statistische toets (t-toets) en je vindt een eenzijdige p-waarde 0,001 (1 op de 1000). Wat betekent dit? De p-waarde geeft de kans aan dat we dit verschil in lengte of groter vinden als we ervan uit gaan dat de nulhypothese waar is.
Een oplossing is om positieve t-waarden altijd negatief te maken voordat je de p-waarde erbij zoekt. Verder moet je deze p-waarden altijd verdubbelen, omdat je altijd tweezijdig toetst (zie de uitleg in andere vragen in dit systeem).
Meestal wordt een waarschijnlijkheid van 95% gebruikt. Dit betekent dat, wanneer we het onderzoek 100 maal in dezelfde populatie met verschillende steekproeven zouden herhalen, 95 van de herhalingen een resultaat geven dat binnen het interval ligt. Dit noemen we een 95% betrouwbaarheidsinterval (95% BI).
Een hoge p-waarde betekent dat heel veel deelnemers de vraag correct beantwoord hebben. Dit kan betekenen dat veel deelnemers deze vraag goed beheersen. Dat kan ook komen doordat de vraag té makkelijk is geformuleerd, waarbij je bijvoorbeeld slechte afleiders hebt geschreven.
Stel je hebt 95% gekozen. Bereken de foutmarge. Je kunt de foutmarge vinden middels de volgende formule: Za/2 * σ/√(n). Za/2 = betrouwbaarheidscoëfficient, waarbij a = betrouwbaarheidsniveau, σ = standaarddeviatie en n = steekproefgrootte.
De p-waarde geeft aan hoe waarschijnlijk het is dat de data die je hebt gevonden zouden voorkomen als de nulhypothese waar zou zijn. Als de p-waarde onder je grenswaarde (vaak p < 0.05) valt, kun je de nulhypothese verwerpen, maar dit betekent niet per se dat je alternatieve hypothese waar is.
Wat is een gepaarde t-test (paired samples t-test)? Je gebruikt een gepaarde t-test (paired samples t-test) om twee gemiddelden van gepaarde steekproeven met elkaar te vergelijken. Gepaarde steekproeven zijn afhankelijk van elkaar.
Een term die aangeeft of een verschil te verklaren is door toeval. Er is sprake van een significante verschil als het verschil niet te verklaren is door toeval maar door iets anders. Op dat moment kunnen er ook conclusies getrokken worden uit zo'n bevinding.
Vinden we een p-waarde van 0,01, dan is er toch nog 1% kans dat er sprake is van toeval. In het medisch onderzoek wordt doorgaans een p-waarde van 0,05 als afkappunt aangehouden. Is de p-waarde kleiner dan 0,05 dan spreken we van 'statistisch significant'.
Statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun resultaten op toeval gebaseerd zijn. Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans).
Een Z-score geeft aan hoeveel standaarddeviaties een observatie van het gemiddelde af zit. Je krijgt dus je plek ten opzichte van het gemiddelde, uitgedrukt in een standaard maat. Dit heeft als voordeel dat je direct kunt zien hoe goed iemand scoort ten opzichte van de rest.
Om te bepalen wie een goede kandidaat is, wordt de totaalscore van de toets gebruikt. De rit-waarde wordt berekend door het resultaat van het vraag te vergelijken met het resultaat van de toets.
De t-test, ook wel t-toets genoemd, wordt gebruikt om de gemiddelden van maximaal twee groepen met elkaar te vergelijken. Je kunt de t-test bijvoorbeeld gebruiken om te analyseren of moedertaalsprekers gemiddeld sneller spreken dan niet-moedertaalsprekers.
Klinisch relevant is een verschil waarvan een clinicus vindt dat het uitmaakt voor zijn handelen. Wanneer een nieuw middel tegen hypertensie significant effectiever is dan het oude middel, maar het gevonden verschil in bloeddrukdaling maar 2 mm is, dan heeft dit nauwelijks enige klinische betekenis.
Als je betrouwbaarheidsinterval voor een correlatie of regressie nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert. In beide gevallen zul je ook een hoge p-waarde vinden bij je statistische test.
Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.
Om de validiteit en betrouwbaarheid van je scriptie te bepalen, moet je nagaan of je met de methoden of onderzoeksmodellen hebt gemeten wat je wilde meten (validiteit) en of je resultaten hetzelfde zouden zijn als je het onderzoek op dezelfde manier herhaalt (betrouwbaarheid).
De nulhypothese (H0) kan worden getoetst door statistische toetsing. Als de gevonden waarde significant verschilt van de verwachte waarde onder de nulhypothese, kunnen we de nulhypothese verwerpen. De nauwkeurigheid van statistisch significante resultaten worden doorgaans weergegeven door de p-waarde.
Bij hypothese toetsen wordt een hypothese H0 getest tegen een hypothese Ha. H0 is de nulhypothese en Ha is de alternatieve hypothese. Ha wordt ook wel H1 genoemd. De alternatieve hypothese is meestal de onderzoekshypothese, die alleen aangenomen (ondersteund) wordt door de nulhypothese te verwerpen.
Op een getallenlijn moet een positieve t-waarde dus rechts van de kritieke waarde liggen. Bij een negatieve t-waarde is dit juist andersom; dan moet de gevonden t-waarde links van de kritieke waarde liggen. Hierbij is het handig om de getallenlijn daadwerkelijk te tekenen, om een vergissing te voorkomen.