Een goed betrouwbaarheidsinterval (BI) is smal en geeft met hoge zekerheid (meestal 95%) aan waar de werkelijke populatiewaarde ligt. Het toont de precisie van een schatting: hoe kleiner het interval, hoe nauwkeuriger de meting. Het wordt berekend op basis van de steekproefgrootte en variabiliteit. OLVG +2
Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.
Voor een betrouwbaarheidsinterval van 90% of 99% is de kritische z-score respectievelijk 1,65 en 2,58. Deze waardes komen uit de standaardnormale tabel of z-tabel. Dat is een wiskundige tabel waarin je kan opzoeken hoeveel % van een verdeling overeenkomt met een bepaalde z-score.
Het betrouwbaarheidsinterval, of confidence interval (CI) in het Engels, geeft de verwachte kans aan (in %) dat het werkelijke effect in je populatie binnen deze grenzen ligt. Meestal wordt een betrouwbaarheidsinterval van 95% gebruikt: het 95% CI.
In 68 % van de steekproeven ligt de populatieproportie tussen p−σ en p+σ . Dit heet het 68 %-betrouwbaarheidsinterval van p en de 68 % heet de betrouwbaarheid. In 95 % van de steekproeven ligt de populatieproportie tussen p−2⋅σ p - 2 ⋅ σ en p+2⋅σ p + 2 ⋅ σ .
68% van alle waarnemingen vallen binnen één standaarddeviatie van het gemiddelde -- binnen σ van het gemiddelde μ. 95% van alle waarnemingen vallen binnen twee standaarddeviaties van het gemiddelde -- binnen 2σ van het gemiddelde μ. 99,7% van alle waarnemingen vallen binnen drie standaarddeviaties van het gemiddelde -- binnen 3σ van het gemiddelde μ.
De p-waarde (ook wel p-value, overschrijdingskans of kanswaarde genoemd) geeft informatie over de statistische significantie van een resultaat. In de meeste onderzoeken wordt een p-waarde van 0.05 of minder als statistisch significant beschouwd, maar deze drempel kan ook hoger of lager zijn.
Het meest gerapporteerde interval is het 95%-betrouwbaarheidsinterval bij een alfa-waarde van 0,05 . Wanneer het onderzoek meerdere malen wordt herhaald, zal ongeveer 95% van de verschillende mogelijke resultaten binnen dit interval vallen.
Als je betrouwbaarheidsinterval voor een correlatie of regressie nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert. In beide gevallen zul je ook een hoge p-waarde vinden bij je statistische test.
De correcte interpretatie van een 95%-betrouwbaarheidsinterval, [L, U], is bijvoorbeeld: " we zijn er 95% zeker van dat de [populatieparameter] tussen [L] en [U] ligt ." Vul de populatieparameter in met de specifieke formulering uit de opgave.
Het is ook mogelijk om een betrouwbaarheidsniveau van 90% te hanteren voor zowel sociale als natuurlijke studies als de onderzoekspopulatie klein is . Bovendien, als de onderzoekspopulatie klein is en we een betrouwbaarheidsniveau van 95% hanteren, is de onderzoeker verplicht om de gehele onderzoekspopulatie als steekproef te gebruiken.
Een relatief risico (RR) is informatiever dan een odds ratio en staat hoger aangeschreven als uitkomstparameter. In tegenstelling tot een OR kan men met de gegevens van een RR ook de absolute risico's, het absolute risicoverschil en de number needed to treat (NNT) berekenen.
Als het 95%-BI de waarde 0% bevat, kan geconcludeerd worden dat de twee infectiepercentages niet statistisch significant verschillen. Ook voor dit 95%-BI om een verschil geldt: hoe kleiner dit interval, des te preciezer de schatting van het werkelijke verschil.
Kort samengevat: een 95%-betrouwbaarheidsinterval geeft een bereik aan voor experimentele resultaten , waarbij met 95% zekerheid de werkelijke waarde binnen dat bereik valt. Het is de standaard geworden vanwege de balans tussen precisie en betrouwbaarheid, en werd ontwikkeld door statisticus Sir Ronald Fisher.
Wat is een betrouwbaarheidsinterval? In rapportages en verslagen van intelligentieonderzoeken staat bij alle scores vaak het betrouwbaarheidsinterval vermeld. Het betrouwbaarheidsinterval is het bereik van IQ-scores, waarbinnen we met hoge mate van zekerheid kunnen zeggen dat de 'echte' IQ-score ligt.
Een belangrijke eigenschap van de normale verdeling is de empirische regel (ook bekend als de 68-95-99.7 regel). Ongeveer 68% van de gegevens ligt binnen één standaardafwijking van het gemiddelde, ongeveer 95% ligt binnen twee standaardafwijkingen, en bijna 99,7% ligt binnen drie standaardafwijkingen.
Het 95%-betrouwbaarheidsinterval geeft een bereik aan waarbinnen je met 95% zekerheid kunt aannemen dat het werkelijke verschil in gemiddelden valt. Het betrouwbaarheidsinterval kan dus negatieve getallen bevatten, omdat het verschil in gemiddelden negatief kan zijn .
Om te testen of een factor significant is, geldt het volgende: als het betrouwbaarheidsinterval 0 bevat, dan zijn de resultaten niet statistisch significant . De test voor statistische significantie is gelijk aan het testen of 0 een waarde is die binnen het betrouwbaarheidsinterval valt.
Door een significantieniveau in te stellen, kunt u de kans beheersen dat u een ware nulhypothese ten onrechte verwerpt. Dit maakt uw resultaten betrouwbaarder. 0,05: Geeft een risico van 5% aan om te concluderen dat er een verschil bestaat terwijl dat er niet is. 0,01: Geeft een risico van 1% aan, waardoor het significantieniveau strenger is .
10.1.2 Betrouwbaarheidsinterval met de normale verdeling
90% van de waarden ligt tussen -1,645 en +1,645 . 95% van de waarden ligt tussen -1,96 en +1,96.
Als je bijvoorbeeld een betrouwbaarheidsinterval met een betrouwbaarheidsniveau van 95% kiest, betekent dit dat je ervan overtuigd bent dat de schatting 95 van de 100 keer tussen de bovenste en onderste waarden van het betrouwbaarheidsinterval zal vallen.
Voor een eenzijdige t-toets: Linkszijdig: de kritische waarde is het 0,05-de kwantiel van de t-verdeling met N – 1 vrijheidsgraden . Rechtszijdig: de kritische waarde is het 0,05-de kwantiel van de t-verdeling met N – 1 vrijheidsgraden.
Traditioneel wordt een p-waarde van 0,05 of lager als statistisch significant beschouwd .
Samengevat geeft een betrouwbaarheidsinterval een completer en genuanceerder beeld van de resultaten van een onderzoek, terwijl een p-waarde slechts een binair antwoord geeft op de vraag naar statistische significantie.
Het betekent in feite dat als je je onderzoek vele malen zou herhalen, 95% van de berekende intervallen de werkelijke parameter zou omvatten. Het is ook goed om te weten hoe betrouwbaarheidsniveaus zich verhouden tot significantieniveaus. Bij tweezijdige toetsen komt een betrouwbaarheidsniveau van 95% overeen met een significantieniveau van 5% (α = 0,05).