Hoe lager het betrouwbaarheidsniveau, des te smaller is het betrouwbaarheidsinterval. Een breder betrouwbaarheidsinterval geeft een grotere kans dat het populatiegemiddelde daar inderdaad in valt: je weet dus zekerder dat je een juiste bewering doet, maar die bewering is wel minder nauwkeurig.
Meestal wordt een waarschijnlijkheid van 95% gebruikt. Dit betekent dat, wanneer we het onderzoek 100 maal in dezelfde populatie met verschillende steekproeven zouden herhalen, 95 van de herhalingen een resultaat geven dat binnen het interval ligt. Dit noemen we een 95% betrouwbaarheidsinterval (95% BI).
De p-waarde is de kans dat er een verschil gemeten is, terwijl er in werkelijkheid geen verschil is. Hoe kleiner de p-waarde, hoe groter de kans dat het gemeten verschil niet toevallig is. Als grenswaarde wordt bij de berekening van de p-waarde meestal 5% gekozen, overeenkomend met het 95% betrouwbaarheidsinterval.
Meestal wordt een waarschijnlijkheid van 95% gebruikt. Dit betekent dat, wanneer we het onderzoek 100 maal in dezelfde populatie met verschillende steekproeven zouden herhalen, 95 van de herhalingen een resultaat geven dat binnen het interval ligt. Dit noemen we een 95% betrouwbaarheidsinterval (95% BI).
Met 4 à 5 metingen heb je een grove indicatie van de spreiding. Met 10 metingen heb je een redelijke waarde. Dit laatste is dus eigenlijk het minimum dat je nodig hebt voor een betrouwbaar resultaat.
Als de kans, dat een verschil door toeval ontstaan is, kleiner is dan 5% (p = 0.05), dan noemt men het verschil significant (betekenisvol). Als de kans, dat het verschil door toeval ontstaan is, kleiner is dan 1% (p = 0.01 ) dan noemt men het verschil zeer significant (zeer betekenis vol).
Als je betrouwbaarheidsinterval voor een correlatie of regressie nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert. In beide gevallen zul je ook een hoge p-waarde vinden bij je statistische test.
Het betrouwbaarheidsinterval (Engels confidence interval (CI)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Het is een interval waar binnen je verwacht dat de werkelijke waarde ligt.
De variantie (variance) is een maat die iets zegt over de spreiding in een dataset. Hoe meer de data verspreid zijn, hoe groter de variantie ten opzichte van het gemiddelde.
Opmerking: Het woord proportie betekent "verhouding" of "deel": het levert een getal op tussen en (dat kan een breuk zijn of een kommagetal). De steekproefproportie is het gevonden aantal gedeeld door de steekproefgrootte. In dit voorbeeld dus 16 50 = 0,32 .
Strikt genomen is de p-waarde een maat voor de kans dat de nulhypothese ten onrechte is verworpen (en het gevonden verschil tussen onderzoeksgroepen dus in werkelijkheid op toeval berust). Praktisch gezien is de p-waarde een waarde tussen 0 en 1, die wordt bepaald door middel van een statistische toets.
In principe is het meten van een proportie (percentage) natuurlijk niets anders dan het meten van een gemiddelde.
Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans). Statistische significantie is enigszins willekeurig, omdat je zelf de drempelwaarde (alfa) kiest. De meest voorkomende drempel is p < 0.05, wat betekent dat de kans 5% is dat de resultaten worden gevonden terwijl de nulhypothese waar is.
In de statistiek wordt hiermee bedoeld dat een gevonden resultaat (waarschijnlijk) niet op toeval berust. Bij het toetsen van significantie gaat men uit van de nulhypothese die stelt dat een gevonden associatie of verschil berust op toeval, met andere woorden dat er in werkelijkheid geen associatie of verschil bestaat.
Het aantal successen in een steekproef gedeeld door het totaal aantal elementen in de steekproef.
Vaak wil je dat een onderzoeksresultaat staat of geldt voor de hele populatie. Als je een steekproef trekt is het tricky om te stellen dat het je gelukt is. Daarom geef je een betrouwbaarheidsinterval. Deze geeft aan tussen welke waarden een onderzoeksuitkomst waarschijnlijk zal zitten.
De t-test, ook wel t-toets genoemd, wordt gebruikt om de gemiddelden van maximaal twee groepen met elkaar te vergelijken. Je kunt de t-test bijvoorbeeld gebruiken om te analyseren of moedertaalsprekers gemiddeld sneller spreken dan niet-moedertaalsprekers.
Het 95%-betrouwbaarheidsinterval geeft aan dat bij het steeds nemen van een nieuwe aselecte steekproef uit dezelfde populatie 95% van de daarbij opgestelde intervallen de populatieproportie bevat. Het 95%-betrouwbaarheidsinterval is: [p −2 p +2 ]
Hoe verder de correlatie van 0 af zit, hoe sterker het verband is. Op basis van toeval zal de correlatie altijd wel iets van 0 afwijken. Maar met de p-waarde wordt beoordeeld of het verband 'significant' is. Bij een p-waarde die kleiner is dan 0.05, is een verband statistisch significant.
Wat is een effectgrootte? De effectgrootte laat zien hoe betekenisvol de relatie tussen variabelen of het verschil tussen groepen is. Het zegt iets over de praktische relevantie (ook wel praktische significantie genoemd) van een onderzoeksresultaat.
De 95% regel is de standaard bij significantie
De meest gehanteerde regel ten aanzien van significantie is de 95% regel. Dit betekent dat wanneer we met 95% zekerheid kunnen zeggen dat een effect niet ontstaan is door toeval, we mogen aannemen dat het effect werkelijk bestaat.
Bij een hypothesetoets wordt de p-waarde vergeleken met het significantieniveau om te beslissen of de nulhypothese moet worden verworpen. Als de p-waarde hoger is dan het significantieniveau, wordt de nulhypothese niet weerlegd en zijn de resultaten niet statistisch significant.
De nulhypothese (H0) kan worden getoetst door statistische toetsing. Als de gevonden waarde significant verschilt van de verwachte waarde onder de nulhypothese, kunnen we de nulhypothese verwerpen. De nauwkeurigheid van statistisch significante resultaten worden doorgaans weergegeven door de p-waarde.