Als van een steekproef de omvang, het gemiddelde en de standaardafwijking bekend zijn, dan kun je het 95 % -betrouwbaarheidsinterval voor het populatiegemiddelde berekenen als: steekproefgemiddelde ± 2 ⋅ steekproefstandaardafwijking steekproefomvang .
Het 95%-betrouwbaarheidsinterval geeft aan dat bij het steeds nemen van een nieuwe aselecte steekproef uit dezelfde populatie 95% van de daarbij opgestelde intervallen de populatieproportie bevat. Het 95%-betrouwbaarheidsinterval is: [p −2 p +2 ]
Meestal wordt een waarschijnlijkheid van 95% gebruikt. Dit betekent dat, wanneer we het onderzoek 100 maal in dezelfde populatie met verschillende steekproeven zouden herhalen, 95 van de herhalingen een resultaat geven dat binnen het interval ligt. Dit noemen we een 95% betrouwbaarheidsinterval (95% BI).
Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.
Interpretatie. Gezien de definitie houdt dit in dat in 95% van de keren dat het interval op dezelfde manier wordt waargenomen, de parameter in het gevonden interval ligt. De parameter heeft steeds dezelfde onbekende waarde, maar iedere keer wordt een (meestal) ander interval waargenomen.
Een betrouwbaarheidsinterval is het gemiddelde van je schatting plus of min de variatie in die schatting. Dit is het bereik van waarden waartussen je verwacht dat je schatting zal vallen als je je test opnieuw doet, binnen een bepaald betrouwbaarheidsniveau.
Meestal hanteert men het 95%-betrouwbaarheidsinterval (95%-BI) rond een steekproefgemiddelde, wat aangeeft dat met een waarschijnlijkheid van 95% het ware populatiegemiddelde zich in dit interval bevindt.
Vaak wil je dat een onderzoeksresultaat staat of geldt voor de hele populatie. Als je een steekproef trekt is het tricky om te stellen dat het je gelukt is. Daarom geef je een betrouwbaarheidsinterval. Deze geeft aan tussen welke waarden een onderzoeksuitkomst waarschijnlijk zal zitten.
De Z-score voor een observatie bereken je door de waarde van de observatie (Xi) af te trekken van het gemiddelde (x̄) en de uitkomst te delen door de standaardafwijking (s). De uitkomst vertelt ons hoe ver de waarde van het gemiddelde valt: Een Z-score van 0 betekent dat de observatie exact gelijk is aan het gemiddelde.
De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.
Maak een lijst van alle scores en vind het gemiddelde. Trek het gemiddelde af van iedere score om de afstand (afwijking) tot het gemiddelde te berekenen. Bereken voor iedere afwijking het kwadraat. Tel alle gekwadrateerde afwijkingen bij elkaar op.
Als n groot genoeg is, heeft p(dakje) een normaal verdeling, waardoor het gemiddelde van de populatie gelijk aan het gemiddelde van de steekproef. De standaarddeviatie is dan gelijk aan: σp(dakje) = √p( 1 −p)/n dit noem je ook wel de standaard error van p.
Gewoonlijk hanteert men p=0,05 als grens van statistische significantie. Indien p≤0,05, dan is de kans dat het gevonden resultaat aan het toeval is te wijten (en we de nulhypothese ten onrechte verwerpen) kleiner of gelijk aan 5%, dit noemt men 'statistisch significant'.
Hoe hoger het percentage, hoe vaker het populatiegemiddelde in het betrouwbaarheidsinterval zal liggen. Als we een 99 % 99% betrouwbaarheidsinterval berekenen, weten we zeker dat het populatiegemiddelde in 99 % 99% van de steekproeven in dat interval zal liggen.
Wat is een betrouwbaarheidsinterval? - YouTube. Gemiddelde en betrouwbaarheidsinterval horen bij elkaar. Het betrouwbaarheidsinterval zegt iets over hoe zeker we weten dat het gemiddelde in een steekproef ook het gemiddelde van de hele populatie is.
Als je betrouwbaarheidsinterval voor het verschil tussen groepen een nul bevat, betekent dit dat er een grote kans bestaat dat je geen verschil vindt tussen de groepen als je het experiment nog een keer uitvoert.
De twee belangrijkste regels die je moet onthouden zijn dus: 68% van de waarnemingen ligt tussen μ – σ en μ + σ. 95% van de waarnemingen ligt tussen μ – 2σ en μ + 2σ
Z. TOETS stelt de kans voor dat het steekproefgemiddelde groter is dan de waargenomen waarde GEMIDDELDE(matrix), wanneer het onderliggende populatiegemiddelde μ0 is. Van de symmetrie van de normale verdeling, als GEMIDDELDE(matrix) < μ0, geeft Z. TOETS een waarde groter dan 0,5 als resultaat.
Een Z-score geeft aan hoeveel standaarddeviaties een observatie van het gemiddelde af zit. Je krijgt dus je plek ten opzichte van het gemiddelde, uitgedrukt in een standaard maat. Dit heeft als voordeel dat je direct kunt zien hoe goed iemand scoort ten opzichte van de rest.
Als de p-waarde groter is dan het significantieniveau: Er is voldoende aanleiding om aan te nemen dat de nulhypothese klopt. Je kunt alleen laten zien dat de steekproefuitkomst wel/niet extreem is gegeven de nulhypothese. Is de uitkomst te extreem, dan concludeer je dat de alternatieve hypothese logischer is.
Significante verschillen tussen groepsgemiddelden worden berekend met behulp van een F-statistiek, die de verhouding weergeeft tussen de gemiddelde som van de kwadraten (de variantie die door de onafhankelijke variabele wordt verklaard) en de gemiddelde kwadratische fout (de variantie die overblijft).
Met 4 à 5 metingen heb je een grove indicatie van de spreiding. Met 10 metingen heb je een redelijke waarde. Dit laatste is dus eigenlijk het minimum dat je nodig hebt voor een betrouwbaar resultaat.
De standaarddeviatie (standard deviation of s) is de gemiddelde hoeveelheid variabiliteit in je dataset. Deze maat vertelt je hoe ver iedere score gemiddeld van het gemiddelde verwijderd is. Des te groter de standaarddeviatie, des te meer variabel je dataset is.
Het betrouwbaarheidsniveau (confidence level) is het percentage van de keren dat je verwacht in de buurt van dezelfde schatting te komen als je je experiment nog een keer uitvoert of opnieuw op dezelfde manier een steekproef uit de populatie haalt.
een standaarddeviatie onder de 0,5 geeft aan dat de respondenten redelijk op één lijn zitten, een standaarddeviatie tussen 0,5 en 1 geeft aan dat er verschillende opvattingen zijn, een standaarddeviatie boven de 1 geeft aan dat er extreme verschillen zijn.