Een populatieproportie p is het deel van de populatie dat voldoet aan een zeker kenmerk, uitgedrukt als percentage of fractie. Omdat een populatieproportie, net als een populatiegemiddelde, vaak niet bekend is, bestaat er ook verklarende statistiek die de populatieproportie onderzoekt.
Bij elke steekproef worden de grenzen van het -betrouwbaarheidsinterval berekend met de vuistregel p ± 2 ⋅ p ( 1 − p ) n .
populatieproportie = P = het deel van de populatie dat een bepaalde eigenschap heeft. Natuurlijk is die P onbekend (als hij bekend was, waarom zou je dan een steekproef of een onderzoek doen?) steekproefproportie = p = het deel van mijn steekproef dat een bepaalde eigenschap heeft.
Meestal wordt een waarschijnlijkheid van 95% gebruikt. Dit betekent dat, wanneer we het onderzoek 100 maal in dezelfde populatie met verschillende steekproeven zouden herhalen, 95 van de herhalingen een resultaat geven dat binnen het interval ligt. Dit noemen we een 95% betrouwbaarheidsinterval (95% BI).
Strikt genomen is de p-waarde een maat voor de kans dat de nulhypothese ten onrechte is verworpen (en het gevonden verschil tussen onderzoeksgroepen dus in werkelijkheid op toeval berust). Praktisch gezien is de p-waarde een waarde tussen 0 en 1, die wordt bepaald door middel van een statistische toets.
Maak een lijst van alle scores en vind het gemiddelde. Trek het gemiddelde af van iedere score om de afstand (afwijking) tot het gemiddelde te berekenen. Bereken voor iedere afwijking het kwadraat. Tel alle gekwadrateerde afwijkingen bij elkaar op.
Met 4 à 5 metingen heb je een grove indicatie van de spreiding. Met 10 metingen heb je een redelijke waarde. Dit laatste is dus eigenlijk het minimum dat je nodig hebt voor een betrouwbaar resultaat.
Een populatie is de gehele groep waarover je uitspraken wilt doen, bijvoorbeeld “verpleegkundigen tussen de 25 en 34 jaar oud”. Een steekproef is de specifieke subgroep die je daadwerkelijk onderzoekt en waarvoor je data verzamelt.
Een Z-score geeft aan hoeveel standaarddeviaties een observatie van het gemiddelde af zit. Je krijgt dus je plek ten opzichte van het gemiddelde, uitgedrukt in een standaard maat. Dit heeft als voordeel dat je direct kunt zien hoe goed iemand scoort ten opzichte van de rest.
Als je betrouwbaarheidsinterval voor een correlatie of regressie nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert. In beide gevallen zul je ook een hoge p-waarde vinden bij je statistische test.
Meestal kies je voor een α van 0.05 of 0.01. Bij hypothesetoetsing wordt de verkregen p-waarde (p-value) vergeleken met het significantieniveau om te bepalen of het gevonden verschil of de gevonden relatie statistisch significant is. Als de p-waarde kleiner is dan de gekozen drempelwaarde, is het resultaat significant.
Hoe hoger het percentage, hoe vaker het populatiegemiddelde in het betrouwbaarheidsinterval zal liggen. Als we een 99 % 99% betrouwbaarheidsinterval berekenen, weten we zeker dat het populatiegemiddelde in 99 % 99% van de steekproeven in dat interval zal liggen.
In principe is het meten van een proportie (percentage) natuurlijk niets anders dan het meten van een gemiddelde.
Bij statistisch onderzoek is het populatiegemiddelde, het gemiddelde van een statistische variabele van de hele populatie, belangrijk. Dat gemiddelde wordt meestal geschat door een steekproef te nemen en daarvan het steekproefgemiddelde te berekenen.
Het aantal successen in een steekproef gedeeld door het totaal aantal elementen in de steekproef.
Steekproef & populatie: wat zijn het? Een populatie is de gehele groep mensen of zaken waar je uitspraken over wilt doen. Een steekproef is een deel van de populatie dat deelneemt aan het onderzoek.
Het steekproefgemiddelde is de gemiddelde waarde van de waarnemingen van de steekproef. Dus: alle waarnemingen bij elkaar optellen, en vervolgens delen door het aantal waarnemingen.
Bij betrouwbaarheid gaat het om hoe consistent een methode iets meet. Hierbij is het van belang dat de uitkomsten hetzelfde zijn als je de meting of het gehele onderzoek op exact dezelfde wijze nog een keer uitvoert (reproduceert of repliceert).
In wetenschappelijk onderzoek noemt men een meetinstrument betrouwbaar wanneer de geobserveerde waarde precies gelijk is aan de waarde op een ander moment, indien onder identieke omstandigheden wordt gemeten.
Om de betrouwbaarheid van je onderzoek te bepalen beantwoord je de vraag: “Als ik hetzelfde nog een keer zo zou onderzoeken en de omstandigheden zijn niet veranderd, krijg ik dan dezelfde uitslag?” Een betrouwbaar onderzoek is dus reproduceerbaar.
Een hoge p-waarde betekent dat heel veel deelnemers de vraag correct beantwoord hebben. Dit kan betekenen dat veel deelnemers deze vraag goed beheersen. Dat kan ook komen doordat de vraag té makkelijk is geformuleerd, waarbij je bijvoorbeeld slechte afleiders hebt geschreven.
De p-waarde geeft aan hoe waarschijnlijk het is dat de data die je hebt gevonden zouden voorkomen als de nulhypothese waar zou zijn. Als de p-waarde onder je grenswaarde (vaak p < 0.05) valt, kun je de nulhypothese verwerpen, maar dit betekent niet per se dat je alternatieve hypothese waar is.
In wetenschappelijke artikelen is geregeld te lezen dat de resultaten 'net niet significant' waren. Meestal betekent dit dat de waarde van de statistische grootheid p vlak boven de 0,05 lag.