De Z-score voor een observatie bereken je door de waarde van de observatie (Xi) af te trekken van het gemiddelde (x̄) en de uitkomst te delen door de standaardafwijking (s). De uitkomst vertelt ons hoe ver de waarde van het gemiddelde valt: Een Z-score van 0 betekent dat de observatie exact gelijk is aan het gemiddelde.
Z-score berekenen met de Z-toets. De z-score of z-waarde geeft aan hoeveel standaarddeviaties een score van het gemiddelde af zit. Het is een verwachtingswaarde van een normale verdeling met een bekende standaardafwijking, uitgedrukt in eenheden van de standaardafwijking.
Een Z-score geeft aan hoeveel standaarddeviaties een observatie van het gemiddelde af zit. Je krijgt dus je plek ten opzichte van het gemiddelde, uitgedrukt in een standaard maat. Dit heeft als voordeel dat je direct kunt zien hoe goed iemand scoort ten opzichte van de rest.
z=(x-μ)/σ,waarbij μ het bevolkingsgemiddelde is en σ de standaardafwijking van de populatie. Opmerking: Als de standaardafwijking van de populatie onbekend is of de steekproefgrootte minder dan 6 is, moet je een t-score gebruiken in plaats van een z-score.
Bij een standaard normaalverdeling is het gemiddelde altijd 0 en de standaarddeviatie altijd 1. Dus N(0,1). Is de z-score negatief, dan ligt deze links van het gemiddelde (gem. is 0). Positieve z-scores liggen rechts van het gemiddelde.
Nu kun je met de z-score formule alle z-scores berekenen. De Excelformule in cel G4 wordt bijvoorbeeld: = (D4-$L$4)/$L$8 = Meetwaaarde (D4) – Populatiegemiddelde (L4) gedeeld door de Standaarddeviatie L8.
Z. TOETS stelt de kans voor dat het steekproefgemiddelde groter is dan de waargenomen waarde GEMIDDELDE(matrix), wanneer het onderliggende populatiegemiddelde μ0 is. Van de symmetrie van de normale verdeling, als GEMIDDELDE(matrix) < μ0, geeft Z. TOETS een waarde groter dan 0,5 als resultaat.
Als van een steekproef de omvang, het gemiddelde en de standaardafwijking bekend zijn, dan kun je het 95 % -betrouwbaarheidsinterval voor het populatiegemiddelde berekenen als: steekproefgemiddelde ± 2 ⋅ steekproefstandaardafwijking steekproefomvang .
Op naar een hoog Sigma niveau
De niveaus zijn hier onder opgesomd: Niveau 1: 68% voldoet. Niveau 2: 95% voldoet.
Z-tests zijn feitelijke tellingen die kunnen worden gebruikt om populatiecontrasten te maken met een steekproef. De z-score geeft aan hoe ver, in standaardafwijkingen, een informatiepunt verwijderd is van het gemiddelde of normale van een informatieverzameling.
Met de grafische rekenmachine zijn ze makkelijk te berekenen, in Excel gebruik je de formules "=GEMIDDELDE" en "=STDEV.P". De definities zijn als volgt: \mu = \frac{\sum{x_i}}{n} \\ \sigma = \sqrt{ \frac{ \sum(x_i-\bar{x})^2}{n} }.
De mediaan is de middelste waarde van een groep getallen die gerangschikt wordt volgens grootte. Het is het getal dat exact in het midden ligt zodat 50% van de gerangschikte getallen boven 50% ligt en 50% onder de mediaan.
De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.
Bij een grote standaarddeviatie is de spreiding van de waarden rond het gemiddelde groter. Een kleine standaarddeviatie impliceert dat de spreiding rond het gemiddelde kleiner is.
Standaardisatie van een statistische waarneming voor één of meerdere kenmerken. Standaardisatie van een statistische waarneming voor één of meerdere kenmerken is een kunstgreep om via weging te corrigeren voor ongelijke verdelingen tussen groepen naar die kenmerken.
De formule voor deviatie is: d = x – x̄. Hierbij is x̄ het gemiddelde en x de waarde van een individuele meting. Om de standaardafwijking te berekenen, moet je vervolgens alle deviaties kwadrateren en bij elkaar optellen (het Σ-teken in de formule betekent dat je de waarden bij elkaar optelt).
Kort gezegd is de variantie: Het kwadraat van de gemiddelde afstand van het geheel van afzonderlijke waarnemingen ten opzichte van het populatie- of steekproefgemiddelde. Variantie wordt als volgt genoteerd: De variantie voor een populatie wordt genoteerd als sigma kwadraat: σ2.
Sigma staat in de statistiek voor standaarddeviatie, dit is de gemiddelde afwijking ten opzichte van het gemiddelde. Sigma (σ) is de Griekse letter die staat voor de spreiding van een verdeling. Het zegt iets over de spreiding van de uitkomst van je proces.
Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.
Een foutmarge berekenen
Bereken de vierkantswortel van de steekproefgrootte en deel deze door de standaardafwijking van de populatie.
Wat betekent het als mijn betrouwbaarheidsinterval een nul bevat? Als je betrouwbaarheidsinterval voor het verschil tussen groepen een nul bevat, betekent dit dat er een grote kans bestaat dat je geen verschil vindt tussen de groepen als je het experiment nog een keer uitvoert.
t -toets (tTest)
Deze toets is gelijk aan een z-toets, maar wordt gebruikt wanneer de populatie klein en normaal verdeeld is. Deze toets wordt vaker gebruikt dan de z-toets, omdat kleine steekproefpopulaties vaker voorkomen in de statistiek dan grote populaties.
De F-toets wordt in de statistiek gebruikt om twee varianties met elkaar te vergelijken. Als je die op elkaar deelt, krijg je een ratio-score die altijd positief is. Het moge duidelijk zijn dat als de varianties van beide groepen even groot zijn, dat dan de uitkomst 1 is.
De t-test, ook wel t-toets genoemd, wordt gebruikt om de gemiddelden van maximaal twee groepen met elkaar te vergelijken. Je kunt de t-test bijvoorbeeld gebruiken om te analyseren of moedertaalsprekers gemiddeld sneller spreken dan niet-moedertaalsprekers.