Bij de 68-95-99,7-regel zag je dat bij een betrouwbaarheidsinterval van 95% een z-score 1,96 hoort. Anders gezegd: het 95% betrouwbaarheidsinterval omvat bij een normale verdeling het gebied tussen de z-score van –1,96 en +1,96.
Er is namelijk een vuistregel (de empirische regel) die zegt dat 68% van de personen tussen een Z-score van -1 en 1 zit, dat 95% van de personen een Z-score tussen -2 en 2 heeft, en 99,7% binnen 3 standaarddeviaties ten opzichte van het gemiddelde zit.
Ongeveer 68% van alle waarden ligt binnen een afstand van 1 standaarddeviatie (σ) of 1 z-score rondom het gemiddelde.
Stel dat je de lengte van 50 planten hebt gemeten en het gemiddelde is 30 cm met een standaarddeviatie van 2 cm. Het 95% betrouwbaarheidsinterval zou dan als volgt worden berekend: Gemiddelde = 30 cm, standaarddeviatie = 2 cm.Kritieke waarde = 1,96 (voor een tweezijdige toets met 95% betrouwbaarheid).
Een proces dat functioneert op een 6 Sigma-niveau wordt beschouwd als uiterst efficiënt, met slechts 3,4 defecten per miljoen mogelijkheden. Dit niveau staat symbool voor bijna perfecte kwaliteit.
Dit zijn de algemeen geaccepteerde benchmarks voor procesvermogen in termen van Sigma-niveaus: – 1 Sigma: 68,27% van de procesoutput voldoet aan de eisen van de klant. – 3 Sigma: 99,73% van de procesoutput voldoet aan de eisen van de klant. – 4 Sigma: 99,9937% van de procesoutput voldoet aan de eisen van de klant.
Een proces met 50% defecten (DPMO = 500.000) zou een Sigma-niveau van 0 hebben. Normaal gesproken wordt een proces met een Sigma-niveau van 6 of hoger beschouwd als een uitstekend proces.
Het betrouwbaarheidsinterval, of confidence interval (CI) in het Engels, geeft de verwachte kans aan (in %) dat het werkelijke effect in je populatie binnen deze grenzen ligt. Meestal wordt een betrouwbaarheidsinterval van 95% gebruikt: het 95% CI.
Omdat 95% van de waarden binnen twee standaarddeviaties van het gemiddelde vallen volgens de 68-95-99.7-regel, hoeft u alleen maar twee standaarddeviaties van het gemiddelde op te tellen en af te trekken om het 95%-betrouwbaarheidsinterval te verkrijgen.
Dit is de kritische z-score die we gebruiken in de formule. Voor een betrouwbaarheidsinterval van 90% of 99% is de kritische z-score respectievelijk 1,65 en 2,58. Deze waardes komen uit de standaardnormale tabel of z-tabel.
Eén standaarddeviatie, of één sigma, uitgezet boven of onder de gemiddelde waarde op die normale verdelingscurve, zou een gebied definiëren dat 68 procent van alle datapunten omvat.
Voorbeeld van het berekenen van het sigma niveau
Er zijn 5 'kritieke' fouten per dossier. Van de afgelopen 800 dossiers zijn er 500 kritieke fouten gevonden. De DPMO is 1 miljoen * 500/(5*800) = 125.000 (12,5% kritieke fouten).
1 sigma = 68% , 2 sigma = 95,4%, 3 sigma = 99,7%, 4 sigma = 99,99% en hoger. Een andere manier om hierover na te denken is door 1-waarschijnlijkheid te nemen. Dus, 1 sigma betekent dat je 32% van de tijd geen 45 +/- 10 km/s meet.
De Z-score is de score die aangeeft hoeveel de FER-ratio van het gemiddelde afwijkt (lees: standaarddeviatie). Een Z-score van -1,64 (het 5e percentiel) of lager correspondeert dan met obstructie.
De z-waarde bij het 95 procent betrouwbaarheidsinterval is dus 1,96 .
Voor een bij benadering normale dataset bedragen de waarden binnen één standaarddeviatie van het gemiddelde ongeveer 68% van de set, terwijl de waarden binnen twee standaarddeviaties ongeveer 95% bedragen en de waarden binnen drie standaarddeviaties ongeveer 99,7%.
Het 95%-betrouwbaarheidsinterval geeft aan dat bij het steeds nemen van een nieuwe aselecte steekproef uit dezelfde populatie 95% van de daarbij opgestelde intervallen de populatieproportie bevat. Het 95%-betrouwbaarheidsinterval is: [p −2 p +2 ]
Voorbeeld: 95% betrouwbaarheidsinterval
Uit de z-tabel blijkt dat de z-score die overeenkomt met een cumulatieve waarschijnlijkheid van 0,975 ongeveer 1,96 is . Voor een betrouwbaarheidsinterval van 95% is de z-score dus 1,96.
Stap 1: Bepaal het betrouwbaarheidsniveau, aangegeven met , waarbij een getal (decimaal) is tussen 0 en 100. Stap 2: Verkrijg het betrouwbaarheidsniveau, aangegeven door α = 1 − C 100 te evalueren. Stap 3: Gebruik de -tabel (of een rekenmachine) om de -score z α / 2 te verkrijgen .
Door experts geverifieerd antwoord
De schatting met een betrouwbaarheidsniveau van 95% die afkomstig is van een kleine steekproef, wordt aangegeven door de foutmarge : hoe groter de marge, hoe kleiner de steekproef. Het identificeren van de optie met de maximale foutmarge (zoals 21%) wijst erop dat deze afkomstig is van een kleine steekproef.
Een betrouwbaarheidsinterval van 95% wordt vaak geïnterpreteerd als een bereik waarbinnen we 95% zeker kunnen zijn dat het werkelijke effect ligt . Deze verklaring is een losse interpretatie, maar is nuttig als een grove leidraad.
Een foutmarge berekenen
Bereken de vierkantswortel van de steekproefgrootte en deel deze door de standaardafwijking van de populatie.
1 Sigma: Een proces met een zeer slechte kwaliteit, met ongeveer 690.000 defecten per miljoen kansen (DPMO). 2 Sigma: Nog steeds van slechte kwaliteit, met ongeveer 308.000 DPMO. 3 Sigma: Matige kwaliteit, ongeveer 66.800 DPMO, wat neerkomt op een opbrengst van 93,32%. 4 Sigma: Goede kwaliteit , ongeveer 6.210 DPMO of 99,38% opbrengst.
Het 3 sigma nauwkeurigheidspercentage bedraagt 99,73% en wordt gebruikt om de voorspelbaarheid van uitkomsten voor een gewenst proces te meten.
Voor andere resultaten, zoals de ontdekking van het Higgs-boson, is een significantie van vijf sigma gelijk aan de waarschijnlijkheid van 0,00003% van een statistische fluctuatie, omdat wetenschappers op zoek zijn naar gegevens die de waarde van vijf sigma op één helft van de normale verdelingsgrafiek overschrijden.