Interkwartielafstand (interquartile range) Voor iedere verdeling die van laag naar hoog is gerangschikt, bevat de interkwartielafstand (IQR) de helft van de waarden. Je berekent de interkwartielafstand door de waarde voor het eerste kwartiel (Q1) af te trekken van de waarde voor het derde kwartiel (Q3).
De interkwartielafstand (IQR) bevat het tweede en derde kwartiel, wat neerkomt op het middelste deel of de “middelste helft” van je dataset. Het bereik (de range) geeft informatie over de spreiding in de gehele dataset, terwijl de interkwartielafstand gelijk is aan het bereik van de middelste helft.
Met specifieke software bereken je de interkwartielafstand in een (fractie van een) seconde. Acht mensen uit een groot bedrijf hebben de volgende gemeten lengtes L [in cm]: 169, 175, 178, 181, 181, 183, 193 en 201. De interkwartielafstand IQR = q3 - q1 = 190,50 – 175,75 = 14,75 cm.
Kwartielafstand = Q3 - Q1
De kwartielafstand geeft aan hoe verspreid de getallen in de waarnemingsreeks zijn. De kwartielafstand is daarom een voorbeeld van een spreidingsmaat.
Het eerste kwartiel is de mediaan van de eerste helft getallen exclusief de mediaan: 1, 2, 4, 5, 7, 8 dus Q 1 = (4 + 5) : 2 = 4,5. Het derde kwartiel is de mediaan van de tweede helft getallen exclusief de mediaan: 10, 12, 15, 16, 17 dus Q 3 = (15 + 16) : 2 = 15,5.
Tijdens de kwalificatie gaan de coureurs het circuit op om hun startpositie veilig te stellen. De kwalificatie duurt doorgaans een uur en wordt onderverdeeld in drie delen, Q1, Q2 en Q3.
De mediaan over de eerste helft (met de laagste getallen) heet het eerste kwartiel en wordt aangegeven met Q1. De mediaan over de tweede helft (met de hoogste getallen) heet het derde kwartiel en wordt aangegeven met Q3.
Eerste kwartiel Q1: Is het 25e percentiel. 25% van de waarnemingen valt onder Q1. Tweede kwartiel: de mediaan, 50% van de waarnemingen valt onder de mediaan, 50% valt erboven. Derde kwartiel Q3: Is het 75e percentiel.
Berekent het kwartiel van een gegevensverzameling. Kwartielen worden veel gebruikt in verkoop- en onderzoeksgegevens om populaties in groepen te verdelen. U kunt met KWARTIEL bijvoorbeeld de bovenste 25 procent van de inkomens van een populatie bepalen.
Het 95%-betrouwbaarheidsinterval geeft aan dat bij het steeds nemen van een nieuwe aselecte steekproef uit dezelfde populatie 95% van de daarbij opgestelde intervallen de populatieproportie bevat. Het 95%-betrouwbaarheidsinterval is: [p −2 p +2 ]
Een boxplot is een grafische weergave van een dataset waarbij een minimum (laagste waarde), het eerste kwartiel, de mediaan, het derde kwartiel en een maximum (hoogste waarde) worden weergegeven. Deze dataset kan bijvoorbeeld een grote database of een steekproef uit een populatie zijn.
De standaarddeviatie geeft de mate van spreiding van getallen rondom het gemiddelde van deze getallen (afb. 1).
De mediaan wordt bijvoorbeeld vaak gebruikt als centrummaat voor de variabele “inkomen”, die over het algemeen niet normaal verdeeld is. Aangezien je voor de mediaan slechts één of twee waarden in het midden gebruikt, wordt deze maat niet beïnvloed door extreme uitbijters of niet-symmetrische verdelingen.
Bij een oneven aantal waarnemingen is het het middelste getal. Bij een even aantal waarnemingen is de mediaan het gemiddelde van de middelste twee waarnemingen. De mediaan kun je berekenen door eerst alle waarnemingen op volgorde te zetten.Daarna neem je het totaal aantal waarnemingen + 1 en deel je dit getal door 2.
De mediaan is de middelste waarde van een groep getallen die gerangschikt wordt volgens grootte. Het is het getal dat exact in het midden ligt zodat 50% van de gerangschikte getallen boven 50% ligt en 50% onder de mediaan.
Q1 duurt 18 minuten, de vijf langzaamste coureurs vallen af. Na Q1 is het tijd voor Q2. Daarin worden de tijden van Q1 geschrapt en moeten de overgebleven coureurs allemaal opnieuw een tijd neerzetten. Q2 duurt een kwartier, opnieuw vallen de vijf langzaamste coureurs af.
Q1 is de internationale standaard richtlijn voor kwaliteitsmanagementsystemen van organisaties, die producten maken en leveren aan de olie- en gasindustrie. Deze richtlijn is opgesteld door de American Petroleum Institute (API) en uw organisatie kan via diezelfde organisatie worden gecertificeerd.
Aan het 1e deel van de kwalificatie (Q1) doen alle 22 coureurs mee. In 18 minuten mogen ze zo veel mogelijk ronden rijden als ze maar willen. De 16 rijders met de snelste rondetijden mogen door naar het volgende deel van de kwalificatie. De 6 langzaamste vallen af.
De standaarddeviatie (standard deviation of s) is de gemiddelde hoeveelheid variabiliteit in je dataset. Deze maat vertelt je hoe ver iedere score gemiddeld van het gemiddelde verwijderd is. Des te groter de standaarddeviatie, des te meer variabel je dataset is.
Decielen uitleg
Bij decielen deel je de reeks door 10. In ons voorbeeld met 10 waarden is elke waarde dus een deciel.
De mediaan verdeelt de gegevens in twee evengrote stukken: 50% eronder en 50% erboven. Je kunt op deze manier een hoeveelheid gegevens ook in vieren verdelen. Dus in 4 stukken van elk 25% van de gegevens. De grenzen van deze vier gebieden worden kwartielen genoemd: q1, q2 en q3.
Omdat Excel geen boxplot optie kent, ga je een gestapeld staafdiagram ombouwen tot een boxplot. De box wordt begrensd door de ondergrens Q1 en de bovengrens Q3. Het middelste getal is de mediaan.
Q1 – Alle twintig coureurs nemen deel aan deze sessie van achttien minuten. Ze mogen zoveel ronden rijden als ze willen in deze tijd. Na afloop van deze sessie vallen de langzaamste vijf coureurs af.
De modale klasse is het interval met de hoogste frequentie. De modale waarde wordt geschat als het middelpunt van de modale klasse.