De interkwartielafstand (interquartile
Je verdeelt als het ware alle gemeten data in vier groepen, op volgorde van laag naar hoog. De interkwartielafstand is dan het verschil tussen het hoogst gemeten resultaat in de eerste groep en het laagst gemeten resultaat in de derde groep. Daarmee heb je dus de middelste helft van alle data te pakken.
Mediaan: de middelste waarde als je de dataset van kleinste naar grootste waarde rangschikt. Gemiddelde: de som van alle waarden, gedeeld door het totale aantal waarden.
De range geeft aan wat de laagste en de hoogste waarde van de data zijn. De IQR is de afstand tussen de eerste en derde kwartiel: de grens van het eerste kwartiel is de waarde waarbij 25% van de data kleiner zijn; de grens van het derde kwartiel is de waarde waarbij 75% van de data kleiner zijn.
De IQR beschrijft de middelste 50% van de waarden wanneer geordend van laag naar hoog . Om de interkwartielafstand (IQR) te vinden, moet u eerst de mediaan (middelste waarde) van de onderste en bovenste helft van de gegevens vinden. Deze waarden zijn kwartiel 1 (Q1) en kwartiel 3 (Q3). De IQR is het verschil tussen Q3 en Q1.
Kwartielen. In wiskunde hebben we een manier om gegevens te verdelen in vier kwartalen - dit wordt gedaan met behulp van kwartielen. Deze kwartielen zijn de mediaan van verschillende delen van onze gegevensset. Het eerste kwartiel, of Q1, is de mediaan van de eerste helft waarnemingsgetallen.
Voor de eerste set wiskundescores kan de IQR op de volgende manier worden berekend: De helft van de IQR wordt de semi-interkwartielafstand of Q genoemd. Zowel Q als IQR hebben een eenvoudige relatie met de standaarddeviatie (σ, later in dit artikel beschreven) in normaal verdeelde gegevens: Q = 0,6754 σ of σ ≈ 1,5 Q .
Het is belangrijk om te weten of de getallen in een reeks dicht rondom het gemiddelde liggen, of dat ze meer verspreid zijn over de gehele range. De indicator daarvoor is de standaarddeviatie. Dit is de statistische term. In alledaags taalgebruik noemt men dit de spreiding of ook wel de standaardafwijking.
De interkwartielafstand (IQR) is het verschil tussen de bovenste (Q3) en onderste (Q1) kwartielen en beschrijft de middelste 50% van de waarden wanneer geordend van laag naar hoog . De IQR wordt vaak gezien als een betere maatstaf voor spreiding dan het bereik, omdat het niet wordt beïnvloed door outliers.
Mediaan. De mediaan is beter bestand tegen extreme, misleidende datawaarden, dus het lijkt de duidelijke keuze.
De modus is het getal of het woord dat het vaakst voorkomt in een groep. Je hebt dus ook een modus als het bijvoorbeeld gaat om kleuren. Als je de volgende groep hebt: groen, groen, rood, wit, geel, dan is groen de modus. Als er meerdere getallen of woorden zijn die het vaakst voorkomen, dan zijn er meerdere modi.
Een kleine IQR zou betekenen dat de centrale gegevens dicht bij elkaar liggen en daarom consistenter zijn, terwijl een grote IQR zou duiden op een grotere spreiding van gegevens en daarom meer variabiliteit.
De interkwartielafstand (interquartile range) is een descriptieve statistiek die informatie geeft over de spreiding van de middelste helft van een verdeling. Deze maat behoort tot de vier meest gebruikte spreidingsmaten (measures of variability).
Berekening: De IQR wordt berekend door het derde kwartiel (Q3) te verminderen met het eerste kwartiel (Q1): IQR = Q3 – Q1. Deze waarde representeert de spreiding van de middelste 50% van de gegevens.
3-Sigmaregel
Ongeveer 68% van alle waarden ligt binnen een afstand van 1 standaarddeviatie (σ) of 1 z-score rondom het gemiddelde. Z-scores zijn uitgedrukt op een schaal die aangeeft hoeveel standaardafwijkingen een waarneming verwijderd is van het gemiddelde.
Met STDEV. S wordt ervan uitgegaan dat de argumenten een steekproef van de populatie vormen. Als uw gegevens de volledige populatie omvatten, moet u de standaarddeviatie berekenen met STDEV. P.
De interkwartielafstand is de beste maatstaf voor variabiliteit voor scheve verdelingen of datasets met outliers . Omdat het gebaseerd is op waarden die uit de middelste helft van de verdeling komen, is het onwaarschijnlijk dat het beïnvloed wordt door outliers.
een standaarddeviatie onder de 0,5 geeft aan dat de respondenten redelijk op één lijn zitten, een standaarddeviatie tussen 0,5 en 1 geeft aan dat er verschillende opvattingen zijn, een standaarddeviatie boven de 1 geeft aan dat er extreme verschillen zijn.
Mediaan en IQR zijn betere statistieken dan gemiddelde en standaarddeviatie voor het beschrijven van scheve kansverdelingen, omdat ze gebaseerd zijn op waarden die uit de middelste helft van de verdeling komen en waarschijnlijk niet worden beïnvloed door uitschieters .
Als een helft uit een even aantal bestaat is het kwartiel het gemiddelde van de middelste 2 getallen. De kwartielafstand geeft aan hoe verspreid de getallen in de waarnemingsreeks zijn. De kwartielafstand is daarom een voorbeeld van een spreidingsmaat.
Het onderste kwartiel, of eerste kwartiel (Q1), is de waarde waaronder 25% van de datapunten worden gevonden wanneer ze in oplopende volgorde worden gerangschikt. Het bovenste kwartiel, of derde kwartiel (Q3), is de waarde waaronder 75% van de datapunten worden gevonden wanneer ze in oplopende volgorde worden gerangschikt.
Een boxplot is een visualisatie van vijf belangrijke beschrijvende statistieken, namelijk het minimum, het eerste kwartiel, de mediaan, het derde kwartiel en het maximum. Soms worden zwakke en sterke uitschieters (outliers) ook opgenomen in een boxplot. Een boxplot zegt iets over de verdeling van de data.