De mediaan is het middelste getal van een rij getallen. Dit betekent dat 50% van de getallen zich onder de mediaan bevindt en 50% boven de mediaan. Deze helften worden ook weer opgedeeld in 2. Hierdoor kan je in de boxplot zien waar de eerste 25% van de getallen zit, de 2e 25%, de 3e 25% en de 4e 25%.
Vaak worden in een boxplot eventuele uitschieters weergegeven en soms ook het rekenkundig gemiddelde.
Het eerste kwartiel is de mediaan van de eerste helft getallen exclusief de mediaan: 1, 2, 4, 5, 7, 8 dus Q 1 = (4 + 5) : 2 = 4,5. Het derde kwartiel is de mediaan van de tweede helft getallen exclusief de mediaan: 10, 12, 15, 16, 17 dus Q 3 = (15 + 16) : 2 = 15,5.
De formule voor deviatie is: d = x – x̄. Hierbij is x̄ het gemiddelde en x de waarde van een individuele meting. Om de standaardafwijking te berekenen, moet je vervolgens alle deviaties kwadrateren en bij elkaar optellen (het Σ-teken in de formule betekent dat je de waarden bij elkaar optelt).
Als er een even aantal getallen is: 10, 11, 12, 13, 15, 20, 23, 35 - de twee in het midden (13 en 15) worden opgeteld (13+15=28) en dan gedeeld door 2 (28/2= 14), dat betekent dat de mediaan in dit geval 14 is.
De mediaan (median) is de waarde die zich precies in het midden van een dataset bevindt als je de waarden van laag naar hoog zet. Het is een centrummaat die de laagste 50% van de waarden scheidt van de hoogste 50%.
Box plots bieden een grafische weergeven van de 5-getallen-samenvatting van de verdeling van continue data. De 5-getallen-samenvatting bestaat uit het minimum, het eerste kwartiel, de mediaan (of het tweede kwartiel), het derde kwartiel en het maximum.
Een boxplot is een grafische weergave van een dataset waarbij een minimum (laagste waarde), het eerste kwartiel, de mediaan, het derde kwartiel en een maximum (hoogste waarde) worden weergegeven. Deze dataset kan bijvoorbeeld een grote database of een steekproef uit een populatie zijn.
Een boxplot is een visualisatie van vijf belangrijke beschrijvende statistieken, namelijk het minimum, het eerste kwartiel, de mediaan, het derde kwartiel en het maximum.
De bovenste 50% en de onderste 50% worden ook in twee delen opgedeeld. Je krijgt dan 4 groepen die alle 4 bestaan uit (ongeveer) 25% van het aantal getallen in de waarnemingsreeks. De mediaan over de eerste helft (met de laagste getallen) heet het eerste kwartiel en wordt aangegeven met Q1.
Bij het maken van een boxplot wordt eerst de waarde van de mediaan aangegeven. Daaromheen wordt een rechthoek (box) geplaatst, waarbij de onder- en bovenzijde van de rechthoek gevormd worden door het eerste kwartiel en derde kwartiel. De hoogte van de box is dus gelijk aan de interkwartielerange (IQR).
Bereik (range): het verschil tussen de hoogste en laagste waarde. Interkwartielafstand (interquartile range): het verschil tussen het eerste en derde kwartiel. Standaarddeviatie (standard deviation): de gemiddelde afstand tot het gemiddelde.
Q1 is de mediaan van de eerste helft en Q3 is de mediaan van de tweede helft. Aangezien de twee helften elk een even aantal waarden bevatten, zijn Q1 en Q3 het gemiddelde van de middelste waarden.
De mediaan wordt bijvoorbeeld vaak gebruikt als centrummaat voor de variabele “inkomen”, die over het algemeen niet normaal verdeeld is. Aangezien je voor de mediaan slechts één of twee waarden in het midden gebruikt, wordt deze maat niet beïnvloed door extreme uitbijters of niet-symmetrische verdelingen.
Bij een oneven aantal waarnemingen is het het middelste getal.Bij een even aantal waarnemingen is de mediaan het gemiddelde van de middelste twee waarnemingen. De mediaan kun je berekenen door eerst alle waarnemingen op volgorde te zetten.
De onder- en bovenkant van de box vertegenwoordigen de 25- en 75-percentielen (kwartielen), 50% van de waarnemingen bevindt zich tussen deze twee lijnen. De mediaan of 50%-percentiel wordt aangegeven met de streep in het midden, terwijl de rode stip het gemiddelde weergeeft.
Tegenwoordig is het eenvoudig om een boxplot in Excel te maken: Selecteer je data. Klik op het tabblad “Invoegen” Selecteer “Illustraties”, “Grafiek, en kies voor “Box-and-whisker”
In een boxplot is een uitschieter (of uitbijter) een waarde die meer dan 1,5 keer de interkwartielafstand onder het eerste kwartiel of boven het derde kwartiel zit.
De mediaan over de eerste helft (met de laagste getallen) heet het eerste kwartiel en wordt aangegeven met Q1. De mediaan over de tweede helft (met de hoogste getallen) heet het derde kwartiel en wordt aangegeven met Q3. Dit heet het derde kwartiel omdat 3 kwart van de getallen lager dan (of gelijk aan) dit getal zijn.
Metaalhaartjes (ook wel 'whiskers', Engels voor snorharen) zijn zeer kleine haarvormige uitgroeiingen van bepaalde metalen.
Met specifieke software bereken je de interkwartielafstand in een (fractie van een) seconde. Acht mensen uit een groot bedrijf hebben de volgende gemeten lengtes L [in cm]: 169, 175, 178, 181, 181, 183, 193 en 201. De interkwartielafstand IQR = q3 - q1 = 190,50 – 175,75 = 14,75 cm.
Als er twee middelste getallen zijn, dan bereken je het midden tussen deze getallen.
Je kunt de mediaan vinden door alle getallen op een rijtje te zetten van laag naar hoog.Vervolgens kijk je welk getal in het midden staat. Dit getal is je mediaan. Als je bijvoorbeeld vijf getallen hebt, dan is het derde getal je mediaan.
De mediaan (symbool Md of ~x ) is de observatie in het midden van de rangorde van observaties 10.