De mediaan wordt bijvoorbeeld vaak gebruikt als centrummaat voor de variabele “inkomen”, die over het algemeen niet normaal verdeeld is. Aangezien je voor de mediaan slechts één of twee waarden in het midden gebruikt, wordt deze maat niet beïnvloed door extreme uitbijters of niet-symmetrische verdelingen.
Methode. Het gemiddelde geeft inzicht in hoe goed of slecht de leerlingen in een klas het proefwerk heeft gemaakt. Om een gemiddelde te berekenen tel je alle cijfers bij elkaar op en dit getal deel je dan door het totaal aantal cijfers.
Bij een oneven aantal waarnemingen is het het middelste getal.Bij een even aantal waarnemingen is de mediaan het gemiddelde van de middelste twee waarnemingen. De mediaan kun je berekenen door eerst alle waarnemingen op volgorde te zetten.
Als er twee middelste getallen zijn, dan bereken je het midden tussen deze getallen.
Bij een oneven aantal staat één waarde in het midden, maar bij een even aantal waarden moet je het gemiddelde van de twee middelste waarden berekenen om de mediaan te vinden.
De functie MEDIAAN geeft de centrale tendens, ofwel de middelste waarde van een groep getallen in een statistische verdeling.
Als je een even aantal getallen hebt, dan is je mediaan het gemiddelde van de twee getallen in het midden.
De definitie van de mediaan luidt: De mediaan is de middelste waarde van een reeks geordende waarden. Maar wat nu als je een even getal hebt, zoals in dit voorbeeld? Neem dan de twee middelste waarden, dat is hier: 6 jaar en 7 jaar. Tel dat bij elkaar op en deel het door 2.
Bij een rechtsscheve verdeling is het gemiddelde groter dan de mediaan. Er zullen dan waarschijnlijk outliers zijn aan de rechterkant van de verdeling.
Je vermenigvuldigt alle klassenmidden met de absolute frequentie en dit alles ga je dan optellen en delen door het aantal. De mediaan is gelijk aan het middelste cijfer. Bij een oneven aantal is dat makkelijk. Bij een even aantal tel je de 2 middelste cijfers op en deel je door 2.
De drie meest voorkomende centrummaten zijn de modus (mode), mediaan (median) en het gemiddelde (mean). Modus: de waarde die het vaakst voorkomt. Mediaan: de middelste waarde als je de dataset van kleinste naar grootste waarde rangschikt. Gemiddelde: de som van alle waarden, gedeeld door het totale aantal waarden.
De mediaan (symbool Md of ~x ) is de observatie in het midden van de rangorde van observaties 10.
Wat is de mediaan van 1, 6, 4, 3, 2, 8, 7, 6, 12 en 3? Eerst op volgorde zetten: 1, 2, 3, 3, 4, 6, 6, 7, 8, 12. Er zijn 10 waarnemingen, dus het middelste waarnemingsgetal is het 10 + 12 = 5,5e getal. Je hebt daarom het gemiddelde van het vijfde en zesde waarnemingsgetal nodig.
Drie manieren om een gemiddelde te berekenen
Tel alle data op en deel ze door het aantal (zie voorbeeld hieronder). Dit getal heet de 'mean'. Zoek het getal op met de middelste waarde (net zoveel hoger en net zoveel lager). Dit gemiddelde heet de 'mediaan'.
De standaarddeviatie of standaardafwijking geeft de mate van spreiding aan in bepaalde data. Het geeft aan hoezeer de geobserveerde waardes afwijken van het gemiddelde.
We gebruiken liever de mediaan dan het gemiddelde als centrummaat als we te maken hebben met scheve, dus niet-symmetrische, verdelingen. De me diaan heeft ook een bijpassende maat voor spreiding, de zogeheten interkwartielafstand.
Als alle inkomens van laag naar hoog worden gerangschikt is de mediaan van het besteedbaar inkomen – ook wel het doorsnee besteedbaar inkomen –gelijk aan het middelste van alle inkomens. Dat betekent dat precies de helft van de populatie een lager of gelijk inkomen heeft, en precies de helft een hoger inkomen.
De interkwartielafstand (interquartile range) is een descriptieve statistiek die informatie geeft over de spreiding van de middelste helft van een verdeling. Deze maat behoort tot de vier meest gebruikte spreidingsmaten (measures of variability).
Een dataset kan geen modus, één modus of meer dan één modus hebben: geen enkele modus: alle waarden zijn anders. unimodaal: één modus.
Een boxplot, ook wel bekend als een doosdiagram, is een grafische weergave van de verdeling van een dataset. Het toont statistische informatie, zoals de mediaan, kwartielen en eventuele uitbijters. Een boxplot geeft een plaatje als samenvatting van statistische beschrijvende kenmerken van je dataset.