De meest gebruikte spreidingsmaten zijn standaarddeviatie, bereik, variantie en interkwartielafstand. Hieronder volgt een korte uitleg over elk van die spreidingsmaten.
De mediaan wordt gebruikt voor variabelen met ordinaal meetniveau.De bijbehorende spreidingsmaat is de interkwartiel afstand (IQR). Het gemiddelde wordt gebruikt voor variabelen met Interval meetniveau en hoger. De bijbehorende spreidingsmaat is de standaarddeviatie (s).
Centrummaten zeggen iets over het punt waar de meeste waarden geclusterd zijn (het midden of het centrum van je dataset). Spreidingsmaten geven informatie over de afstand tussen datapunten (hoe verspreid zijn de data).
Spreidingsmaten zijn maten die je in de statistiek gebruikt om weer te geven hoe ver data uit elkaar liggen en welke mate van spreiding er is om de centrummaat heen (zoals het gemiddelde of de mediaan). Spreidingsmaten gebruik je voor beschrijvende statistiek.
Er zijn vier meetniveaus: nominaal, ordinaal, interval en ratio.
De standaarddeviatie is de meest gebruikte maatstaf voor spreiding in combinatie met het gemiddelde.
Deze bredere spread toont lagere liquiditeit, hogere volatiliteit en hogere transactiekosten voor handelaren . De bid-ask spread is cruciaal voor high-frequency traders of market makers omdat hun winstmarges vaak worden afgeleid van deze kleine verschillen.
Wat is de formule voor kwartielafwijking voor ongegroepeerde gegevens? Voor ongegroepeerde gegevens kunnen kwartielen worden verkregen met behulp van de formules Q1 = [(n+1)/4]th item, Q2 = [(n+1)/2]th item, Q3 = [3(n+1)/4]th item , waarbij n het totale aantal observaties in de gegeven dataset vertegenwoordigt.
Het eerste kwartiel, of Q1, is de mediaan van de eerste helft waarnemingsgetallen. Het derde kwartiel, bekend als Q3, is de mediaan van de tweede helft waarnemingsgetallen. En het tweede kwartiel, Q2, is eigenlijk de algemene mediaan die we kennen.
De mediaan is de middelste waarde van een groep getallen die gerangschikt wordt volgens grootte. Het is het getal dat exact in het midden ligt zodat 50% van de gerangschikte getallen boven 50% ligt en 50% onder de mediaan.
Het bereik van een dataset is het verschil tussen de kleinste en grootste waarden in de dataset. Om het bereik te berekenen, trekt u het kleinste getal af van het grootste getal (Bereik = Maximum - Minimum).
Dit is het verschil tussen beide: Bij de standaarddeviatie druk je de spreiding uit in de oorspronkelijke waarden (bijvoorbeeld in centimeters). Bij de variantie druk je de spreiding uit in grotere maten dan de oorspronkelijke waarden (zoals in vierkante centimeters).
Bereik. Het bereik van het verschil tussen de grootste en de kleinste waarden in een dataset. Het biedt een snelle en gemakkelijke meting van de spreiding van deze waarden. Het bereik wordt het beste gebruikt met gegevens die geen extreme waarden hebben .
Standaarddeviatie (SD) meet de mate van variatie of spreiding tussen de afzonderlijke gegevenswaarden en het gemiddelde.
De spread kan worden gevonden met behulp van het bereik, de variantie of de standaarddeviatie . Andere maten van spread zijn de gemiddelde absolute deviatie en de interkwartielafstand.
Standaarddeviatie is de vierkantswortel van het rekenkundig gemiddelde van de kwadraten van de afwijkingen gemeten van het rekenkundig gemiddelde van de data. Het wordt beschouwd als de beste en meest gebruikte maatstaf voor spreiding om een hoge mate van betrouwbaarheid te garanderen, aangezien het een maatstaf is voor het gemiddelde van afwijkingen van het gemiddelde.
Discrete variabelen zijn variabelen die geen tussenwaarden kunnen aannemen. Bijvoorbeeld het aantal kinderen in een gezin, een score op een toets van veertig meerkeuzevragen, leeftijd, schoenmaat, enzovoort. Continue variabelen zijn variabelen als lengte, gewicht, buitentemperatuur, tijd, enzovoort.
Elk van de vier schalen (d.w.z. nominaal, ordinaal, interval en ratio ) biedt een ander type informatie. Meting verwijst naar de toewijzing van getallen op een betekenisvolle manier, en het begrijpen van meetschalen is belangrijk voor het interpreteren van de getallen die aan mensen, objecten en gebeurtenissen zijn toegewezen.
Een voorbeeld van een ordinale variabele is “Leeftijd”.
De meest voorkomende maatstaf voor spreiding is de standaarddeviatie . Net als bij centrummaten kunnen de vorm van de distributie en de aanwezigheid van extreme waarden bepalen wat de meest geschikte maatstaf voor spreiding is om de distributie te beschrijven.
Bepaal de afstand tot het gemiddelde door het gemiddelde af te trekken van iedere waarde. Kwadrateer al deze afwijkingen van het gemiddelde. Tel alle gekwadrateerde afwijkingen bij elkaar op. Deel de som van de gekwadrateerde afwijkingen door n – 1 (voor een steekproef) of N (voor een populatie).
(Tover)formule van de Z-score
De Z-score voor een observatie (Zi) bereken je als volgt: Neem de waarde van de observatie (Xi)Trek hiervan het gemiddelde (X) af. Deel dit getal door de standaardafwijking (s)