Een uitbijter of uitschieter (outlier) is in de statistiek en gegevensanalyse een waarneming die niet bij de overige lijkt te passen.
Een statistische maat is gevoelig voor uitschieters wanneer de berekening van deze maat sterk beïnvloed wordt door de aanwezigheid van extreem hoge of lage scores in de dataset. Zowel de modus en de mediaan zijn zijn ongevoelig zijn voor de aanwezigheid van uitschieters in de dataset.
Via de 'Descriptive Statistics'> 'Explore' kunnen door middel van de options knop outliers opgevraagd worden. Hierdoor zal in de output een boxplot weergegeven worden met eventuele outliers aangegeven met cirkels en sterretjes.
Vuistregels voor het omgaan met outliers
Zoek de extreme waarden (hoogste en/of laagste score) in de dataset.Isoleer de uitbijter. Als extreme waarden bizar afwijken van de volgende 5% waarden, isoleer dan de cases die bizar hoog of bizar laag scoren. Kijk naar de scatterplot of sorteer data van laag naar hoog.
Je kunt outliers het beste alleen verwijderen als je daar een goede reden voor hebt. Sommige uitschieters vertegenwoordigen natuurlijke variatie in de populatie en deze mogen niet worden verwijderd uit je dataset. Dit zijn echte uitschieters.
Wanneer je in SPSS z-scores berekent, worden deze aan de datamatrix toegevoegd. Om de z-scores te laten berekenen volg je de volgende procedure: Analyze -> Descriptive Statistics -> Descriptives.
Om het gemiddelde in SPSS te berekenen, open je allereerst de dataset. Vervolgens kun je of via de knoppen, of via de syntax het gemiddelde berekenen. Via de knoppen ga je naar Analyze -> Descriptive Statistics-> Frequencies.Je kiest de variabelen die je wilt en verplaatst die naar de rechterkolom.
De z-score wordt berekend met de z-toets. Dit gaat als volgt. Het gemiddelde van de dataset wordt aan 0 gelijkgesteld door elke score van het gemiddelde af te trekken. Deze uitkomst wordt gedeeld door de standaarddeviatie, zodat de standaarddeviatie gegarandeerd wordt gelijkgesteld aan 1.
Als er een even aantal getallen is: 10, 11, 12, 13, 15, 20, 23, 35 - de twee in het midden (13 en 15) worden opgeteld (13+15=28) en dan gedeeld door 2 (28/2= 14), dat betekent dat de mediaan in dit geval 14 is.
Een boxplot is een grafische weergave van een dataset waarbij een minimum (laagste waarde), het eerste kwartiel, de mediaan, het derde kwartiel en een maximum (hoogste waarde) worden weergegeven. Deze dataset kan bijvoorbeeld een grote database of een steekproef uit een populatie zijn.
De n staat voor totaal aantal dingen waar je uit kan kiezen. En r staat voor hoe vaak je moet kiezen. Het uitroepteken noem je faculteit en gebruik je bij berekenen van aantal manieren om n dingen op volgorde te zetten.
Boxplots worden voornamelijk gebruikt voor het snel weergeven en vergelijken van meerdere verdelingen en geven een algemeen beeld van de spreiding en scheefheid van een verdeling.
De interkwartielafstand (interquartile range) is een descriptieve statistiek die informatie geeft over de spreiding van de middelste helft van een verdeling. Deze maat behoort tot de vier meest gebruikte spreidingsmaten (measures of variability).
Om een gemiddelde te berekenen tel je alle cijfers bij elkaar op en dit getal deel je dan door het totaal aantal cijfers.
De modus is de waarde die het vaakst voorkomt in de dataset. Je kunt geen modus, één modus of meer dan één modus hebben. Om de modus te vinden, sorteer je de waarden in je dataset (categorisch of van kleinste naar grootste waarde), en selecteer je de antwoordoptie die het vaakst is gekozen.
Om de mediaan te vinden, zet je de waarden in je dataset van laag naar hoog. Vervolgens bepaal je de middelste positie op basis van n (het aantal waarden in je dataset).
De standaardnormale verdeling, ook wel z-verdeling genoemd, is een speciale normale verdeling waarbij het gemiddelde gelijk is aan 0 en de standaarddeviatie gelijk is aan 1.
De z-score is een dimensieloos getal dat aangeeft in welke mate een persoon of een groep personen afwijkt van de gemiddelde waarde van een variabele in de populatie. Hierdoor kan men de waarde van verschillende variabelen beter vergelijken en eventueel optellen.
De z-score of z-waarde geeft aan hoeveel standaarddeviaties een score van het gemiddelde af zit. Het is een verwachtingswaarde van een normale verdeling met een bekende standaardafwijking, uitgedrukt in eenheden van de standaardafwijking.
In de wiskunde wordt het symbool ∀ gebruikt voor de universele kwantor.
In de wiskunde
Vijf is het derde priemgetal, het enige priemgetal dat lid is van twee priemtweelingen en het is een primoriaal priemgetal.
In de wiskunde
Een vierhoek is een geometrische figuur bestaande uit vier zijden en vier hoeken. Het getal 4 is het kleinste samengestelde getal (2 × 2). Vier is het dubbele van twee, wat impliceert 4 = 2 × 2, maar ook 4 = 2 + 2.