Standaarddeviatie (standard deviation): de gemiddelde afstand tussen iedere waarde in de dataset en het gemiddelde.Variantie (variance): de standaarddeviatie in het kwadraat.
Voor de variantie gebruiken we als symbool S2. Voor de standaarddeviatie (de wortel uit de variantie) gebruiken we als symbool de letter S. Uit de berekening van de variantie volgt de standaarddeviatie door de vierkantswortel te berekenen uit de gevonden waarde voor de variantie.
De variantie is in de statistiek een maat voor de spreiding van een reeks waarden, dat wil zeggen de mate waarin de waarden onderling verschillen. Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het "gemiddelde" afwijken.
In het kort
De variantie is een maat voor spreiding (variatie). Letterlijk is de variantie het (bijna exact) gemiddelde van kwadratische verschillen tussen gemiddelde en individuele waarde.
Wat is standaardafwijking? Standaardafwijking is een ander woord (synoniem) voor standaarddeviatie. De woorden betekenen dus hetzelfde. Standaardafwijking of standaarddeviatie geeft de mate van spreiding weer in bepaalde data.
Betekenis standaarddeviatie of standaardafwijking
De standaarddeviatie is een van de spreidingsmaten die iets zeggen over de opbouw en de verscheidenheid in scores die zijn gemeten op een variabele voor een bepaalde steekproef of van een gemeten kenmerk van leden van een bepaalde populatie.
een standaarddeviatie tussen 0,5 en 1 geeft aan dat er verschillende opvattingen zijn,een standaarddeviatie boven de 1 geeft aan dat er extreme verschillen zijn.
Het kwadraat van de gemiddelde afstand van het geheel van afzonderlijke waarnemingen ten opzichte van het populatie- of steekproefgemiddelde. Variantie wordt als volgt genoteerd: De variantie voor een populatie wordt genoteerd als sigma kwadraat: σ2. De variantie voor een steekproef wordt genoteerd als S kwadraat: S2.
Als je de absolute frequentie vermenigvuldigt met de kwadratische afwijking krijg je een lijst van getallen. Als je die optelt, krijg je een totaal en als je dit getal deelt door het aantal krijg je de variantie. Dit is een manier om de spreiding weer te geven.
De vuistregel hiervoor is dat de proportie verklaarde variantie R2 minstens 0,25 moet zijn. Hoe kleiner het aantal eenheden in de analyse, hoe soepeler je deze vuistregel moet toepassen.
De F-waarde wordt vergeleken met een theoretische F-verdeling om te bepalen hoe waarschijnlijk het is dat de F-waarde per toeval wordt verkregen. Deze waarschijnlijkheid is de significante waarde. Als de significantie kleiner is dan het significantieniveau, zijn de gemiddelden significant verschillend.
Met een ANOVA wil je nagaan of de variantie tussen de groepen substantieel is. Dat wil zeggen, is de variantie tussen de groepen voldoende groot om te kunnen zeggen dat de drie gemiddelden van elkaar verschillen. Immers, als de variantie tussen de groepen 0 is, dan is er ook geen verschil tussen de gemiddelden.
De sum of squares is de som van de gekwadrateerde (standaard)afwijkingen van het gemiddelde. Voor de sum of squares worden XXXXX van enkele observatie uit een steekproef vergeleken met de gemiddelde waarde van die steekproef. Het verschil tussen deze twee waarden wordt gekwadrateerd.
Bij een grote standaarddeviatie is de spreiding van de waarden rond het gemiddelde groter.
Bij een normale verdeling ligt ongeveer 68% van de gevallen één standaardafwijking of minder van het gemiddelde af. Bij twee standaarddeviaties is dat ongeveer 95%.
Variantie (variance)
Variantie weerspiegelt de mate van spreiding in de dataset. Hoe meer de data verspreid zijn, des te groter de variantie ten opzichte van het gemiddelde. Voorbeeld: Variantie Om de variantie te bepalen, kwadrateer je de standaarddeviatie.
In het algemeen wordt de 'proportie verklaarde variantie' opgevat als een aanwijzing voor hoe goed een socioloog het verschijnsel dat hij of zij bestudeert inhoudelijk kan verklaren. Hoe hoger de R^, hoe beter de verklaring, zo luidt dan het oordeel. En vaak is dat oordeel kritisch.
- De proportie verklaarde variantie (R2) kan geïnterpreteerd worden als het percentage verklaarde variantie in de afhankelijke variabele op grond van de onafhankelijke variabele. Bijvoorbeeld: "de variantie in het aantal uur Net5 kijken kan voor 67% verklaard worden door de variantie in leeftijd".
ANOVA staat voor Analysis of Variance, oftewel variantieanalyse, en wordt gebruikt om gemiddelden van meer dan twee groepen met elkaar te vergelijken.
Je gebruikt de Two-way ANOVA als je 2 of meer groepen met elkaar wilt vergelijken in combinatie met één of meer onafhankelijke variabelen op basis van een gemiddelde. Op deze manier worden de hoofdeffecten voor elkaar en op de interactie-effecten gecontroleerd.
Bereik (range): het verschil tussen de hoogste en laagste waarde uit de dataset. Interkwartielafstand (interquartile range): het bereik van het middelste deel van de dataset. Standaarddeviatie (standard deviation): de gemiddelde afstand tussen iedere waarde in de dataset en het gemiddelde.
Als er helemaal geen variatie in de getallenreeks is dan is de uitkomst 0 (nul). Alle getallen komen dan overeen met het gemiddelde. Verder kan de standaarddeviatie in theorie oplopen tot plus oneindig.
De standaardafwijking of standaarddeviatie (vaak aangeduid met de Griekse letter σ voor de populatie en s voor de steekproef), een begrip in de statistiek, is een maat voor de spreiding van een variabele of van een verdeling of populatie.
De formule voor deviatie is: d = x – x̄. Hierbij is x̄ het gemiddelde en x de waarde van een individuele meting. Om de standaardafwijking te berekenen, moet je vervolgens alle deviaties kwadrateren en bij elkaar optellen (het Σ-teken in de formule betekent dat je de waarden bij elkaar optelt).
Precisie wordt bepaald door de toevallige fout. Hoe kleiner de toevallige afwijkingen, hoe groter de precisie. Precisie wordt wel uitgedrukt in de standaardafwijking.