De regressie analyse kijkt of er een (voorspellend) verband is.Dit wordt gedaan op basis van de correlatie van de onafhankelijke variabele en de afhankelijke variabele. De regressie wordt gebruikt om hypotheses te toetsen. De enkelvoudige regressie analyse maakt gebruik van continue data (schaalvariabelen).
Regressieanalyse wordt gebruikt om het effect te bepalen van een (of meerdere) verklarende variabele(n), zoals lengte of leeftijd, op een afhankelijke variabele zoals gewicht. Je kunt regressieanalyse gebruiken om: Samenhang tussen twee variabelen te bepalen (leeftijd en waarde van een auto)
De regressielijn
In de algebra heeft een rechte lijn de formule van y = a + bx, waarbij de a en de b constanten zijn die de kenmerken van de rechte lijn bepalen. De a geeft aan waar de lijn de y-as passeert (het intercept) en de b geeft aan hoe schuin die lijn loopt (de regressiecoëfficiënt).
Als u de Excel-bureaubladtoepassing hebt, kunt u de knop Openen in Excel gebruiken om uw werkmap te openen en het hulpprogramma Regressie van Analysis ToolPak of statistische functies gebruiken om daarmee een regressieanalyse uit te voeren. Klik op Openen in Excel en voer een regressieanalyses uit.
Lineaire regressie is een statistisch proces waarmee je een (meestal) lineair verband tussen twee grootheden kan aantonen en kwantificeren. Hierbij kies je steeds één grootheid, de onafhankelijke grootheid die op de x-as (horizontale as) van het diagram staat.De andere grootheid wordt hierdoor bepaald.
De regressiecoëfficiënt ß geeft aan in welke mate de waarde van een afhankelijke variabele gemiddeld zal veranderen wanneer de waarde van de onafhankelijke (of voorspellende of verklarende) variabele verandert.
Een vuistregel is dat bij logistische regressie het aantal parameters in een multivariabel model maximaal 5% tot 10% mag zijn van het minimum van het aantal mensen met en zonder obesitas (event) in je sample. Dus als je 300 met en 593 zonder obesitas hebt, mag je max 15 tot 30 parameters in je model opnemen.
Correlatie geeft de mate aan waarin twee variabelen covariëren of samen bewegen.Regressie geeft echter de mate van verandering in de geschatte waarde aan op basis van de gegeven waarde.
Een regressieanalyse laat zien hoe een verband eruit ziet door een lijn te trekken door een puntenwolk (Figuur 1). Een negatieve regressielijn betekent een negatief verband en een positieve regressielijn (u raadt het al) een positief verband.
De regressievergelijking is de vergelijking die de samenhang weergeeft tussen de afhankelijke variabele en een of meer andere variabelen die haar beïnvloeden (de onafhankelijke variabelen). Met de regressievergelijking is het mogelijk de procesprestatie (Y) te voorspellen bij een specifieke waarde van de variabele X.
Met logistische regressie kan je een dichotome uitkomstvariabele (dood versus leven, wel of geen klachten, etc.)relateren aan één of meerdere predictoren. Het basis idee achter logistische regressie is dat je de uitkomstvariabele zodanig transformeert dat er een soort lineaire regressie mogelijk is.
Een economische recessie is een periode waarbij een laagconjunctuur relatief lang aanhoudt. Vaak wordt van een economische recessie gesproken als de het Bruto Binnenlands Product (BBP) minstens twee opeenvolgende kwartalen daalt.
We spreken van enkelvoudige (ook wel simple of univariable) regressie als we de uitkomst willen voorspellen met één predictor. In de praktijk zal dat in vele gevallen niet voldoende zijn en is het wenselijk om de effecten van twee of meer voorspellers te analyseren.
Gebruik logistische regressie om te toetsen of een binaire afhankelijke variabele voorspeld kan worden met twee of meer onafhankelijke variabelen (predictors) en om te toetsen of er een relatie is tussen een predictor en de afhankelijke variabele in aanwezigheid van andere predictors.
Wanneer gebruik je de multiple regressie analyse? Je gebruikt de multiple regressie om te toetsen of meerdere onafhankelijke variabelen invloed hebben op een afhankelijke variabele en of dit een positief of een negatief effect is. Ook is het mogelijk om interactie-effecten te toetsen.
Rapporteren van logistische regressie
Logistische regressie kan je ongeveer hetzelfde rapporteren als lineaire regressie. Vermeld de b-waardes, standaard meetfouten en de significantie. Vermeld ook de odds ratio, het betrouwbaarheidsinterval en de constante.
Antwoord. De F toets kan gebruikt worden om te kijken of een gevonden meervoudig regressiemodel significant bijdraagt tot de verklaring van de afhankelijke variabele. Is dat niet zo dan is het regressiemodel zinloos.
De y-intercept van een lijn, vaak geschreven als b, is de waarde van y op het punt waar de lijn de y-as kruist. De vergelijking voor een rechte lijn is y = mx + b. Als u de waarden voor m en b kent, kunt u elk punt op die lijn berekenen door de x- of de y-waarde in te vullen.
Je kunt onafhankelijke (independent variables) en afhankelijke variabelen (dependent variables) beschouwen als oorzaken en gevolgen: De onafhankelijke variabele is de variabele waarvan je denkt dat deze de oorzaak is.De afhankelijke variabele is de variabele waarvan je denkt dat deze het gevolg is.
Als de correlatie niet significant is, betekent dit dat de relatie tussen de variabelen waarschijnlijk het resultaat is van toeval. Tot slot moet je je conclusies trekken. Als er een significant verband is, kun je proberen de redenen achter deze relatie te begrijpen.
Correlatie betekent kort gezegd samenhang. Het gaat hierbij om samenhang tussen reeksen getallen of de waarden van toevalsvariabelen. Je kunt bij samenhang denken aan de samenhang tussen leeftijd en lengte of de samenhang tussen de groei van de economie en de bevolkingsgroei.
Een positieve correlatie betekent dat beide variabelen samen toenemen of afnemen. Een negatieve correlatie betekent dat de ene variabele toeneemt, terwijl de andere variabele afneemt. Als de correlatiecoëfficiënt gelijk is aan 0, is er geen verband tussen de variabelen (zero correlation).
Variabelen zijn eigenschappen die verschillende waarden kunnen aannemen, zoals lengte, leeftijd, diersoort of toetsscore. Bij wetenschappelijk onderzoek willen we vaak het effect van de ene variabele op de andere variabele onderzoeken.
Het belangrijkste doel van de regressie analyse is om na te gaan hoeveel procent van de variantie in de afhankelijke variabele de onafhankelijke variabelen gezamenlijk verklaren. Dit wordt de R-Square genoemd. En voor elke onafhankelijke variabele zelf kun je ook zien of er een relatie is.
Er zijn drie soorten categorische variabelen: binaire variabelen, nominale variabelen en ordinale variabelen.