Lineaire versus logistische regressie
Bij statistische analyse is het belangrijk om de relaties tussen de betrokken variabelen voor het onderzoek te identificeren. Soms is het misschien het enige doel van de analyse zelf. Een sterk hulpmiddel dat wordt gebruikt om het bestaan van een relatie vast te stellen en de relatie te identificeren, is regressie-analyse.
De eenvoudigste vorm van regressieanalyse is de lineaire regressie, waarbij de relatie tussen de variabelen een lineaire relatie is. In statistische termen wordt de relatie tussen de verklarende variabele en de responsvariabele weergegeven. Als we bijvoorbeeld regressie gebruiken, kunnen we de relatie tussen de grondstoffenprijs en het verbruik vaststellen op basis van gegevens die uit een willekeurige steekproef zijn verzameld. Regressieanalyse zal een regressiefunctie van de gegevensverzameling produceren, wat een wiskundig model is dat het beste past bij de beschikbare gegevens. Dit kan eenvoudig worden weergegeven door een spreidingsdiagram. Grafische regressie is gelijk aan het vinden van de best passende curve voor de gegeven dataset. De functie van de curve is de regressiefunctie. Met behulp van het wiskundige model kan het gebruik van een grondstof voor een bepaalde prijs worden voorspeld.
Daarom wordt de regressieanalyse veel gebruikt bij het voorspellen en voorspellen. Het wordt ook gebruikt voor het vaststellen van de relaties in experimentele gegevens, op het gebied van natuurkunde, scheikunde en in veel natuurwetenschappen en technische disciplines. Als de relatie of de regressiefunctie een lineaire functie is, staat het proces bekend als een lineaire regressie. In de spreidingsplot kan het worden voorgesteld als een rechte lijn. Als de functie geen lineaire combinatie van de parameters is, is de regressie niet-lineair.
Logistische regressie is vergelijkbaar met multivariate regressie en het creëert een model om de impact van meerdere voorspellers op een responsvariabele te verklaren. Bij logistische regressie moet de variabele van het eindresultaat echter categorisch zijn (meestal verdeeld, d.w.z. een paar haalbare resultaten, zoals overlijden of overleving, hoewel speciale technieken het mogelijk maken om meer gecategoriseerde informatie te modelleren). Een continue uitkomstvariabele kan worden getransformeerd in een categoriale variabele, te gebruiken voor logistische regressie; het inklappen van continue variabelen op deze manier wordt echter meestal afgeraden omdat het de nauwkeurigheid vermindert.
Anders dan bij de lineaire regressie, naar het gemiddelde, hoeven de voorspellingsvariabelen in logistische regressie niet te worden gedwongen om lineair verbonden te zijn, gemeenschappelijk te worden verdeeld of om een gelijke variantie binnen elke cluster te hebben. Als gevolg hiervan is de relatie tussen de voorspellings- en uitkomstvariabelen waarschijnlijk geen lineaire functie.
Wat is het verschil tussen Logistische en Lineaire regressie?
• Bij lineaire regressie wordt uitgegaan van een lineaire relatie tussen de verklarende variabele en de responsvariabele en parameters die voldoen aan het model worden gevonden door analyse, om de exacte relatie te geven.
• Lineaire regressie wordt uitgevoerd voor kwantitatieve variabelen en de resulterende functie is een kwantitatief.
• In de logistische regressie kunnen de gegevens categorisch of kwantitatief zijn, maar het resultaat is altijd categorisch.