Regression mot ANOVA
Regression och ANOVA (Analys av varians) är två metoder i den statistiska teorin för att analysera beteendet hos en variabel jämfört med en annan. I regression är det ofta variationen av beroende variabel baserat på oberoende variabel, medan det i ANOVA är variationen i attributen för två prover från två populationer.
Mer om regression
Regression är en statistisk metod som används för att rita sambandet mellan två variabler. Ofta när data samlas in kan det finnas variabler som är beroende av andra. Den exakta relationen mellan dessa variabler kan endast fastställas med regressionsmetoder. Att bestämma detta förhållande hjälper till att förstå och förutsäga beteendet hos en variabel till den andra.
Den vanligaste tillämpningen av regressionsanalysen är att uppskatta värdet på den beroende variabeln för ett givet värde eller värdeområde för de beroende variablerna. Med hjälp av regression kan vi till exempel fastställa förhållandet mellan råvarupriset och konsumtionen baserat på data som samlats in från ett slumpmässigt urval. Regressionsanalys kommer att producera en regressionsfunktion för datamängden, vilket är en matematisk modell som bäst passar tillgängliga data. Detta kan lätt representeras av ett spridningsdiagram. Grafisk regression är likvärdig med att hitta den bästa anpassningskurvan för att ge datamängden. Kurvens funktion är regressionsfunktionen. Med hjälp av den matematiska modellen kan användningen av en vara förutsägas för ett givet pris.
Därför används regressionsanalysen i stor utsträckning vid förutsägelse och prognoser. Det används också för att etablera relationer i experimentella data, inom områdena fysik, kemi och många naturvetenskapliga och tekniska discipliner. Om förhållandet eller regressionsfunktionen är en linjär funktion, är processen känd som en linjär regression. I spridningsdiagrammet kan den representeras som en rak linje. Om funktionen inte är en linjär kombination av parametrarna är regressionen icke-linjär.
Mer om ANOVA (Analys av varians)
ANOVA involverar inte analysen av en relation mellan två eller flera variabler uttryckligen. Det kontrolleras snarare om två eller flera prover från olika populationer har samma medelvärde. Tänk till exempel på testresultaten för en tentamen för betyg i skolan. Även om testerna är olika kan prestanda vara lika från klass till klass. En metod för att verifiera detta är att jämföra medel för varje klass. ANOVA eller ANALYS OF Variance gör att denna hypotes kan testas. I grund och botten kan ANOVA betraktas som en förlängning av t-testet, där medelvärdet för de två proverna från två populationer jämförs.
Grundtanken med ANOVA är att beakta variationen i provet och variation mellan proverna. Variationen inom provet kan tillskrivas slumpmässigheten, medan variationen mellan proverna kan tillskrivas både slumpmässighet och andra externa faktorer. Analys av varians baseras på tre modeller; modell för fasta effekter, modell för slumpmässiga effekter och modeller för blandade effekter.
Vad är skillnaden mellan regression och ANOVA?
• ANOVA är analysen av variation mellan två eller flera prover medan regression är analysen av en relation mellan två eller flera variabler.
• ANOVA-teorin används med hjälp av tre grundmodeller (modellen för fasta effekter, modellen för slumpmässiga effekter och modellen för blandade effekter) medan regression tillämpas med två modeller (linjär regressionsmodell och multipel regressionsmodell).
• ANOVA och Regression är båda två versioner av General Linear Model (GLM). ANOVA är baserat på kategoriska prediktorvariabler, medan regression baseras på kvantitativa prediktorvariabler.
• Regression är den mer flexibla tekniken, och den används vid prognoser och förutsägelser medan ANOVA används för att jämföra jämställdheten mellan två eller flera populationer.