Ce este regresia liniară?
Regresia liniară este o diagramă de date care grafică relația liniară dintre o variabilă independentă și dependentă. Este de obicei utilizat pentru a arăta vizual puterea relației și dispersia rezultatelor - toate în scopul explicării comportamentului variabilei dependente.
Spune că am vrut să testăm puterea relației dintre cantitatea de înghețată mâncată și obezitatea. Am lua variabila independentă, cantitatea de înghețată și am relaționa-o cu variabila dependentă, obezitatea, pentru a vedea dacă a existat o relație. Având în vedere că o regresie este o afișare grafică a acestei relații, cu cât variabilitatea este mai scăzută a datelor, cu atât relația este mai puternică și cu atât mai strânsă se va potrivi liniei de regresie.
Cheie de luat cu cheie
- Regresia liniară modelează relația dintre o variabilă dependentă și independentă. Analiza de regresie poate fi realizată dacă variabilele sunt independente, nu există heteroscedasticitate, iar termenii de eroare ale variabilelor nu sunt corelați. Modificarea regresiei liniare în Excel este mai ușoară cu Instrumentul de analiză a datelor.
Considerații importante
Există câteva ipoteze critice despre setul de date care trebuie să fie adevărat pentru a continua cu o analiză de regresie:
- Variabilele trebuie să fie cu adevărat independente (folosind un test Chi-square). Datele nu trebuie să aibă variații de eroare diferite (aceasta se numește heteroskedasticitate (de asemenea, heteroscedasticitate ortografică)). Termenii de eroare ai fiecărei variabile trebuie să fie necorelate. Dacă nu, înseamnă că variabilele sunt corelate în serie.
Dacă aceste trei lucruri sună complicate, acestea sunt. Dar efectul uneia dintre aceste considerente nu este adevărat este o estimare părtinitoare. În esență, ați afirma greșit relația pe care o măsurați.
Afișarea unei regresii în Excel
Primul pas în derularea analizei de regresie în Excel este verificarea dublă a instalării gratuit a pluginului Excel Data Analysis ToolPak. Acest plugin face foarte ușor calcularea unei game de statistici. Nu este obligatoriu să graficăm o linie de regresie liniară, dar creează mai simplu tabelele de statistici. Pentru a verifica dacă este instalat, selectați „Date” din bara de instrumente. Dacă „Analiza datelor” este o opțiune, funcția este instalată și gata de utilizare. Dacă nu este instalată, puteți solicita această opțiune făcând clic pe butonul Office și selectând „Opțiuni Excel”.
Folosind Instrumentul de analiză a datelor, crearea unei ieșiri de regresie este de doar câteva clicuri.
Variabila independentă se încadrează în intervalul X.
Având în vedere randamentele S&P 500, să spunem că vrem să știm dacă putem estima puterea și relația randamentelor de acțiuni Visa (V). Stocurile Visa (V) returnează datele populează coloana 1 ca variabilă dependentă. S&P 500 returnează datele populează coloana 2 ca variabilă independentă.
- Selectați „Date” din bara de instrumente. Se afișează meniul „Date”. Selectați „Analiza datelor”. Se afișează caseta de dialog Analiza datelor - Instrumente de analiză. Din meniu, selectați „Regresie” și faceți clic pe „OK”. În caseta de dialog Regresie, faceți clic pe caseta „Intrare Y Range” și selectați datele variabile dependente (Visa (V) stoc) returnează). Faceți clic pe caseta „Intrare X Range” și selectați datele variabile independente (S&P 500 returnează). Faceți clic pe „OK” pentru a rula rezultatele.
Interpretați rezultatele
Folosind aceste date (aceleași din articolul nostru R-pătrat), obținem următorul tabel:
Valoarea R 2, cunoscută și sub denumirea de coeficient de determinare, măsoară proporția de variație a variabilei dependente explicată de variabila independentă sau cât de bine se încadrează modelul de regresie. Valoarea R 2 variază de la 0 la 1, iar o valoare mai mare indică o potrivire mai bună. Valoarea p, sau valoarea probabilității, de asemenea, variază de la 0 la 1 și indică dacă testul este semnificativ. Spre deosebire de valoarea R 2, o valoare mai mică este favorabilă, deoarece indică o corelație între variabilele dependente și independente.
Graficarea unei regresii în Excel
Putem grafica o regresie în Excel prin evidențierea datelor și graficarea acestora ca un grafic de împrăștiere. Pentru a adăuga o linie de regresie, alegeți „Aspect” din meniul „Instrumente grafic”. În caseta de dialog, selectați „Trendline” și apoi „Line line Trendline”. Pentru a adăuga valoarea R 2, selectați „Mai multe opțiuni de tendință” din meniul „Trendline. În sfârșit, selectați„ Afișați valoarea R-pătrat pe diagramă ”. Rezultatul vizual însumează puterea relației, deși în detrimentul ne furnizării. la fel de multe detalii ca tabelul de mai sus.
