Ce este regresia liniară multiplă - MLR?
Regresia liniară multiplă (MLR), cunoscută și sub denumirea de regresie multiplă, este o tehnică statistică care folosește mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns. Scopul regresiei liniare multiple (MLR) este modelarea relației liniare între variabilele explicative (independente) și variabila de răspuns (dependentă).
În esență, regresia multiplă este extinderea regresiei obișnuite a celor mai mici pătrate (OLS) care implică mai mult de o variabilă explicativă.
Formula pentru regresie liniară multiplă este
Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵ unde, pentru i = n observații: yi = variablexi dependente = variabile expanatoriiβ0 = y-interceptare (constantă termen) βp = coeficienții de pantă pentru fiecare variabilă explicativă = termenul de eroare al modelului (cunoscut și sub denumirea de reziduuri)
Explicarea regresiei liniare multiple
O regresie liniară simplă este o funcție care permite unui analist sau statistician să facă predicții despre o variabilă pe baza informațiilor cunoscute despre o altă variabilă. Regresia liniară poate fi utilizată doar atunci când una are două variabile continue - o variabilă independentă și o variabilă dependentă. Variabila independentă este parametrul care este utilizat pentru a calcula variabila sau rezultatul dependent. Un model de regresie multiplă se extinde la mai multe variabile explicative.
Modelul de regresie multiplă se bazează pe următoarele ipoteze:
- Există o relație liniară între variabilele dependente și variabilele independente. Variabilele independente nu sunt prea strâns corelate între ele . Observațiile sunt selectate independent și aleatoriu de la populație.Rezidualele ar trebui să fie distribuite în mod normal cu o medie de 0 și variație σ.
Coeficientul de determinare (pătrat R) este o metrică statistică care este utilizată pentru a măsura cât de mult din variația rezultatului poate fi explicată prin variația variabilelor independente. R2 crește întotdeauna pe măsură ce se adaugă mai mulți predictori la modelul MLR, chiar dacă predictorii nu pot fi legați de variabila rezultat.
Prin urmare, R2 nu poate fi utilizat pentru a identifica ce predictori ar trebui să fie incluși într-un model și care ar trebui să fie excluși. R 2 poate fi doar între 0 și 1, unde 0 indică faptul că rezultatul nu poate fi prezis de niciuna dintre variabilele independente și 1 indică faptul că rezultatul poate fi prezis fără eroare din variabilele independente.
Când se interpretează rezultatele unei regresii multiple, coeficienții beta sunt valabili, menținând constant toate celelalte variabile („toate celelalte egale”). Ieșirea dintr-o regresie multiplă poate fi afișată pe orizontală ca o ecuație sau verticală sub formă de tabel.
Exemplu folosind regresie liniară multiplă
De exemplu, un analist poate dori să știe cum afectează circulația pieței prețul Exxon Mobil (XOM). În acest caz, ecuația sa liniară va avea valoarea indicelui S&P 500 ca variabilă independentă sau predictor și prețul XOM ca variabilă dependentă.
În realitate, există mai mulți factori care prezic rezultatul unui eveniment. De exemplu, mișcarea prețurilor Exxon Mobil depinde mai mult decât de performanța pieței de ansamblu. Alți predictori, precum prețul petrolului, ratele dobânzilor și mișcarea prețurilor la viitorul petrolului pot afecta prețul XOM și prețul acțiunilor altor companii petroliere. Pentru a înțelege o relație în care sunt prezente mai mult de două variabile, se utilizează o regresie liniară multiplă.
Regresia liniară multiplă (MLR) este utilizată pentru a determina o relație matematică între un număr de variabile aleatorii. În alți termeni, MLR analizează modul în care mai multe variabile independente sunt legate de o singură variabilă dependentă. După ce fiecare dintre factorii independenți a fost determinat să prezică variabila dependentă, informațiile despre multiplele variabile pot fi utilizate pentru a crea o predicție exactă asupra nivelului de efect pe care îl au asupra variabilei de rezultat. Modelul creează o relație sub forma unei linii drepte (liniare) care se apropie cel mai bine de toate punctele de date individuale.
Cu referire la ecuația MLR de mai sus, în exemplul nostru:
- y i = variabilă dependentă: prețul XOMx i1 = ratele dobânziix i2 = prețul petrolului i3 = valoarea S&P 500 indexx i4 = prețul futurilor petroluluiB 0 = interceptarea y la ora zeroB 1 = coeficientul de regresie care măsoară o modificare a unității în dependentă variabilă când se schimbă x i1 - modificarea prețului XOM când se modifică ratele dobânziiB 2 = valoarea coeficientului care măsoară o modificare unitară a variabilei dependente atunci când se schimbă x i2 - modificarea prețului XOM atunci când prețurile petrolului se modifică
Cele mai mici pătrate estimate, B 0, B 1, B 2… B p, sunt de obicei calculate prin software statistic. Întrucât multe variabile pot fi incluse în modelul de regresie în care fiecare variabilă independentă este diferențiată cu un număr - 1, 2, 3, 4… p. Modelul de regresie multiplă permite unui analist să prezică un rezultat bazat pe informațiile furnizate pe mai multe variabile explicative.
Totuși, modelul nu este întotdeauna perfect exact, deoarece fiecare punct de date poate diferi ușor de rezultatul prevăzut de model. Valoarea reziduală, E, care este diferența dintre rezultatul real și rezultatul prevăzut, este inclusă în model pentru a ține cont de astfel de variații ușoare.
Presupunând că rulăm modelul nostru de regresie a prețurilor XOM printr-un software de calcul statistic, care returnează această ieșire:
Un analist ar interpreta această ieșire pentru a însemna dacă alte variabile vor fi menținute constant, prețul XOM va crește cu 7, 8% dacă prețul petrolului pe piețe va crește cu 1%. Modelul arată, de asemenea, că prețul XOM va scădea cu 1, 5% în urma creșterii cu 1% a ratelor dobânzii. R 2 indică faptul că 86, 5% din variațiile prețului acțiunii Exxon Mobil pot fi explicate prin modificări ale ratei dobânzii, prețului petrolului, futuresului petrolului și a indicelui S&P 500.
Cheie de luat cu cheie
- Regresia liniară multiplă (MLR), cunoscută și sub denumirea de regresie multiplă, este o tehnică statistică care folosește mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns. Regresia multiplă este o extensie a regresiei liniare (OLS) care folosește doar o variabilă explicativă. MLR este utilizat pe scară largă în economie și inferențe financiare.
Diferența dintre regresia liniară și multiplă
Regresia liniară (OLS) compară răspunsul unei variabile dependente, dată fiind o modificare a unei variabile explicative. Cu toate acestea, este rar ca o variabilă dependentă să fie explicată de o singură variabilă. În acest caz, un analist folosește regresia multiplă, care încearcă să explice o variabilă dependentă folosind mai multe variabile independente. Regresii multiple pot fi liniare și neliniare.
Regresii multiple se bazează pe presupunerea că există o relație liniară între variabilele dependente și independente. De asemenea, nu presupune nicio corelație majoră între variabilele independente.
