Ce este regresia în trepte?
Analiza de regresie este o abordare statistică pe scară largă, care urmărește identificarea relațiilor dintre variabile. Ideea este de a grupa date relevante pentru a lua decizii mai bine informate și este o practică comună în lumea investițiilor. Regresia în trepte este construcția iterativă pas cu pas a unui model de regresie care implică selectarea automată a variabilelor independente. Disponibilitatea pachetelor software statistice face posibilă regresia în trepte, chiar și la modelele cu sute de variabile.
Tipuri de regresie în trepte
Obiectivul de bază al regresiei în trepte este, printr-o serie de teste (teste F, teste t) de a găsi un set de variabile independente care influențează semnificativ variabila dependentă. Aceasta se face cu calculatoarele prin iterație, care este procesul de a ajunge la rezultate sau decizii, parcurgând runde repetate sau cicluri de analiză. Efectuarea testelor în mod automat cu ajutorul pachetelor software statistice are avantajul de a economisi timp pentru individ.
Cheie de luat cu cheie
- Analiza de regresie este o abordare statistică care urmărește să înțeleagă și să măsoare relațiile dintre variabilele independente și dependente. Regresia simplă este o metodă care examinează semnificația statistică a fiecărei variabile independente din model. Abordarea de selecție înainte adaugă o variabilă și apoi testează semnificația statistică.Metoda de eliminare înapoi începe cu un model încărcat cu multe variabile și apoi elimină o variabilă pentru a-și testa importanța în raport cu rezultatele generale. În mod normal, regresia are multe critici, deoarece este abordarea care încadrează datele într-un model pentru a obține un rezultat dorit.
Regresia în trepte poate fi obținută fie prin încercarea unei variabile independente la un moment dat și includerea acesteia în modelul de regresie dacă este semnificativă statistic sau prin includerea tuturor variabilelor potențiale independente în model și eliminarea celor care nu sunt semnificative statistic. Unele folosesc o combinație de ambele metode și, prin urmare, există trei abordări ale regresiei în trepte:
- Selecția înainte începe fără variabile în model, testează fiecare variabilă pe măsură ce este adăugată modelului, apoi le păstrează pe cele care sunt considerate cele mai semnificative statistic - repetând procesul până când rezultatele sunt optime. Eliminarea înapoi începe cu un set de variabile independente, ștergerea pe rând, apoi testarea pentru a vedea dacă variabila eliminată este semnificativă statistic. Eliminarea bidirecțională este o combinație a primelor două metode care testează ce variabile ar trebui să fie incluse sau excluse.
Un exemplu de regresie în trepte folosind metoda de eliminare înapoi ar fi o încercare de a înțelege consumul de energie la o fabrică folosind variabile precum timpul de funcționare a echipamentului, vârsta echipamentului, dimensiunea personalului, temperaturile exterioare și perioada anului. Modelul include toate variabilele - apoi fiecare este eliminată, câte una pentru a determina care este cea mai puțin semnificativă statistic. În cele din urmă, modelul ar putea arăta că perioada anului și temperaturile sunt cele mai semnificative, ceea ce sugerează că consumul maxim de energie din fabrică este atunci când consumul de aer condiționat este cel mai ridicat.
Limitările regresiei în trepte
Analiza regresiei, atât liniară, cât și multivariată, sunt utilizate astăzi pe scară largă în lumea investițiilor. Ideea este de multe ori să găsești modele care au existat în trecut, care ar putea reapărea și în viitor. O regresie liniară simplă, de exemplu, ar putea analiza raportul preț-câștig și randamentul stocurilor pe parcursul mai multor ani pentru a determina dacă stocurile cu raporturi P / E scăzute (variabilă independentă) oferă randamente mai mari (variabilă dependentă). Problema acestei abordări este că condițiile de piață se schimbă adesea și relațiile care au avut loc în trecut nu se mențin neapărat în prezent sau în viitor.
Între timp, procesul de regresie în trepte are multe critici și există chiar apeluri pentru a nu mai folosi metoda cu totul. Statisticienii observă mai multe neajunsuri ale abordării, inclusiv rezultate incorecte, o părtinire inerentă în procesul propriu-zis și necesitatea unei puteri de calcul semnificative pentru a dezvolta modele de regresie complexe prin iterație.
