Ce este un factor de inflație varianță?
Factorul de inflație varianță (VIF) este o măsură a cantității multicolinearității într-un set de variabile de regresie multiplă. Din punct de vedere matematic, VIF pentru o variabilă de model de regresie este egală cu raportul dintre variația generală a modelului și variația unui model care include doar acea singură variabilă independentă. Acest raport este calculat pentru fiecare variabilă independentă. Un VIF ridicat indică faptul că variabila independentă asociată este extrem de colinată cu celelalte variabile din model.
Cheie de luat cu cheie
- Un factor de inflație de varianță (VIF) oferă o măsură a multicolinearității între variabilele independente dintr-un model de regresie multiplă. Detectarea multicolinearității este importantă, deoarece, deși nu reduce puterea explicativă a modelului, ea reduce semnificația statistică a variabilelor independente. Un VIF mare pe o variabilă independentă indică o relație extrem de colinară cu celelalte variabile care ar trebui luate în considerare sau ajustate în structura modelului și în selectarea variabilelor independente.
Înțelegerea unui factor de inflație varianță
O regresie multiplă este utilizată atunci când o persoană dorește să testeze efectul mai multor variabile asupra unui anumit rezultat. Variabila dependentă este rezultatul pe care îl acționează variabilele independente, care sunt intrările în model. Multicollinearitatea există atunci când există o relație liniară, sau o corelație, între una sau mai multe dintre variabilele sau intrările independente. Multicollinearitatea creează o problemă în regresia multiplă, deoarece intrarile se influențează reciproc, ele nu sunt de fapt independente și este dificil de testat cât de mult afectează variabila independentă sau rezultatul, în cadrul modelului de regresie.. În termeni statistici, un model de regresie multiplă în care există multicolinearitate ridicată va face mai dificilă estimarea relației dintre fiecare dintre variabilele independente și variabila dependentă. Modificări mici în datele utilizate sau în structura ecuației modelului pot produce schimbări mari și neregulate ale coeficienților estimate asupra variabilelor independente.
Pentru a vă asigura că modelul este specificat corect și funcționează corect, există teste care pot fi rulate pentru multicolinearitate. Factorul de inflație varianță este unul dintre aceste instrumente de măsurare. Utilizarea factorilor de inflație varianță ajută la identificarea gravității oricăror probleme multicollinearitate, astfel încât modelul să poată fi ajustat. Factorul de inflație varianță măsoară cât de mult este influențat sau umflat, prin interacțiunea / corelația acestuia cu celelalte variabile independente, comportamentul (variația) unei variabile independente. Factorii de inflație varianți permit o măsură rapidă a cât de mult contribuie o variabilă la eroarea standard în regresie. Atunci când există probleme semnificative despre multicollinearitate, factorul de inflație a varianței va fi foarte mare pentru variabilele implicate. După identificarea acestor variabile, mai multe abordări pot fi utilizate pentru a elimina sau combina variabile colineare, rezolvând problema multicollinearității.
În timp ce multicolinearitatea nu reduce puterea de prognoză generală a unui model, poate produce estimări ale coeficienților de regresie care nu sunt semnificative statistic. Într-un anumit sens, poate fi gândit ca un fel de contorizare dublă în model. Când două sau mai multe variabile independente sunt strâns legate sau măsoară aproape același lucru, atunci efectul de bază pe care îl măsoară este contabilizat de două ori (sau mai multe) între variabile și devine dificil sau imposibil de spus care variabilă influențează cu adevărat variabila independenta. Aceasta este o problemă, deoarece scopul multor modele econometrice este de a testa exact acest tip de relație statistică între variabilele independente și variabila dependentă.
De exemplu, dacă un economist dorește să testeze dacă există o relație semnificativă statistic între rata șomajului (ca variabilă independentă) și rata inflației (ca variabilă dependentă). Includerea unor variabile independente suplimentare care au legătură cu rata șomajului, o astfel de cerere inițială nouă pentru un loc de muncă, ar fi probabil să introducă multicollinearitate în model. Modelul general ar putea arăta o putere explicativă statistică suficient de puternică, dar nu poate identifica dacă efectul se datorează în mare parte ratei șomajului sau noilor cereri inițiale de șomaj. Acest lucru ar detecta VIF și ar sugera eventual renunțarea la una dintre variabile din model sau găsirea unei modalități de consolidare a acestora pentru a capta efectul comun, în funcție de ipoteza specifică pe care cercetătorul este interesat să o testeze.
