Ce este multicolaritatea?
Multicolinearitatea este apariția intercorelațiilor ridicate între variabilele independente într-un model de regresie multiplă. Multicolinearitatea poate duce la rezultate înclinate sau înșelătoare atunci când un cercetător sau un analist încearcă să determine cât de bine poate fi utilizată cel mai eficient fiecare variabilă independentă pentru a prezice sau înțelege variabila dependentă într-un model statistic. În general, multicollinearitatea poate duce la intervale de încredere mai largi și valori de probabilitate mai puțin fiabile pentru variabilele independente. Adică, e posibil ca inferențele statistice ale unui model cu multicolinearitate să nu fie de încredere.
Înțelegerea multicollinearității
Analiștii statistici utilizează mai multe modele de regresie pentru a prezice valoarea unei variabile dependente specificate pe baza valorilor a două sau mai multe variabile independente. Variabila dependentă este uneori denumită variabilă rezultat, țintă sau criteriu. Un exemplu este un model de regresie multivariată care încearcă să anticipeze randamentele stocurilor bazate pe elemente precum raportul preț-câștig, capitalizarea pieței, performanța trecută sau alte date. Returnarea stocului este variabila dependentă, iar diferitele biți ale datelor financiare sunt variabile independente.
Cheie de luat cu cheie
- Multicollinearitatea este un concept statistic în care sunt corelate variabile independente dintr-un model.Multicolinearitatea dintre variabilele independente va avea ca rezultat inferențe statistice mai puțin fiabile.Este mai bine să utilizați variabile independente care nu sunt corelate sau repetitive atunci când construiți mai multe modele de regresie care folosesc două sau mai multe variabile.
Multicolinearitatea într-un model de regresie multiplă indică faptul că variabilele independente colineare sunt corelate într-o anumită modă, deși relația poate fi sau nu întâmplătoare. De exemplu, performanțele anterioare ar putea fi legate de capitalizarea de piață, deoarece stocurile care au avut rezultate bune în trecut vor avea valori de piață în creștere. Cu alte cuvinte, multicolinearitatea poate exista atunci când două variabile independente sunt puternic corelate. Se poate întâmpla, de asemenea, dacă o variabilă independentă este calculată din alte variabile din setul de date sau dacă două variabile independente oferă rezultate similare și repetitive.
Unul dintre cele mai comune moduri de eliminare a problemei multicollinearității este mai întâi identificarea variabilelor independente colineare și apoi eliminarea tuturor, cu excepția uneia. De asemenea, este posibilă eliminarea multicolinearității prin combinarea a două sau mai multe variabile colineare într-o singură variabilă. Analiza statistică poate fi apoi realizată pentru a studia relația dintre variabila dependentă specificată și doar o singură variabilă independentă.
Exemplu de multicolinearitate
În ceea ce privește investițiile, multicolinearitatea este o considerație comună atunci când se efectuează analize tehnice pentru a prezice mișcările viitoare ale prețurilor posibile ale unui titlu, cum ar fi un stoc sau un bun de marfă. Analiștii de piață doresc să evite utilizarea indicatorilor tehnici care sunt coliniari, întrucât se bazează pe inputuri foarte similare sau conexe; acestea tind să dezvăluie predicții similare cu privire la variabila dependentă a mișcării prețurilor. În schimb, analiza pieței trebuie să se bazeze pe variabile independente semnificativ pentru a se asigura că acestea analizează piața din punct de vedere analitic independent.
Analistul tehnic remarcat John Bollinger, creatorul indicatorului Bollinger Bands, observă că „o regulă cardinală pentru utilizarea cu succes a analizei tehnice necesită evitarea multicollinearității pe fondul indicatorilor”.
Pentru a rezolva problema, analiștii evită să folosească doi sau mai mulți indicatori tehnici de același tip. În schimb, ei analizează o securitate folosind un tip de indicator, cum ar fi un indicator de moment și apoi fac analize separate folosind un alt tip de indicator, cum ar fi un indicator de tendință.
Un exemplu de problemă potențială multicollineară este efectuarea unei analize tehnice folosind doar mai mulți indicatori similari, cum ar fi stochastica, indicele de rezistență relativă (RSI) și Williams% R, care sunt indicatori de moment care se bazează pe intrări similare și sunt susceptibile de a produce produse similare. rezultate. În acest caz, este mai bine să eliminați toți, în afară de unul dintre indicatori sau să găsiți o modalitate de a îmbina mai multe dintre ele într-un singur indicator, adăugând în același timp un indicator de tendință care nu este probabil corelat cu indicatorul de moment.
