Ce este Homoskedastic?
Homoskedasticul (de asemenea, scris "homoscedastic") se referă la o condiție în care variația termenului rezidual sau de eroare într-un model de regresie este constantă. Adică, termenul de eroare nu variază foarte mult pe măsură ce se modifică valoarea variabilei predictor. Cu toate acestea, lipsa de homoskedasticitate poate sugera că modelul de regresie ar putea avea nevoie să includă variabile de predictie suplimentare pentru a explica performanța variabilei dependente.
Cheie de luat cu cheie
- Homoskedasticitatea apare atunci când variația termenului de eroare într-un model de regresie este constantă. Dacă variația termenului de eroare este homoskedastic, modelul a fost bine definit. Dacă există o varianță prea mare, este posibil ca modelul să nu fie definit bine. Adăugarea de variabile de predictor suplimentare poate ajuta la explicarea performanței variabilei dependente. Dimpotrivă, heteroskedasticitatea apare atunci când variația termenului de eroare nu este constantă.
Cum funcționează Homoskedasticul
Homoskedasticitatea este o presupunere de modelare a regresiei liniare. Dacă variația erorilor din jurul liniei de regresie variază mult, modelul de regresie poate fi slab definit. Opusul homoskedasticității este heteroskedasticitatea la fel cum opusul „omogen” este „eterogen”. Heteroskedasticitatea (denumită și „heteroscedasticitate”) se referă la o condiție în care variația termenului de eroare într-o ecuație de regresie nu este constantă.
Când se consideră că variația este diferența măsurată între rezultatul prevăzut și rezultatul real al unei anumite situații, determinarea homoskedasticității poate ajuta la determinarea factorilor care trebuie reglați pentru precizie.
consideratii speciale
Un model de regresie simplă, sau ecuație, este format din patru termeni. În partea stângă se află variabila dependentă. Reprezintă fenomenul pe care modelul caută să-l „explice”. În partea dreaptă se află o constantă, o variabilă predictivă și un termen rezidual sau de eroare. Termenul de eroare arată cantitatea de variabilitate a variabilei dependente care nu este explicată de variabila predictoare.
Exemplu de homoskedastic
De exemplu, să presupunem că ați dorit să explicați scorurile testelor studenților folosind perioada de timp petrecută de fiecare student. În acest caz, scorurile testului ar fi variabila dependentă, iar timpul petrecut în studiu ar fi variabila predictoare.
Termenul de eroare ar arăta cantitatea de varianță în scorurile testului care nu a fost explicată de timpul de studiu. Dacă acea varianță este uniformă sau homoskedastică, atunci acest lucru ar sugera că modelul poate fi o explicație adecvată pentru performanța testului - explicând-o în termeni de studiu petrecuți.
Dar variația poate fi heteroskedastică. O diagramă a datelor privind termenul de eroare poate arăta o cantitate mare de timp de studiu a corespuns foarte strâns cu scoruri de test ridicate, dar că scorurile scăzute ale testului timpului de studiu au variat mult și chiar au inclus scoruri foarte mari. Deci, variația scorurilor nu va fi explicată doar printr-o singură variabilă predictoare - timpul de studiu. În acest caz, un alt factor este probabil la locul de muncă, iar modelul poate fi necesar să fie îmbunătățit pentru a-l identifica. Cercetările ulterioare pot dezvălui că unii studenți au văzut răspunsurile la test înainte sau au făcut anterior un test similar și, prin urmare, nu au fost nevoiți să studieze pentru acest test.
Pentru a îmbunătăți modelul de regresie, cercetătorul ar adăuga, așadar, o altă variabilă explicativă, indicând dacă un student a văzut răspunsurile înainte de test. Modelul de regresie ar avea apoi două variabile explicative - studierea timpului și dacă studentul avea cunoștințe prealabile despre răspunsuri. Cu aceste două variabile, s-ar explica mai mult din variația scorurilor testului și variația termenului de eroare ar putea fi apoi homoskedastică, ceea ce sugerează că modelul a fost bine definit.
