Ce este corelația spuroasă
În statistici, o corelație spuroasă, sau spuriție, se referă la o conexiune între două variabile care apare cauzal, dar nu este. Relațiile spuroase au adesea aspectul unei variabile care afectează alta. Această corelație spuroasă este adesea cauzată de un al treilea factor care nu este evident în momentul examinării, uneori numit factor de confuzie.
Cheie de luat cu cheie
- Corelația spuriosă sau spuriția este atunci când doi factori apar relaționate casual, dar nu sunt. Apariția unei relații cauzale se datorează adesea mișcării similare pe un grafic care se dovedește a fi coincidentă sau cauzată de un al treilea factor „confuz”. poate fi adesea cauzată de mărimi mici ale eșantionului sau de obiective arbitrare.
Cum funcționează corelația spuriosă
Atunci când două variabile aleatorii se urmăresc reciproc îndeaproape pe un grafic, este ușor de bănuit corelația sau o relație între cei doi factori, unde o schimbare îl afectează pe celălalt. Renunțând la „cauzalitate”, un alt subiect, această observație poate determina cititorul graficului să creadă că mișcarea variabilei A este legată de mișcarea din variabila B sau invers. dar uneori, la examinarea statistică mai atentă, mișcările aliniate sunt coincidente sau cauzate de un al treilea factor care afectează primii doi. Aceasta este o corelație spuroasă. Cercetările efectuate cu dimensiuni mici ale eșantionului sau cu obiective finale arbitrare sunt particularități susceptibile de a fi înfiorătoare.
Exemplu de corelații spațioase
Nu este prea dificil să descoperi corelații interesante. Cu toate acestea, mulți se vor dovedi a fi spuriosi. Pentru speciile de sex masculin de pe Wall Street, două corelații spuroase populare implică femei și sport. Originară în anii 1920 este teoria lungimii fustei, care susține că lungimile fustei și direcția pieței bursiere sunt corelate. Dacă lungimile fustei sunt lungi, asta înseamnă că piața bursieră este în scădere; dacă sunt scurte, piața este în creștere. La sfârșitul lunii ianuarie, se vorbește despre așa-numitul indicator Super Bowl, care sugerează că o victorie a echipei AFC înseamnă probabil că piața bursieră va scădea în anul următor, în timp ce o victorie a echipei NFC prevede o creștere a piaţă. Din 1966, indicatorul a avut o rată de precizie de 80%. Este o piesă de conversație amuzantă, dar probabil că nu este un lucru pe care un consilier financiar serios l-ar recomanda ca strategie de investiții pentru clienți.
Iată câteva exemple suplimentare de corelații spurice comune:
- Depunerile cresc când vânzările de înghețată cresc. Se poate părea că vânzările crescute de înghețată provoacă mai multe înec, dar, în realitate, căldura în creștere poate determina mai mulți oameni să înoate, precum și să cumpere mai multă înghețată. Rata de omor din SUA din 2006-2011 a scăzut în același ritm ca Microsoft Internet Explorer utilizare.Executorii care spun vă rog și vă mulțumesc se bucură mai des de o performanță mai bună a acțiunilor.
Cum să localizați corelațiile spuroase
Statisticii și alți oameni de știință care analizează datele trebuie să fie în permanență în căutarea relațiilor spuroase. Există numeroase metode pe care le folosesc, inclusiv:
- Asigurarea unui eșantion reprezentativ corespunzător.Obținerea unei dimensiuni de eșantion adecvate. Fiți atenți la obiectivele arbitrare. Controlul pentru cât mai multe variabile externe posibil. Utilizarea unei ipoteze nule și verificarea unei valori p puternice.
