Ce este o statistică Chi-Square?
Un chi-pătrat ( χ 2) statistică este un test care măsoară modul în care așteptările se compară cu datele reale observate (sau rezultatele modelului). Datele utilizate pentru calcularea unei statistici chi-pătrate trebuie să fie aleatorii, brute, excluse reciproc, extrase din variabile independente și extrase dintr-un eșantion suficient de mare. De exemplu, rezultatele aruncării unei monede de 100 de ori îndeplinesc aceste criterii.
Testele chi-pătrate sunt adesea utilizate în testarea ipotezelor.
Formula pentru Chi-Square este
χc2 = ∑ (Oi − Ei) 2Eiunde: c = grade de libertateO = valoarea (valorile) observate E = valoarea (valorile) așteptate \ begin {aliniate} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {unde:} \ & c = \ text {grade of freedom} \ & O = \ text {valoarea / valorile observate} \ & E = \ text {valoarea / valorile așteptate } \ \ end {aliniat} χc2 = ∑Ei (Oi −Ei) 2 unde: c = grade de libertateO = valoarea (valorile) observată E = valoarea / valorile așteptate
Ce vă spune o statistică Chi-Square?
Există două tipuri principale de teste chi-pătrate: testul independenței, care pune o întrebare de relație, cum ar fi: "Există o relație între gen și scoruri SAT?"; și testul de bunătate de potrivire, care întreabă ceva de genul „Dacă o monedă este aruncată de 100 de ori, o să vină capete de 50 de ori și cozi de 50 de ori?”
Pentru aceste teste, gradele de libertate sunt utilizate pentru a determina dacă o anumită ipoteză nulă poate fi respinsă pe baza numărului total de variabile și probe din experiment.
De exemplu, când se iau în considerare alegerea cursanților și a cursului, este probabil ca o dimensiune de eșantion de 30 sau 40 de studenți să nu fie suficient de mare pentru a genera date semnificative. Obținerea acelorași rezultate similare dintr-un studiu folosind o dimensiune de eșantion de 400 sau 500 de studenți este mai valabilă.
Într-un alt exemplu, luați în considerare aruncarea unei monede de 100 de ori. Rezultatul scontat de aruncarea unei monede corecte de 100 de ori este că capetele vor veni de 50 de ori și cozile vor veni de 50 de ori. Rezultatul real ar putea fi că capetele se ridică de 45 de ori și cozile cresc de 55 de ori. Statistica chi-pătrat arată orice discrepanțe între rezultatele așteptate și rezultatele reale.
Exemplu de test Chi-Squared
Imaginează-ți că un sondaj aleatoriu a fost luat la peste 2.000 de alegători, atât bărbați, cât și femei. Persoanele care au răspuns au fost clasificate în funcție de sex și indiferent dacă sunt republicane, democrate sau independente. Imaginați-vă o grilă cu coloanele etichetate republican, democrat și independent și două rânduri etichetate masculin și feminin. Presupunem că datele de la 2.000 de respondenți sunt următoarele:
Primul pas pentru calcularea statisticii chi patrat este de a găsi frecvențele așteptate. Acestea sunt calculate pentru fiecare „celulă” din grilă. Deoarece există două categorii de gen și trei categorii de viziune politică, există șase frecvențe totale așteptate. Formula frecvenței preconizate este:
E (r, c) = n (r) × c (r) undeva: r = rândul în questionc = coloana în chestionare = totalul corespunzător \ begin {aliniat} & E (r, c) = \ frac {n (r) times c (r)} {n} \ & \ textbf {unde:} \ & r = \ text {rândul în cauză} \ & c = \ text {coloana în cauză \ \ & n = \ text {total corespunzător} \ \ end {aliniat} E (r, c) = nn (r) × c (r) unde: r = rândul în chestc = coloana în chestionar = totalul corespunzător
În acest exemplu, frecvențele așteptate sunt:
- E (1, 1) = (900 x 800) / 2.000 = 360E (1, 2) = (900 x 800) / 2.000 = 360E (1, 3) = (200 x 800) / 2.000 = 80E (2, 1) = (900 x 1.200) / 2.000 = 540E (2, 2) = (900 x 1.200) / 2.000 = 540E (2, 3) = (200 x 1.200) / 2.000 = 120
În continuare, acestea sunt valorile utilizate pentru a calcula statistica chi-squared folosind următoarea formulă:
Chi-squared = ∑2E (r, c) unde: O (r, c) = date observate pentru rândul și coloana date \ begin {align} & \ text {Chi-squared} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {unde:} \ & O (r, c) = \ text {date observate pentru rândul și coloana date} \ \ end {aliniat} Chi-squared = ∑E (r, c) 2 unde: O (r, c) = date observate pentru rândul și coloana dată
În acest exemplu, expresia pentru fiecare valoare observată este:
- O (1, 1) = (400 - 360) 2/360 = 4, 44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2, 96O (2, 2) = (600 - 540) 2/540 = 6, 67O (2, 3) = (100 - 120) 2/120 = 3, 33
Statistica chi-pătrată este egală cu suma acestor valori, sau 32, 41. Putem apoi să ne uităm la un tabel de statistică chi-pătrat pentru a vedea, având în vedere gradele de libertate în configurarea noastră, dacă rezultatul este semnificativ statistic sau nu.
