Care este media winsorizată?
Media winsorizată este o metodă de medie care înlocuiește inițial cele mai mici și mai mari valori cu observațiile cele mai apropiate de acestea. Acest lucru este făcut pentru a limita efectul valorilor extreme sau al valorilor extreme asupra calculului. După înlocuirea valorilor, se folosește formula medie aritmetică pentru a calcula media winorizată.
Formula pentru media winsorizată este
Media Winsorized = Nxn… xn + 1 + xn + 2… xn unde: n = Numărul de date mai mari și mai mici care trebuie înlocuite de observație
Mijloacele winsorizate sunt exprimate în două moduri. O „k n ” medie wonorizată se referă la înlocuirea celor mai mici și mai mari observații „k”, unde „k” este un număr întreg. O medie X wonorizată „X%” implică înlocuirea unui procent dat de valori din ambele capete ale datelor.
Cum se calculează media winsorizată
Media câștigată se calculează prin înlocuirea celor mai mici și mai mari puncte de date, apoi se însumează toate punctele de date și se împarte suma la numărul total de puncte de date.
Ce îți spune Winsorized?
Media câștigată este mai puțin sensibilă la valori superioare, deoarece le poate înlocui cu valori mai puțin extreme. Adică este mai puțin sensibil la contururi față de medie. Cu toate acestea, dacă o distribuție are cozi de grăsime, efectul de a elimina valorile cele mai mari și cele mai mici din distribuție va avea o influență mică din cauza numărului mare de variabilitate a cifrelor de distribuție.
Cheie de luat cu cheie
- O metodă de medie care include înlocuirea celor mai mici și mai mari valori cu observațiile cele mai apropiate de ele. Mai puțin sensibile la valorile exterioare, deoarece le poate înlocui cu valori mai puțin extreme. tind să fie aproape.
Exemplu de utilizare a mediei winsorizate
Se poate calcula media victorizată pentru următorul set de date: 1, 5, 7, 8, 9, 10, 14. În acest exemplu, presupunem că media winorizată este în prima ordine, înlocuim cele mai mici și mai mari valori cu cele mai apropiate observații.
Setul de date apare astfel: 5, 5, 7, 8, 9, 10, 10. Luând o medie aritmetică a noului set produce o medie winorizată de 7, 7 sau (5 + 5 + 7 + 8 + 9 + 10 + 10) împărțit la 7.
Sau luați în considerare o medie câștigată cu 20% care ia primele 10% și 10% inferioare și le înlocuiește cu următoarea lor valoare. Vom câștiga următorul set de date: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Cei doi cele mai mici și mai mari puncte de date, sau 10%, vor fi înlocuite cu următoarea lor valoare cea mai apropiată. Astfel, noul set de date este: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. media este 33, 9 sau totalul datelor (678) împărțit la numărul total de puncte de date (20).
Diferența dintre media winsorizată și media trimisă
Media câștigată include modificarea punctelor de date, în timp ce media tăiată implică eliminarea punctelor de date. Este obișnuit ca media victorizată și media tăiată să fie apropiate.
Limitări ale utilizării mediei winsorizate
Unul dintre dezavantajele majore ale mijloacelor winorizate este că acestea introduc prejudecăți în setul de date. Acordat, setul de date este, în mod ideal, mai puțin părtinitor după modificare decât în cazul în care au rămas valori superioare.
Aflați mai multe despre media winsorizată
Pentru informații conexe, despre diferențele dintre calculele medii cheie.
