Ce sunt statisticile nonparametrice?
Statisticile nonparametrice se referă la o metodă statistică în care datele nu sunt necesare pentru a se încadra într-o distribuție normală. Statistica nonparametrică folosește date care sunt adesea ordinale, ceea ce înseamnă că nu se bazează pe numere, ci mai degrabă pe un clasament sau ordine de fel. De exemplu, un sondaj care transmite preferințele consumatorilor care variază de la cum ar fi la neplăcut ar fi considerate date ordinare.
Statisticile nonparametrice includ statistici descriptive nonparametrice, modele statistice, inferențe și teste statistice. Structura modelului modelelor neparametrice nu este specificată a priori, ci este în schimb determinată din date. Termenul nonparametric nu este menit să implice faptul că astfel de modele lipsesc complet parametri, ci mai degrabă că numărul și natura parametrilor sunt flexibili și nu sunt fixați în avans. O histogramă este un exemplu de estimare nonparametrică a unei distribuții a probabilității.
Înțelegerea statisticilor nonparametrice
În statistici, statisticile parametrice includ parametri cum ar fi media, mediana, abaterea standard, variația, etc. Această formă de statistici utilizează datele observate pentru a estima parametrii distribuției. Conform statisticilor parametrice, se presupune că datele corespund unei distribuții normale cu parametrii necunoscuți μ (media populației) și σ 2 (variația populației), care sunt apoi estimați folosind media eșantionului și variația probei.
Statisticile nonparametrice nu fac nicio presupunere cu privire la mărimea eșantionului sau dacă datele observate sunt cantitative.
Statisticile nonparametrice nu presupun că datele sunt trase dintr-o distribuție normală. În schimb, forma distribuției este estimată sub această formă de măsurare statistică. Deși există multe situații în care se poate presupune o distribuție normală, există și anumite scenarii în care nu va fi posibil să se stabilească dacă datele vor fi distribuite în mod normal.
Exemple de statistici nonparametrice
În primul exemplu, luați în considerare un cercetător care dorește o estimare a numărului de bebeluși din America de Nord născuți cu ochii căprui poate decide să ia un eșantion de 150.000 de bebeluși și să efectueze o analiză pe setul de date. Măsurarea pe care o obțin va fi utilizată ca estimare a întregii populații de bebeluși cu ochi căprui născuți în anul următor.
Pentru un al doilea exemplu, luați în considerare un cercetător diferit care dorește să știe dacă mersul la culcare devreme sau târziu este legat de cât de des se îmbolnăvește. Presupunând că eșantionul este ales la întâmplare din populație, distribuția dimensiunii eșantionului a frecvenței bolii poate fi presupusă a fi normală. Cu toate acestea, un experiment care măsoară rezistența corpului uman la o tulpină de bacterii nu se poate presupune că are o distribuție normală.
Acest lucru se datorează faptului că o probă selectată aleatoriu poate fi rezistența la tulpină. Pe de altă parte, dacă cercetătorul ia în considerare factori precum machiajul genetic și etnia, el poate constata că o dimensiune a eșantionului selectată folosind aceste caracteristici poate să nu fie rezistentă la tulpină. Prin urmare, nu se poate presupune o distribuție normală.
Această metodă este utilă atunci când datele nu au o interpretare numerică clară și este cel mai bine de utilizat cu date care au un clasament de sorturi. De exemplu, un test de evaluare a personalității poate avea un clasament al valorilor sale setate ca fiind puternic în dezacord, nu sunt de acord, indiferent, sunt de acord și sunt de acord puternic. În acest caz, trebuie utilizate metode nonparametrice.
consideratii speciale
Statisticile nonparametrice au câștigat aprecieri datorită ușurinței lor de utilizare. Pe măsură ce nevoia de parametri este ușurată, datele devin mai aplicabile unei varietăți mai mari de teste. Acest tip de statistici pot fi utilizate fără media, dimensiunea eșantionului, abaterea standard sau estimarea oricărui alt parametru aferent atunci când nu există niciuna dintre aceste informații.
Deoarece statisticile nonparametrice fac mai puține ipoteze cu privire la datele de eșantion, aplicarea acesteia are un scop mai larg decât statisticile parametrice. În cazurile în care testarea parametrică este mai adecvată, metodele nonparametrice vor fi mai puțin eficiente. Acest lucru se datorează faptului că rezultatele obținute din statisticile nonparametrice au un grad de încredere mai mic decât dacă rezultatele au fost obținute folosind statistici parametrice.
Cheie de luat cu cheie
- Statisticile nonparametrice sunt ușor de utilizat, dar nu oferă precizia concretă a altor modele statistice. Acest tip de analiză este cel mai potrivit atunci când se ia în considerare ordinea a ceva, unde chiar dacă datele numerice se schimbă, rezultatele vor rămâne probabil aceleași.
