Formula de distribuție normală se bazează pe doi parametri simpli - media și abaterea standard - care cuantifică caracteristicile unui set de date dat. În timp ce media indică valoarea „centrală” sau medie a întregului set de date, abaterea standard indică „răspândirea” sau variația punctelor de date în jurul valorii respective.
Luați în considerare următoarele 2 seturi de date:
Set de date 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Set de date 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Pentru Dataset1, media = 10 și abaterea standard (stddev) = 0
Pentru Dataset2, medie = 10 și abatere standard (stddev) = 2, 83
Să graficăm aceste valori pentru DataSet1:
În mod similar pentru DataSet2:
Linia orizontală roșie din ambele grafice de mai sus indică „media” sau valoarea medie a fiecărui set de date (10 în ambele cazuri). Săgețile roz din al doilea grafic indică răspândirea sau variația valorilor datelor din valoarea medie. Aceasta este reprezentată de valoarea de deviere standard de 2, 83 în cazul DataSet2. Deoarece DataSet1 are toate valorile la fel (ca 10 fiecare) și nici o variație, valoarea stddev este zero și, prin urmare, nu sunt aplicate săgeți roz.
Valoarea stddev are câteva caracteristici semnificative și utile, care sunt extrem de utile în analiza datelor. Pentru o distribuție normală, valorile datelor sunt distribuite simetric pe ambele părți ale mediei. Pentru orice set de date normal distribuit, graficul grafic cu stddev pe axa orizontală și nr. a valorilor datelor pe axa verticală, se obține următorul grafic.
Proprietățile unei distribuții normale
- Curba normală este simetrică față de medie; Media este la mijloc și împarte zona în două jumătăți; Suprafața totală sub curbă este egală cu 1 pentru media = 0 și stdev = 1; Distribuția este descrisă complet prin media sa si stddev
După cum se poate vedea din graficul de mai sus, stddev reprezintă următoarele:
- 68, 3% din valorile datelor se află într- o abatere standard a mediei (-1 la +1) 95, 4% din valorile datelor se află în 2 abateri standard ale mediei (-2 la +2) 99, 7% din valorile datelor se află în 3 abateri standard din media (de la -3 la +3)
Zona sub curba în formă de clopot, atunci când este măsurată, indică probabilitatea dorită a unui interval dat:
- mai mică de X: - de exemplu, probabilitatea valorilor datelor să fie mai mică de 70 mai mare decât X - de exemplu, probabilitatea valorilor datelor să fie mai mare de 95 între X 1 și X 2 - de exemplu, probabilitatea valorilor de date între 65 și 85
unde X este o valoare de interes (exemple de mai jos).
Trasarea și calcularea zonei nu este întotdeauna convenabilă, deoarece seturi de date diferite vor avea valori medii și stddev diferite. Pentru a facilita o metodă standard uniformă pentru calcule ușoare și aplicabilitate la problemele din lumea reală, a fost introdusă conversia standard la valori Z, care fac parte din tabelul normal de distribuție.
Z = (X - medie) / stddev, unde X este variabila aleatorie.
Practic, această conversie obligă media și stddev să fie standardizate la 0 și respectiv 1, ceea ce permite utilizarea unui set standard de valori Z (din tabelul de distribuție normală) pentru calcule ușoare. O imagine instantanee a tabelului de valori z standard care conține valori de probabilitate este următoarea:
z |
0.00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0.0 |
0.00000 |
0, 00399 |
0.00798 |
0.01197 |
0.01595 |
0.01994 |
… |
0.1 |
0.0398 |
0.04380 |
0.04776 |
0.05172 |
0.05567 |
0.05966 |
… |
0.2 |
0.0793 |
0.08317 |
0.08706 |
0.09095 |
0.09483 |
0.09871 |
… |
0.3 |
0.11791 |
0.12172 |
0.12552 |
0.12930 |
0.13307 |
0.13683 |
… |
0.4 |
0.15542 |
0.15910 |
0.16276 |
0.16640 |
0.17003 |
0.17364 |
… |
0.5 |
0.19146 |
0.19497 |
0.19847 |
0.20194 |
0.20540 |
0.20884 |
… |
0.6 |
0.22575 |
0.22907 |
0.23237 |
0.23565 |
0.23891 |
0.24215 |
… |
0.7 |
0.25804 |
0.26115 |
0.26424 |
0.26730 |
0.27035 |
0.27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
Pentru a găsi probabilitatea legată de valoarea z de 0, 239865, rotunjiți-o mai întâi la 2 zecimale (adică 0, 24). Verificați apoi primele 2 cifre semnificative (0, 2) din rânduri și cele mai puțin semnificative cifre (rămase 0, 04) în coloană. Aceasta va duce la o valoare de 0, 09483.
Tabelul complet de distribuție normal, cu precizie de până la 5 zecimale pentru valorile de probabilitate (inclusiv cele pentru valori negative), poate fi găsit aici.
Să vedem câteva exemple din viața reală. Înălțimea indivizilor dintr-un grup mare urmează un model normal de distribuție. Presupunem că avem un set de 100 de persoane, ale căror înălțimi sunt înregistrate, iar media și stddev sunt calculate la 66, respectiv 6 inci.
Iată câteva exemple de întrebări la care se poate răspunde cu ușurință folosind tabelul cu valori z:
- Care este probabilitatea ca o persoană din grup să aibă 70 de centimetri sau mai puțin?
Întrebarea este de a găsi valoarea cumulată a P (X <= 70) adică în întregul set de date de 100, câte valori vor fi cuprinse între 0 și 70.
Să transformăm mai întâi valoarea X de 70 la valoarea Z echivalentă.
Z = (X - medie) / stddev = (70-66) / 6 = 4/6 = 0, 66667 = 0, 67 (rotund până la 2 zecimale)
Acum trebuie să găsim P (Z <= 0.67) = 0. 24857 (din tabelul z de mai sus)
adică există o probabilitate de 24, 857% ca un individ din grup să fie mai mic sau egal cu 70 de centimetri.
Dar agățați - cele de mai sus sunt incomplete. Amintiți-vă, căutăm probabilitatea tuturor înălțimilor posibile până la 70 adică de la 0 la 70. De mai sus, vă oferim doar porțiunea de la valoarea medie la dorită (adică 66 la 70). Trebuie să includem cealaltă jumătate - de la 0 la 66 - pentru a ajunge la răspunsul corect.
De la 0 la 66 reprezintă jumătatea porțiunii (adică o medie la extremă până la mijlocul drumului), probabilitatea sa este pur și simplu 0, 5.
De aici, probabilitatea corectă a unei persoane de 70 cm sau mai puțin = 0, 24857 + 0, 5 = 0. 74857 = 74, 857%
Grafic (prin calcularea ariei), acestea sunt cele două regiuni însumate care reprezintă soluția:
- Care este probabilitatea ca o persoană să fie cu 75 de centimetri sau mai mare?
adică Găsiți P cumulativ complementar (X> = 75).
Z = (X - medie) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Care este probabilitatea ca o persoană să fie între 52 inci și 67 inci?
Găsiți P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (.40905) =
Acest tabel normal de distribuție (și valorile z) găsește în mod obișnuit utilizarea pentru orice calcul de probabilitate cu privire la evoluția prețurilor preconizate pe piața bursieră pentru acțiuni și indici. Sunt utilizate în tranzacționarea bazată pe gamă, identificând creșterea ascendentă sau descendentă, nivelurile de susținere sau rezistență și alți indicatori tehnici bazate pe concepte normale de distribuție a mediei și abaterii standard.
Comparați conturile de investiții × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații. Denumirea furnizoruluiArticole similare
Comercializarea educației de bază
Testarea ipotezei în finanțe: concept și exemple
Managementul riscului
Optimizează-ți portofoliul folosind distribuția normală
Analiza tehnică Educație de bază
Regresia liniară a timpului și a prețului
Managementul riscului
Utilizările și limitele volatilității
Analiză financiară
Cum se calculează valoarea la risc (VaR) în Excel
Instrumente pentru analiza fundamentală
Înțelegerea măsurătorilor de volatilitate
Link-uri pentru parteneriTermeni înrudiți
Intervalul de încredere Definiția Intervalul de confidență, în statistici, se referă la probabilitatea ca un parametru al populației să cadă între două valori setate. mai mult Managementul riscului în finanțe În lumea financiară, managementul riscului este procesul de identificare, analiză și acceptare sau atenuare a incertitudinii în deciziile de investiții. Gestionarea riscurilor apare oricând un investitor sau un administrator de fond analizează și încearcă să cuantifice potențialul de pierderi dintr-o investiție. mai mult Înțelegerea curbei de trezorerie a ratei spotului Curba trezoreriei ratei spotului este definită ca o curbă a randamentului construită folosind ratele la trezoreria locului, mai degrabă decât randamentele. Curba trezoreriei ratei spot poate fi folosită ca punct de referință pentru obligațiunile de stabilire a prețurilor. mai mult Indicele Gini Definiția Indicele Gini este o măsură statistică de distribuție adesea folosită ca un ecart al inegalității economice. mai mult Modelul de preț al activelor de capital (CAPM) Modelul de preț al activelor de capital este un model care descrie relația dintre risc și rentabilitatea preconizată. mai mult Înțelegerea mediei armonice Media armonică este o medie care este utilizată în finanțe pentru a multiplica medie, cum ar fi raportul preț-câștig. Mai Mult