La distribuzione normale
Cos'è la distribuzione normale
La distribuzione normale è una distribuzione di probabilità caratterizzata da una curva a campana simmetrica.
E' definita dalla media e dalla deviazione standard di una popolazione.
A cosa serve?
Il calcolo della distribuzione normale mi fornisce informazioni sulla distribuzione delle probabilità dei valori che una variabile statistica può assumere.
Esempio. L'altezza delle persone della popolazione in una determinata fascia d'età può essere ben rappresentata dalla distribuzione normale perché gran parte delle persone hanno un'altezza vicina alla media.
Come calcolare la distribuzione normale
Per calcolare la distribuzione normale di una popolazione ho bisogno di due dati
- La media della popolazione
- La deviazione standard
Con questi due dati posso calcolare le probabilità dei valori.
Un esempio pratico
Considero una popolazione X composta da 100 studenti di cui conosco la media dell'altezza
$$ \mu=1,8 \ metri $$
e la deviazione standard
$$ \sigma^2 = 0,1 $$
A partire da questi dati voglio conoscere la probabilità per fasce di altezza
Scrivo una tabella con le altezze in ordine crescente da 1,65 a 2,00 metri
altezza | densità di probabilità | cumulativa |
---|---|---|
1,6 | ||
1,65 | ||
1,7 | ||
1,75 | ||
1,8 | ||
1,85 | ||
1,9 | ||
1,95 | ||
2,00 |
Quindi, calcolo la densità di probabilità normale e cumulativa usando la distribuzione normale.
altezza | densità di probabilità | cumulativa |
---|---|---|
1,6 | 0,54 | 0,02 |
1,65 | 1,30 | 0,07 |
1,7 | 2,42 | 0,16 |
1,75 | 3,52 | 0,31 |
1,8 | 3,99 | 0,50 |
1,85 | 3,52 | 0,69 |
1,9 | 2,42 | 0,84 |
1,95 | 1,30 | 0,93 |
2,00 | 0,54 | 0,98 |
La funzione della densità di probabilità mi fornisce un'idea sulla probabilità dei valori.
Ad esempio, i valori più vicini alla media aritmetica (μ=1,8) hanno una densità di probabilità maggiore.
Dal punto di vista grafico la distribuzione della densità di probabilità assume la classica forma di curva a campana simmetrica.
La curva della funzione di distribuzione cumulativa è invece una curva crescente da 0 a 1
Dove 0 e 1 misurano la probabilità.
La funzione di distribuzione cumulativa mi permette di calcolare la probabilità per fascia di altezza.
Ad esempio, sapendo che la probabilità cumulativa fino a 1,7 metri è 0,16 e quella fino a 1,75 metri è 0,31, calcolo per differenza la probabilità della fascia 1,7-1,75
$$ p = 0,31 - 0,16 = 0,15 $$
Pertanto, la probabilità dell'altezza tra 1,7 e 1,75 metri è del 15%
Allo stesso modo posso calcolare le altre probabilità.
altezza | probabilità | nota |
---|---|---|
1,60 - 1.65 | 0,05 | 0,07-0,02 = 0,05 = 5% |
1-65 - 1,70 | 0,09 | 0,16-0,07 = 0,09 = 9% |
1,70 - 1,75 | 0,15 | 0,31-0,16 = 0,15 = 15% |
1,75 - 1,80 | 0,19 | 0,50-0,31 = 0,19 = 19% |
1,80 - 1,85 | 0,19 | 0,69-0,50 = 0,19 = 19% |
1,85 - 1,90 | 0,15 | 0,84-0,69 = 0,15 = 15% |
1,90 - 1,95 | 0,09 | 0,93-0,84 = 0,09 = 9% |
1,94 - 2,00 | 0,05 | 0,98-0,83 = 0,05 = 5% |
E così via.