I terzili
Cosa sono i terzili
I terzili sono due indici di posizione (quantili) che dividono una distribuzione statistica in tre parti uguali.
Ogni parte è un gruppo con lo stesso numero di elementi.
Esistono due terzili
- Il primo terzile (T1) raggruppa a sinistra 1/3 degli elementi (33,33%) della distribuzione, lasciando a destra i restanti 2/3 degli elementi (66,67%).
- Il primo terzile (T2) raggruppa a sinistra 2/3 degli elementi (66,67%) della distribuzione, lasciando a destra il restante 1/3 degli elementi (33,33%).
Esempio. In questa seriazione il primo terzile T1=5,5 e il secondo terzile T2=8,5 dividono la distribuzione in tre parti uguali. $$ X = \{ \underbrace{3,4,5},\color{red}{T_1}, \underbrace{6,7,8}, \color{red}{T_2}, \underbrace{9,10,11} \} $$
Come calcolare i terzili
Per calcolare i terzili devo distinguere tra le seriazioni e le distribuzioni in classi di frequenza.
Seriazioni
Per calcolare i terzili di una seriazione (serie di valori)
- Ordino la distribuzione in modo crescente
- Moltiplico il numero degli elementi per p=1/3 nel caso di T1 e per p=2/3 nel caso di T2 $$ k = n \cdot p $$
- Calcolo la posizione del terzile
- Se il prodotto k è un numero intero, ottengo il primo terzile facendo la media tra il k-esimo e il (k+1)-esimo elemento della distribuzione.
- Se il prodotto k non è intero, ottengo il primo terzile arrotondando per eccesso k al primo intero successivo.
Distribuzioni di frequenze
Per calcolare i terzili in una distribuzione di frequenze
- Calcolo il cumulato delle frequenze assolute in ogni classe della distribuzione
- Divido il cumulato totale delle frequenze per 1/3 e per 2/3. In questo modo trovo la posizione del primo terzile (T1) e del secondo terzile (T2) nelle frequenze cumulate.
- Individuo l'intervallo delle frequenze cumulate in cui cadono le posizioni dei terzili T1 e T2. Le rispettive classi di frequenza sono i terzili della distribuzione.
Nota. Esistono diversi metodi per calcolare i terzili. Alcuni metodi usano l'interpolazione lineare per trovare il valore del terzile in una classe. Altri metodi, invece, approssimano il terzile al valore medio della classe.
Un esempio pratico
Esempio 1
Considero questa distribuzione composta da n=9 elementi
$$ X = \{ 9,6,11,8,4,7,10,3,5 \} $$
Ordino la distribuzione X in modo crescente
$$ X = \{ 3,4,5,6,7,8,9,10,11 \} $$
Per calcolare il primo terzile (T1) moltiplico il numero degli elementi (n=9) per 1/3
$$ k = n \cdot \frac{1}{3} = 9 \cdot \frac{1}{3} =3 $$
Il prodotto è un numero intero.
Quindi calcolo la media dei valori tra il terzo (k=3) e il quarto (k+1=4) elemento della seriazione.
$$ X = \{ 3,4,\underbrace{5,6},7,8,9,10,11 \} $$
Il terzo elemento è il valore 5 mentre il quarto elemento è il valore 6.
$$ T_1 = \frac{5+6}{2} = 5,5 $$
Pertanto, il primo terzile della distribuzione X è il valore T1=5,5
$$ T_1 = 5,5 $$
Per calcolare il secondo terzile (T2) moltiplico il numero degli elementi (n=9) per 2/3
$$ k = n \cdot \frac{2}{3} = 9 \cdot \frac{2}{3} =6 $$
Il prodotto è un numero intero.
Quindi calcolo la media tra il valore del sesto elemento (k=6) e quello del settimo elemento (k+1=7) della seriazione.
$$ X = \{ 3,4,5,6,7,\underbrace{8,9},10,11 \} $$
Il sesto elemento è il valore 8 mentre il settimo elemento è il valore 9.
$$ T_2 = \frac{8+9}{2} = 8,5 $$
Pertanto, il secondo terzile è il valore T2=8,5
$$ T_2 = 8,5 $$
Complessivamente i due terzili T1 = 5,5 e T2 = 8,5 dividono la distribuzione in tre parti uguali.
$$ X = \{ \underbrace{3,4,5},\color{red}{T_1}, \underbrace{6,7,8}, \color{red}{T_2}, \underbrace{9,10,11} \} $$
Nota. In questo caso i due terzili sono valori che non appartengono alla distribuzione X.
Esempio 2
Considero la precedente distribuzione eliminando un elemento.
Ora la distribuzione è composta da n=8 elementi
$$ X = \{ 9,6,8,4,7,10,3,5 \} $$
Ordino la distribuzione X in modo crescente
$$ X = \{ 3,4,5,6,7,8,9,10 \} $$
Per calcolare il primo terzile (T1) moltiplico il numero degli elementi (n=8) per 1/3
$$ k = n \cdot \frac{1}{3} = 8 \cdot \frac{1}{3} =2,66 $$
Il prodotto non è un numero intero.
Quindi approssimo il primo terzile al primo intero successivo di 2,66 ossia k=3
$$ X = \{ 3,4,\color{red}5,6,7,8,9,10,11 \} $$
Il terzo elemento è il valore 5
Pertanto, il primo terzile della distribuzione X è il valore T1=5
$$ T_1 = 5 $$
Per calcolare il secondo terzile (T2) moltiplico il numero degli elementi (n=8) per 2/3
$$ k = n \cdot \frac{2}{3} = 8 \cdot \frac{2}{3} =5,33 $$
Il prodotto non è un numero intero.
Quindi approssimo il secondo terzile al primo intero successivo di 5,33 ossia k=6
$$ X = \{ 3,4,5,6,7,\color{red}8 ,9,10,11 \} $$
Il sesto elemento è il valore 8.
Pertanto, il secondo terzile è il valore T2=8
$$ T_2 = 8 $$
Complessivamente i due terzili T1 = 5 e T2 = 8 dividono la distribuzione in tre parti uguali.
$$ X = \{ \underbrace{3,4},\color{red}{5}, \underbrace{6,7}, \color{red}{8}, \underbrace{9,10} \} $$
Nota. In questo caso i due terzili sono valori che appartengono alla distribuzione X.
Esempio 3
Considero questa distribuzione di frequenze.
In questo caso i voti dell'esame sono le modalità in cui si è presentato il fenomeno mentre il numero degli studenti sono le rispettive frequenze assolute.
Per trovare i terzili aggiungo la colonna delle frequenze cumulate dalla prima classe in poi.
Il totale delle frequenze cumulate è ftot=40
Per trovare il primo terzile moltiplico le frequenze cumulate ftot=40 per 1/3
$$ k =f_{tot} \cdot \frac{1}{3} = 40 \cdot \frac{1}{3} = 13,3 $$
Il risultato 13,3 è compreso nell'intervallo 13-16 delle frequenze cumulate.
Pertanto, il primo terzile è la classe T1=22
Per trovare il secondo terzile moltiplico le frequenze cumulate ftot=40 per 2/3
$$ k =f_{tot} \cdot \frac{2}{3} = 40 \cdot \frac{2}{3} = 26,6 $$
Il risultato 26,6 è compreso nell'intervallo 22-30 delle frequenze cumulate.
Pertanto, il secondo terzile è la classe T2=25
E così via.