La concentrazione della variabilità
La concentrazione misura la variabilità di un fenomeno additivo. In altre parole, misura quanto sono concentrati i dati in una variabile statistica X.
La concentrazione è compresa tra due situazioni estreme
- Massima concentrazione
Se una sola unità ha l'intero ammontare della variabile statistica X, la concentrazione è massima. - Equidistribuzione
Se tutte le unità hanno lo stesso ammontare del carattere,allora la concentrazione è nulla. Si verifica l'equidistribuzione. E' anche conosciuta come "concentrazione nulla".
Come si misura la concentrazione
Se una variabile statistica ha n modalità di natura quantitativa, ordino le n modalità in ordine non decrescente. Dalla più piccola alla più grande.
$$ x_{1},x_{2},...,x_{n} $$
Esempio. Ho la distribuzione X composta da 8 valori
Ordino i dati in modo non decrescente.
Poi suddivido le n unità osservate in n frazioni cumulate (pi) che chiamo frazioni cumulate delle unità.
$$ p_1 = \frac{1}{n} \\ p_2 = \frac{2}{n} \\ \vdots \\ p_n = \frac{n}{n} = 1 $$
Esempio. Nella distribuzione X ci sono n=8 unità osservate. Quindi, le frazioni cumulate delle unità sono $$ p_1 = \frac{1}{8} = 0,125 \\ p_2 = \frac{2}{8} = 0,25 \\ p_3 = \frac{3}{8} = 0,375 \\ p_4 = \frac{4}{8} = 0,5 \\ p_2 = \frac{5}{8} = 0,625 \\ p_6 = \frac{6}{8} = 0,75 \\ p_7 = \frac{7}{8} = 0,875 \\ p_8 = \frac{8}{8} = 1 $$ Le aggiungo nella tabella precedente.
Le frazioni cumulate delle unità sono valori da 0 a 1.
Calcolo il totale xtot del carattere nella variabile statistica
$$ x_{tot} = \sum_{i=1}^n x_{i} $$
Esempio. In questo caso il totale delle osservazioni è xtot=238
Aggiungo il cumulato x' delle osservazioni
Esempio. Aggiungo la colonna del cumulato x' alla tabella
Infine, calcolo le frazioni cumulate del carattere.
$$ q_1 = \frac{1}{ x_{tot} } \cdot \sum_{i=1}^1 x_i $$
$$ q_2 = \frac{1}{ x_{tot} } \cdot \sum_{i=1}^2 x_i $$
$$ q_n = \frac{1}{ x_{tot} } \cdot \sum_{i=1}^n x_i = 1 $$
Anche in questo le frazioni cumulate del carattere sono valori compresi tra 0 e 1.
Esempio. Aggiungo la colonna q delle frazioni cumulate del carattere alla tabella.
Il confronto tra le frazioni cumulate delle unità osservate (pi) e del carattere (qi) delinea un quadro della concentrazione dei dati.
Per fare questo confronto utilizzo la curva di Lorenz o curva della concentrazione.
Sull'area delle ascisse misuro le frazioni cumulate delle unità osservate (pi) mentre sull'asse delle ordinate misuro le frazioni cumulate del carattere (qi)
La diagonale dal punto di origine (0;0) al punto (1;1) in alto a destra identifica la retta di equidistribuzione.
Se ci fosse un'equidistribuzione del carattere tutti i punti si collocherebbero su questa retta.
Infine, traccio dei punti nelle coordinate (pi,qi) per i=1,...,n.
Quando unisco questi punti ottengo la curva di concentrazione della variabile statistica.
L'area compresa tra la retta di equidistribuzione e la curva di concentrazione misura la concentrazione della variabile statistica ed è detta area di concentrazione (A).