Tabelle di frequenza
In statistica, una tabella di frequenza è uno strumento che permette di organizzare e rappresentare in modo chiaro e ordinato i dati raccolti in un'indagine statistica.
Questo tipo di tabella suddivide i dati in classi o categorie e indica quante volte ogni classe o categoria compare nel dataset, ossia la frequenza con cui si verificano i diversi valori.
La tabella di frequenza è composta generalmente da quattro colonne principali:
- Classi di frequenza o categorie
Rappresentano i diversi gruppi o intervalli (modalità) in cui vengono suddivisi i dati.Se, ad esempio, si volessi analizzare l'altezza di un gruppo di persone, le classi potrebbero essere intervalli di altezza come "150-159 cm", "160-169 cm", ecc.
- Frequenza assoluta (F)
Indica il numero di osservazioni dette "occorrenze" che rientrano in ciascuna classe o categoria.Continuando con l'esempio dell'altezza, la frequenza assoluta per la classe "150-159 cm" potrebbe essere, ad esempio, 12, il che significa che 12 persone hanno un'altezza compresa tra 150 e 159 cm.
- Frequenza relativa (f)
È il rapporto tra la frequenza assoluta di una classe e il numero totale di osservazioni. La somma di tutte le frequenze relative di una tabella è uguale a 1. $$ f = \frac{F}{T} $$ Dove T è il numero totale delle unità statistiche mentre F è la frequenza assoluta di una modalità. Questo valore è spesso espresso come percentuale. $$ f = \frac{F}{T} \cdot 100 $$ In questo caso, la somma di tutte le frequenze relative espresse in percentuale è uguale a 100%.
Se il totale delle persone osservate fosse 100, e 12 persone rientrano nella classe "150-159 cm", la frequenza relativa sarebbe 12%. $$ f = \frac{F}{T} \cdot 100 $$ In questo caso F=12 e T=100. $$ f = \frac{12}{100} \cdot 100 = 0.12 \cdot 100 = 12% $$
- Frequenza cumulata
La frequenza cumulata è la somma delle frequenze assolute e/o relative fino a una certa classe o categoria. Rappresenta il numero totale di osservazioni che rientrano in quella classe e in tutte le classi precedenti. Viene utilizzata per capire quanti dati sono inclusi fino a un determinato punto della distribuzione.
Le tabelle di frequenza sono molto utili per analizzare rapidamente le distribuzioni dei dati e sono spesso utilizzate come base per rappresentazioni grafiche come istogrammi o diagrammi a barre.
Permettono inoltre di individuare facilmente la moda (il valore che compare più frequentemente) e di avere un'idea immediata della distribuzione dei dati all'interno del campione.
Esempio pratico
Ho raccolto i dati sull'altezza di 30 studenti, con i seguenti risultati:
- 150-159 cm: 3 studenti
- 160-169 cm: 8 studenti
- 170-179 cm: 15 studenti
- 180-189 cm: 4 studenti
La tabella di frequenza potrebbe apparire così:
Altezza (cm) | Frequenza Assoluta | Frequenza Relativa (%) | Frequenza Cumulata | Frequenza Cumulata (%) |
---|---|---|---|---|
150-159 | 3 | 10% | 3 | 10% |
160-169 | 8 | 26.7% | 11 | 36.7% |
170-179 | 15 | 50% | 26 | 86.7% |
180-189 | 4 | 13.3% | 30 | 100% |
Totale | 30 | 100% |
L'insieme delle coppie formate dalla modalità (prima colonna) e dalla frequenza assoluta corrispondente (seconda colonna) viene detta distribuzione di frequenza.
Ad esempio (150-159,3), (160-169,8), (170-179,15), (180-189,4)
La terza colonna indica la frequenza cumulata assoluta.
Ad esempio, nella riga della modalità 170-179 cm la frequenza cumulata è 26 perché la somma delle frequenze assolute fino a questa modalità è $$ 3+8+15=26 $$
La quarta colonna indica la frequenza cumulata relativa. In questo caso vengono sommate le frequenze relative.
Ad esempio, nella riga della modalità 170-179 cm la frequenza cumulata relativa è 86.7% perché la somma delle frequenze relative fino a questa modalità è $$ 10 \% +26.7 \% +50 \% =86.7 \% $$
In conclusione, le tabelle di frequenza rappresentano un passaggio cruciale nell'analisi statistica, consentendo di trasformare un insieme di dati grezzi in una forma più interpretabile e visivamente chiara.