Il livello di significatività
Il livello di significatività è una soglia che viene scelta in statistica per determinare quanto sia improbabile un risultato osservato prima di rifiutare l'ipotesi nulla. E' indicato con \( \alpha \).
Rappresenta la probabilità di commettere un errore di tipo I, ovvero la probabilità di rifiutare l'ipotesi nulla quando in realtà è vera.
In altre parole, il livello di significatività è una misura che stabilisce il criterio di decisione per accettare o rifiutare un’ipotesi in base alla probabilità di errore che si è disposti a tollerare.
Cos'è un errore di tipo I? Un errore di tipo I si verifica in statistica inferenziale quando rifiuto l'ipotesi nulla (H0) che in realtà è vera. In altre parole, è un falso positivo. Concludo che c'è un effetto o una relazione di dipendenza tra due o più variabili quando, in realtà, non c'è.
Cosa significa in pratica?
Quando conduco un test statistico (come il test del chi-quadro), sto verificando se le osservazioni sono coerenti con l'ipotesi nulla.
Ad esempio, un'ipotesi nulla (H0) potrebbe essere che due variabili statistiche $ X $ e $ Y $ siano indipendenti, ovvero la variazione dell'una non influenza quella dell'altra.
In questo caso il livello di significatività stabilisce il criterio oltre il quale considero che il risultato osservato non è dovuto al caso, ma indica effettivamente una differenza reale o una relazione di dipendenza tra le due variabili.
Quale livello di significatività scegliere?
Un livello di significatività comune è \( \alpha = 0,05 \), che significa che c'è un 5% di probabilità di commettere un errore di tipo I.
In altre parole, accetto il rischio che il risultato sia dovuto al caso 1 volta su 20.
Altri valori comunemente usati sono \( \alpha = 0,01 \) (1%) e \( \alpha = 0,10 \) (10%), a seconda della situazione e del rigore richiesto.
Come si utilizza il livello di significatività?
Nel calcolo del test di indipendenza statistica come il chi-quadro \( \chi^2 \) il livello di significatività, insieme ai gradi di libertà, mi permette di calcolare il valore critico con cui confrontare il chi-quadro.
- Se il valore del test supera il valore critico, rifiuto l'ipotesi nulla. Significa che il risultato è statisticamente significativo e che è improbabile che le osservazioni siano dovute al caso.
- Se il valore del test non supera il valore critico, non ci sono prove sufficienti per rifiutare l'ipotesi nulla e concludo che il risultato non è statisticamente significativo. Le variabili sono probabilmente indipendenti.
Esempio. Utilizzo il test del chi-quadro per verificare se c'è un’associazione tra due variabili e scelgo un livello di significatività \( \alpha = 0,05 \) e la tabella a doppia entrata ha 2 gradi di libertà. Consultando la tabella della distribuzione del chi-quadro il valore critico è 5,99. Se il valore del \( \chi^2 \) che ho calcolato è maggiore di 5,99, rifiuto l'ipotesi nulla e concludo che c'è una dipendenza tra le variabili. Viceversa, se è minore o uguale a 5,99, accetto l'ipotesi nulla e concludo che non ci sono prove sufficienti per stabilire una relazione di dipendenza tra le variabili.
E così via.