Il teorema di Bayes
Il teorema di Bayes mi permette di calcolare la probabilità di un determinato evento A considerando le informazioni disponibili sull'evento B. $$ p(A|B) = \frac{ p(A) \cdot p(B|A) }{ p(B) } $$
- p(A|B) e p(B|A) sono probabilità condizionate (a posteriori)
- p(A) e p(B) sono probabilità semplici (a priori)
Come funziona la probabilità condizionata? La probabilità condizionata p(A|B) è la probabilità che l'evento A si verifichi, dopo che si è verificato l'evento B.
Un esempio pratico
Una popolazione è composta dal 40% di maschi e dal 60% di femmine.
I maschi indossano solo pantaloni mentre le femmine indossano al 50% pantaloni e al 50% gonne.
Un osservatore nota da lontano una persona con i pantaloni.
Qual è la probabilità che sia femmina?
La probabilità semplice (a priori) che sia femmina ( evento A ) è del 60%
$$ p(A) = 0.6 $$
Nota. Il motivo è semplice. La popolazione è composta per il 60% da femmine. E' una stima veritiera ma troppo approssimativa per rispondere correttamente alla domanda.
La probabilità semplice (a priori) che una persona porti i pantaloni ( evento B ) è del 70%
$$ p(B) = 0.7 $$
Nota. Tutti gli uomini portano i pantaloni (40% della popolazione) a cui si aggiunge la metà delle donne (30%). Quindi, il 70% di persone portano i pantaloni.
Secondo i dati del problema la probabilità condizionata (o a posteriori) che porti i pantaloni (evento B) una donna (evento A) è del 50%
$$ p(B|A) = 0.5 $$
Nota. La metà della popolazione femminile dell'esempio porta i pantaloni. Quindi, il 50% è riferito alla popolazione femminile. Non alla popolazione complessiva.
A questo punto applico il teorema di Bayes per calcolare la probabilità che a portare i pantaloni (evento B) sia una donna (evento A)
$$ p(A|B) = \frac{ p(A) \cdot p(B|A) }{ p(B) } $$
Sostituisco i dati delle probabilità che già conosco e trovo la soluzione del problema.
$$ p(A|B) = \frac{ 0.6 \cdot 0.5 }{ 0.7 } $$
$$ p(A|B) = 0.43 $$
Quindi, c'è una probabilità del 43% che la persona vista da lontano sia una donna.
E' la probabilità condizionata dell'evento A ( donna ) considerando l'informazione disponibile sull'evento B ( pantaloni ).
Nota. Inizialmente la probabilità semplice p(A) che fosse una donna era del 60%. La probabilità condizionata, invece, è scesa al 43% ed è più affidabile perché considera anche l'informazione B.
Si tratta di un semplice esempio di applicazione pratica del teorema di Bayes.
E così via.