La normalizzazione statistica

In statistica la normalizzazione è la trasformazione di una variabile tramite la relazione $$ z_i = \frac{x_i - \mu}{ \sigma } $$ per renderla confrontabile con altre variabili.

Dove xi è il valore della distribuzione X che devo normalizzare, μ è la media di X , σ è lo scarto quadratico medio di X.

La normalizzazione si basa sul processo di standardizzazione di una variabile aleatoria X o di una distribuzione di valori.

I valori x della distribuzione sono trasformati in valori z, detti punti zeta.

In questo modo ottengo una distribuzione Z detta distribuzione normale standardizzata che ha le seguenti caratteristiche

  • la media aritmetica di Z è uguale a zero
  • la varianza di Z è uguale a uno

Per il resto la distribuzione Z conserva lo stesso andamento della distribuzione di origine X.

A cosa serve la normalizzazione? La normalizzazione delle variabili mi permette di confrontare tra loro due distribuzioni diverse. Inoltre, ha il vantaggio di ridurre gli errori sistematici di rilevazione durante un esperimento.

    Un esempio pratico

    Considero questa distribuzione di valori composta da n=5 elementi

    $$ X = \{ 18 \ , \ 22 \ , \ 24 \ , \ 26 \ , \ 30 \} $$

    La media aritmetica dei valori è 24

    $$ \mu_x = \frac{\sum^n_i x_i}{n} =\frac{18+22+24+26+30}{5} = 24 $$

    La varianza dei valori è 4

    $$ \sigma^2 = \frac{1}{n} \cdot \sum (x_i - \mu)^2 $$

    $$ \sigma^2 = \frac{1}{5} \cdot [(18-24)^2 + (22-24)^2 + (24-24)^2 + (26-24)^2 + (30-24)^2 ] $$

    $$ \sigma^2 = \frac{1}{5} \cdot [6^2 + 2^2 + 0^2 + (-2)^2 + (-6)^2 ] $$

    $$ \sigma^2 = \frac{1}{5} \cdot [36 + 4 + 0 + 4 + 36] $$

    $$ \sigma^2 = \frac{1}{5} \cdot 80 $$

    $$ \sigma^2 = 16 $$

    Quindi lo scarto quadratico medio è

    $$ \sigma = \sqrt{16} = 4 $$

    Per normalizzare devo utilizzare la relazione

    $$ z_i = \frac{x_i - \mu}{ \sigma } $$

    Sostituisco la media è μ=24 e lo scarto quadratico medio σ=4

    $$ z_i = \frac{x_i - 24}{ 4 } $$

    A questo punto calcolo i valori zeta della distribuzione X={18, 22, 24, 26, 30}

    $$ z_1 = \frac{x_1 - 24}{ 4 } = \frac{18 - 24}{ 4 } = \frac{-6}{4} = - \frac{3}{2} = - 1,5 $$

    $$ z_2 = \frac{x_2 - 24}{ 4 } = \frac{22 - 24}{ 4 } = \frac{-2}{4} = - \frac{1}{2} = -0,5 $$

    $$ z_3 = \frac{x_3 - 24}{ 4 } = \frac{24 - 24}{ 4 } = 0 $$

    $$ z_4 = \frac{x_4 - 24}{ 4 } = \frac{26 - 24}{ 4 } = \frac{2}{4} = \frac{1}{2} = 0,5 $$

    $$ z_5 = \frac{x_1 - 24}{ 4 } = \frac{30 - 24}{ 4 } = \frac{6}{4} = \frac{3}{2} = 1,5 $$

    In questo modo ottengo la distribuzione normale standardizzata Z

    $$ Z = \{ - 1,5 \ , \ - 0,5 \ , \ 0 \ , \ 0,5 \ , \ 1,5 \} $$

    La distribuzione Z ha le stesse caratteristiche della distribuzione X.

    $$ X = \{ 18 \ , \ 22 \ , \ 24 \ , \ 26 \ , \ 30 \} $$

    Tuttavia, Z ha la media centrata in zero e una varianza pari a uno.

    E così via

     


     

    Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

    FacebookTwitterLinkedinLinkedin
    knowledge base

    Statistica