La derivata di una matrice
La derivata di una matrice rispetto a una variabile scalare o vettoriale si basa sul calcolo della derivata di ciascun elemento della matrice, in modo analogo alla derivata delle funzioni.
Ecco i principali casi con esempi pratici:
Derivata di una matrice rispetto a una variabile scalare
La derivata di una matrice \( A(t) \), i cui elementi dipendono da una variabile scalare \( t \), è una nuova matrice in cui ciascun elemento è ottenuto derivando l'elemento corrispondente di \( A(t) \) rispetto a \( t \).
Un esempio pratico
Considero questa matrice 2x2
$$ \mathbf{A}(t) = \begin{bmatrix} t^2 & \sin(t) \\ e^t & t + 1 \end{bmatrix} $$
Si tratta di una funzione matriciale \( \mathbf{A}(t) \), che dipende da una variabile scalare \( t \).
Voglio calcolare la derivata di \( \mathbf{A}(t) \) rispetto a \( t \). Per farlo, devo derivare ogni elemento della matrice separatamente rispetto a \( t \).
Derivo ogni singolo elemento della matrice.
- \( \frac{d}{dt} \left( t^2 \right) = 2t \)
- \( \frac{d}{dt} \left( \sin(t) \right) = \cos(t) \)
- \( \frac{d}{dt} \left( e^t \right) = e^t \)
- \( \frac{d}{dt} \left( t + 1 \right) = 1 \)
Quindi, la derivata di \( \mathbf{A}(t) \) rispetto a \( t \) è:
$$ \frac{d\mathbf{A}(t)}{dt} = \begin{bmatrix} 2t & \cos(t) \\ e^t & 1 \end{bmatrix} $$
Questo è un esempio di derivata di una matrice i cui elementi dipendono da una variabile scalare \( t \).
Derivata di una matrice rispetto a un vettore
La derivata di una matrice \( A(\mathbf{x}) \), i cui elementi dipendono da un vettore \( \mathbf{x} = [x_1, x_2, \ldots, x_n]^T \), è una nuova matrice (o un tensore) in cui ciascun elemento è dato dalla derivata parziale dell'elemento corrispondente di \( A(\mathbf{x}) \) rispetto a ciascuna componente del vettore \( \mathbf{x} \).
Questo processo genera un tensore che contiene tutte le derivate parziali.
Un esempio pratico
Considero una matrice \( \mathbf{B}(\mathbf{x}) \) che dipende da un vettore \( \mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} \).
$$ \mathbf{B}(\mathbf{x}) = \begin{bmatrix} x_1^2 & x_1 x_2 \\ x_1 + x_2 & x_2^2 \end{bmatrix} $$
Per calcolare la derivata della matrice \( \mathbf{B} \) rispetto al vettore \( \mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} \), devo calcolare le derivate parziali della matrice rispetto a ciascuna componente del vettore \( x_1 \) e \( x_2 \).
Le derivate parziali rispetto a \( x_1 \) sono le seguenti:
- \( \frac{\partial}{\partial x_1} (x_1^2) = 2x_1 \)
- \( \frac{\partial}{\partial x_1} (x_1 x_2) = x_2 \)
- \( \frac{\partial}{\partial x_1} (x_1 + x_2) = 1 \)
- \( \frac{\partial}{\partial x_1} (x_2^2) = 0 \)
Quindi, la matrice delle derivate parziali rispetto a \( x_1 \) è:
$$ \frac{\partial \mathbf{B}}{\partial x_1} = \begin{bmatrix} 2x_1 & x_2 \\ 1 & 0 \end{bmatrix} $$
Le derivate parziali rispetto a \( x_2 \) sono:
- \( \frac{\partial}{\partial x_2} (x_1^2) = 0 \)
- \( \frac{\partial}{\partial x_2} (x_1 x_2) = x_1 \)
- \( \frac{\partial}{\partial x_2} (x_1 + x_2) = 1 \)
- \( \frac{\partial}{\partial x_2} (x_2^2) = 2x_2 \)
Quindi, la matrice delle derivate parziali rispetto a \( x_2 \) è:
$$ \frac{\partial \mathbf{B}}{\partial x_2} = \begin{bmatrix} 0 & x_1 \\ 1 & 2x_2 \end{bmatrix} $$
Metto insieme le derivate parziali e ottengo la matrice Jacobiana, che posso pensare come un array tridimensionale (o tensore).
$$ \mathbf{J}(\mathbf{x}) = \begin{bmatrix} \frac{\partial \mathbf{B}}{\partial x_1}, \frac{\partial \mathbf{B}}{\partial x_2} \end{bmatrix} = \begin{bmatrix} \begin{bmatrix} 2x_1 & x_2 \\ 1 & 0 \end{bmatrix}, \begin{bmatrix} 0 & x_1 \\ 1 & 2x_2 \end{bmatrix} \end{bmatrix} $$
Il risultato finale è la matrice Jacobiana di \( \mathbf{B} \).
In questo caso, poiché \( \mathbf{B} \) ha dimensioni \( 2 \times 2 \) e \( \mathbf{x} \) ha dimensioni \( 2 \times 1 \), la matrice Jacobiana è semplicemente un tensore di dimensioni \( 2 \times 2 \times 2 \).
Esempio 2
Considero una funzione che mappa un vettore \( \mathbf{x} = [x, y]^T \) a una matrice \( A(\mathbf{x}) = \begin{bmatrix} xy & x^2 \\ y^2 & xy \end{bmatrix} \).
Per calcolare la derivata di \( A \) rispetto a \( \mathbf{x} \), calcolo tutte le derivate parziali:
- Derivata rispetto a \( x \): $$ \frac{\partial A}{\partial x} = \begin{bmatrix} y & 2x \\ 0 & y \end{bmatrix} $$
- Derivata rispetto a \( y \): $$ \frac{\partial A}{\partial y} = \begin{bmatrix} x & 0 \\ 2y & x \end{bmatrix} $$
Queste matrici costituiscono la Jacobiana della funzione matriciale rispetto al vettore \( \mathbf{x} \).
$$ \mathbf{J}(\mathbf{x}) = \begin{bmatrix} \frac{\partial A}{\partial x} & \frac{\partial A}{\partial y} \end{bmatrix} = \begin{bmatrix} \begin{bmatrix} y & 2x \\ 0 & y \end{bmatrix} & \begin{bmatrix} x & 0 \\ 2y & x \end{bmatrix} \end{bmatrix} $$
E così via.