Deviazione Standard
Varianza, Deviazione Standard
Varianza
La varianza è una misura che indica quanto i valori di un insieme di dati siano sparsi rispetto alla loro media.In altre parole, più alta è la varianza, maggiore è la dispersione dei dati.
Formula della Varianza
La formula per calcolare la varianza di un campione di dati è la seguente:\[ Var(X) = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2 \]
Dove:
\( N \) è il numero totale di dati.
\( x_i \) è il valore del dato.
\( \mu \) è la media del dataset.
Esempio di Calcolo della Varianza
Immaginiamo di avere il seguente dataset: [3, 7, 8, 5, 9].
1. Calcola la media:
\[ \mu = \frac{3 + 7 + 8 + 5 + 9}{5} = \frac{32}{5} = 6.4 \]
2. Calcola la somma dei quadrati delle differenze dalla media:
\[ (3 - 6.4)^2 = 11.56, \quad (7 - 6.4)^2 = 0.36, \quad (8 - 6.4)^2 = 2.56 \] \[ (5 - 6.4)^2 = 1.96, \quad (9 - 6.4)^2 = 6.76 \]
3. Somma i quadrati:
\[ 11.56 + 0.36 + 2.56 + 1.96 + 6.76 = 23.2 \]
4. Dividi per il numero totale di dati (poiché è un campione, divideremo per \( N \), non \( N-1 \)):
\[ Var(X) = \frac{23.2}{5} = 4.64 \]
Calcolo della Varianza in Python
import numpy as np
# Dati
data = [3, 7, 8, 5, 9]
# Calcolare la varianza
variance = np.var(data)
print(f"Varianza: {variance}")
Deviazione Standard
La deviazione standard è la radice quadrata della varianza.
Essa fornisce una misura di dispersione dei dati che ha le stesse unità di misura dei dati stessi, a differenza della varianza che ha unità elevate al quadrato.
Formula della Deviazione Standard
La formula per calcolare la deviazione standard di un campione di dati è:\[ \text{Deviazione Standard} = \sqrt{Var(X)} \]
Esempio di Calcolo della Deviazione Standard
Dal calcolo precedente, sappiamo che la varianza è \( 4.64 \). La deviazione standard sarà:\[ \text{Deviazione Standard} = \sqrt{4.64} \approx 2.15 \]
Calcolo della Deviazione Standard in Python
# Calcolare la deviazione standard
std_dev = np.std(data)
print(f"Deviazione Standard: {std_dev}")
Coefficiente di Variazione
Il coefficiente di variazione è una misura relativa della dispersione di un dataset, calcolata come il rapporto tra la deviazione standard e la media, espressa come percentuale.
Il coefficiente di variazione è utile quando si vuole confrontare la dispersione di due o più dataset con medie molto diverse.
Formula del Coefficiente di Variazione
La formula del coefficiente di variazione è:
\[ CV = \frac{\text{Deviazione Standard}}{\mu} \times 100 \]
Esempio di Calcolo del Coefficiente di Variazione
Utilizzando la deviazione standard di \( 2.15 \) e la media di \( 6.4 \):\[ CV = \frac{2.15}{6.4} \times 100 \approx 33.59\% \]
Calcolo del Coefficiente di Variazione in Python
# Calcolare il coefficiente di variazione
cv = (std_dev / np.mean(data)) * 100
print(f"Coefficiente di Variazione: {cv}%")
Conclusioni
La varianza, la deviazione standard e il coefficiente di variazione sono concetti fondamentali in statistica, utilizzati per analizzare la dispersione dei dati.
La varianza ci dà una misura della dispersione al quadrato, la deviazione standard fornisce un'indicazione più pratica (con le stesse unità dei dati) e il coefficiente di variazione è utile per confrontare la dispersione tra diversi dataset.