Il Teorema Centrale del Limite
Il Teorema Centrale del Limite (TCL) afferma che, indipendentemente dalla distribuzione della popolazione, se si prendono campioni casuali di dimensione sufficientemente grande (\( n \geq 30 \)), la distribuzione della media campionaria segue una distribuzione normale con media uguale alla media della popolazione e varianza ridotta.In termini matematici, se \( X \) è una variabile casuale con media \( \mu \) e deviazione standard \( \sigma \), allora la media campionaria \( \bar{X} \) per campioni di grandezza \( n \) segue:
\[ \bar{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right) \]
Esempio Pratico
Supponiamo di avere una popolazione distribuita in modo non normale (ad esempio, una distribuzione uniforme tra 0 e 100). Se estraiamo più campioni di dimensione \( n \) e calcoliamo le medie campionarie, vedremo che queste si distribuiranno in modo approssimativamente normale.
Codice Python
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# Generiamo una popolazione non normale (distribuzione uniforme tra 0 e 100)
popolazione = np.random.uniform(0, 100, 100000)
# Parametri della simulazione
num_campioni = 1000 # Numero di campioni estratti
n = 30 # Dimensione del singolo campione
medie_campionarie = []
# Estrazione dei campioni e calcolo delle medie
for _ in range(num_campioni):
campione = np.random.choice(popolazione, size=n, replace=True)
medie_campionarie.append(np.mean(campione))
# Grafico della distribuzione delle medie campionarie
plt.figure(figsize=(10, 5))
sns.histplot(medie_campionarie, bins=30, kde=True, color="blue", label="Medie Campionarie")
plt.axvline(np.mean(popolazione), color='red', linestyle='--', label="Media della Popolazione")
plt.xlabel("Valore Medio del Campione")
plt.ylabel("Frequenza")
plt.title("Teorema Centrale del Limite: Distribuzione delle Medie Campionarie")
plt.legend()
plt.show()
Conclusione
Sebbene la popolazione abbia una distribuzione non normale, la distribuzione delle medie campionarie si avvicina a una distribuzione normale, come previsto dal Teorema Centrale del Limite.Questo principio è fondamentale in statistica per giustificare l’uso della distribuzione normale in molte applicazioni pratiche.