-->

Intelligenza Artificiale

A un certo punto non fu più la biologia a dominare il destino dell'uomo, ma il prodotto del suo cervello: la cultura.
Cosicché: "Le uniche leggi della materia sono quelle che la nostra mente deve architettare e le uniche leggi della mente sono architettate per essa dalla materia".
JAMES CLERK MAXWELL

P-Value


Più è basso, maggiore è l'evidenza contro l'ipotesi nulla.

Test d'Ipotesi e p-value

Come Verificare se un Campione Fornisce Informazioni sulla Popolazione
Il test d’ipotesi è una tecnica statistica utilizzata per verificare se un campione è coerente con una certa ipotesi sulla popolazione da cui proviene.
Un concetto chiave in questo processo è il p-value, che ci aiuta a decidere se accettare o rifiutare l'ipotesi nulla (H₀).
In questo articolo, spiegheremo il p-value in modo semplice, vedremo un esempio matematico e forniremo il codice Python per calcolarlo.

Cos’è il p-value

Il p-value è la probabilità di ottenere un risultato uguale o più estremo rispetto a quello osservato, se l'ipotesi nulla fosse vera.
- Se p-value è piccolo (< 0.05), significa che il risultato osservato è molto improbabile se H₀ fosse vera → Rifiutiamo H₀.
- Se p-value è grande (> 0.05), il risultato è compatibile con H₀ → Non possiamo rifiutare H₀.

Esempio pratico
Immagina di avere una moneta e vuoi verificare se è truccata.
Se lanci la moneta 10 volte e ottieni 9 teste e 1 croce, il p-value ti dice quanto è probabile ottenere un risultato così sbilanciato se la moneta fosse equa.

Il Test d’Ipotesi con un Esempio di Batterie

Supponiamo di testare 30 batterie per verificare se la loro durata media è diversa da 10 ore.
-Ipotesi nulla (H₀): la durata media è 10 ore.
-Ipotesi alternativa (H₁): la durata media è diversa da 10 ore.
Utilizzeremo un t-test per confrontare la media del campione con la media attesa.

Esempio Matematico del Calcolo del p-value

Il p-value viene calcolato confrontando la statistica t con la distribuzione t di Student.

Passaggi per il calcolo matematico


Calcoliamo la statistica t

\[ t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}} \]
Dove:
\( \bar{x} \) = Media del campione
\( \mu_0 \) = Media ipotizzata sotto H₀ (10 ore)
\( s \) = Deviazione standard del campione
\( n \) = Numero di osservazioni
Esempio numerico

- Supponiamo che il nostro campione di 30 batterie abbia una media \( \bar{x} = 10.3 \) ore e una deviazione standard \( s = 0.5 \) ore.
- Calcoliamo t :
\[ t = \frac{10.3 - 10}{\frac{0.5}{\sqrt{30}}} = \frac{0.3}{\frac{0.5}{5.477}} = \frac{0.3}{0.0913} = 3.29 \]
Troviamo il p-value dalla distribuzione t di Student
Ora dobbiamo calcolare la probabilità di ottenere un valore di t ≥ 3.29 (o minore di -3.29, perché il test è bilaterale).
Dal t-table (con 29 gradi di libertà), otteniamo:
\[ p = 2 \times P(t > 3.29) \approx 2 \times 0.0015 = 0.003 \]
Interpretazione:
Il p-value è 0.003, molto inferiore a 0.05 → Il risultato è molto improbabile se H₀ fosse vera.
Conclusione: Rifiutiamo H₀ → La durata media è significativamente diversa da 10 ore.

t-table
Tabella t di Student è una tabella statistica che mostra i valori critici della distribuzione t di Student per diversi gradi di libertà (df, degrees of freedom) e livelli di significatività.

Codice Python per Calcolare il p-value


Ora vediamo come calcolare il p-value in Python con il t-test.

import numpy as np
import scipy.stats as stats

# Simuliamo un campione di 30 batterie con una durata media di 10.3 ore
np.random.seed(42)  # Per riproducibilità
campione = np.random.normal(loc=10.3, scale=0.5, size=30)  # Media=10.3, Deviazione Std=0.5

# Media ipotizzata sotto H0 (10 ore)
mu_0 = 10  

# Calcoliamo la statistica t e il p-value
t_stat, p_value = stats.ttest_1samp(campione, mu_0)

# Stampiamo i risultati
print(f"Statistiche del Test: t = {t_stat:.4f}, p-value = {p_value:.4f}")

# Interpretazione del risultato
alpha = 0.05  # Livello di significatività

if p_value < alpha:
    print("Rifiutiamo l'ipotesi nulla: la durata media delle batterie è significativamente diversa da 10 ore.")
else:
    print("Non possiamo rifiutare l'ipotesi nulla: non ci sono prove sufficienti per dire che la durata media è diversa da 10 ore.")

Conclusione

✔️ Il p-value misura quanto è raro il nostro risultato se l’ipotesi nulla fosse vera.

✔️ Se p-value < 0.05, rifiutiamo H₀ → La durata media delle batterie è significativamente diversa da 10 ore.

✔️ Se p-value > 0.05, non possiamo rifiutare H₀ → Non abbiamo abbastanza prove per dire che la durata sia diversa.

Prova il codice su Google Colab e verifica i tuoi dati con un test statistico!