-->

Intelligenza Artificiale

A un certo punto non fu più la biologia a dominare il destino dell'uomo, ma il prodotto del suo cervello: la cultura.
Cosicché: "Le uniche leggi della materia sono quelle che la nostra mente deve architettare e le uniche leggi della mente sono architettate per essa dalla materia".
JAMES CLERK MAXWELL

test Chi-quadro


Verificare la differenza tra le frequenze osservate e quelle attese,

Test Chi-quadro

Il test Chi-quadro (χ²) è un test statistico che viene utilizzato per confrontare le frequenze osservate in un campione con le frequenze attese secondo una distribuzione teorica o un'ipotesi predefinita.
È particolarmente utile quando si desidera verificare se i dati seguono una distribuzione specifica o se ci sono differenze significative tra due o più gruppi.

Fasi del Test delle Ipotesi

Affermare le Ipotesi
Per il test Chi-quadro, vogliamo verificare se la durata media delle batterie è significativamente diversa da 10 ore.
Le ipotesi saranno:
- Ipotesi nulla (\( H_0 \)): la durata delle batterie è uguale a 10 ore. \[ H_0: \mu = 10 \]
- Ipotesi alternativa (\( H_1 \)): la durata delle batterie è **diversa da 10 ore**. \[ H_1: \mu \neq 10 \]
Stabilire i Criteri di Decisione
Il test Chi-quadro viene utilizzato per dati categorici, quindi per applicarlo a un problema numerico (come la durata delle batterie) dobbiamo raggruppare i dati in categorie.
Ad esempio, possiamo suddividere le durate in tre gruppi: "meno di 9 ore", "tra 9 e 11 ore", e "più di 11 ore".
La formula per il calcolo del Chi-quadro è:
\[ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \] Dove:
\( O_i \) è la frequenza osservata per ciascuna categoria.
\( E_i \) è la frequenza attesa per ciascuna categoria, calcolata sotto l'ipotesi nulla.
La somma è calcolata su tutte le categorie.
Eseguire il Test
Immagina di avere un campione di 30 batterie con le seguenti durate (in ore):
\[ [9.5, 10.2, 10.8, 9.7, 10.5, 9.2, 10.1, 10.6, 9.8, 10.3, 9.6, 9.9, 10.4, 10.7, 9.4, 10.0, 9.3, 9.1, 10.9, 10.0, 9.8, 10.1, 10.5, 9.9, 10.6, 10.3, 10.2, 9.7, 9.8, 10.4] \] Dividiamo i dati in 3 categorie:
- Meno di 9 ore** (0 batterie)
- Tra 9 e 11 ore (tutti i dati del campione)
- Più di 11 ore (0 batterie)
Le frequenze osservate (O) per ciascuna categoria sono:
- Categoria "Meno di 9 ore": 0
- Categoria "Tra 9 e 11 ore": 30
- Categoria "Più di 11 ore": 0
Le frequenze attese (E) per ciascuna categoria, sotto l'ipotesi nulla, sono:
- Categoria "Meno di 9 ore": 10
- Categoria "Tra 9 e 11 ore": 10
- Categoria "Più di 11 ore": 10
Prendere una Decisione
Calcoliamo il valore del Chi-quadro. Se il valore calcolato di \( \chi^2 \) è maggiore del valore critico dalla tabella Chi-quadro, rifiutiamo l'ipotesi nulla.
La tabella Chi-quadro è uno strumento fondamentale in questo processo.
Essa fornisce i **valori critici** di \( \chi^2 \) per un determinato livello di significatività (ad esempio \( \alpha = 0.05 \)) e per i gradi di libertà del campione.
I **gradi di libertà si calcolano come il numero di categorie meno uno:
\[ df = k - 1 \] Dove \( k \) è il numero di categorie.
Nel nostro esempio, abbiamo 3 categorie, quindi: \[ df = 3 - 1 = 2 \]
Dalla tabella Chi-quadro per 2 gradi di libertà e \( \alpha = 0.05 \), il valore critico di \( \chi^2 \) è 5.99.
Se il valore calcolato di \( \chi^2 \) è maggiore di 5.99, rifiutiamo l'ipotesi nulla, altrimenti la accettiamo.

Cos'è la Tabella Chi-quadro

La tabella Chi-quadro è una tabella che fornisce i valori critici della distribuzione Chi-quadro per diversi gradi di libertà (df) e livelli di significatività (α).
Ogni riga della tabella corrisponde a un determinato grado di libertà, e ogni colonna corrisponde a un livello di significatività diverso.
- I gradi di libertà (df) dipendono dal numero di categorie nel test. Nel nostro caso, se abbiamo 3 categorie, i gradi di libertà saranno 3 - 1 = 2 .
- Il livello di significatività (α) è generalmente impostato a 0.05 o **0.01**, ma può variare a seconda delle esigenze dell'analisi.
La tabella mostra i valori critici che il valore calcolato di \( \chi^2 \) deve raggiungere o superare per rifiutare l'ipotesi nulla.
Se il valore calcolato è maggiore del valore critico, si rifiuta l'ipotesi nulla. Se è inferiore, l'ipotesi nulla non viene rifiutata.

Codice Python per il Test Chi-quadro

Ecco come calcolare il test Chi-quadro in Python, includendo il calcolo del valore di \( \chi^2 \) e il confronto con il valore critico dalla tabella.

import numpy as np
import scipy.stats as stats

# Dati del campione (durata delle batterie in ore)
durate_batterie = [9.5, 10.2, 10.8, 9.7, 10.5, 9.2, 10.1, 10.6, 9.8, 10.3, 
                   9.6, 9.9, 10.4, 10.7, 9.4, 10.0, 9.3, 9.1, 10.9, 10.0, 
                   9.8, 10.1, 10.5, 9.9, 10.6, 10.3, 10.2, 9.7, 9.8, 10.4]

# Categorie: meno di 9 ore, tra 9 e 11 ore, più di 11 ore
categorie = ['<9 ore', '9-11 ore', '>11 ore']

# Frequenze osservate
observed = [0, 30, 0]  # nessuna batteria <9 ore o >11 ore, tutte tra 9-11 ore

# Frequenze attese (tutte le categorie dovrebbero avere 10 batterie)
expected = [10, 10, 10]

# Calcolo del test Chi-quadro
chi_squared, p_value = stats.chisquare(observed, expected)

# Stampiamo i risultati
print(f"Valore Chi-quadro: {chi_squared:.4f}, p-value: {p_value:.4f}")

# Livello di significatività
alpha = 0.05
if p_value < alpha:
    print("Rifiutiamo l'ipotesi nulla: la durata delle batterie è significativamente diversa da 10 ore.")
else:
    print("Non possiamo rifiutare l'ipotesi nulla: non ci sono prove sufficienti per dire che la durata delle batterie è diversa da 10 ore.")

Conclusione


✔️ Il test Chi-quadro è un utile strumento statistico per verificare la differenza tra le frequenze osservate e quelle attese, soprattutto in contesti categorici.
✔️ Nel nostro esempio, abbiamo utilizzato il test per confrontare la durata delle batterie rispetto a un valore atteso di 10 ore, raggruppando i dati in categorie.
✔️ La tabella Chi-quadro è fondamentale per determinare il valore critico di \( \chi^2 \) e prendere decisioni informate sul rifiuto o l'accettazione dell'ipotesi nulla.