-->

Intelligenza Artificiale

A un certo punto non fu più la biologia a dominare il destino dell'uomo, ma il prodotto del suo cervello: la cultura.
Cosicché: "Le uniche leggi della materia sono quelle che la nostra mente deve architettare e le uniche leggi della mente sono architettate per essa dalla materia".
JAMES CLERK MAXWELL

Test Ipotesi


Un campione rappresenta una popolazione ?

Test delle Ipotesi

Il test delle ipotesi è un metodo statistico che permette di verificare se un campione rappresenta correttamente una popolazione.
È utilizzato in diversi ambiti come la medicina, l’industria e l’economia per prendere decisioni basate sui dati.

Esempio Testare la Durata delle Batterie


Immaginiamo che un’azienda affermi che la durata media delle sue batterie sia di **10 ore**. Vogliamo verificare se questa affermazione è vera analizzando un campione di batterie.
- Domanda: le batterie durano davvero **10 ore in media**, o il produttore sta sovrastimando la durata?
- Metodo: utilizziamo il test delle ipotesi per scoprirlo.

Selezionare il Campione di 30 Batterie

Per ottenere risultati affidabili, dobbiamo scegliere un campione che rappresenti l’intera popolazione di batterie prodotte dall’azienda.

Campionamento casuale semplice


Il campionamento casuale semplice è il metodo più comune e consiste nel selezionare le batterie in modo casuale tra tutte quelle disponibili, senza alcun criterio di preferenza.
Esempio di procedura
1. Mescolare tutte le batterie prodotte in un lotto.
2. Estrarre 30 batterie a caso, senza guardare la loro durata precedente.
3. Registrare la durata di ciascuna batteria fino allo scaricamento completo.
Perché è importante
Se scegliamo le batterie in modo non casuale (es. solo quelle della prima fila), potremmo ottenere un campione non rappresentativo, portando a risultati distorti nel test delle ipotesi.

Formulare le Ipotesi

- Ipotesi nulla (H₀): la durata media delle batterie è **10 ore**.
- Ipotesi alternativa (H₁): la durata media delle batterie è **diversa da 10 ore**.

Stabilire i Criteri di Decisione


- Livello di significatività (α): usiamo 0.05 (5%), cioè accettiamo un rischio del 5% di commettere un errore di primo tipo (rifiutare H₀ quando è vera).
- Scelta del test statistico: utilizziamo il t-test per confrontare la media del campione con il valore atteso di 10 ore.

Cos’è il t-test e Come Funziona


Il t-test è un test statistico utilizzato per confrontare la media di un campione con un valore di riferimento (in questo caso, 10 ore).
- Se la media del campione è molto diversa da 10 ore, allora potremmo concludere che la durata media non è 10 ore.
- Se la media del campione è **simile** a 10 ore, allora non abbiamo prove sufficienti per dire che la durata sia diversa.

Come Calcolare il p-value e Cosa Significa

Il p-value è un numero che ci dice quanto è probabile ottenere i risultati osservati (o più estremi) se l’ipotesi nulla (H₀) fosse vera.
Come interpretare il p-value
- Se p-value < 0.05 → rifiutiamo H₀: la durata media **non è 10 ore.
- Se p-value > 0.05 → non possiamo rifiutare H₀: non ci sono prove sufficienti per dire che la durata sia diversa da 10 ore.
-Un p-value basso significa che è molto improbabile ottenere i dati osservati se H₀ fosse vera → quindi rifiutiamo H₀.
-Un p-value alto significa che i risultati possono essere dovuti al caso → quindi non rifiutiamo H₀.

Formula del p-value nel t-test

Il p-value viene calcolato confrontando la statistica t con la distribuzione t di Student, che descrive la probabilità di ottenere un certo valore di t per un dato numero di osservazioni. Fortunatamente, in Python possiamo calcolarlo automaticamente con la funzione `ttest_1samp()` della libreria `scipy.stats`.

Prendere una Decisione Basata sul p-value


Ora che abbiamo calcolato il p-value, possiamo decidere:
- Se p-value < 0.05 → rifiutiamo H₀ e concludiamo che la durata media delle batterie è diversa da 10 ore.
- Se p-value > 0.05 → non possiamo rifiutare H₀ e concludiamo che non ci sono prove sufficienti per dire che la durata sia diversa da 10 ore.

Errori nel Test delle Ipotesi


Errore di Primo Tipo (Falso Positivo)

Rifiutiamo H₀ quando in realtà è vera.
Esempio: concludere che la durata media è diversa da 10 ore quando in realtà è esattamente 10 ore.

Errore di Secondo Tipo (Falso Negativo)
:
Non rifiutiamo H₀ quando in realtà è falsa.
Esempio: non rilevare una differenza nella durata quando in realtà esiste.