Intelligenza Artificiale

A un certo punto non fu più la biologia a dominare il destino dell'uomo, ma il prodotto del suo cervello: la cultura.
Cosicché: "Le uniche leggi della materia sono quelle che la nostra mente deve architettare e le uniche leggi della mente sono architettate per essa dalla materia".
JAMES CLERK MAXWELL


Definizione, Formule e Codice

Intervallo di Confidenza (IC)

L'intervallo di confidenza è un intervallo numerico utilizzato per stimare l'intervallo di valori in cui potrebbe trovarsi un parametro di interesse,
con un certo livello di confidenza. In altre parole, è un intervallo di valori che, con una determinata probabilità (generalmente espressa come un livello di confidenza, ad esempio del 95%), contiene il vero valore del parametro.

Un intervallo di confidenza è calcolato utilizzando i dati osservati e le stime puntuali del parametro.
La larghezza dell'intervallo dipende dalla deviazione standard delle stime e dalla distribuzione campionaria del parametro.
Maggiore è il livello di confidenza richiesto, più ampio sarà l'intervallo.

Esempio:

Supponiamo di stimare la media di un campione e calcolare un intervallo di confidenza del 95%. Se l'intervallo risultante è 60-70, significa che siamo ragionevolmente sicuri al 95% che la vera media popolazionale si trovi in quell'intervallo.

Test di Ipotesi:

Il test di ipotesi è una procedura statistica utilizzata per prendere decisioni su affermazioni fatte riguardo a una popolazione basandosi sui dati raccolti da un campione. L'obiettivo è valutare la validità di un'affermazione detta ipotesi.
L'ipotesi iniziale, chiamata ipotesi nulla (\(H_0\)), afferma solitamente l'assenza di effetti o relazioni, mentre l'ipotesi alternativa \(H_1\) o \(H_a\) sostiene l'esistenza di un effetto o una relazione specifica. Il test di ipotesi utilizza dati campionari per decidere se accettare o rifiutare l'ipotesi nulla.

Esempio:

Supponiamo di avere un campione e vogliamo testare se la media del campione è diversa da una certa media popolazionale. La nostra ipotesi nulla (\(H_0\)) potrebbe affermare che le medie sono uguali, mentre l'ipotesi alternativa (\(H_a\)) potrebbe affermare che le medie sono diverse.
Con l'analisi dei dati, il test di ipotesi ci consentirà di decidere se rifiutare o non rifiutare l'ipotesi nulla in base alle evidenze dal campione.

In sintesi, mentre l'intervallo di confidenza fornisce un intervallo stimato per il parametro di interesse, il test di ipotesi è una procedura formale per prendere decisioni riguardo a dichiarazioni specifiche basate sui dati campionari. Entrambi sono strumenti importanti nella statistica inferenziale.


Z-Test:

Il test Z è un test statistico utilizzato quando si conosce la deviazione standard della popolazione.
È spesso utilizzato per testare ipotesi sulla media di una popolazione.

Formula:

\[ Z = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}} \] dove \(\bar{X}\) è la media campionaria, \(\mu\) è la media della popolazione, \(\sigma\) è la deviazione standard della popolazione, e \(n\) è la dimensione del campione.

Esempio

Supponiamo di avere una popolazione con media \(\mu = 50\) e deviazione standard \(\sigma = 10\). Un campione di dimensione \(n = 25\) ha una media campionaria di \(\bar{X} = 52\). Vogliamo testare se la media campionaria è significativamente diversa dalla media della popolazione.

Codice Python:



  ```python
  from scipy.stats import norm

  # Dati
  mu = 50
  sigma = 10
  sample_mean = 52
  sample_size = 25

  # Calcolo del valore Z
  z_score = (sample_mean - mu) / (sigma / (sample_size**0.5))

  # Calcolo del p-value (unilaterale)
  p_value = norm.cdf(z_score)

  print("Z-Score:", z_score)
  print("P-Value:", p_value)
  ```

P-Value:

Il p-value è la probabilità di ottenere un risultato almeno altrettanto estremo di quello osservato, assumendo che l'ipotesi nulla sia vera.
Un p-value basso suggerisce che si possono rifiutare le ipotesi nulle.

Esempio:

Se il p-value è 0.02, significa che c'è una probabilità del 2% di ottenere un risultato così estremo o più estremo del risultato osservato, se l'ipotesi nulla è vera. Il p-value (valore p) è una misura che fornisce la probabilità di ottenere un risultato almeno altrettanto estremo quanto quello osservato, assumendo che l'ipotesi nulla sia vera. In un contesto di test di ipotesi, un p-value basso suggerisce che hai ragioni per respingere l'ipotesi nulla.

codice Python P-value

Ecco un esempio di che esegue un test t e calcola il p-value utilizzando la libreria `scipy.stats`.

```python
import numpy as np
from scipy.stats import ttest_ind

# Genera dati casuali per due gruppi
np.random.seed(42)  # Per riproducibilità
group1 = np.random.normal(0, 1, 100)
group2 = np.random.normal(0.5, 1, 100)

# Esegui il test t
t_statistic, p_value = ttest_ind(group1, group2)

# Stampa il risultato
print(f'T-statistic: {t_statistic:.4f}')
print(f'P-value: {p_value:.4f}')

# Interpretazione del p-value
alpha = 0.05
if p_value < alpha:
    print("Il p-value è inferiore al livello di significatività. Possiamo rifiutare l'ipotesi nulla.")
else:
    print("Il p-value è maggiore del livello di significatività. Non possiamo rifiutare l'ipotesi nulla.")
```
In questo esempio, stiamo generando dati casuali per due gruppi e poi eseguendo un test t indipendente tra i gruppi utilizzando `ttest_ind` di `scipy.stats`.
Il risultato include la statistica t e il p-value. Infine, confrontiamo il p-value con un livello di significatività (comunemente 0.05) per decidere se rifiutare o non rifiutare l'ipotesi nulla.

T-Test:

Il t-test è un test statistico utilizzato quando la deviazione standard della popolazione è sconosciuta e deve essere stimata dal campione. Ci sono varianti del t-test, tra cui il t-test per campioni indipendenti e il t-test per campioni appaiati.
-h4 Formula (T-Test per campioni indipendenti): \[ t = \frac{\bar{X_1} - \bar{X_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \] dove \(\bar{X_1}\) e \(\bar{X_2}\) sono le medie campionarie, \(s_1\) e \(s_2\) sono le deviazioni standard campionarie, \(n_1\) e \(n_2\) sono le dimensioni dei campioni. -

Esempio

Supponiamo di avere due campioni e vogliamo testare se le loro medie sono significativamente diverse.
-

Codice Python (T-Test per campioni indipendenti):



  ```python
  from scipy.stats import ttest_ind

  # Dati
  sample1 = [23, 25, 28, 32, 35]
  sample2 = [18, 20, 25, 28, 30]

  # Calcolo del t-test
  t_stat, p_value = ttest_ind(sample1, sample2)

  print("T-Statistic:", t_stat)
  print("P-Value:", p_value)
  ```

In pratica, si utilizzano il test Z e il p-value quando la deviazione standard della popolazione è nota, mentre si utilizza il t-test quando la deviazione standard è sconosciuta e deve essere stimata dal campione. Il p-value fornisce una misura di quanto i dati siano incompatibili con l'ipotesi nulla. Se il p-value è inferiore a una soglia prefissata (spesso 0.05), si può rifiutare l'ipotesi nulla.

  • Il Z-Test si basa sulla distribuzione normale standard (Z).
  • Il p-value può essere associato sia alla distribuzione normale standard (Z) che alla distribuzione t, a seconda del contesto.
  • Il T-Test si basa sulla distribuzione t (t-distribuzione).