ESERCIZIO 2
 

In un supermercato, durante l'arco di un quadrimestre, sono stati monitorati gli acquisti dei pacchi di acqua frizzante (F) e naturale (N) mediante l'utilizzo di 60 carte fedeltà.
Di seguito è riportata la tabella a doppia entrata costruita con i dati ottenuti.

 
 
1. Formulare statisticamente la situazione considerata individuando: il collettivo in esame, la sua numerosità, la singola unità statistica, i caratteri considerati e la loro tipologia.
 
 

Soluzione del punto 1:

U: Collettivo composto dalle 60 carte fedeltà monitorate; ogni carta fedeltà rappresenta la singola unità statistica.

La numerosità del collettivo è n=60.

I caratteri considerati sono: F=Numero di pacchi d'acqua frizzante acquistati con una particolare carta fedeltà; N=Numero di pacchi d'acqua naturale acquistati con una particolare carta fedeltà.
I due caratteri sono di tipo quantitativo discreto e come si può notare sono stati suddivisi in classi disgiunte e della stessa ampiezza.

 

 
2. Si dica se i due caratteri considerati sono statisticamente indipendenti. Per farlo si calcolino le loro distribuzioni relative condizionate.
 
 

Soluzione del punto 2:

Il carattere F si dice statisticamente indipendente da N se, qualunque sia la modalità con cui si manifesta il carattere N, la distribuzione relativa condizionata di F rimane sempre la stessa, cioè i profili colonna della tabella a doppia entrata sono tutti uguali fra loro. Calcoliamo dunque i profili colonna della tabella a doppia entrata:

I profili colonna risultano essere tutti uguali fra loro. Si può dunque affermare che i due caratteri considerati sono statisticamente indipendenti.

Si osservi inoltre che un'ulteriore conferma viene data dal calcolo delle frequenze teoriche di indipendenza, definite da che nel caso di indipendenza statistica devono coincidere con quelle empiriche .
Per esempio si ha infatti: e lo stesso si può facilmente verificare per tutte le rimanenti frequenze teoriche di indipendenza.

 

 

 
3. Si calcoli il baricentro delle due distribuzioni.
 
 

Soluzione del punto 3:

Si definisce baricentro la coppia data dalle medie aritmetiche dei due caratteri.

Grazie alla tabella a doppia entrata, conosciamo la distribuzione di frequenze dei due caratteri (distribuzioni marginali della tabella a doppia entrata). Inoltre, considerando che i due caratteri sono stati suddivisi in classi del tipo , sarà necessario approssimare le medie aritmetiche utilizzando il valore centrale di ogni classe, dato da

Per calcolare le due medie aritmetiche utilizziamo quindi le seguenti formule:


Il baricentro risulta quindi uguale a (18,33;18).

 

 
 
4. Si calcoli la covarianza e si commenti il risultato ottenuto.
 
 

Soluzione del punto 4:

Avendo già i valori delle due medie aritmetiche dal punto 3., per calcolare la covarianza tra F e N possiamo usare la formula:

A partire dalla tabella a doppia entrata calcoliamo dunque:

Da cui risulta:

Si osserva che questo risultato è in accordo con la proposizione che dice che se due caratteri sono statisticamente indipendenti allora la loro covarianza è nulla.
Chiaramente il valore 0,06 è dovuto a tutte le approssimazioni compiute fino a questo punto; se avessimo tenuto tutti i risultati sotto forma di frazioni avremmo certamente ottenuto zero, senza necessità di arrotondare.
NB: Si ricordi però che non vale l'implicazione opposta!

 

 

 
5. Si calcoli il coefficiente di correlazione lineare di Bravais-Pearson e lo si commenti in relazione alle risposte precedenti.
 
 

Soluzione del punto 5.

 

 
 
6. Calcolare la retta di regressione dei minimi quadrati e commentare il risultato ottenuto.
 
 

Soluzione del punto 6.

 

 
 
7. Calcolare l'indice di determinazione, commentare il risultato ottenuto in relazione alla retta di regressione e in termini di varianza totale, spiegata e residua.
 
 

Soluzione del punto 7.