ESERCIZIO 1
 

Una casa di produzione di telefilm decide di fare un'indagine per capire meglio i gusti del suo pubblico. Viene chiesto a 20 persone di esprimere un giudizio di gradimento con un numero compreso tra 1 e 4 (1=Per niente, 2=Poco, 3=Abbastanza, 4=Molto) relativamente a due telefilm: il primo d'azione, il secondo romantico.

 
1. Formulare statisticamente la situazione considerata individuando: il collettivo in esame, la sua numerosità, la singola unità statistica, i caratteri considerati, la loro tipologia e le loro modalità.
 

Soluzione del punto 1:

U: Collettivo di persone a cui è stato chiesto di esprimere un giudizio di gradimento relativamente a due telefilm; ogni persona rappresenta la singola unità statistica.

La numerosità del collettivo è n=20.

I caratteri considerati sono: X=Giudizio di gradimento del telefilm d'azione; Y=Giudizio di gradimento del telefilm romantico. I due caratteri sono di tipo qualitativo ordinato; utilizzando però la numerazione da 1 a 4 possono essere considerati come caratteri quantitativi discreti.

X e Y hanno entrambi modalità 1=Per niente, 2=Poco, 3=Abbastanza, 4=Molto.

 

 
2. La seguente tabella riporta i dati ottenuti in forma di distribuzione unitaria doppia dei due caratteri. Organizzare tali dati in una tabella a doppia entrata.
 
 
 
 

Soluzione del punto 2:

La tabella a doppia entrata che si ottiene è la seguente:

 

 

 
3. Si dica se i due caratteri considerati sono statisticamente indipendenti. Per farlo si calcolino le loro distribuzioni relative condizionate.
 
 

Soluzione del punto 3:

Il carattere X si dice statisticamente indipendente da Y se, qualunque sia la modalità con cui si manifesta il carattere Y, la distribuzione relativa condizionata di X rimane sempre la stessa, cioè i profili colonna della tabella a doppia entrata sono tutti uguali fra loro. Calcoliamo dunque i profili colonna della tabella a doppia entrata:

Evidentemente i profili colonna non sono tutti uguali fra loro. Si può dunque affermare che i due caratteri considerati non sono statisticamente indipendenti.

Si osservi inoltre che un'ulteriore conferma viene data dal calcolo delle frequenze teoriche di indipendenza, definite da che nel caso di indipendenza statistica devono coincidere con quelle empiriche . Per esempio si ha infatti:

 

 
 
4. Si calcoli il baricentro e si disegni il grafico di dispersione relativo alle distribuzioni unitarie dei due caratteri.
 
 

Soluzione del punto 4:

Data la distribuzione unitaria doppia di due caratteri X e Y quantitativi, si definisce baricentro la coppia data dalle medie aritmetiche dei due caratteri.

Grazie alla tabella a doppia entrata costruita al punto 2., conosciamo la distribuzione di frequenze dei due caratteri (distribuzioni marginali della tabella a doppia entrata). Per calcolare le due medie aritmetiche utilizziamo quindi le seguenti formule:


Disegniamo ora il grafico di dispersione:

 

 

 
5. Si calcoli la covarianza e si commenti il risultato ottenuto coerentemente con il grafico di dispersione.
 
 

Soluzione del punto 5.

 

 
 
6. Si calcoli il coefficiente di correlazione lineare di Bravais-Pearson e lo si commenti in relazione alle risposte precedenti.
 
 

Soluzione del punto 6.

 

 
 
7. Calcolare la retta di regressione dei minimi quadrati e rappresentarla sul grafico di dispersione.
 
 

Soluzione del punto 7.

 

 
 
8. Calcolare l'indice di determinazione, commentare il risultato ottenuto in relazione alla retta di regressione disegnata e in termini di varianza totale, spiegata e residua.
 
 

Soluzione del punto 8.