ESERCIZIO 3
 

La seguente tabella riporta in forma di distribuzione unitaria doppia i dati delle regioni italiane relativamente al Quoziente di nuzialità (matrimoni per 1000 abitanti) e al Quoziente di natalità (nati per 1000 abitanti).

 

 
 
1. Formulare statisticamente la situazione considerata individuando: il collettivo in esame, la sua numerosità, la singola unità statistica, i caratteri considerati e la loro tipologia.
 
 

Soluzione del punto 1:

U: Collettivo formato dalle 20 regioni d'Italia; ogni regione rappresenta la singola unità statistica.

La numerosità del collettivo è n=20.

I caratteri considerati sono: X=Quoziente di nuzialità (matrimoni per 1000 abitanti); Y=Quoziente di natalità (nati per 1000 abitanti). I due caratteri sono di tipo quantitativo continuo.

 

 
2. Si calcoli il baricentro e si disegni il grafico di dispersione relativo alle distribuzioni unitarie dei due caratteri.
 
 

Soluzione del punto 2:

Data la distribuzione unitaria doppia di due caratteri X e Y quantitativi, si definisce baricentro la coppia data dalle medie aritmetiche dei due caratteri.

Per calcolare le due medie aritmetiche utilizziamo quindi le seguenti formule:


Disegniamo ora il grafico di dispersione:

 

 

 
3. Si calcoli la covarianza e si commenti il risultato ottenuto coerentemente con il grafico di dispersione.
 
 

Soluzione del punto 3:

Avendo già i valori delle due medie aritmetiche dal punto 2., per calcolare la covarianza tra X e Y possiamo usare la formula:

A partire dalla distribuzione unitaria doppia, ricordando che n=20, calcoliamo dunque:

Da cui risulta:
Possiamo quindi concludere che i due caratteri sono positivamente correlati: al crescere dell'uno, anche l'altro cresce. Nello specifico all'aumentare del quoziente di nuzialità, aumenta anche il quoziente di natalità. Scopriremo poi, mediante l'analisi del coefficiente di Bravais-Pearson, in quanta parte tale correlazione è di tipo lineare.

Questo risultato conferma ciò che si vedeva anche dal grafico di dispersione, nel quale infatti prevalgono gli scostamenti concordi (I e III quadrante), che fanno sì che la covarianza risulti positiva.

 

 
 
4. Si calcoli il coefficiente di correlazione lineare di Bravais-Pearson e lo si commenti in relazione alle risposte precedenti.
 
 

Soluzione del punto 4:

Il coefficiente di correlazione lineare di Bravais e Pearson è definito come:

Calcoliamo quindi la deviazione standard dei due caratteri X e Y ricordando i valori delle due medie aritmetiche ottenute al punto 2. e ricordando che n=20.


Da cui seguono: In conclusione risulterà:

Anche questo risultato conferma che i due caratteri sono positivamente correlati.

In particolare si ricordi che il coefficiente di correlazione lineare è un indice relativo che assume valori nell'intervallo [-1,1], assumendo il valore degli estremi nel caso di perfetto legame lineare.

Si osservi dunque che in questo caso il coefficiente di Bravais e Pearson indica che la relazione tra i due caratteri considerati si avvicina molto ad una relazione di tipo lineare.

 

 

 
5. Calcolare la retta di regressione dei minimi quadrati e rappresentarla sul grafico di dispersione.
 
 

Soluzione del punto 5:

Per calcolare la retta di regressione Y*=a*+b*X bisogna ottenere la coppia (a*, b*) data dalle seguenti formule:


Si noti che il coefficiente di regressione b* è risultato positivo, segno che la retta di regressione avrà pendenza positiva.

Si ottiene quindi la retta di regressione Y*=-6,14+2,88X che si può riportare sul grafico di dispersione:

Si osservi che il valore del coefficiente angolare b*=2,88 ci dice che per ogni aumento unitario del quoziente di nuzialità, il modello prevede un aumento del quoziente di natalità di 2,88.

 

 
 
6. Calcolare l'indice di determinazione, commentare il risultato ottenuto in relazione alla retta di regressione disegnata e in termini di varianza totale, spiegata e residua.
 
 

Soluzione del punto 6.