Es. 3 del 14/09
 

3.a Per calcolare la distribuzione relativa condizionata di X rispetto alla modalità =6 di Y, osservando che in questo caso j=3, si utilizza la formula
Per ogni riga i-ma della tabella, corrispondente ad una diversa modalità del carattere X, dovremo dividere ogni frequenza cungiunta (per j=3) per il corrispondente totale di colonna (per j=3).

Si otterrà:

 

 

3.b L'indice di determinazione è definito come il quadrato del coefficiente di correlazione lineare. Quest'ultimo è definito come:

Per calcolare la covarianza possiamo utilizzare la formula:

Utilizzando le distribuzioni marginali, calcoliamo dunque le medie aritmetiche necessarie:

Si otterrà:

Calcoliamo quindi le deviazione standard dei due caratteri X e Y.


Da cui seguono:

In conclusione risulterà:

Questo risultato ci comunica che i due caratteri sono positivamente correlati.

L'indice di determinazione varrà dunque

Si ricordi che la varianza totale può essere scritta come somma della varianza spiegata e della varianza residua e che l'indice di determinazione è una misura relativa della riduzione della variabilità di Y, ottenuta proprio rapportando la varianza spiegata su quella totale.

Questo dato ci indica che la retta di regressione che è possibile ottenere sarà in grado di spiegare solamente il 4% della variabilità totale, mentre rimane un 96% della variabilità totale (che corrisponde appunto alla variabilità residua) che il modello di regressione lineare semplice non spiega.