9. Metodo di interpolazione dei minimi quadrati |
|
|
|
|
Il metodo di interpolazione dei minimi quadrati, che permette di individuare la retta di regressione, consiste nel minimizzare la somma dei quadrati delle differenze tra il valore osservato e il valore teorico : |
|
 |
(19) |
|
Ricordando che la distanza euclidea tra due generici punti e è definita , la distanza euclidea
tra un valore osservato e il corrispondente punto sulla retta è data da  |
|
Minimizzando la funzione si individueranno i due
parametri e della retta di regressione, la quale minimizza la somma
dei quadrati delle distranze euclidee tra i punti della nuvola dei punti
osservati, data dal grafico di dispersione, e i corrispondenti punti della retta
. Più precisamente si dà la seguente |
|
Definizione 41. Si chiama retta di regressione la retta di equazione
, dove la coppia minimizza in la funzione di due
variabili definita da (19). |
|
Il problema della determinazione della retta di regressione è risolto dalla
seguente |
|
|
Proposizione 42. I valori che minimizzano sono dati da |
|
|
 |
(20) |
|
dove , e è detto coefficiente di regressione.
La retta di regressione che meglio si adatta ai dati osservati è dunque data
da Sostituendo le espressioni trovate si ottiene |
|
 |
(21) |
|
Dimostrazione.  |
|
|
Osservazione 6. 1. Il coefficiente di regressione, così come , è un indice
che misura la dipendenza lineare tra due caratteri, con la differenza che è un indice asimmetrico, cioè assume un valore diverso se si scambia
il ruolo assunto dai due caratteri.
2. Il coefficiente di regressione varia in e ha come unità di
misura il rapporto tra le unità di misura di Y e X. Esso indica, a meno
di , di quanto varia Y in corrispondenza di una variazione unitaria di
X.
3. sempre, quindi il segno di è determinato dal segno di .
4. Se X e Y sono statisticamente indipendenti allora =0; tuttavia non
vale il contrario poiché, come si è visto, può annullarsi anche
quando non vale l'indipendenza tra i caratteri. Nel caso =0 la
retta di regressione è parallela all'asse delle ascisse e interseca l'asse
delle ordinate nel punto .
5. Tutti i punti del piano che soddisfano il sistema normale appartengono
alla retta di regressione, quindi anche il baricentro appartiene a
tale retta, come si può facilmente verificare. |
|
In maniera analoga a quanto svolto finora, avendo esaminato la relazione
, si può esaminare la relazione , per la quale
si ottengono risultati analoghi. In particolare, i parametri che si possono
ottenere con il metodo dei minimi quadrati sono |
|
 |
(23) |
|
quindi la retta di regressione che rappresenta X in funzione di Y diventa |
|
|
 |
(24) |
|
Osservazione 7. Se si considera la tabella a doppia entrata di due caratteri
X e Y suddivisi rispettivamente in H e K classi, le formule (20) e (23)
per i coefficienti di regressione diventano |
|
 |
(25) |
|
in cui e sono rispettivamente i valori centrali dell'i-esima classe di X e
della j-esima classe di Y. |
|
|
 |
|
 |
|
 |
 |
|