Capitolo 7

7. Associazione fra caratteri quantitativi

	Esaminiamo ora in dettaglio l'associazione fra due caratteri quantitativi. Introduciamo alcune nozioni preliminari.
	Definizione 32. Data la distribuzione unitaria doppia di due caratteri X e Y quantitativi, si definisce baricentro la coppia data dalle medie aritmetiche dei due caratteri.
	Definizione 33. A partire dalla distribuzione unitaria doppia di due caratteri quantitativi X e Y osservati su un collettivo di n unità, si definisce grafico di dispersione l'insieme delle coppie di modalità dei due caratteri osservate per ogni unità del collettivo. Tali coppie possono essere rappresentate come punti di un piano cartesiano i cui assi corrispondono ai due caratteri e in cui l'origine viene poi traslata in corrispondenza del baricentro.
	A partire dal grafico di dispersione si parla di concordanza se la maggior parte degli scostamenti dalla media è concorde, cioè se la maggior parte dei punti del grafico di dispersione appartiene al I e III quadrante. Al contrario, si parla di discordanza se la maggior parte degli scostamenti è discorde.
	Esempio 34.
	Il grafico di dispersione è di per sé molto utile per evidenziare se prevale la concordanza o la discordanza fra due caratteri. E' possibile tuttavia introdurre un indice che permette di effettuare la stessa analisi con un semplice calcolo, senza dover ricorrere al grafico di dispersione. Si tratta della covarianza.
	Definizione 35. A partire dalla distribuzione unitaria doppia, la covarianza tra due caratteri quantitativi è definita come la media dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie:
		(11)
	Il prodotto è detto codevianza.
	Si può dimostrare facilmente la seguente
	Proposizione 36. La covarianza verifica le seguenti proprietà.
	1.	(12)
	2. Se due caratteri sono statisticamente indipendenti allora la loro covarianza è nulla. 3. Indicando con e le deviazioni standard di X e Y si ha
		(13)
	Inoltre se e solo se esiste un legame perfetto di tipo lineare tra X e Y, ossia tali che Y=a+bX.
	Dimostrazione.
	Per la proprietà 2 della Proposizione 36 non vale il viceversa. Si possono infatti fornire semplici controesempi.
	Esempio 37.
	Un difetto della covarianza è quello di dipendere dall'unità di misura delle osservazioni cosicché non è corretto confrontare il valore della covarianza calcolato su diverse distribuzioni doppie. Per ovviare tale problema è necessario introdurre un indice relativo.
	Definizione 38. Si definisce coefficiente di correlazione lineare di Bravais e Pearson l'indice, atto a misurare l'interdipendenza lineare tra due caratteri, dato da:
		(16)
	Dalla Proposizione 36 segue immediatamente il seguente
	Corollario 39. Il coefficiente di correlazione lineare gode delle seguenti proprietà: 1. 2. oppure se e solo se tra i due caratteri sussiste un perfetto legame lineare del tipo Y=a+bX. In particolare, per b<0 si ha e per b>0 si ha . 3. se e solo se , il che può essere dovuto all'indipendenza dei due caratteri oppure a qualche relazione di tipo non lineare (in quest'ultimo caso i due caratteri vengono detti incorrelati). 4. Dati e due caratteri quantitativi X e Y, si costruiscono le trasformazioni lineari e . Per il coefficiente di correlazione tra X' e Y' si ha se i coefficienti b e d hanno stesso segno; in caso contrario. In particolare, se come trasformazione lineare consideriamo proprio la standardizzazione dei caratteri: e si ha quindi che .