Il Maraschini-Palma - volume 3

10 Elementi di Statistica Anche questa seconda retta di regressione di x su y passa per il baricentro dei dati e il suo coefficiente angolare m si ottiene scambiando tutte le xi con le yi e viceversa: COVAR(X, Y) m = ____________ VAR(Y) Le due rette si intersecano nel punto di coordinate (x¯ ; y¯), cioè nel baricentro dei dati, e sono coincidenti se e solo se i punti che rappresentano i valori reali sono perfettamente allineati. Tenendo conto di questi due diversi coefficienti angolari delle rette di regressione possiamo definire un nuovo indice, che misura la correlazione tra i caratteri X e Y. DEFINIZIONE Si chiama indice di correlazione lineare di Bravais-Pearson il valore della seguente espressione: COVAR(X, Y) r = _____________ (X ) (Y) APPROFONDIMENTO A L dipendenza statistica o La correlazione tra due variabili, quando stabilita, indica che al variare di un carattere X si accompagna il variare di un carattere Y, ma non implica necessariamente che tra X e Y ci sia un rapporto di causa-effetto. Potrebbe darsi, per esempio, che sia X sia Y siano l effetto di una terza variabile Z che non è stata analizzata. L analisi delle cause va quindi metodologicamente distinta dall analisi della correlazione. ATTENZIONE! A Possiamo dimostrare che l indice di correlazione lineare è compreso tra 1 e 1 e assume questi valori estremi in caso di dipendenza perfetta, mentre assume il valore 0 in caso di indipendenza assoluta. Valori positivi di r indicano una correlazione positiva, mentre valori negativi indicano una correlazione negativa. I simboli (X) e (Y) indicano lo scarto quadratico medio rispettivamente per la distribuzione X e per quella Y. ______ Ricordiamo che è (X) = VAR(X) Abbiamo correlazione positiva quando la funzione che descrive l andamento della dipendenza è crescente; abbiamo invece correlazione negativa quando la funzione è decrescente. correlazione positiva (0 < r 1) correlazione negativa ( 1 r < 0) esempio O In tabella sono indicati i valori delle distanze percorse in orizzontale da un carrellino, a massa costante, lasciato cadere da diverse posizioni lungo un piano inclinato. Verifica se esiste dipendenza lineare tra i due caratteri e calcola l indice di correlazione. Distanza sul piano inclinato (cm) 20 40 60 80 100 120 Distanza in orizzontale (cm) 28 72 81 138 140 193 Dall esame dei dati possiamo riconoscere una proporzionalità diretta, seppur approssimata, tra distanza sul piano inclinato (X) e distanza in orizzontale (Y). Completiamo adesso la tabella dei dati aggiungendo le colonne degli scarti dai rispettivi valori medi, i prodotti degli scarti delle due grandezze, e i quadrati dei singoli scarti. Nell ultima riga calcoliamo le medie di tutti i dati in colonna. 539

Il Maraschini-Palma - volume 3
Il Maraschini-Palma - volume 3