Definiție covarianță

Termenul de covarianță nu face parte din dicționarul elaborat de Academia Regală Spaniolă ( RAE ). Totuși, conceptul este utilizat în domeniul statisticii și în domeniul probabilității de a desemna valoarea care reflectă gradul de variație comună înregistrat în două variabile aleatorii, care își iau mijloacele ca măsură.

covarianță

Astfel, covarianța ne permite să descoperim dacă variabilele mențin o legătură de dependență . De asemenea, datele ajută la cunoașterea altor parametri.

Este cunoscut cu numele variabilei aleatoare unei funcții care la rezultatul unui experiment aleator îi atribuie o valoare, de obicei de tip numeric. Un experiment aleator, pe de altă parte, este unul care poate produce rezultate diferite, chiar dacă este efectuat de mai multe ori în aceleași condiții, astfel încât fiecare experiență devine imposibilă de a anticipa și, prin urmare, de a se reproduce.

Un exemplu foarte frecvent de experiment aleatoriu, pe care îl putem dovedi în viața noastră de zi cu zi, este aruncarea unui mor: chiar dacă este aruncat pe aceeași suprafață, cu aceeași mână sau ceașcă și aplicând mai mult sau mai puțin aceeași forță și direcție, este posibil să preziceți care dintre fețele dvs. vor fi îndreptate în sus.

Dacă valorile joase ale unei variabile corespund valorilor scăzute ale unei alte variabile sau dacă același lucru se întâmplă și cu valorile ridicate ale ambelor, covarianța are o valoare pozitivă și este calificată ca fiind directă . Pe de altă parte, dacă valorile joase ale unei variabile corespund celor mai mari valori ale unei alte variabile și invers, covarianța este negativă și este definită ca fiind inversă . Tendința existentă în relația liniară stabilită între variabile, în acest fel, este exprimată prin semnul covarianței .

Există formule diferite pentru a calcula covarianța. Se poate spune că covarianța este media aritmetică care apare din produsul abaterilor variabilelor în raport cu mijloacele proprii.

Să presupunem că variabilele sunt rezultatele evaluărilor istorice și geografice ale a cinci studenți:

Gradul Istoric (P) al celor cinci elevi: 6, 5, 7, 7, 4 (total = 29)
Geografia (S) scorurile celor cinci elevi: 7, 3, 4, 3, 5 (total = 22)

Apoi, trebuie să tabulați, înmulțind rezultatele evaluărilor fiecărui student:

P x S: 42 (de la 6x7 = 42), 15 (5x3), 28 (7x4), 21 (7x3), 20 (4x5). Totalul sumei rezultatelor = 126)

Media lui P: 29/5 = 5.8
Media lui S: 22/5 = 4.4

în cele din urmă:

PS Covariance: (126/5) - 5, 8 x 4, 4
PS Covariance: 25, 2 - 5, 8 x 4, 4
Covariance PS: 25, 2 - 25, 52
PS Covariance: -0.32

În afară de a ști dacă două variabile aleatorii date au o legătură de dependență reciprocă, covarianța este utilizată pentru a estima parametrii precum linia de regresie și coeficientul de corelare liniară .

Linia de regresie este, de asemenea, cunoscută ca ajustare liniară sau regresie liniară și este un concept aparținând domeniului statistic care include un model matematic folosit pentru a aproxima dependența care există între un grup de variabile și un termen aleatoriu.

Coeficientul de corelare liniară, pe de altă parte, este un indicator al direcției și puterii unei relații liniare (în matematică, ceea ce este dat dacă valoarea unei magnitudine depinde de ceea ce are alta) și o proporționalitate (raport sau relație constantă care se produce între magnitudine care pot fi măsurate) între două variabile statistice (acestea sunt caracteristici care pot fluctua, cu valori care pot fi observate și măsurate).

Este important să se diferențieze următoarele două tipuri de covarianță: cea care are loc între două variabile aleatoare, care este considerată o proprietate a distribuției în comun, adică a evenimentelor ambelor care apar simultan; eșantionul, care este folosit ca o estimare statistică a parametrului .

Recomandat