Resumen

Importante

La relación entre dos variables la definiremos como correlación. Y ésta puede ser:

  • Correlación funcional: si existe una relación funcional entre las variables X e Y. Es decir, podemos calcular los valores de Y a partir de los de X, con una función.
  • Correlación positiva o directa: existe cierta relación entre ambas variables, y al aumentar los valores de X también aumentan los de Y (primer gráfico).
  • Correlación negativa o inversa: existe cierta relación entre las variables, pero al aumentar los valores de X disminuyen los de Y (segundo gráfico).
  • Correlación nula: no existe ningún tipo de relación entre ambas.

Importante

La Covarianza de una Variable Estadística Bidimensional (X,Y) la denotaremos como σxy y se calcula

donde fi es la frecuencia de cada par (xi,yi), N es el total de pares de valores y e son las medias marginales de cada variable.

Interpretación: el signo de la covarianza nos permitirá saber el tipo de correlación.

  • Si la covarianza es positiva, la correlación será directa.
  • Si la covarianza es negativa, la correlación será inversa.

Importante

El Coeficiente de Correlación de Pearson es el parámetro que nos va a decir si la correlación es débil o fuerte. Para calcularlo, necesitamos conocer el valor de las desviaciones típicas marginales de cada variable σx y σy. Su valor siempre estará entre -1 y 1. Su expresión es la siguiente:

 

 

Interpretación: Según los valores de r, tenemos cuatro casos:

  • r = 0: No existe correlación.
  • r = 1 ó r = -1: La correlación es perfecta.
  • r próximo a 1 o -1: La correlación es fuerte.
  • r próximo a 0: La correlación es débil.

Importante

Para una variable estadística bidimensional, la recta de regresión de Y sobre X viene dada por la ecuación:


Una vez que tenemos la ecuación de la recta, podemos "predecir" valores de la variable que no conozcamos sustituyendo el valor de x. Veámoslo en el siguiente ejemplo.

La recta de regresión de X sobre Y, que tiene la siguiente ecuación:

 

 

El punto de coordenadas se denomina Centro de Gravedad de la distribución.