1.3 Estimaciones con las rectas de regresión

Pues ya que tenemos todo lo  necesario. Vamos a aplicar todo lo que hemos aprendido en este tema a situaciones reales.

La utilidad de la recta de regresión es que nos permite predecir valores que se van a dar en una variable cuando le damos un valor que no conocemos a la otra. Además, con el coeficiente de correlación, podemos saber si la predicción que estamos haciendo es buena o no, si es fiable o no lo es.

En el siguiente importante, puedes ver los pasos a seguir para resolver un problema de regresión lineal:

Importante

Con el siguiente gráfico puedes realizar un rápido repaso por todo lo visto en el tema:

Problema de regresón lineal

Imagen de elaboración propia. Haz clic en la imagen para ampliar

En el siguiente vídeo puedes ver un ejercicio completo de regresión lineal siguiente los pasos descritos en el Importante anterior:

Vídeo de lasmatematicas.es alojado en Youtube

Caso práctico

En uno de los informes sobre estadísticas hospitalarias, Mercedes observa la evolución de las donaciones de sangre en Andalucía. Parece evidente que la concienciación social y la solidaridad de la población sobre este asunto es cada vez mayor.

Con el objeto de analizar de manera rigurosa la evolución de las donaciones de sangre y de hacer una estimación de lo que ocurrirá en años venideros, se ha recogido en la siguiente tabla la Tasa de donaciones de sangre (n.º de donaciones por cada 1000 habitantes) en Andalucía desde el año 94 hasta 2008:

Año 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008

Tasa de donaciones

31,70 32,40 33,10 3,10 32,50 34,66 34,62 35,00 35,30 34,94 35,18 33,62 33,30 32,88 34,08

¿Qué tasa de donaciones se prevé que haya en el año 2009? ¿Y en 2010? ¿Cómo son de fiables estas predicciones?

En este segundo ejemplo, se está haciendo un estudio de control de población de conejos y zorros en una zona de bosque. Se cree que el número de ambas especies está íntimamente relacionado.

Durante los últimos 8 años se ha hecho un censo de ambos animales, obteniéndose las cifras que se muestran a continuación:

 

N.º zorros 20 30 15 20 26 30 15 14
N.º conejos 320 500 270 310 400 450 200 250

 

¿Cuántos zorros deberá haber si en el último año se han contado 350 conejos? Y si un año llegaran a contarse 1000 conejos, cuántos zorros debería haber para que el ecosistema fuera sostenible? ¿Son fiables las predicciones?

Comprueba lo aprendido

Ahora te toca a ti. Vas a hacer un ejercicio en el que al final tienes que hace un pronóstico sobre aguas y cultivos.

Ve rellenando los distintos huecos. Si aparecen decimales, usa la coma para separar y redondea todos los resultados con 3 decimales, aunque si te equivocas en algún decimal tampoco ocurre nada.

El historial hidrológico de Olvera en los últimos 8 años y la producción de aceitunas que han dado los olivos del campo de Curro vienen dados por la siguiente tabla:

Año 2002 2003 2004 2005 2006 2007 2008 2009
L/m2 702 680 650 710 640 600 604 673
Producción ( miles kg) 215 220 184 221 168 136 162 197

Aunque en la cooperativa le informan a Curro de nuevos abonos que mejoran el rendimiento y de los distintos tipos de insecticidas que ha usado, Curro cree que el único factor determinante de la producción de sus olivos es el agua que cae en el año. ¿Tiene razón Curro y es verdad que la cantidad de agua es tan decisiva?
¿Qué cantidad de agua tendría que llover para que la producción fuera al menos de 250.000 kg de aceitunas?

Le llamamos X al agua caída e Y a la producción obtenida.

Media de X = Desviación típica de X =

Media de Y = Desviación típica de Y =

Covarianza = Coeficiente de correlación r =

Según ese valor de r, influye de manera decisiva la cantidad de agua caída, ¿sí o no?

Calculamos la recta de regresión X sobre y, pues me pide un valor de X, conocido uno de Y, y sustituimos la y por 250.

recta de regresión: X = y +

Estimación: Para obtener 250.000 kg de cosecha, deberán caer l/m2

Habilitar JavaScript

Importante

La fiabilidad de la estimación de la recta de regresión nos la dará el coeficiente de determinación. Cuanto más cerca esté r2 de 0, la fiabilidad de la la predicción será menor, y cuanto más cerca  esté de 1 más fiable es la predicción.