2.2 Gráficas y nubes de puntos

Representación de datos

Si te fijas en los pasos que hemos dado hasta este momento, verás que es un proceso muy lógico:

  1. Nos planteamos una pregunta sobre la relación entre dos parámetros.
  2. Tomamos suficientes datos de ambos parámetros sobre la población que nos interesa.
  3. Organizamos estos datos en una tabla simple o en una de doble entrada.

El siguiente paso será visualizar estos datos en una gráfica, de modo que nos resulte más fácil dar respuesta a nuestra pregunta inicial. Veamos cómo representar datos recogidos en una tabla simple.

Importante

Dados los pares (xi, yj) de una variable estadística bidimensional (X, Y), a la representación cartesiana de estos puntos se le denomina diagrama de dispersión.

El punto cuyas coordenadas son las medias aritméticas se le llama centro de gravedad o centro de masas

 Vamos a representar los valores de Temperatura y Precipitaciones medias mensuales en una determinada estación climatológica que tenías en la autoevaluación del apartado anterior.

tabla

Diagrama de dispersión o Nube de puntos:

La nube de puntos se representa sobre un par de ejes cartesianos. En este caso, cada punto representa un par de datos de la Variable Estadística Bidimensional.

Nube de puntos

En el siguiente vídeo puedes ver otro ejemplo con una explicación muy detallada:

Vídeo de estudiia alojado en Youtube

Caso práctico

Dada la tabla del apartado 2

Horas TV (X) 8 8 12 12 14 18 20 20 24
Horas deporte (Y) 8 10 6 10 4 8 2 6 4

Representa la nube de puntos.

Para saber más

Representación gráfica para datos recogidos en tablas de doble entrada

Si volvemos a la tabla de doble entrada que vimos en el ejercicio resuelto en el que comparábamos el número de días mensuales en los que se superaba la concentración máxima de NO2 y de Ozono en el aire:

Tabla

El par (0,0) se podría representar como un punto en una gráfica habitual de ejes cartesianos, pero en este caso tenemos que hacer ver de algún modo que la frecuencia de ese par es 7. A continuación, verás algunos ejemplos:

Para representar la información partimos de tres ejes cartesianos.

a) Histograma tridimensional:

En los ejes X e Y marcamos los posibles valores de cada variable (en nuestro caso 0, 1, 2 y 3 para X, y 0, 1, 2, 3 y 4 para Y). Cada cuadrado representa un par de valores.

La altura de cada cuadrado será la correspondiente frecuencia de ese par de valores.

Fíjate cómo en nuestro caso el par con mayor frecuencia es el (0,0), que se repite 7 veces, y por tanto es el prisma de mayor altura.

El siguiente sería el (1,4) que tiene frecuencia 5.

b) Diagrama de dispersión o de Burbujas:

En este caso partimos de un par de ejes cartesianos X e Y en los que representamos los valores de ambos parámetros.

En lugar de puntos, representamos circunferencias en las que su superficie es proporcional a la frecuencia. Ojo, no son proporcionales los radios sino las superficies.

Los pares de datos que tienen frecuencia 0 no se representan.