4.2. Curiosidades

Curiosidad

Retrato de Galton en 1850
Imagen en Wikimedia Commons de Fastfission bajo Dominio Público

Algo de Historia

Sir Francis Galton (16 de febrero de 1822 – 17 de enero de 1911). Antropólogo, geógrafo, explorador, inventor, meteorólogo, estadístico y psicólogo británico.

No tuvo cátedras universitarias y realizó la mayoría de sus investigaciones por su cuenta. Sus múltiples contribuciones recibieron reconocimiento formal cuando, a la edad de 87 años, se le concedió el título de Sir o caballero del Reino.

De intereses muy variados, Galton contribuyó a diferentes áreas de la ciencia como la psicología, la biología, la tecnología, la geografía, la estadística o meteorología. A menudo, sus investigaciones fueron continuadas dando lugar a nuevas disciplinas.

Primo segundo de Charles Darwin, aplicó sus principios a numerosos campos, principalmente al estudio del ser humano y de las diferencias individuales.

En el campo de la estadística, la principal contribución de Galton fue el concepto de correlación entre pares de atributos, aplicándolo a problemas sobre herencia y genética.


Karl Pearson (1857-1936), matemático y filósofo de las ciencias británico, se le conoce por haber desarrollado algunas de las técnicas centrales de la moderna estadística, y por aplicar estas técnicas a los problemas de la herencia biológica.

A principios de 1900, Pearson se interesó por el trabajo de Francis Galton, que intentaba encontrar relaciones estadísticas para explicar cómo las características biológicas iban pasando a través de sucesivas generaciones. La investigación de Pearson colocó en gran medida las bases de la estadística del siglo XX, definiendo los significados de correlación, análisis de la regresión y desviación típica. En 1911 Pearson alcanzó el cargo de profesor de eugenesia en el University College, examinando la recopilación y análisis de la información en el sentido que las características como inteligencia, criminalidad, pobreza y creatividad se trasmiten a través de generaciones. Pearson confiaba en aplicar estas intuiciones con el fin de mejorar la raza humana.

Si quieres saber más sobre el trabajo de K. Pearson, sigue el enlace.

Pre-conocimiento

Imagen en www.venganza.org

¿Leyendas urbanas?

Aunque hemos visto que la correlación indica que una variable esté relacionada con otra, esto no quiere decir que exista una relación de causa y efecto entre una y otra. Mira los siguientes ejemplos:

  • Según la DGT, el 20 % de los motoristas fallecidos en accidentes de tráfico no llevaban casco.
  • La mayoría de los accidentes de tráfico se producen entre vehículos que ruedan a una velocidad moderada.
  • Los días de luna llena se produce un aumento en el número de nacimientos.
  • El cambio climático provoca el aumento de tornados en el hemisferio norte.

En el primer y segundo caso, no se puede establecer que sea mejor no llevar casco o circular a una velocidad excesiva, pues lo que no se dice es que la mayoría de los motoristas llevan casco, y la mayoría de los coches circulan a una velocidad moderada, de ahí que sea también mayor el número de accidentes.

El tercer ejemplo es el típico caso en el que, a pesar de haber sido refutadas con estudios estadísticos, siguen formando parte de las leyendas urbanas.

El cuarto, es un ejemplo de mal uso de las estadísticas para crear buenos titulares. Los estudios indican que, aunque haya aumentado el número de tornados en el hemisferio norte, no ha sido así a nivel mundial y no se puede establecer que el aumento de tornados sea causa directa del cambio climático.

El gráfico que tienes arriba, de la web www.venganza.org, representa el aumento de las temperaturas globales y la disminución en el número de piratas en los últimos siglos. Es un ejemplo muy curioso de cómo se pueden relacionar dos variables que no tienen nada que ver, y obtener una correlación muy fuerte ¿Han desaparecido los piratas debido al cambio climático?

Resumiendo, como nos explican en Microsiervos, hay que aprender a interpretar los estudios estadísticos y a ser crítico con las noticias que nos llegan a diario.

Pre-conocimiento

Representación gráfica para tablas de doble entrada

Si volvemos a la tabla de doble entrada que vimos en el ejercicio resuelto en el que comparábamos el número de días mensuales en los que se superaba la concentración máxima de NO2 y de Ozono en el aire:

Tabla

El par (0,0) se podría representar como un punto en una gráfica habitual de ejes cartesianos, pero en este caso tenemos que hacer ver de algún modo que la frecuencia de ese par es 7. A continuación, verás algunos ejemplos:

Gráfico de barras

a) Histograma tridimensional:

Para representar la información partimos de tres ejes cartesianos.

En los ejes X e Y marcamos los posibles valores de cada variable (en nuestro caso 0, 1, 2 y 3 para X, y 0, 1, 2, 3 y 4 para Y). Cada cuadrado representa un par de valores.

La altura de cada cuadrado será la correspondiente frecuencia de ese par de valores.

Fíjate cómo en nuestro caso el par con mayor frecuencia es el (0,0), que se repite 7 veces, y por tanto es el prisma de mayor altura.

El siguiente sería el (1,4) que tiene frecuencia 5.


Diagrama de burbujas

b) Diagrama de dispersión o de Burbujas:

En este caso partimos de un par de ejes cartesianos X e Y en los que representamos los valores de ambos parámetros.

En lugar de puntos, representamos circunferencias en las que su superficie es proporcional a la frecuencia. Ojo, no son proporcionales los radios sino las superficies.

Los pares de datos que tienen frecuencia 0 no se representan.