1. Correlación no significa causalidad.
El azar y la casualidad que se encuentran tras una noticia
1.- Correlación no significa causalidad.
La causa implica un orden determinado. Sabemos que los deslaves son causados por la deforestación, esto es un hecho que ha sido demostrado que es así y no al contrario, mientras que la correlación implica que dos hechos o circunstancias están unidas pero no se puede determinar con claridad cuál de ellos es la causa. Por ejemplo, se sostiene que las personas con temperamentos alegres tienen más éxito en sus relaciones sociales. Eso es una correlación demostrada. Sin embargo no se puede afirmar que haya causalidad, esto es, que el temperamento alegre sea la causa del éxito en las relaciones sociales, pues se puede afirmar que el éxito en las relaciones sociales también puede ser la causa del temperamento alegre.
De esta manera, sí bien la correlación puede estar demostrada, la causalidad no siempre se deduce de ella.
Causalidad es una relación, no una función. Dados dos eventos, puedo preguntarme si un evento es causa del otro o si no están relacionados. Pero dado un evento, la pregunta de cuál es la causa es vaga y ambigua, o en otras palabras, está mal hecha. No existe una causa para cada efecto. A veces, mejor que considerar causas, es hablar de factores. El agua hierve bajo ciertos factores como temperatura, presión atmosférica, estado actual, etc. Podemos hablar de factores necesarios y de factores suficientes. Cada factor puede ser una causa, pero ninguno es «la causa».
Distinguir entre causalidad y casualidad es fundamental en el análisis de datos para evitar interpretaciones erróneas y tomar decisiones informadas. Aquí detallamos su importancia:
Precisión en las Conclusiones: La confusión entre causalidad y casualidad puede llevar a conclusiones incorrectas. Solo porque dos fenómenos estén correlacionados no significa que uno cause el otro. Es vital analizar cuidadosamente los datos y considerar otros factores que podrían influir.
Toma de Decisiones Informada: Si asumimos causalidad cuando solo hay casualidad, podríamos tomar decisiones basadas en información incompleta o incorrecta. Por ejemplo, podría llevar a políticas públicas ineficaces o estrategias comerciales fallidas.
Validación de Hipótesis: En la investigación científica, distinguir entre causalidad y casualidad es esencial para validar hipótesis. Es necesario realizar experimentos controlados para establecer relaciones causales de manera confiable.
Desarrollo de Modelos Predictivos Precisos: Los modelos predictivos deben basarse en relaciones causales genuinas para ser efectivos. Si se confunden causalidad y casualidad, los modelos pueden generar predicciones inexactas y poco confiables.
Evitar Correlaciones Espurias: Las correlaciones espurias son asociaciones aparentes entre variables que no tienen una relación causal real. La distinción entre causalidad y casualidad ayuda a identificar y evitar estas correlaciones engañosas.
Mejora en la Investigación Científica: En la ciencia, la distinción entre causalidad y casualidad promueve una comprensión más precisa de los fenómenos naturales y sociales. Facilita la construcción de teorías sólidas y la generación de conocimiento confiable.
Resumimos unos ejemplos de este tipo de errores:
Tendencias de gripe por Google (Google Flu Trends): Google intentó predecir brotes de gripe analizando patrones de búsqueda relacionados con la gripe. Aunque inicialmente fue promocionado como un éxito, con el tiempo se descubrió que el modelo sobreestimaba significativamente la prevalencia de la gripe. Este error se debió, en parte, a no distinguir correctamente entre las búsquedas causadas por la preocupación o el interés en la gripe y las búsquedas realizadas por personas que realmente tenían gripe.
Redes Sociales y Ventas: Varias empresas han aumentado su presupuesto en publicidad en redes sociales después de observar una correlación entre el aumento de la actividad en estas plataformas y un incremento en las ventas. Sin embargo, algunas de estas empresas no consideraron otros factores, como campañas de marketing offline simultáneas, que podrían haber sido los verdaderos impulsores del aumento de ventas, llevando a una sobrestimación del impacto de las redes sociales.
Negocios de Ropa y Clima: Algunas marcas de ropa han cambiado sus estrategias de inventario y marketing basándose en la correlación entre el clima y las ventas de ciertos tipos de ropa, como abrigos o trajes de baño. Sin embargo, no tomar en cuenta otros factores, como las tendencias de moda o las actividades promocionales, puede llevar a decisiones erróneas sobre qué productos promocionar o almacenar.
Inversiones Financieras: En el ámbito financiero, algunos inversores han cometido el error de invertir en acciones basándose en correlaciones históricas, como el "Efecto Enero", donde las acciones tienden a subir en enero. Sin un análisis causal más profundo, estos inversores pueden sufrir pérdidas significativas cuando las condiciones del mercado cambian o cuando la correlación histórica no se mantiene.
2.- Correlaciones espúreas.
Veamos a continuación algunas situaciones ficticias elaboradas a partir de estudios científicos que saltan del campo científico al periodístico porque ayudan así a crear narraciones fáciles y divertidas. Pero, como bien sabemos, una cosa no tiene por qué estar relacionada con la otra, o como deberíamos decir, la correlación no implica causalidad. Para ello tenemos la página web de Tyler Virgen, abogado de Harvard que desde hace años mantiene un experimento estadístico y de datos llamado Spurious Correlations, o correlaciones espurias. Su título es bastante explicativo, así que vamos con algunos de los ejemplos recientes:
2.1.- Número de apariciones en películas de Penélope Cruz y el índice de polución del aire en Palm Beach, Florida.

Esta gráfica se corresponden con los datos de la tabla (Haz clic sobre ella):

. (CC BY-NC-SA)
Esta noticia representa a través de los años la relación existente entre la contaminación del aire en la zona de Palm Beach (Florida) y el número de películas realizadas por nuestra actriz Penélope Cruz. La correlación es clara. Cuantas más películas hace Penélope más polución existe en dicha zona. Lo mejor será que nuestra actriz coja unos años sabáticos para que así disminuya la contaminación. Resulta difícil creer que la carrera de actriz de Penélope Cruz determine el grado de contaminación en una zona concreta. Podemos concluir que estas correlaciones no implican que una cosa sea la causa de la otra. Veamos entonces una explicación a estas gráficas. Que dos fenómenos se den a la vez, o que uno preceda al otro, no implica que uno sea la causa del otro. Aunque observamos una correlación entre A (películas de Penélope) y B (polución atmosférica) eso no significa que las películas de ella provoquen dicha contaminación. ¿Y, si no es A la causa de B, por qué se dan los dos fenómenos a la vez de forma repetida? En general, si existe una fuerte correlación entre los fenómenos A y B, tenemos cuatro posibilidades:
Que A cause B. Que B cause A. Que haya un tercer fenómeno C, que provocara tanto A como B. Y la cuarta posibilidad, que es la más razonable, la del puro y duro azar, la casualidad. Hay muchos datos en el mundo, así que si los comparamos todos más tarde o más temprano encontraremos este tipo de correlaciones que no significan nada.
¿QUÉ ES UN DESLAVE? Es la caída de rocas o tierra desde una ladera, en forma lenta o rápida, que se produce en épocas de lluvia o a causa de un sismo. La mayoría se presenta durante las estaciones lluviosas. Cuando el suelo recibe una gran cantidad de agua, la tierra se ablanda y se desprende formando flujos de lodo, que se precipitan pendiente a bajo. Algunas personas contribuyen a que ocurran deslizamientos, cuando construyen con materiales pesados en terrenos débiles, o cuando realizan excavaciones que desestabilizan las laderas. La deforestación también es una causa de los deslizamientos, porque el suelo queda desprotegido.