Big Data
Importante
Big data: “Todo lo que se puede medir se puede mejorar”
El concepto <<Big data>> hace referencia a la gestión y el análisis de volúmenes de datos que, por su enorme cantidad, no pueden ser tratados de forma convencional, ya que superan los limites y las capacidades de las herramientas de software habituales para la captura, la gestión y el procesamiento de información.
Engloba infraestructuras, tecnologías, herramientas y servicios que procesan enormes conjuntos de datos (por ejemplo mensajes en redes sociales, correos electrónicos, campos de formularios o encuestas, visualización de vídeos, señales de geoposición de móviles, sensores, imágenes digitales, búsqueda de información como vuelos, etc) convirtiéndolos en información que facilita la toma de decisiones.
¿Cómo cambiará nuestra vida?
![]() |
Imagen de kamiphuc en Flickr. Licencia CC |
Por ejemplo la monitorización de las constantes vitales del usuario puede no sólo mejorar su salud, también su bolsillo, una aseguradora podrá ofrecer descuentos a los asegurados que lleven puestos sistemas para monitorizar su forma física. Con cada nuevo seguro de vida, la compañía ofrece una pulsera que recibe la actividad física del usuario. Cuanto más ejercicio haga, más se ahorra.
El análisis de los big data generados en los procesos educativos permite predecir tendencias y patrones en el comportamiento de los estudiantes, además de facilitar la creación de caminos para personalizar los entornos de aprendizaje en función de las necesidades de cada individuo y adaptar las metodologías con el fin de conseguir una mayor eficacia.
A medida que el aprendizaje se traslada a la Web, existe una cantidad cada vez mayor de datos que podemos utilizar para mejorar y personalizar el aprendizaje.
Algunos ejemplos actuales de aplicación del BIG Data
El uso de Big Data no es ciencia ficción, aquí tienes algunos ejemplos en diversos ámbitos:
Uso científico y médico
El análisis de datos masivos ha favorecido el desarrollo de la genómica (estudio del material genético de los organismos: secuenciación, mapeo y análisis de los códigos ADN y ARN) para así comprender cómo funcionan los genes y qué impacto tienen en las enfermedades, convirtiéndose en uno de los pilares de la medicina preventiva.
El Big Data también se está usando para controlar y predecir la evolución de epidemias y brotes de enfermedades. La empresa Google ofrece desde el año 2008 datos relativos a búsquedas sobre el virus de la gripe en más de 25 países, esto permite extraer conclusiones sobre la incidencia de este virus y facilita las comparaciones con series de años anteriores.
Uso político
Barak Obama fue el primero en utilizar Big Data. Para su campaña de reelección en 2012 su equipo se enfocó en tres grandes esfuerzos:
1.- Registro: para recoger datos de los votantes convencidos
2.- Persuasión: para dirigirse a los dudosos de forma eficaz
3.- Voto del electorado: para asegurarse de que los partidarios fueran a ejercer el voto sí o sí.
Uso comercial de los datos
Extraer información del uso de tarjetas de créditos, o de las compras online permite visualizar la procedencia de las compras y crear patrones de consumo.
Amazon analiza millones de datos de sus clientes, así como las tendencias actuales en redes sociales. De esta manera puede conocer el gusto de cada cliente para realizarle recomendaciones de productos incluso antes que el propio cliente las solicite.
Otro ejemplo, BBVA lanzó la herramienta Commerce360, que permite conocer datos que hasta ahora solo eran accesibles a la gran distribución, y que proporciona una ventaja competitiva a la hora de diseñar estrategias comerciales y de marketing.
Tecnologías para implementar el Big Data
El BIG Data debe parte de su rápida extensión tanto a la tecnología de almacenamiento en la nube (Cloud Computing) como al Internet de las Cosas que está empezando a permitir la recolección de millones de datos de todo tipo de dispositivos conectados a la red en cualquier parte del mundo.
Las cuatro fases de un sistema de Big Data son: generación, adquisición, almacenamiento y análisis de datos.En este último punto debemos hacer mención expresa a las aplicaciones para representar y visualizar esos millones de datos de forma precisa pero sencilla para facilitar la toma de decisiones.
A la hora de trabajar con millones de datos que pueden estar estructurados, no estructurados o semiestructurados, se debe elegir una plataforma de almacenamiento; dos de las más extendidas y, a veces complementarias, son:
Hadoop: Es una herramienta open source de Big Data y es considerada el framework estándar para el almacenamiento de grandes volúmenes de datos; se usa también para analizar y procesar, y es utilizado por empresas como Facebook y Yahoo!.
MongoDB: Es un sistema de Bases de datos no SQL que, a diferencia de las tradicionales bases de datos relacionales, almacena documentos no registros. Es una alternativa en fase de expansión para entornos que requieren mucha escalabilidad, donde modelos relacionales no son capaces de dar una respuesta eficiente a la hora de manejar ese gran tamaño, complejidad de formatos y velocidad de entrega de datos; por ejemplo, sería el caso de aplicaciones on-line con miles de usuarios concurrentes y millones de consultas al día.
Por otro lado, a la hora del procesamiento de datos en entornos de Big Data, hemos de mencionar los lenguajes de programación más utilizados: Lenguaje R y Phyton.
Para saber más
El usuario empieza a ser consciente del valor de sus datos para empresas y gobiernos.
Algunos de los peligros al que nos exponemos al navegar por internet y permitir que los algoritmos recopilen nuestros datos:
- El Big Data ha propiciado la compra-venta de datos personales, muchas veces sin consentimiento del usuario para facilitar a las empresas la recomendación personalizada de productos.
- Uso gubernamental: los gobiernos pueden recolectar millones de datos personales (financieros, médicos, de identidad sexual, raza, religión, afinidades políticas, etc) cuyo destino puede preocupar sobremanera al ciudadano.
- Discriminación predictiva: el análisis predictivo de los datos personales puede ser utilizado para tomar decisiones sobre la adecuación de un usuario para, por ejemplo, acceder a un determinado trabajo, un préstamo o una tarjeta de crédito.