Saltar la navegación

2. Datos con herramientas ofimáticas

Rétor dice

Hasta ahora, seguramente has trabajado con hojas de cálculo y bases de datos que se incluyen en software ofimática para algunas tareas manejando datos. Las hojas de cálculo más utilizadas suelen ser  Microsoft Exel y Acces en software propietario y por otro lado  Libreoffice Calc y Base en software libre.

Vamos a repasar algunos conceptos con alguna estas herramientas libres que nos será útiles para luego pasar a trabajar con datos masivos con otro tipo de herramientas de cara a realizar el reto final. 

¡Vamos a comenzar!

1. Datos con LibreOffice Calc

LibreOffice CalcPara refrescar nuestros conocimientos vamos a trabajar con una hoja de calculo con datos de la población de España tomados del Instituto Nacional de Estadística (INE).

Utilizaremos LibreOffice  Calc como herramienta de software libre y el siguiente archivo con datos:

Enlace al archivo población.ods

El archivo contiene una serie de datos estadísticos sobre la población española desde el año 2000 hasta el 2015.

Tarea:

Vamos a utilizar estos datos para obtener información útil sobre la población y si crecimiento.

  1. Ordena los datos de mayor a menor, según  la  población que tienen en 2015.
  2. En la hoja 2 pon el resultado de filtrar los datos buscando las provincias que han tenido crecimiento negativo de la población entre 2000 y 2015.
  3. En la hoja 3 muestra los datos solamente de las 8 provincias andaluzas.
  4. En la hoja 4 pon el resultado de filtrar los datos buscando las  provincias que han tenido crecimiento positivo de la población entre 2000 y 2015 y en 2015 tengan más de un millón de habitantes.
  5. En la hoja 5 realiza un gráfico de la evolución de la población de tu provincia desde 2000 a 2015: gráfico de barras en 3D en rojo, sin leyenda, con título general y en los ejes.
  6. Crea un gráfico con la línea de tendencia o de regresión para poder estudiar la evolución futura de la población.

Es un organismo autónomo adscrito al Ministerio de Economía y Hacienda. Su tarea principal tarea es la de elaborar estadísticas públicas, que son estudios oficiales sobre la situación y evolución de la población, la economía y la sociedad de España.

Lumen dice No recuerdo cómo trabajar con Calc

Si no recuerdas cómo trabajar con LibreOffice Calc o nunca has trabajado más allá de crear unas tablas de horarios o similar, no te preocupes pues te vamos a ayudar:

Ordenar datos

Lo primero que de debes saber es que las operaciones siempre se realizan seleccionando todo el rango de datos, en nuestro caso desde la celda  8B a la Q59 esto es lo que se llama un rango de datos y se expresa como 8B:Q59.

Imagen que muestra un rango de datos Lo puedes hacer con el ratón o más fácil escribiendo el rango de datos en la casilla correspondiente en la parte superior derecha.

Para ordenar una tabla de datos necesitamos un criterio para ordenarlos, es decir, saber cómo vamos a decidir en qué orden se van  a colocar. En nuestro caso el criterio es la población en 2015 empezando por el de mayor población y terminando en la provincia que menos población tenía en 2015.

Tras seleccionar todo el rango de datos y en la barra de menú superior seleccionamos Datos --> Ordenar y como criterio de ordenación tomamos la columna B donde está la población en 2015 y el orden Descendente.

Imagen de la ventana para ordenar datos

El resultado será la misma tabla pero ahora con las provincias y los datos ordenados de mayor a menor según la población de 2015.

Filtro automático

Filtrar datos es útil para obtener los datos que cumplan alguna condición específica. En este caso queremos saber las provincias que han tenido un crecimiento negativo o decrecimiento, es decir que su población ha disminuido desde 2000 a 2015.

Imagen en la que se explica como crear una funciónPara ello es útil conocer la diferencia de población entre estos dos años. para ello en la celda R8 vamos a crear una fórmula que lo calcule automáticamente la resta entre ambas cantidades: = B8 - Q8

Arrastrando desde el cuadradito de la esquina inferior derecha de dicha casilla copiaremos esta fórmula hasta la casilla R59.

De esta forma obtendremos una columna en la que las cifras en negativo indicarán un descenso de la población, ahora solo queda filtrar los daros para quedarnos sólo con esas filas:

Imagen que muestra la opción de fitro automático

      • Seleccionamos el nuevo rango de datos: A6:R59
      • Menú Datos --> Filtro Automático utilizando la primera fila como cabecera de las columnas y obtendremos unas pestañas en cada una de las celdas de la cabecera.
      • Clicando en la pestaña de la columna que llamaremos "Resta" podemos seleccionar como aplicar el filtro. En este caso si escribimos un menos "-" en la casilla "Buscar elementos" nos seleccionará las cifras negativas y obtendremos el resultado deseado con las 9 provincias con descenso de la población.
      • Copia y pega el resultado en una nueva hoja (Hoja 2).

Utilizando también el filtro automático en la columna de los nombres de provincias podemos seleccionar las 8 provincias andaluzas y realizar el apartado 3 que copiaremos en la Hoja 3

Filtro estándar

Para obtener las provincias que han tenido crecimiento positivo de la población entre 2000 y 2015 y en 2015 tengan más de un millón de habitantes vamos a utilizar el filtro estándar:

  • De nuevo en la Hoja1 y deshaciendo los filtros anteriores, seleccionamos de nuevo el rango de datos A8:R59
  • Menú Datos --> Más filtros --> Filtro estándar
  • En la ventana que se presenta introducimos las condiciones para el filtrado:

Imagen con la ventana de Filtro estándar

El resultado lo copiamos en la Hoja 4

Representación gráfica

Para realizar el gráfico del apartado 5 debes tomas los resultados del apartado 3 con las provincias andaluzas,

  • Selecciona las dos filas:  Año y la de tu provincia sin incluir la celda de la resta del apartado 2 ( por ejemplo para Málaga). Para seleccionar ambas filas a la vez debes mantener pulsada la tecla CTRL pulsada.
  • Para realizar el gráfico utilizaremos el "Asistente para gráficos" que se activa al seleccionar el menú Insertar --> Gráfico

Seleccionaremos:

  1. Tipo de gráfico --> Columna --> Aspecto 3D Realista
  2. Intervalo de datos --> Series de datos en filas y Primera fila como etiqueta
  3. Series de datos --> no cambiamos nada
  4. Elementos del gráfico --> como en la imagen siguiente:

Imagen que muestr distintos tipos de graficos con Calc

Línea de tendencia

Para obtener una línea de tendencia, también llamada recta de regresión realizaremos los siguientes pasos:

Seleccionamos los mismos datos que el apartado anterior pero ahora el tipo de gráfico será de dispersión y el resto igual:

Imagen mostrando el tipo de gráfico de dispersión

Una vez obtenido el gráfico veremos que los puntos están en la parte superior. Para una mejor visualización vamos a variar la escala del eje Y:

  • Con doble Clic seleccionamos el gráfico y de nuevo doble Clic sobre alguna cifra a la derecha del eje Y nos aparece una ventana donde podemos variar la estala automática.
  • En el mínimo pondremos una cifra redonda menor que el dato más bajo. Ahora vemos mejor la diferencia entre los años.
  • Hacemos Clic sobre alguno de los puntos del gráfico y con el botón derecho del ratón en el menú contextual seleccionamos "Insertar línea de tendencia" donde podemos ajustar el tipo de regresión y el aspecto de la línea. En este caso podemos seleccionar la Polinómica y de color rojo y 0,10 cm.

Conclusiones

Imgen qjue muestara un gráfico de tendenciaSi todo ha ido bien obtendremos un gráfico de este estilo donde podemos extrapolar la evolución de la población de la provincia en años futuros.

Esto nos permite tomar decisiones sobre el crecimiento urbanístico, prever necesidades de suministros de agua y saneamientos, planear infraestructuras de comunicaciones, etc..

Este tipo de información y su análisis es de gran ayuda en muchos ámbitos como el político, económico, sanitario, comercial, etc.. 

Averiguar o estimar el valor de una magnitud para valores de la variable que se hallan fuera del intervalo en que dicha magnitud es conocida .

2. Limitaciones de las hojas de cálculo y bases de datos

Con la aparición del denominado Big Data, ha surgido la necesidad de tratar enormes cantidades de información. Las hojas de cálculo como Calc , Excel y también Access, nos permiten trabajar con grandes bases de datos y las últimas versiones han aumentado su capacidad, pero cuando hablamos de Big Data, existen varias limitaciones. 

Data center

Tarea:

Averigua los siguientes datos de Excel o Libreoffice Calc:

  • Número máximo de columnas por hoja de trabajo.
  • Número máximo de filas por hoja de trabajo.
  • Número máximo de celdas por hoja de trabajo.
  • Número máximo de caracteres en una celda.
  • Número máximo de hojas de trabajo en un libro de trabajo.