Saltar la navegación

4.6.4. El número que explica

Diccionario

Disparidad

Disparidad

Definición

Diferencia o desigualdad de una cosa respecto a otra.

Ejemplo

Hubo disparidad de opiniones.

1. Introducción

Imagen descriptiva de una fuente en la que las gotas caen en el agua.

Rétor dice ...Si recuerdas, cuando comenzamos esta experiencia preguntando sobre cuánto tiempo nos iríamos de viaje de estudios, o cuánto dinero nos podíamos gastar, quizá te sorprendiera la disparidad de las respuestas a algunas preguntas. Por ejemplo, algunos de tus compañeros querrían irse menos tiempo de viaje que tú. Otros estarían dispuestos a gastar más dinero para hacer un viaje con mejores servicios.

¿Cómo representa el valor elegido a todos los de una población?. 

Por ejemplo, si la media de días que queréis ir de viaje es 5 días y la mayoría de respuestas son cercanas, por ejemplo, 4 o 6 días, podemos decir que la media representa el sentir general de la clase. Pero si había compañeros que sólo querían ir 2 días de viaje y otros estar 10, la media calculada podría no ser tan buena y no dejara contento a nadie.

Los parámetros de dispersión nos permiten medir esa dispersión de los datos, completando la representatividad de los parámetros de centralización a los que están asociados.

En este apartado vamos a estudiar este tipo de medidas de dispersión asociadas a la media.

Disparidad

Definición
Diferencia o desigualdad de una cosa respecto a otra.
Ejemplo
Hubo disparidad de opiniones.

Lectura facilitada

Recuerda cuando se preguntó por los días que querías ir de viaje

y el dinero que podrías gastar.

Cada compañero y compañera respondió algo diferente.

Ahora, ¿cómo se representa la media de toda la población?


Por ejemplo: la mayoría de compañeros y compañeras 

han elegido 4 o 6 días para ir de viaje.

La media de días para ir de viaje es 5 días.

La media representa a los compañeros que han elegido 4 o 6 días.

Pero hay compañeros y compañeras que quieren ir 2 o 10 días.

Para esos compañeros y compañeras la media de 5 días

son pocos días de viaje y no están contentos.

Los parámetros de dispersión nos ayudan a analizar lo cerca

o lo lejos que están los datos de una medida.

Por ejemplo, lo cerca o lo lejos que están de la media.


Ahora vas a estudiar la medida de dispersión asociada a la media.

2. Desviación típica

Las dos medidas de dispersión más usadas son la desviación típica y la varianza.

La varianza se representa por \( \sigma^2 \).

La desviación típica se define como la raíz cuadrada de la varianza y se representa por la letra griega \( \sigma \).

La desviación típica y la varianza miden la dispesión de los datos con respecto a la media, es decir, lo "lejos o cerca" que están estos valores que toma la variable con respecto a la media.

Así, si los datos están lejos de la media, la desviación típica y la varianza serán grandes y si están concentrados respecto a ella, serán pequeñas.

¿Y por que hay dos medidas si sirven para lo mismo?

Pues porque la varianza es más sencilla de calcular, pero viene expresada en las mismas unidades que la variable pero al cuadrado, lo que hace más difícil su interpretación.

Y la desviación típica se tarda más en calcular, pero viene expresada en las mismas unidades que la variable y es más fácil de interpretar. La desviación típica es la que más vas a usar.

Veamos un ejemplo para entenderlo bien.

Las respuestas obtenidas al preguntar los días que queremos irnos de vacaciones en dos de los grupos en que hemos dividido la clase han sido:

Grupo 1:

3, 4, 6, 7

Media = 5 días

Varianza = 2.5 dias2

Desviación típica = 1.58 días

media grupo1

Grupo 2:

1, 2, 8, 9

Media = 5 días

Varianza = 12.5 dias2

Desviación típica = 3.53 días

media grupo2

En el próximo apartado verás cómo se calcula la varianza y la desviación típica.

Primero fíjate en la varianza, viene expresada en días2, que no se entiende muy bien qué es.

Y ahora fíjate en los valores que toma la varianza y la desviación típica. Las dos medidas son más pequeñas en el grupo 1, y los valores del grupo 3, 4, 6, y 7 están todos "más cerca" de la media que los valores del grupo dos 1, 2, 8 y 9.

Como en el grupo 1 la varianza y la desviación típica son más pequeñas que en el grupo 2 puedes afirmar que la media del grupo 1 representa mejor lo que los integrantes del grupo quieren.

Lectura facilitada

Las medidas de dispersión más utilizadas son la varianza y la desviación típica.

La varianza se representa \( \sigma ^2 \).

La desviación típica es la raíz cuadrada de la varianza.

La desviación típica se representa \( \sigma \).

La varianza y la desviación típica miden lo cerca o lejos

que están los datos de la media.

La varianza es más sencilla de calcular.

La varianza es más difícil de interpretar, se mide en unidades al cuadrado.

La desviación típica se tarda más en calcular.

La desviación típica se mide en la misma unidad que la variable.

Ejemplo:

En un grupo de cuatro alumnos, los votos con el número de días que ir de vacaciones son: 3 días, 4 días, 6 días y 7 días.

La media es 5 días, la varianza es 2.5 días y la desviación típica es 1.58 días.

media grupo 1

En otro grupo los votos han sido: 1 día, 2 días, 8 días y 9 días.

La media es 5 días, la varianza 12.5 días y la desviación típica 3.53 días.

media grupo 2

Los votos  del primer grupo están más cerca de la media que los votos del segundo grupo.

Por eso, la varianza y la desviación típica del primer grupo es menor.

Notación matemática

A la columna que usamos para calcular la desviación típica se le llama xi2·ni.

3. ¡Vamos con un ejemplo!

Siempre se calcula primero la varianza, y después se calcula la desviación típica haciendo la raíz cuadra de la varianza.

Para calcular la varianza, añadimos una nueva columna a la tabla de frecuencias, que ya hemos empleado en la media. En ella multiplicaremos el cuadrado de cada una de las modalidades de la variable por su frecuencia. Posteriormente, sumaremos los valores de dicha columna, la dividimos entre el tamaño de la población y restamos el cuadrado de la media.

Observa cómo se hace paso a paso:

1. Añade una columna para calcular la varianza

Días que queremos irnos de viaje Frecuencia absoluta

Columna de la media

\( x_i \cdot n_i \)

Columna de la varianza

\(x_i^2 \cdot n_i \)

3 5 15
4 7 28
5 8 40
6 6 36
7 4 28
Totales 30 147

2. Completa la primera fila elevando al cuadrado la modalidad y multiplicando por su frecuencia

Días que queremos irnos de viaje Frecuencia absoluta

Columna de la media

\( x_i \cdot n_i \)

Columna de la varianza

\(x_i^2 \cdot n_i \)

3 5 15 \( 3^2 \cdot 5 =45 \)
4 7 28
5 8 40
6 6 36
7 4 28
Totales 30 147

3. Completa la segunda fila elevando al cuadrado la modalidad y multiplicando por su frecuencia

Días que queremos irnos de viaje Frecuencia absoluta

Columna de la media

\( x_i \cdot n_i \)

Columna de la varianza

\(x_i^2 \cdot n_i \)

3 5 15 \( 3^2 \cdot 5 =45 \)
4 7 28 \( 4^2 \cdot 7 =112 \)
5 8 40
6 6 36
7 4 28
Totales 30 147

4. Completa todas las filas de las modalidades de la misma manera, elevando al cuadrado la modalidad y multiplicando por su frecuencia

Días que queremos irnos de viaje Frecuencia absoluta

Columna de la media

\( x_i \cdot n_i \)

Columna de la varianza

\(x_i^2 \cdot n_i \)

3 5 15 \( 3^2 \cdot 5 =45 \)
4 7 28 \( 4^2 \cdot 7 =112 \)
5 8 40 \( 5^2 \cdot 8 = 200 \)
6 6 36 \( 6^2 \cdot 6 = 216 \)
7 4 28 \( 7^2 \cdot 4 =196 \)
Totales 30 147

5. Completa la fila de los totales sumando todos los valores de esa columna

Días que queremos irnos de viaje Frecuencia absoluta

Columna de la media

\( x_i \cdot n_i \)

Columna de la varianza

\(x_i^2 \cdot n_i \)

3 5 15 \( 3^2 \cdot 5 =45 \)
4 7 28 \( 4^2 \cdot 7 =112 \)
5 8 40 \( 5^2 \cdot 8 = 200 \)
6 6 36 \( 6^2 \cdot 6 = 216 \)
7 4 28 \( 7^2 \cdot 4 =196 \)
Totales 30 147 769

6. Calcula la varianza dividiendo el total de la columna para la varianza entre el tamaño de la muestra y restándole la media al cuadrado

Días que queremos irnos de viaje Frecuencia absoluta

Columna de la media

\( x_i \cdot n_i \)

Columna de la varianza

\(x_i^2 \cdot n_i \)

3 5 15 \( 3^2 \cdot 5 =45 \)
4 7 28 \( 4^2 \cdot 7 =112 \)
5 8 40 \( 5^2 \cdot 8 = 200 \)
6 6 36 \( 6^2 \cdot 6 = 216 \)
7 4 28 \( 7^2 \cdot 4 =196 \)
Totales 30 147 769

\( \sigma^2 = \displaystyle \frac{769}{30} -4.9^2 =1.62 \)

7. Calcula la desviación típica haciendo la raíz cuadrada de la varianza

Días que queremos irnos de viaje Frecuencia absoluta

Columna de la media

\( x_i \cdot n_i \)

Columna de la varianza

\(x_i^2 \cdot n_i \)

3 5 15 \( 3^2 \cdot 5 =45 \)
4 7 28 \( 4^2 \cdot 7 =112 \)
5 8 40 \( 5^2 \cdot 8 = 200 \)
6 6 36 \( 6^2 \cdot 6 = 216 \)
7 4 28 \( 7^2 \cdot 4 =196 \)
Totales 30 147 769

\( \sigma = \displaystyle \sqrt{1.62}=1.27 \)

Si los datos están agrupados en intervalos tienes que utilizar las marcas de clase en vez de las modalidades, igual que en el cálculo de la media.

Lectura facilitada

Primero se calcula la varianza.

Para calcular la desviación típica tienes que hacer 

la raíz cuadrada de la varianza. \(  \sqrt{\sigma^2}\)

Para calcular la varianza añadimos una columna nueva a la tabla de frecuencias.

Multiplicamos el cuadrado de cada modalidad por su frecuencia absoluta \( x_i ^2 \cdot n_i \)

Recuerda que la modalidad son las respuestas que tienes.

Luego sumaremos los valores de la columna nueva

y dividimos el resultado entre el tamaño de la población.

Por último, restamos el cuadrado de la media.

¿Por qué se hacen esos cálculos?

¿Quieres saber por qué hay que hacer todas esas cuentas para calcular la varianza y la desviación media?

Con estas medidas pretendes averiguar si los valores que toma la variable están cerca o lejos de la media.

Si le restas a la media el valor de la variable obtienes la distancia a la que se encuentra.

\( \overline{x} -x_i \)

Pero cuando el valor es más pequeño que la media sale positivo y cuando el valor es mayor sale negativo, y si sumas los resultados se cancelan unos con otros y no te sirve el resultado.

Para evitar ese problema, antes de realizar la suma elevas el resultado al cuadrado y obtienes siempre un número positivo.

\( \left( \overline{x} -x_i \right) ^2\)

La varianza se define como la media de todas esas distancias al cuadrado. Por tanto, para calcularla tienes que multiplicar cada distancia por su frecuencia, sumar y dividir por el tamaño de la muestra.

\( \sigma^2 = \frac{\Sigma \left( \overline{x}-x_i \right) ^2 \cdot n_i}{N} \)

Para realizar los cálculos esta fórmula no es muy apropiada, pero desarrollando su expresión se obtiene otra que resulta más sencilla de utilizar.

\( \sigma^2 = \frac{\Sigma  x_i ^2 \cdot n_i}{N}-\overline{x}^2 \)

Si te fijas esta es la fórmula que hemos usado para calcular la varianza.

Por último, si quieres una fórmula para calcular la desviación típica sólo tienes que hacer la raíz cuadrada de la varianza:

\( \sigma =\displaystyle \sqrt{\displaystyle \frac{\Sigma  x_i ^2 \cdot n_i}{N}-\overline{x}^2} \)

4. ¡No te desvíes!

Rétor dice...¡Anímate a elegir más de una de las siguientes opciones de esta actividad! En cada una de ellas descubrirás las características y la utilidad de los desviación típica para interpretar datos de una encuesta. 

Opción A: Calcula tú la desviación típica paso a paso

Vamos a calcular la desviación típica en un ejercicio muy parecido.

Días que queremos irnos de viaje Frecuencia absoluta
2 1
3 4
4 4
5 1
Totales 10

Lo primero es completar la tabla con la columna que usamos para la media (que vamos a llamar Columna de la media) y una nueva columna que llamaremos Columna de la varianza.

Dale al botón empezar y sigue los pasos que se indican.

https://www.geogebra.org/m/hyq6v4jc (Ventana nueva)

REA_Andaluc%EDa,https%3A//www.geogebra.org/m/hyq6v4jc,GG_MAT3ESO_REA01_VARIANZARECUERDA_V01,1,Autor%EDa

Opción B: Calcula la desviación típica sin ayuda

Calcula la desviación típica de este ejemplo:

Dinero que queremos gastar en el viaje Marca de clase Frecuencia
[0,200) 100 6
[200,400) 300 9
[400,600) 500 12
[600,800) 700 3
Totales 30

Retroalimentación

La desviación típica vale 183.30 €

Si no te ha salido eso puedes ver cómo se calcula avanzando en esta presentación

1. Añade una columna para calcular la media

Dinero que queremos gastar en el viaje Marca de clase Frecuencia

Columna para la media

\( x_i \cdot n_i \)

[0,200) 100 6 600
[200,400) 300 9 2700
[400,600) 500 12 6000
[600,800) 700 3 2100
Totales 30 11400

2. Calcula la media

Dinero que queremos gastar en el viaje Marca de clase Frecuencia

Columna para la media

\( x_i \cdot n_i \)

[0,200) 100 6 600
[200,400) 300 9 2700
[400,600) 500 12 6000
[600,800) 700 3 2100
Totales 30 11400

Divide el total de la columna de la media entre el tamaño de la población:

\( \overline{x}=\displaystyle \frac{11400}{30}=380 \quad € \)

3. Añade una columna para calcular la varianza

Dinero que queremos gastar en el viaje Marca de clase Frecuencia

Columna para la media

\( x_i \cdot n_i \)

Columna para la varianza

\(x_i ^2 \cdot n_i \)

[0,200) 100 6 600 60000
[200,400) 300 9 2700 810000
[400,600) 500 12 6000 3000000
[600,800) 700 3 2100 1470000
Totales 30 11400 5340000

4. Calcula la varianza

Dinero que queremos gastar en el viaje Marca de clase Frecuencia

Columna para la media

\( x_i \cdot n_i \)

Columna para la varianza

\(x_i ^2 \cdot n_i \)

[0,200) 100 6 600 60000
[200,400) 300 9 2700 810000
[400,600) 500 12 6000 3000000
[600,800) 700 3 2100 1470000
Totales 30 11400 5340000

Divide el total de la columna de la varianza entre el tamaño de la población y réstale la media al cuadrado.

\( \sigma^2=\displaystyle \frac{5340000}{30}-380^2=33600 \quad €^2 \)

5. Calcula la desviación típica

Haz la raíz cuadrada de la varianza.

\(\sigma = \sqrt{33600}=183.30 € \)

Opción C: Analiza y completa

Lea y complete

Observa los datos que hemos recogido en un par de encuestas hechas a 12 alumnos de 4º ESO A y a 12 alumnos de 4º ESO B.

Le hemos preguntado el número de días que les gutaría irse de viaje.

4º ESO A (los números indican la cantidad de días que cada alumno quisiera irse)

2, 6, 7, 2, 3, 8, 7, 4, 8, 2, 3, 8.

4º ESO B (los números indican la cantidad de días que cada alumno quisiera irse)

5, 3, 6, 5, 4, 5, 7, 4, 6, 5, 6, 4.

Agrupando los datos en una tabla de frecuencias y realizando los diagramas de barras hemos obtenido:

4º ESO A
Número de días Frecuencia
2 3
3 2
4 1
5 0
6 1
7 2
8 3
Total 12
4 eso a
4º ESO B
Número de días Frecuencia
2 0
3 1
4 3
5 4
6 3
7 1
8 0
Total 12
4 eso b

Sin realizar nínguna cuenta completa el siguiente texto:

La media de en los dos grupos es 5 días. En 4º ESO A hay respuestas más de la media, por eso, su desviación típica es y vale días. En 4º ESO B las respuestas son más a la media, por eso, su desviación típica es y vale días.

Habilitar JavaScript

Opción D: Obtén los datos, calcula y analiza

Es tu turno de elaborar una tabla con datos que hayas obtenido entre tus compañeros y calcular la desviación típica.

Debes hacer lo siguiente:

  1. Pregunta a 10 personas (compañeros de otra clase, familiares o amigos) el número de días que les gustaría irse de viaje.
  2. Elabora una tabla con las columnas necesarias para el cálculo de la media y la desviación típica en tu cuaderno.
  3. Analiza lo bien que la media representa las respuestas de todos fijándote en el valor que has obtenido de la desviación típica.
  4. Compara tus resultados con los obtenidos por dos compañeros de clase fijándote en los valores de la media y de la desviación típica que habéis obtenido.

Clavis dice ¡No pierdas la perspectiva!

Aunque vimos que las medidas de tendencia central son muy cómodas, has podido comprobar que, en ocasiones, reducirlo todo a un número nos hace perder la perspectiva de la realidad. Las medidas de dispersión nos ayudan a matizar ese número que resume. Debes tener esto en cuenta para cuando te enfrentes a la tarea final.