4. Muestreo

1. Qué es el muestreo probabilístico

El muestreoproceso mediante el cual se elige una muestra, es una herramienta esencial en la estadística y la investigación científica porque permite obtener información sobre una población amplia a partir de una muestra más manejable. Esto no solo reduce costos y tiempo, sino que también facilita la realización de estudios que serían imposibles de llevar a cabo si se intentara incluir a toda la población. Un muestreo adecuado permite hacer inferencias precisas y tomar decisiones informadas basadas en datos representativos y confiables.

El muestreo probabilístico es una técnica utilizada para seleccionar una muestra de una población de manera que cada individuo tenga la misma probabilidad  de ser incluido. Esta metodología garantiza que la muestra sea representativa de la población, permitiendo generalizar los resultados obtenidos a toda la población con un nivel conocido de confianza y error. El muestreo probabilístico es crucial en estudios donde se busca minimizar el sesgo y obtener resultados precisos y confiables.

El sesgo en el muestreo ocurre cuando ciertos individuos o grupos dentro de la población tienen más o menos probabilidad de ser incluidos en la muestra. Este sesgo puede distorsionar los resultados del estudio y llevar a conclusiones incorrectas.

Imaginemos una encuesta que busca evaluar las opiniones de los ciudadanos sobre una nueva política gubernamental. La encuesta se realiza exclusivamente por teléfono, y el investigador decide usar un directorio telefónico tradicional para seleccionar a los participantes, es decir, utiliza un directorio telefónico impreso que contiene principalmente números de teléfonos fijos. Muchos hogares modernos, especialmente aquellos con personas más jóvenes, han dejado de usar teléfonos fijos y se han cambiado exclusivamente a teléfonos móviles.

Como consecuencia, la muestra no es representativa de toda la población y decimos que está sesgada. Los individuos que todavía utilizan teléfonos fijos tienden a ser mayores y pueden tener diferentes opiniones y experiencias en comparación con las personas más jóvenes que usan principalmente teléfonos móviles. Como resultado, las opiniones de los jóvenes y otros grupos demográficos que no están bien representados en el directorio de teléfonos fijos se excluyen o se subrepresentan.

Otro ejemplo visual de la importancia de considerar muestras representativas de una población se puede obtener a partir de una imagen y del hecho de que nuestro cerebro puede inferir objetos incluso cuando solo se ven parcialmente. Este fenómeno, conocido como completamiento perceptivo o constancia perceptiva, ocurre cuando el cerebro utiliza información visual previa y pistas contextuales para "rellenar" los detalles que faltan, creando una percepción completa del objeto.

Imaginemos una imagen compleja y detallada, como una fotografía.

2. Tipos de muestreos

Muestreo Aleatorio Simple

Proceso de Selección

  1. Definición de la Población:
    • Identificar claramente la población de estudio. Esta puede ser un grupo de personas, objetos, eventos, etc., dependiendo del objetivo de la investigación.
  2. Determinación del tamaño de la muestra:
    • Decidir cuántos individuos serán incluidos en la muestra. Esto se puede determinar utilizando fórmulas estadísticas que consideran el tamaño de la población, el nivel de confianza deseado y el margen de error aceptable.
  3. Enumeración de la Población:
    • Asignar un número único a cada individuo en la población. Esto facilita el proceso de selección aleatoria.
  4. Selección Aleatoria:
    • Utilizar un método de selección aleatoria para elegir a los individuos que formarán parte de la muestra. Esto puede hacerse mediante el uso de generadores de números aleatorios, tablas de números aleatorios, o sorteos.

Ventajas:

  1. Simplicidad y facilidad de ejecución:
    • El proceso de muestreo aleatorio simple es fácil de entender y ejecutar, ya que no requiere procedimientos complejos.
  2. Representatividad:
    • Dado que cada individuo tiene la misma probabilidad de ser seleccionado, la muestra tiende a ser representativa de la población, permitiendo inferencias válidas.
  3. Imparcialidad:
    • La selección aleatoria reduce el riesgo de sesgo del investigador, asegurando que la muestra no esté influenciada por preferencias personales.

Desventajas:

  1. Necesidad de una lista completa de la Población:
    • Requiere una lista completa y actualizada de todos los individuos de la población, lo cual puede ser difícil de obtener en algunos casos.
  2. Poco eficiente para Poblaciones grandes:
    • En poblaciones muy grandes, el proceso de enumeración y selección aleatoria puede ser poco práctico y costoso.
Muestreo aleatorio simple.
Imagen de elaboración propia. Muestreo aleatorio simple. (CC BY-NC-SA)

Muestreo Aleatorio Sistemático

Definición y Proceso de Selección:

El muestreo sistemático es una técnica de muestreo probabilístico en la que los elementos de la población se seleccionan a intervalos regulares a partir de un punto de partida aleatorio. Esta técnica es eficiente y fácil de implementar, especialmente útil cuando se trabaja con grandes poblaciones ordenadas.

Proceso de Selección:

  1. Definición de la Población:
    • Identificar claramente la población de estudio. Esta puede ser un grupo de personas, objetos, eventos, etc., dependiendo del objetivo de la investigación.
  2. Determinación del tamaño de la muestra:
    • Decidir cuántos individuos serán incluidos en la muestra. Este tamaño se determina utilizando fórmulas estadísticas que consideran el tamaño de la población, el nivel de confianza deseado y el margen de error aceptable.
  3. Calculo del intervalo de selección (k):
    • Calcular el intervalo de selección (k) dividiendo el tamaño de la población (N) entre el tamaño de la muestra deseada (n): $k = {\Large{\frac{N}{n}}}$​.
  4. Selección del punto de partida:
    • Elegir un punto de partida aleatorio entre 1 y k. Este punto se puede seleccionar utilizando un generador de números aleatorios o una tabla de números aleatorios.
  5. Selección de la muestra:
    • A partir del punto de partida seleccionado, se elige cada k-ésimo individuo en la lista de la población hasta completar el tamaño de la muestra.

Ventajas:

  1. Simplicidad y eficiencia:
    • El muestreo sistemático es fácil de entender y aplicar. Es especialmente útil para poblaciones grandes y listas ordenadas, ya que reduce el esfuerzo de selección aleatoria pura.
  2. Distribución uniforme:
    • Garantiza una distribución uniforme de la muestra a lo largo de la población, evitando la agrupación de elementos.
  3. Economía de tiempo y recursos:
    • Es menos costoso y consume menos tiempo que el muestreo aleatorio simple, ya que no requiere enumerar completamente a la población cada vez que se selecciona un individuo.

Desventajas:

  1. Riesgo de sesgo periódico:
    • Si hay un patrón periódico en la población que coincide con el intervalo de selección, puede introducir un sesgo en la muestra. Por ejemplo, si se está seleccionando empleados de una fábrica y el intervalo coincide con el turno de trabajo, se puede omitir sistemáticamente un grupo particular de trabajadores.
  2. Dependencia de una lista ordenada:
    • Requiere una lista ordenada de la población, lo cual puede no estar siempre disponible o ser práctico de obtener.
Muestreo aleatorio sistemático.
Imagen de elaboración propia. Muestreo aleatorio sistemático. (CC BY-NC-SA)

Muestreo Aleatorio Estratificado

Definición y Proceso de Selección:

El muestreo estratificado es una técnica de muestreo probabilístico en la que la población se divide en subgrupos homogéneos llamados "estratos". Estos estratos se forman en base a una o más características compartidas por sus miembros, como la edad, el género, el nivel educativo, etc. Luego, se selecciona una muestra aleatoria de cada estrato. Esta técnica mejora la precisión y la representatividad de la muestra, especialmente cuando existen diferencias significativas entre los estratos.

Proceso de Selección:

  1. Definición de la Población y Estratificación:
    • Identificar claramente la población de estudio y determinar las características que se usarán para dividir la población en estratos homogéneos.
  2. División en Estratos:
    • Dividir la población total en estratos basados en las características seleccionadas. Cada miembro de la población debe pertenecer a un solo estrato.
  3. Determinación del tamaño de la muestra:
    • Decidir el tamaño total de la muestra y la proporción de cada estrato en la muestra. Esto se puede hacer utilizando dos métodos:
      • Afijación proporcional: El tamaño de la muestra de cada estrato es proporcional al tamaño del estrato en la población.
      • Afijación simple: Se selecciona el mismo número de individuos de cada estrato, independientemente del tamaño del estrato en la población.
  4. Selección Aleatoria en cada Estrato:
    • Realizar un muestreo aleatorio simple dentro de cada estrato para seleccionar los individuos que formarán parte de la muestra final.

Ventajas:

  1. Mayor precisión:
    • Al asegurar que cada subgrupo relevante de la población esté representado en la muestra, se mejora la precisión y la capacidad de generalización de los resultados.
  2. Representatividad mejorada:
    • Garantiza que los estratos importantes de la población estén adecuadamente representados, reduciendo la posibilidad de que algún subgrupo esté infra o sobre representado.
  3. Comparaciones más detalladas:
    • Permite hacer comparaciones más detalladas y precisas entre los diferentes estratos de la población.

Desventajas:

  1. Complejidad administrativa:
    • Requiere información detallada sobre las características de la población y un proceso administrativo más complejo para dividir en estratos y realizar el muestreo dentro de cada uno.
  2. Costo y tiempo:
    • Puede ser más costoso y llevar más tiempo que el muestreo aleatorio simple, especialmente si se requiere recopilar información adicional para la estratificación.

La imagen proporcionada a continuación, ilustra el concepto de muestreo estratificado mostrando cómo se selecciona una muestra representativa de una población dividida en estratos. 

Muestreo estratificado con Afijación proporcional.
Imagen de elaboración propia. Muestreo estratificado con Afijación proporcional.
(CC BY-NC-SA)
  • Estrato 1: De 10 individuos totales, se seleccionaron 2, lo que representa el 20% de este estrato.
  • Estrato 2: De 40 individuos totales, se seleccionaron 8, lo que también representa el 20% de este estrato.
  • Estrato 3: De 50 individuos totales, se seleccionaron 10, lo que igualmente representa el 20% de este estrato.

Proceso Representado:

  • Identificación y división: La población se ha dividido en tres estratos homogéneos basados en una característica relevante.
  • Afijación Proporcional: La muestra se selecciona proporcionalmente en cada estrato. En este caso, el 20% de los individuos en cada estrato ha sido seleccionado para la muestra final.
  • Selección Aleatoria: Dentro de cada estrato, los individuos se seleccionan de manera aleatoria, asegurando que cada uno tenga la misma probabilidad de ser incluido en la muestra.

Muestreo Aleatorio por Conglomerados

Definición y Proceso de Selección:

El muestreo por conglomerados es una técnica de muestreo probabilístico en la cual la población se divide en grupos heterogéneos denominados "conglomerados". A diferencia del muestreo estratificado, donde los estratos son homogéneos, los conglomerados en este método son mini-representaciones de la población total. Luego, se seleccionan algunos conglomerados al azar, y todos los individuos dentro de los conglomerados seleccionados se incluyen en la muestra.

Proceso de Selección:

  1. Definición de la Población y división en conglomerados:
    • Identificar claramente la población de estudio y dividirla en conglomerados. Los conglomerados deben ser heterogéneos internamente pero similares entre sí en términos de la variable de interés.
  2. Selección aleatoria de conglomerados:
    • Elegir aleatoriamente un número de conglomerados de la lista de todos los conglomerados formados.
  3. Incluir todos los individuos en la muestra:
    • Todos los individuos dentro de los conglomerados seleccionados se incluyen en la muestra final.

Ventajas:

  1. Eficiencia y conveniencia:
    • Es particularmente útil cuando es logísticamente difícil o costoso realizar un muestreo en toda la población. Al centrarse en conglomerados específicos, se reduce el costo y el tiempo de recopilación de datos.
  2. Facilidad de implementación:
    • No se requiere una lista completa de toda la población, sino solo una lista de los conglomerados, lo que simplifica el proceso.
  3. Aplicable a grandes poblaciones:
    • Es adecuado para poblaciones grandes y dispersas geográficamente, como regiones o comunidades enteras.

Desventajas:

  1. Menor Precisión:
    • Los resultados pueden ser menos precisos y representar mayor variabilidad en comparación con otros métodos de muestreo probabilístico, ya que los conglomerados pueden no ser perfectamente representativos de la población total.
  2. Dependencia en la Homogeneidad de los Conglomerados:
    • Si los conglomerados no son similares entre sí, puede introducirse un sesgo, reduciendo la efectividad del muestreo.

La imagen proporcionada a continuación, ilustra el concepto de muestreo por conglomerados, mostrando cómo se selecciona una muestra representativa de una población dividida en conglomerados.

Muestreo por Conglomerados.
Imagen de elaboración propia. Muestreo por Conglomerados. (CC BY-NC-SA)

3. Ejemplos

Ejemplo 1. Muestreo aleatorio simple

Encuesta universitaria.
Imagen de elaboración propia generada con Ideogram. Encuesta universitaria. (CC0)

Supongamos que queremos realizar una encuesta sobre la satisfacción de los estudiantes en una universidad. La población de estudio es el total de estudiantes matriculados en la universidad.

  1. Definición de la Población:
    • Todos los estudiantes matriculados en la universidad.
  2. Determinación del tamaño de la muestra:
    • Decidimos encuestar a 200 estudiantes de una población total de 10000 estudiantes.
  3. Enumeración de la Población:
    • Asignamos un número del 1 al 10000 a cada estudiante.
  4. Selección Aleatoria:
    • Utilizamos un generador de números aleatorios para seleccionar 200 números entre el 1 y el 10000. Los estudiantes correspondientes a estos números serán los que formarán parte de la muestra.

El muestreo aleatorio simple es una técnica eficaz para obtener muestras representativas y realizar inferencias válidas sobre una población, siempre que se disponga de una lista completa de la población y se maneje de manera adecuada.

Ejemplo 2. Muestreo aleatorio sistemático

Una fábrica produce 5000 teléfonos móviles diariamente y quiere inspeccionar 250 unidades para asegurar la calidad del producto.

Fábrica de móviles.
Imagen de elaboración propia generada con Ideogram. Fábrica de móviles. (CC0)

Paso 1: Definir la Población. La población es de 5,000 teléfonos móviles producidos en un día.

Paso 2: Determinar el Tamaño de la Muestra. Se decide que se inspeccionarán 250 teléfonos móviles.

Paso 3: Calcular el Intervalo de Selección (k). $k = {\Large{\frac{N}{n}}} = {\Large{\frac{5000}{250}}} = 20$

Paso 4: Selección del Punto de Partida. Se elige aleatoriamente un número entre 1 y 20, digamos que es 15.

Paso 5: Selección de la Muestra. A partir del teléfono móvil 15, se selecciona cada vigésimo teléfono móvil: 15, 35, 55, 75, 95, 115, 135, 155, 175, etc.

Este método asegura que la muestra sea representativa de toda la producción del día, distribuyendo la selección uniformemente a lo largo de la línea de producción y permitiendo detectar problemas de calidad que puedan ocurrir en diferentes momentos del proceso de producción.

Ejemplo 3. Muestreo aleatorio estratificado

Una organización de salud pública quiere realizar un estudio para conocer la opinión de diferentes grupos de edad sobre nuevas políticas de salud. La población objetivo es de 1200 personas.

Paso 1: Definir la Población y Estratificación

La población total de 1200 personas se divide en tres estratos según los segmentos de edad:

  • Estrato 1: 18-29 años (400 personas)
  • Estrato 2: 30-49 años (500 personas)
  • Estrato 3: 50 años y más (300 personas)

Paso 2: Determinar el tamaño de la muestra

Se decide que se encuestarán 300 personas en total.

Paso 3: Afijación proporcional

Se determina el número de personas a encuestar en cada estrato proporcionalmente a su tamaño en la población.

  • Estrato 1: ${\Large{\frac{400}{1200}}} \cdot 300 = 100 \text{ personas}$

  • Estrato 2: ${\Large{\frac{500}{1200}}} \cdot 300 = 125 \text{ personas}$

  • Estrato 3: ${\Large{\frac{300}{1200}}} \cdot 300 = 75 \text{ personas}$

Paso 4: Selección aleatoria en cada estrato

  • Selección aleatoria de 100 personas del Estrato 1.
  • Selección aleatoria de 125 personas del Estrato 2.
  • Selección aleatoria de 75 personas del Estrato 3.

Se obtiene una muestra de 300 personas, representativa de las opiniones sobre políticas de salud en cada segmento de edad.

Ejemplo 4. Muestreo aleatorio por conglomerados

Hospitales.
Imagen de elaboración propia generada con Bing Creator. Hospitales. (CC0)

Una entidad pública de salud quiere evaluar la calidad del servicio en los hospitales de una ciudad que cuenta con 50 hospitales en total.

Paso 1: Definir la Población y Conglomerados

La población objetivo son todos los pacientes de los 50 hospitales en la ciudad. Cada hospital se considera un conglomerado.

Paso 2: Selección Aleatoria de Conglomerados

Se decide evaluar la calidad del servicio en 10 hospitales. Selección aleatoria de 10 hospitales de la lista de 50.

Paso 3: Selección de Individuos en los Conglomerados Seleccionados

Dentro de cada uno de los 10 hospitales seleccionados, se decide encuestar a todos los pacientes dados de alta durante una semana.

La muestra incluye todos los pacientes dados de alta durante una semana en los 10 hospitales seleccionados aleatoriamente. Esto permite evaluar la calidad del servicio en una muestra representativa de hospitales.

4. Elige el muestreo más adecuado

Pregunta

1. Un partido político quiere conocer la opinión de los ciudadanos de una ciudad grande sobre su candidato. La ciudad tiene diferentes barrios con características socioeconómicas variadas.

Respuestas

Muestreo aleatorio sistemático

Muestreo aleatorio estratificado

Muestreo aleatorio por conglomerados

Retroalimentación

Pregunta

2. Una empresa multinacional quiere evaluar la satisfacción de sus empleados en diferentes sedes ubicadas en varios países.

Respuestas

Muestreo aleatorio simple

Muestreo aleatorio por conglomerados

Muestreo aleatorio sistemático

Retroalimentación

Pregunta

3. Un centro comercial quiere saber las preferencias de compra de sus visitantes durante un fin de semana.

Respuestas

Muestreo aleatorio simple

Muestreo aleatorio sistemático

Muestreo aleatorio estratificado

Retroalimentación

Pregunta

4. Un hospital quiere conocer la satisfacción de los pacientes que han sido dados de alta en el último mes.

Respuestas

Muestreo aleatorio por conglomerados

Muestreo aleatorio simple

Muestreo aleatorio estratificado

Retroalimentación

Pregunta

5. Una institución financiera quiere evaluar la calidad del servicio en sus sucursales de diferentes regiones.

Respuestas

Muestreo aleatorio por conglomerados

Muestreo aleatorio simple

Muestreo aleatorio estratificado

Retroalimentación

5. Resuelve y responde. Muestreo estratificado

Resuelve los problemas que se plantean a continuación, e introduce tu respuesta en los huecos correspondientes.

Problema 1

Una agencia de transporte quiere conocer las preferencias de transporte público de los residentes de una ciudad. La ciudad tiene 30000 residentes distribuidos en cinco barios: Barrio A (5000), Barrio B (8000), Barrio C (6000), Barrio D (7000) y Barrio E (4000). Se decide encuestar a 600 residentes en total. El tamaño de la muestra en cada distrito utilizando la afijación proporcional es:

  • Barrio A:  residentes
  • Barrio B:  residentes
  • Barrio C:  residentes
  • Barrio D:  residentes
  • Barrio E:   residentes

 

Problema 2

Una organización ambiental quiere evaluar la calidad del aire en diferentes barrios de una ciudad con una población de 60000 personas, distribuidos en cuatro barrios: Barrio Norte (15000), Barrio Sur (20000), Barrio Este (10000) y Barrio Oeste (15000). Se sabe que se encuestará a 80 personas del Barrio Norte. El tamaño total de la muestra utilizando la afijación proporcional es:  personas.

 

Problema 3

Una compañía de suministros eléctricos quiere estudiar los hábitos de consumo de energía en diferentes zonas urbanas. La muestra incluye 300 hogares en total, distribuidos en tres zonas: Zona A (100 hogares), Zona B (150 hogares) y Zona C (50 hogares). Se sabe que la población total de hogares en la Zona A es de 12000. La población total de hogares en todas las zonas utilizando la afijación proporcional es:  hogares.

 

Habilitar JavaScript

Página 5 de 11

Obra publicada con Licencia Creative Commons Reconocimiento No comercial Compartir igual 4.0

Creado con eXeLearning (Ventana nueva)