Resumen

Actividad
Un muestreo se dice que es aleatorio o probabilístico cuando todos los individuos de la muestra se eligen al azar, de modo que todos tienen la misma probabilidad de ser elegidos.
Sólo este método de muestreo nos asegura la representatividad de la muestra extraída y es, por tanto, el más recomendable.

Actividad
El muestreo con reemplazamiento es aquel en el que un elemento puede ser seleccionado más de una vez en la muestra. Para ello se extrae un elemento de la población, se observa y se devuelve a la población, por lo que de esta forma se pueden hacer infinitas extracciones de la población aún siendo ésta finita.
El muestreo sin reemplazamiento es el que se realiza sin devolver los elementos extraídos a la población hasta que no se hayan extraído todos los elementos de la población que conforman la muestra.

Actividad
Si te acuerdas de la unidad anterior, cuando en una población estudiábamos una determinada característica o variable que sólo podía tomar dos valores, éxito o fracaso, la población seguía una distribución binomial.
En esta población, la proporción de individuos que poseen esa característica la llamamos p y en todas las muestras de tamaño n que podamos extraer de la población, llamaremos al porcentaje de individuos que tengan esa característica.
Los distintos valores de que dependen de las muestras elegidas, dan lugar a una variable aleatoria que se representa por
y que se llama estadístico.
Llamamos distribución muestral de proporciones a la distribución de los valores de .
La variable aleatoria tiene las siguientes características:
a) La media es: .
b) La desviación típica es: , siendo
.
c) Para muestras donde n≥30, la distribución de se aproxima a una distribución normal
.

Importante
La distribución en el muestreo de la media tiene las siguientes características:
a. Media: Tiene la misma media que la población μ.
b. Desviación típica: La desviación típica de esta distribución es, siendo n el tamaño de las muestras.
c. Si la población no sigue una distribución normal, pero n ≥ 30, la distribución de las medias muestrales se aproxima a una distribución normal, esta aproximación será mejor cuanto mayor sea n.

Importante
La variable aleatoria T tiene las siguientes características:
a. Media: n·μ, donde n es el número de individuos de la muestra.
b. Desviación típica :
c. Si la población no sigue una distribución normal, pero n ≥ 30, la distribución de T se aproxima a una normal .

Importante
El Teorema Central del Límite nos indica que si tenemos una serie de variables aleatoria independientes (el valor de una no influye en la otra) e idénticamente distribuidas (todas las variables tienen la misma distribución y por tanto, los mismos parámetros), la distribución de la suma de esas variables (si el número de variables que se suman es suficientemente grande) se aproxima a una Distribución Normal.
Lo precisamos todavía más, porque no se aproxima a una normal cualquiera sino que podemos saber a cuál:
Si tenemos n variables aleatorias X1, X2, X3,..., Xn todas ellas independientes entre sí y todas ellas con media µ y desviación típica σ, la suma de esas variables genera una nueva variable aleatoria que se aproximará a una distribución Normal de media y desviación típica

La coletilla de si el número es suficientemente grande no es ninguna tontería, pues lo que en realidad se aproxima es el límite de la suma de las variables cuando el número de variables tiende a infinito. O sea, que para que esto funcione, el número de variables o de datos que se han de sumar tiene que ser grande. A efectos prácticos nos vale con que al menos haya 30 datos, es decir, para aplicar este teorema tiene que cumplirse que n ≥ 30.
Ojo, fíjate que en ningún momento estamos diciendo que la variable X tenga que ser una distribución normal, sino que sea lo que sea la distribución de la variable en la población, la suma de muchas observaciones se va a aproximar a una normal.
Si ya de por sí la población de partida sigue una distribución normal, ese resultado se cumple siempre, sea el tamaño el que sea. No importa el valor de n.