1. Primeros pasos
Espacio muestral
Definición.- El espacio muestral E asociado a un experimento aleatorio es el conjunto de resultados elementales que pueden obtenerse en dicho experimento. El conjunto formado por uno o varios resultados elementales recibe el nombre de Suceso. Como conjuntos que son los sucesos, podemos efectuar las mismas operaciones entre ellos, como por ejemplo, la unión, la intersección y el suceso complementario.
Ideas previas: Ya debemos saber de situaciones de aprendizaje anteriores, cómo conseguir los conjuntos unión, intersección y contrario, no obstante vamos a recordarlos brevemente:
- Conjunto unión: Se representa por $A\cup B $ y está formado por los elementos que pertenecen a A o a B, lógicamente sin repetirlos, si un elemento pertenece al mismo tiempo a A y a B solo se pone una vez en el conjunto unión.
- Conjunto intersección: Se representa por $A\cap B $ y está formado por los elementos que pertenecen a A y a B al mismo tiempo, es decir sólo contiene los elementos que pertenecen a los dos conjuntos simultáneamente.
- Conjunto contrario: Se representa habitualmente como $\bar A $, aunque puede encontrarse en otros libros o tratados de otras dos formas: $A'$ o $A^{C}$ y está formado por el resto de elementos del espacio muestral que no pertenecen a A.
Ejemplo. El espacio muestral asociado a un experimento aleatorio es E = {a, b, c, d, e, f, g}. Se definen los sucesos A, B y C de la siguiente manera:
A = {a, b, c} B = {b, e, f, g} C = {a, b, e, g}.
Si notamos por $\cup, \cap,$ a la unión e intersección de sucesos y al suceso complementario de A, lo notamos por $\bar{A};$ averigua la composición de los siguientes sucesos:
a) $A\cup B $
b) $A\cap C $
c) $A\cap B\cap C $
d) $\bar A\cup C $
e) $\bar B\cap\bar C $
f) $\bar A\cup \bar C $
Solución:
E = {a, b, c, d, e, f, g};
A = {a, b, c} B = {b, e, f, g} C = {a, b, e, g}.
a) $A\cup B $={a, b, c, e, f, g}
b) $A\cap C $={a, b}
c) $A\cap B\cap C $={b}
d) $\bar A\cup C $={a, b, d, e, f, g}
e) $\bar B\cap\bar C $={c, d}
f) $\bar A\cup \bar C $={c, d, e, f, g}
Probabilidad - Frecuencia relativa
Ideas previas: Como ya hemos visto en los apartados anteriores, todos tenemos una intuición probabilística que nos indica con mucha frecuencia la probabilidad correcta, sin embargo, no siempre es tan sencillo. La regla de Laplace nos indica que en el caso en que todos los sucesos elementales tengan la misma probabilidad, podemos calcular la probabilidad de un suceso dividiendo el número de casos favorables entre el número de casos posibles, por eso cuando en una bolsa opaca tenemos dos bolas rojas y tres blancas que sean del mismo tamaño y características, podremos calcular la probabilidad de sacar una bola blanca o roja dividiendo el número de casos favorables entre el número de casos posibles, así podemos concluir:
$P(R)={\Large{\frac{2}{5}}}$
$P(B)={\Large{\frac{3}{5}}}$
Regla de Laplace: $P(A)={\Large{\frac{\text{Nº de casos favorables}}{\text{Nº de casos posibles}}}}$
Pero ojo que esto no ocurre siempre, como veremos en el ejemplo siguiente, es condición indispensable para poder aplicar la regla de Laplace que las probabilidades de los sucesos elementales sea la misma y esto no ocurre siempre.
Ejemplo. Se lanzan dos dados y anotamos los puntos de las caras superiores. Sean los sucesos A = {la suma de las puntuaciones es 5} y B = {las dos puntuaciones son números primos}. Halla las probabilidades de los siguientes sucesos:
a) $A$
b) $B$
c) $A\cup B$
d) $A\cap B$
Solución:
Si en este problema buscamos el espacio muestral, es decir los resultados posibles, encontraremos que el menor valor que podemos obtener es el 2, sacando un uno en cada dado y el máximo 12 sacando un seis en cada dado. Por tanto el espacio muestral del experimento sería:
$E=\{2,3,4,5,6,7,8,9,10,11,12\}$
Podemos fijarnos en estos valores y vemos que hay más números pares que impares, y concluir erróneamente que la probabilidad de obtener un número par es mayor que la de obtener un número impar, hay once posibles resultados y seis son pares, podríamos decir que la probabilidad de sacar par sea:
$P(P)={\Large{\frac{\text{Nº de casos favorables}}{\text{Nº de casos posibles}}}}={\Large{\frac{6}{11}}}$
¡Pero esto es un error! ¿Por qué?
Porque esos sucesos no son equiprobables.
Para obtener sucesos elementales equiprobalbes, tenemos que descender en la estructura del problema, si consideramos todos los valores posibles de cada dado y los asociamos dos a dos, entonces todas las probabilidades si que serán la misma, cada pareja de valores tiene una probabilidad de salir de un caso de 36 posibles (seis por seis), pero muchos de esos casos aportan el mismo valor como suma de sus caras, por ejemplo, sacar dos solo se puede obtener sacando un uno en cada dado, con el par (1,1), sin embargo sacar siete como suma de los dados puede obtenerse con muchas parejas, en concreto con todas estas:
(1,6); (2,5); (3,4); (4,3); (5,2); (6,1)
Lo que significa que sacar un 7 como suma de los dados es seis veces más probable que sacar un 2.
Por todo esto y teniendo en cuenta que todos los resultados son ahora equiprobables, es decir, tienen la misma posibilidad de salir, cuando los consideramos como parejas de dos dados (a,b), con a y b entre 1 y 6 y que el orden en los resultados implican sucesos distintos, (1,4) y (4,1) son sucesos distintos entre sí. Estaremos de acuerdo que en total habrá $6·6=36$ resultados posibles. Por tanto, la probabilidad en este experimento la podemos calcular como el cociente entre el número de Casos Favorables y el número total de Casos Posibles. A esta ley la conocemos con Regla de Laplace, en honor a su autor.
En cada apartado pedido damos dos pasos, primero detectar las parejas que son favorables al ejercicio y luego aplicar la regla de Laplace:
a) $A$={(1,4),(2,3),(3,2),(4,1)} $ \rightarrow P(A)={\Large{\frac{4}{36}}}={\Large{\frac{1}{9}}}$
b) $B$={(1,1),(1,2),(1,3),(1,5),(2,1),(2,2),(2,3),(2,5),(3,1),(3,2),(3,3),(3,5),(5,1),(5,2),(5,3),(5,5)} $ \rightarrow P(B)={\Large{\frac{16}{36}}}={\Large{\frac{4}{9}}}$
c) $A\cup B$={(1,1),(1,2),(1,3),(1,4),(1,5),(2,1),(2,2),(2,3),(2,5),(3,1),(3,2),(3,3),(3,5),(4,1),(5,1),(5,2),(5,3),(5,5)} $ \rightarrow P(A\cup B)={\Large{\frac{18}{36}}}={\Large{\frac{1}{2}}}$
d) $A\cap B$={(2,3),(3,2)} $ \rightarrow P(A\cap B)={\Large{\frac{2}{36}}}={\Large{\frac{1}{18}}}$
Técnicas de recuento
Ideas previas: Todo lo necesario para este apartado ya lo hemos estudiado en la primera situación de aprendizaje del curso, "Más coches que matrículas" donde se hizo un estudio concienzudo sobre las técnicas de recuento. Estas técnicas son muy importantes para determinar tanto los casos favorables como los casos posibles de un problema de probabilidad, cuantificar esos dos valores nos llevará a resolver el problema con una simple división. Por este motivo esas técnicas son tan importantes en probabilidad.
Ejemplo. Javier ha encontrado cuatro huevos de pavo real. Cree que lo más probable es que sean dos machos y dos hembras, ya que la probabilidad de ser macho o hembra es la misma. ¿Es cierto o se equivoca?
Solución:
Notamos por H y M, a los huevos que dan lugar a Hembra y Macho, respectivamente. Por tanto, 4 huevos pueden dar lugar a los siguientes resultados:
- Los casos en los que los 4 huevos tienen el mismo sexo son únicos: HHHH o MMMM, se trata de una combinación de cuatro elementos tomados de cuatro en cuatro, o de cero en cero, según a quién consideremos: En cada caso tendremos:
$\left (\begin {array} {c} 4 \\ 0\end {array} \right)=\left (\begin {array} {c} 4 \\ 4\end {array} \right)={\Large{\frac{4!}{4! · 0!}}}=1$
- Los casos que tienen un huevo de un sexo y tres del otro son los siguientes, recordad que simplemente debemos ir desplazando el lugar ocupado por el huevo de diferente sexo al lugar adyacente hasta llegar desde el primer lugar al último, consideramos aquí ambos casos uno M con tres H o uno H con tres M:
HMMM
MHMM
MMHM
MMMH
MHHH
HMHH
HHMH
HHHM
En cualquier caso, el recuento nos lo dan las combinaciones de cuatro elementos tomados de tres en tres o de uno en uno:
$\left (\begin {array} {c} 4 \\ 3\end {array} \right)=\left (\begin {array} {c} 4 \\ 1\end {array} \right)={\Large{\frac{4!}{1! · 3!}}}=4$
- Los casos que tienen dos huevos de cada sexo los podemos poner de entrada separados dos a la derecha y dos a la izquierda e ir desplazando hacia el otro lado de uno en uno hasta llegar al final:
HHMM
HMHM
HMMH
MHHM
MHMH
MMHH
En este caso se trata de combinaciones de cuatro elementos tomados de dos en dos, con lo que el recuento sería:
$\left (\begin {array} {c} 4 \\ 2\end {array} \right)={\Large{\frac{4!}{2! · 2!}}}={\Large{\frac{4·3·2·1}{2·1 · 2·1!}}}=3·2=6$
Como vemos, hay 6 casos en los que la familia tiene 2 hembras y 2 machos. La probabilidad por tanto será igual a:
$P_1={\Large{\frac{6}{16}}}={\Large{\frac{3}{8}}}$.
Sin embargo hay 8 casos en los que hay 3 pavos de un sexo y 1 del otro. Esta posibilidad, por tanto, será más factible, siendo su probabilidad:
$P_2={\Large{\frac{8}{16}}}={\Large{\frac{1}{2}}}$.
Diagramas de árbol
Ideas previas: Un diagrama de árbol, es una técnica de representación gráfica de un problema que puede tener diferentes opciones. Es la representación de los posibles resultados de un experimento que consta de diversos pasos. En un diagrama de árbol realizamos primero un experimento aleatorio y representamos sus finitas posibilidades partiendo de un mismo nodo que por medio de una linea nos lleva a cada una de estas posibilidades, en dichas lineas colocamos la probabilidad de cada posibilidad. Después, de cada uno de los resultados posibles salen diferentes lineas que representan un segundo experimento, igualmente con sus probabilidades sobre la linea. De esta forma tenemos una visual gráfica y completa de todas las probabilidades, donde es muy importante, que la suma de todas las probabilidades que salen de un mismo nodo sea 1. Lo veremos en el siguiente ejemplo concreto.
Ejemplo: En un concurso hay dos bolsas. En la bolsa A hay 3 bolas verdes y 2 rojas y en la bolsa B hay 7 bolas verdes, 3 bolas negras y 5 bolas rojas. Tienes que elegir una bolsa y sacar una bola roja para ganar un premio. Expresa el problema por medio de un diagrama de árbol y cuantifica cada una de las probabilidades implicadas en el árbol.
Solución:

En este caso la interpretación del problema es sencilla, primero elegimos una de las dos urnas que consideramos iguales y esa elección tendrá una probabilidad igual para ambos casos, por eso en las primeras líneas que llevan a Urna A y Urna B ponemos una probabilidad de $\Large{\frac{1}{2}}$, mientras que en las líneas que salen de cada urna y llevan a los colores que podemos obtener de las bolas extraídas, los valores de la probabilidad están afectados por el contenido de cada urna. La lógica y nuestra intuición probabilística mencionada en el apartado anterior nos indica acertadamente que debemos aplicar la regla de Laplace dado que la probabilidad de elegir una bola concreta de entre todas es la misma para cualquier bola, por eso en la primera urna que hay tres bolas verdes y dos rojas, las probabilidades respectivas de sacar una bola de color roja es $\Large{\frac{3}{5}}$ y la de sacar una bola verde $\Large{\frac{2}{5}}$, en cada caso el cociente de los casos favorables entre los casos posibles. Finalmente rellenamos también las probabilidades de las bolas de la segunda urna, donde hay 15 bolas en total con la distribución de siete verdes, tres negras y cinco rojas, y por tanto las probabilidades, aplicando de nuevo la regla de Laplace, son respectivamente: $\Large{\frac{7}{15}}$; $\Large{\frac{3}{15}}$ y $\Large{\frac{5}{15}}$
Puede comprobarse fácilmente que la suma de todas las probabilidades que salen de cualquiera de los nodos es uno:
${\Large{\frac{1}{2}}}+{\Large{\frac{1}{2}}}={\Large{\frac{1+1}{2}}}=1$
${\Large{\frac{3}{5}}}+{\Large{\frac{2}{5}}}={\Large{\frac{3+2}{5}}}=1$
${\Large{\frac{7}{15}}}+{\Large{\frac{3}{15}}}+{\Large{\frac{5}{15}}}={\Large{\frac{7+3+5}{15}}}=1$
Tablas de contingencia
Ideas previas: Las tablas de contingencia ya las hemos estudiado en la situación de aprendizaje número dos de este tercer bloque "¿Causalidad o casualidad?" y aunque allí las tratábamos como variables estadísticas, podemos entenderlas aquí asociando la frecuencia relativa a la probabilidad de cada supuesto. En este caso el problema consiste en asignar las entradas horizontales a las posibilidades de uno de los experimentos y las verticales al otro, son muy comunes en los casos de que cada experimento tenga dos posibilidades como en el ejemplo que se describe a continuación. En este caso no hay un experimento que siga al otro como en el caso del diagrama de árbol que si tiene una secuencia lógica, primero elegimos una urna y luego sacamos una bola, en estos casos podremos entrar primero por la horizontal o por la vertical. La tabla se construye escribiendo en su interior todas las probabilidades, donde cada celda nos indica de que probabilidad se trata, de manera que si nuestro caso tuviera dos posibles variables $A$ y $B$ por ejemplo, con dos valores cada una $A \text{ y } \bar A$ y $B \text{ y } \bar B$, la tabla requeriría introducir las siguientes probabilidades:
$B$ | $\bar{B}$ | TOTALES | |
$A$ | $P \left( A \cap B \right)$ | $P \left( A \cap \bar{B} \right)$ | $P \left( A \right)$ |
$\bar{A}$ | $P \left( \bar{A} \cap B \right)$ | $P \left( \bar{A} \cap \bar{B} \right)$ | $P \left( \bar{A} \right)$ |
TOTALES | $P \left( B \right)$ | $P \left( \bar{B} \right)$ | 1 |
Ejemplo. Se sabe que el 80% de los visitantes de un determinado museo son andaluces y que el 55% son andaluces y adultos. Además, el 17% de los visitantes no son andaluces pero si adultos. Se elige, al azar, un visitante del museo. Realiza una tabla de contingencia para determinar cada una de las probabilidades.
Solución:
Realizamos la tabla de contingencia:
$A$=Andaluz | $\bar{A}$= No Andaluz | TOTALES | |
$D$=Adulto | 0.55 | 0.17 | 0.72 |
$\bar{D}$= No Adulto | 0.25 | 0.03 | 0.28 |
TOTALES | 0.8 | 0.20 | 1 |
El proceso para rellenar esta tabla es el siguiente: primero colocamos las probabilidades dadas por el enunciado, son las escritas en color negro, el total de andaluces es el 80% y por tanto es 0.8; la intersección de andaluces y adultos es del 0.55 (55%) y la celda confluencia de no andaluz y adulto es 0.17 (17%), Estos son los datos del problema a los que añadimos uno que es evidente y siempre debe cumplirse, la confluencia de totales y totales debe ser la unidad, es 1 porque lo engloba a todo. Bien pues los datos que están en rojo se calculan simplemente por diferencia y suma:
- El total de adultos debe ser la suma de las dos celdas de la izquierda, $0.55+0.17=0.72$
- El total de no adultos será la diferencia entre 1 y el valor calculado anteriormente: $1-0.72=0.28$
- La confluencia de No adulto y Andaluz debe ser la diferencia entre el total andaluz y andaluz adulto: $0.8-0.55=0.25$
- El total de no andaluz se obtiene por diferencia entre el total-total y el total Andaluz: $1-0.8=0.20$
- Y finalmente la confluencia entre No andaluz y No adulto podemos hacerlo de dos formas y comprobar que sale lo mismo, podemos restar al total No andaluz el adulto no andaluz: $0.20-0.17=0.03$ que sale lo mismo que restar al total No adulto el andaluz no adulto: $0.28-0.25=0.03$