3. Variables aleatorias y distribuciones de probabilidad

1. Qué son las distribuciones de probabilidad

Los diferentes modelos de distribución de probabilidad se definen para proporcionar marcos matemáticos que nos permitan comprender, describir y predecir el comportamiento de fenómenos aleatorios en una variedad de contextos. Estas distribuciones son idealizaciones o modelos matemáticos que buscan capturar las características esenciales de las distribuciones de frecuencias relativas observadas en datos reales. Las razones principales para definir y utilizar estos modelos son:

  • Simplificación y abstracción: La realidad es intrínsecamente compleja y multifacética. Los modelos de distribución de probabilidad ofrecen una manera de simplificar esta complejidad, permitiéndonos enfocarnos en los aspectos esenciales de un fenómeno aleatorio. A través de la abstracción, podemos aplicar conceptos teóricos a situaciones prácticas.
  • Predicción y análisis: Al entender cómo se distribuyen los posibles resultados de un proceso o experimento aleatorio, podemos hacer predicciones sobre futuros eventos. Estos modelos permiten calcular probabilidades, evaluar riesgos y tomar decisiones informadas en presencia de incertidumbre.

Ejemplo. Distribución de los pesos de recién nacidos

Este histograma de frecuencias relativas, muestra la distribución de los pesos de 50 niños al nacer.

Diagrama de barras con la distribución de frecuencias relativas de pesos al nacer.
Imagen de elaboración propia. Diagrama de barras. (CC BY-NC-SA)

En el siguiente gráfico, la curva roja representa la distribución de probabilidad normal calculada a partir de la media y la desviación típica de los datos anteriores, permitiendo visualizar cómo la distribución teórica se ajusta a los datos reales.

Comparación de datos reales con distribución normal teórica.
Imagen de elaboración propia. Distribución teórica. (CC BY-NC-SA)

El uso de una distribución de probabilidad para modelar datos empíricos, como la distribución normal en el ejemplo de los pesos al nacer, ofrece varias ventajas significativas:

  • Simplificación y comprensión: La distribución de probabilidad proporciona un resumen simplificado y comprensible de los datos empíricos. Al ajustar una distribución conocida a los datos, se pueden resumir las características importantes de los datos (como la tendencia central y la dispersión) mediante parámetros de la distribución (media y desviación típica para la distribución normal). Esto facilita la interpretación y comunicación de los resultados.
  • Predicción y extrapolación: Una vez que se ha ajustado una distribución de probabilidad a los datos, se puede usar para hacer predicciones sobre eventos futuros o valores no observados dentro del rango de los datos. Por ejemplo, se puede calcular la probabilidad de que el peso al nacer de un niño esté por encima o por debajo de cierto valor crítico, lo cual es crucial para el monitoreo de la salud neonatal.
  • Manejo de incertidumbre: La distribución de probabilidad encapsula la variabilidad y la incertidumbre inherentes en los datos empíricos. Al entender la distribución de los datos, se pueden identificar y cuantificar las fuentes de variabilidad, lo cual es crucial para la gestión de riesgos y la planificación en muchas áreas, como la medicina, la ingeniería y la economía.

2. Variables aleatorias y distribuciones de probabilidad

Una variable aleatoria es un concepto fundamental en la teoría de la probabilidad y estadística que sirve como puente entre los sucesos aleatorios y los números reales. Esencialmente, consiste en asignar un número real a cada posible resultado de un experimento aleatorio. La variable aleatoria puede tomar diferentes valores, cada uno asociado con una probabilidad específica, reflejando la naturaleza incierta del fenómeno que está modelando.

Las variables aleatorias se clasifican en dos tipos principales:

  • Variables aleatorias discretas: Son aquellas que toman valores en un conjunto contable, ya sea finito o infinito numerable. Los ejemplos incluyen el número de caras obtenidas al lanzar monedas múltiples veces, o el número de clientes que llegan a un mostrador en cierto periodo.
  • Variables aleatorias continuas: Son aquellas que pueden tomar cualquier valor numérico dentro de un intervalo. Ejemplos de variables aleatorias continuas incluyen la altura de una persona seleccionada al azar o el tiempo que tarda en llegar un autobús.

La distribución de probabilidad de una variable aleatoria describe cómo se distribuyen las probabilidades entre los diferentes valores que puede tomar la variable. En otras palabras, proporciona un perfil completo de la variabilidad de la variable aleatoria.

Distribuciones de probabilidad discretas

Para variables aleatorias discretas, la distribución de probabilidad se describe a menudo mediante una función de probabilidad, que asigna una probabilidad a cada uno de los posibles valores discretos que la variable aleatoria puede tomar.

Cada posible resultado tiene una probabilidad específica asociada, y la suma de las probabilidades de todos los posibles resultados es igual a 1.

Ejemplo 1. Bolsa con canicas

Bolsa con canicas.
Imagen de elaboración propia. (CC BY-NC-SA)

Imagina que tienes una bolsa con 3 canicas rojas y 2 azules. Si seleccionas una canica al azar, los posibles resultados son rojo o azul, pero la probabilidad no es la misma para ambos. Aplicando la regla de Laplace, que hemos visto en el apartado anterior, la probabilidad de sacar una canica roja es ${\large{\frac{3}{5}}}$ y la de sacar una canica azul es ${\large{\frac{2}{5}}}$

Para representar los sucesos "Roja" y "Azul" con una variable aleatoria, asignaremos valores numéricos a cada color. Digamos que:

$X=1$ representa sacar una canica Roja.
$X=0$ representa sacar una canica Azul.
Ahora, utilizando esta variable aleatoria $X$, podemos reconstruir la tabla y la gráfica de la función de probabilidad para la distribución de sacar una canica de la bolsa.

Esta tabla utiliza la variable aleatoria $X$ para cuantificar los sucesos "Roja" y "Azul" como valores numéricos $1$ y $0$ respectivamente, facilitando el análisis matemático y estadístico de la situación.

Función de probabilidad para la selección de canicas.
Imagen de elaboración propia. Función de probabilidad. (CC BY-NC-SA)


Distribución discreta uniforme

Una distribución discreta uniforme ocurre cuando todos los posibles resultados de un experimento tienen la misma probabilidad de ocurrir. Esto significa que no hay sesgo hacia ningún resultado particular; todos son igualmente probables.

Cómo se define:

  • Dado un conjunto de \(n\) resultados posibles, la probabilidad de cada resultado es \({\large{\frac{1}{n}}}\).
  • La función de probabilidad de una variable aleatoria \(X\) que sigue una distribución uniforme discreta es: \(P(X = x_i) = {\large{\frac{1}{n}}}\), para \(i = 1, 2, \ldots, n\), donde \(x_i\) representa los posibles valores de \(X\) y \(n\) es el número total de resultados posibles.

Ejemplo 2. Lanzamiento de un dado

Supongamos que lanzas un dado justo de 6 caras. El conjunto de posibles resultados es $\{1, 2, 3, 4, 5, 6\}$, y cada resultado tiene una probabilidad de ${\large{\frac{1}{6}}}$ de ocurrir. Este es un ejemplo clásico de una distribución discreta uniforme porque cada cara del dado tiene la misma probabilidad de aparecer en una sola tirada.

En esta tabla y gráfica, cada resultado posible ($xi​$), que representa una de las caras del dado, tiene una probabilidad de ${\large{\frac{1}{6}}}$ de ocurrir, reflejando la naturaleza uniforme de la distribución en este experimento.

Función de probabilidad del lanzamiento de un dado.
Imagen de elaboración propia. Lanzamiento de un dado. (CC BY-NC-SA)

Distribuciones de probabilidad continuas

Las distribuciones de probabilidad continuas se utilizan para modelar situaciones en las que el conjunto de posibles resultados de un experimento es un intervalo de números reales. A diferencia de las distribuciones discretas, donde los resultados posibles son valores específicos, las distribuciones continuas pueden tomar cualquier valor dentro de un rango determinado, con infinitos posibles resultados.

La probabilidad de que una variable aleatoria tome un valor dentro de un intervalo dado es equivalente al área bajo la curva de su función de densidad de probabilidad en ese intervalo. Esta es una propiedad fundamental de cómo se modelan y calculan las probabilidades en el contexto de variables aleatorias continuas.

En las distribuciones de probabilidad continuas, la probabilidad de que la variable aleatoria tome un valor específico exacto es 0 debido a la naturaleza infinita de los números reales dentro de cualquier intervalo dado, no importa cuán pequeño sea.

Distribución continua uniforme

Una distribución continua uniforme se caracteriza por tener una probabilidad igual para todos los valores dentro de un intervalo específico. Todos los resultados en el intervalo son igualmente probables, y la probabilidad de un resultado específico en un rango continuo es cero; en su lugar, se habla de la probabilidad de que el resultado caiga dentro de un subintervalo del intervalo total.

Esto quiere decir que si se calcula la probabilidad de que la variable aleatoria tome un valor concreto, por ejemplo a, entonces el resultado es cero: $P(X=a)=0$

Cómo se define:

La función de densidad de probabilidad de una variable aleatoria \(X\) que sigue una distribución continua uniforme en el intervalo \([a, b]\) es:
\[ f(x) = {\large{\frac{1}{b - a}}} \quad \text{para } a \leq x \leq b \]
La función de densidad es constante \(\left({\Large{\frac{1}{b - a}}}\right)\) dentro del intervalo y cero fuera de él. La probabilidad de que \(X\) caiga en un subintervalo específico se calcula hallando el área sobre ese subintervalo.

La fórmula para calcular la probabilidad en una distribución uniforme continua es: \[ P(x_1 < X < x_2) = {\large{\frac{x_2 - x_1}{b - a}}} \] donde:  \(x_1\) y \(x_2\) son los valores entre los cuales queremos encontrar la probabilidad,  \(a\) y \(b\) son los límites de la distribución. La expresión anterior nos permite calcular la probabilidad de que la variable aleatoria $X$ se encuentre entre $x_1$ y $x_2$.

Es importante resaltar que debe cumplirse que los valores $x_1$ y $x_2$ deben estar comprendidos entre $a$ y $b$, es decir, debe cumplirse: $a \leq x_1 < x_2 \leq b$. No se incluye el igual en la desigualdad entre $x_1$ y $x_2$ porque si fueran iguales ya hemos dicho que la probabilidad sería cero.

Por lo tanto, la probabilidad corresponde directamente al área del rectángulo formado por estos dos puntos en el eje $x$ y la constante \(\left({\Large{\frac{1}{b - a}}}\right)\)

Ejemplo 3. Sorteo de un número aleatorio

En un experimento donde se sortea un número real aleatorio entre 0 y 1 utilizando un generador de números aleatorios perfectamente calibrado, la variable aleatoria $X$ que representa el número seleccionado sigue una distribución continua uniforme en el intervalo [0, 1]. Cada número dentro de este intervalo tiene exactamente la misma probabilidad de ser elegido.

Esta función de densidad de probabilidad para una distribución continua uniforme en el intervalo [0, 1].

f(x) = \(\begin{cases}
1 & \text{si } 0 \leq x \leq 1 \\
0 & \text{de lo contrario}
\end{cases}\)

Aquí tienes la gráfica de la función de densidad de probabilidad para una distribución continua uniforme en el intervalo [0, 1]. Como se puede ver, la función de densidad $f(x)$ es igual a 1 en el intervalo [0, 1] y 0 fuera de él. Esto refleja la propiedad de la distribución uniforme continua, donde cada valor dentro del intervalo tiene exactamente la misma probabilidad de ser elegido.

Representación gráfica de la función de densidad de probabilidad de una distribución uniforme continua.
Imagen de elaboración propia. Distribución uniforme. (CC BY-NC-SA)

Distribución continua no uniforme

Ejemplo 4. Tiempo entre llegadas a una tienda

El tiempo entre llegadas de clientes a una tienda o entre llamadas telefónicas en un centro de llamadas puede modelarse con una distribución exponencial.

Esta es la función de densidad de una distribución exponencial:

f(x; λ) =\(\begin{cases}
\lambda ·e^{\large{{-\lambda x}}} & \text{si } x \geq 0 \\
0 & \text{de lo contrario}
\end{cases}\)

Cuando $\lambda=1$, la función se simplifica a:

f(x; 1) = \(\begin{cases}
e^{\large{{-x}}} & \text{si } x \geq 0 \\
0 & \text{de lo contrario}
\end{cases}\)

Aquí tienes la gráfica de la función de densidad de probabilidad para una distribución exponencial, que modela el tiempo entre llegadas de clientes a una tienda o entre llamadas telefónicas en un centro de llamadas, asumiendo una tasa promedio de llegada de 1 cliente por unidad de tiempo (λ=1). La curva muestra cómo la probabilidad de tiempos más cortos entre llegadas es más alta y disminuye exponencialmente para tiempos más largos entre llegadas, reflejando el característico decaimiento exponencial.

Función de densidad de probabilidad de una distribución exponencial.
Imagen de elaboración propia. Distribución exponencial. (CC BY-NC-SA)

3. Ejemplos resueltos

Ejemplo 1. Elección de proyecto

Empresa de software.
Imagen de elaboración propia generada con DALL-E 3. Empresa de software. (CC0)

Una empresa de desarrollo de software tiene tres proyectos en los que podría trabajar el próximo año: un sistema de gestión empresarial (Proyecto A), una aplicación móvil de salud y bienestar (Proyecto B), y una plataforma de e-commerce (Proyecto C). Debido a limitaciones de recursos, solo pueden elegir uno. La probabilidad de éxito estimada para cada proyecto es de 0.5 para el Proyecto A, 0.3 para el Proyecto B, y 0.2 para el Proyecto C.

Si la empresa decide seleccionar el proyecto basándose en un sorteo ponderado por la probabilidad de éxito de cada uno, ¿cuál es la probabilidad de que el proyecto seleccionado sea el Proyecto B?

Respuesta

Paso 1: Identificar las probabilidades de éxito de cada proyecto
Las probabilidades dadas para cada proyecto son:

Proyecto A (Sistema de gestión empresarial): 0.5
Proyecto B (Aplicación móvil de salud y bienestar): 0.3
Proyecto C (Plataforma de e-commerce): 0.2

Paso 2: Entender la pregunta
Se nos pide calcular la probabilidad de que el Proyecto B sea seleccionado en un sorteo ponderado por estas probabilidades de éxito.

Paso 3: Calcular la probabilidad
Dado que la selección se basa en las probabilidades de éxito y estas suman 1 (0.5 + 0.3 + 0.2 = 1), la probabilidad de que se seleccione cada proyecto es igual a su probabilidad de éxito. Por lo tanto, la probabilidad de que se seleccione el Proyecto B es directamente la probabilidad de éxito dada para el Proyecto B.

Construimos la variable aleatoria asignando valores enteros a cada uno de los proyectos. Esto se puede hacer de la siguiente manera:

X=1 para el Proyecto A (Sistema de gestión empresarial)
X=2 para el Proyecto B (Aplicación móvil de salud y bienestar)
X=3 para el Proyecto C (Plataforma de e-commerce)
Ahora, definimos la variable aleatoria X como el resultado del sorteo de proyectos, donde X toma valores de 1, 2, o 3, con cada número representando uno de los proyectos.

Tabla de valores de la función de probabilidad.
Imagen de elaboración propia. Función de probabilidad. (CC BY-NC-SA)

Paso 4: Conclusión
La probabilidad de que el Proyecto B sea seleccionado es del 30% (0.3 o 30/100).

Este cálculo es directo debido a la naturaleza de la pregunta, que vincula la probabilidad de selección con la probabilidad de éxito ya proporcionada para cada proyecto. No se requiere ningún cálculo adicional más allá de comprender que la probabilidad de selección es igual a la probabilidad de éxito en este escenario particular.

A continuación se muestra la gráfica de la función de probabilidad para la selección de proyectos. Cada barra representa la probabilidad de selección para cada uno de los proyectos (Proyecto A, Proyecto B y Proyecto C), basada en sus respectivas probabilidades de éxito. Como se ve, el Proyecto A tiene la mayor probabilidad de ser seleccionado (50%), seguido por el Proyecto B con un 30% y el Proyecto C con un 20%.

Gráfica de distribución.
Imagen de elaboración propia. Gráfica de distribución. (CC BY-NC-SA)

Ejemplo 2. Control de calidad

Fábrica.
Imagen de elaboración propia generada con DALL-E 3. Fábrica. (CC0)

Eres el responsable del control de calidad en una fábrica que produce piezas de metal para maquinaria. La longitud de las piezas producidas se supone que sigue una distribución uniforme continua debido a las variaciones en el proceso de producción. Las especificaciones de diseño indican que las piezas deben medir entre 5.0 y 5.5 centímetros para ser consideradas dentro de la norma.

Durante un control de calidad, se selecciona al azar una pieza producida. ¿Cuál es la probabilidad de que esta pieza mida más de 5.3 centímetros pero menos de 5.45 centímetros?

Respuesta.

Paso 1: Identificar los parámetros de la distribución.

Dado que la longitud de las piezas sigue una distribución uniforme continua entre 5.0 y 5.5 centímetros, podemos identificar los siguientes parámetros:

  • \(a = 5.0\) cm (límite inferior de la distribución)
  • \(b = 5.5\) cm (límite superior de la distribución)

Paso 2: Fórmula de la probabilidad en una distribución uniforme continua

La fórmula para calcular la probabilidad en una distribución uniforme continua es:

\[ P(x_1 < X < x_2) = \frac{x_2 - x_1}{b - a} \]

donde:

  • \(x_1\) y \(x_2\) son los valores entre los cuales queremos encontrar la probabilidad,
  • \(a\) y \(b\) son los límites de la distribución.

Paso 3: Aplicar los valores al problema

Para calcular la probabilidad de que una pieza mida más de 5.3 cm pero menos de 5.45 cm, aplicamos los valores a la fórmula:

  • \(x_1 = 5.3\) cm
  • \(x_2 = 5.45\) cm

Entonces, sustituimos en la fórmula:   \( P(5.3 < X < 5.45) = {\Large{\frac{5.45 - 5.3}{5.5 - 5.0}}} \)

Paso 4: Realizar el cálculo

Ahora, calculamos el valor:     \( P(5.3 < X < 5.45) = {\Large{\frac{0.15}{0.5}}} \)

\[ P(5.3 < X < 5.45) = 0.3 \]

Conclusión:

La probabilidad de que una pieza producida mida más de 5.3 centímetros pero menos de 5.45 centímetros es del 30\%.

Esta es la gráfica de la función de densidad para la distribución uniforme continua de la longitud de las piezas. La zona sombreada entre 5.3 cm y 5.45 cm resalta la probabilidad calculada del 30% de que una pieza producida esté dentro de ese rango de longitud. ​

Probabilidad como área.
Imagen de elaboración propia. Probabilidad como área. (CC BY-NC-SA)

4. Resuelve y comprueba

Problema 1.

Ingeniera trabajando.
Imagen de elaboración propia generada con DALL-E 3. Ingeniera trabajando. (CC0)

Supón que eres un/a ingeniero/a de pruebas trabajando para una empresa de teléfonos inteligentes. Recientemente, la empresa ha lanzado un nuevo modelo de teléfono. Las pruebas internas han mostrado que la duración de la batería del teléfono sigue una distribución uniforme continua. Los datos indican que la batería dura entre 20 y 30 horas con una sola carga bajo un uso normal.

Si un cliente usa su teléfono de manera que la duración de la batería sigue la distribución mencionada, ¿cuál es la probabilidad de que necesite recargar su teléfono en menos de 24 horas?

Representa la gráfica de la distribución uniforme continua de la duración de la batería del teléfono inteligente y sombrea el área que corresponde a la probabilidad encontrada.

Respuesta

Paso 1: Identificar los parámetros de la distribución

Dado que la duración de la batería del teléfono sigue una distribución uniforme continua, identificamos los siguientes parámetros:

  • \(a = 20\) horas (límite inferior de la distribución).
  • \(b = 30\) horas (límite superior de la distribución)

Paso 2: Entender la pregunta

Se nos pide calcular la probabilidad de que un cliente necesite recargar su teléfono en menos de 24 horas.

Paso 3: Aplicar la fórmula de la probabilidad para una distribución uniforme continua

La probabilidad \(P(X < x)\) en una distribución uniforme continua se calcula como:  \( P(X < x) = {\Large{\frac{x - a}{b - a}}} \)

Paso 4: Sustituir con los valores del problema

Sustituimos \(x = 24\) horas en la fórmula:  \( P(X < 24) = {\Large{\frac{24 - 20}{30 - 20}}} \)

Paso 5: Realizar el cálculo

Calculamos la probabilidad:  \( P(X < 24) = {\Large{\frac{4}{10}}} = 0.4 \)

Conclusión:

La probabilidad de que la batería necesite ser recargada en menos de 24 horas es del 40\%.

Esta es la gráfica de la distribución uniforme continua de la duración de la batería del teléfono inteligente, con la zona sombreada representando la probabilidad calculada. Esta área sombreada indica la probabilidad de que la batería necesite ser recargada en menos de 24 horas, la cual hemos calculado que es del 40%

Gráfica de distribución.
Imagen de elaboración propia. Gráfica de distribución. (CC BY-NC-SA)

Problema 2.

App móvil.
Imagen de elaboración propia generada con DALL-E 3. App móvil. (CC0)

Una aplicación móvil permite a los usuarios calificar los servicios con estrellas, donde pueden dar de 1 a 5 estrellas. Las probabilidades de cada calificación son: 1 estrella (0.05), 2 estrellas (0.1), 3 estrellas (0.25), 4 estrellas (0.35), y 5 estrellas (0.25).

¿Cuál es la probabilidad de recibir una calificación de al menos 4 estrellas?

Representa la gráfica de la función de probabilidad discreta sombreando las barras correspondientes a la probabilidad encontrada.

Respuesta

Paso 1: Identificar las probabilidades de interés

Las probabilidades dadas para cada calificación de estrellas son:

  • 1 estrella: 0.05
  • 2 estrellas: 0.1
  • 3 estrellas: 0.25
  • 4 estrellas: 0.35
  • 5 estrellas: 0.25

Paso 2: Definir la pregunta de probabilidad

La pregunta nos pide calcular la probabilidad de recibir una calificación de al menos 4 estrellas, es decir, considerar las calificaciones de 4 y 5 estrellas.

Paso 3: Calcular la probabilidad

Para obtener la probabilidad de recibir una calificación de al menos 4 estrellas, sumamos las probabilidades de recibir 4 estrellas y 5 estrellas (son sucesos incompatibles):

\[ P(\text{al menos 4 estrellas}) = P(\text{4 estrellas}) + P(\text{5 estrellas}) \]\[ P(\text{al menos 4 estrellas}) = 0.35 + 0.25 \]

Paso 4: Realizar el cálculo

\[ P(\text{al menos 4 estrellas}) = 0.6 \]

Conclusión

La probabilidad de recibir una calificación de al menos 4 estrellas es del 60\%.

Aquí tienes la gráfica de la función de probabilidad para las calificaciones de la aplicación móvil, con las barras correspondientes a 4 y 5 estrellas sombreadas. Esto visualiza claramente que la probabilidad de recibir una calificación de al menos 4 estrellas es del 60%

Gráfica función de probabilidad.
Imagen de elaboración propia. Gráfica función de probabilidad. (CC BY-NC-SA)

5. Distribución de Bernoulli

Una distribución de Bernoulli es una distribución de probabilidad discreta que modela experimentos que tienen exactamente dos posibles resultados: "éxito" y "fracaso", donde "éxito" tiene una probabilidad de ocurrencia \(p\) y "fracaso" tiene una probabilidad de \(1-p\).

En términos formales, si tenemos una variable aleatoria \(X\) que sigue una distribución de Bernoulli, entonces \(X\) puede tomar el valor 1 (representando "éxito") con probabilidad \(p\) y el valor 0 (representando "fracaso") con probabilidad \(1-p\). La función de masa de probabilidad (PMF) de una distribución de Bernoulli se define como:\[
P(X = x) = 
\begin{cases} 
p & \text{si } x = 1, \\
1-p & \text{si } x = 0. 
\end{cases}
\]

donde \(0 \leq p \leq 1\).

Ejemplos:

1. Lanzar una moneda: Considera el experimento de lanzar una moneda justa. Definimos el "éxito" como obtener cara en el lanzamiento, lo cual tiene una probabilidad de \(p = 0.5\) (asumiendo que la moneda no está sesgada), y el "fracaso" como obtener cruz, también con una probabilidad de \(1-p = 0.5\). La variable aleatoria que representa obtener cara en el lanzamiento sigue una distribución de Bernoulli con \(p = 0.5\).

2. Control de calidad en producción: En un proceso de fabricación, un artículo puede salir defectuoso o no defectuoso. Si la probabilidad de que un artículo sea defectuoso es del 2 % (es decir, \(p = 0.02\)), entonces el evento "el artículo es defectuoso" sigue una distribución de Bernoulli. Aquí, "éxito" se define como encontrar un artículo defectuoso en la inspección de un solo artículo, mientras que "fracaso" sería no encontrar defectos en el artículo.

6. Propiedad de los sucesos incompatibles

Recuerda que si dos sucesos \(A\) y \(B\) son incompatibles, no pueden ocurrir al mismo tiempo, entonces \(P(A \cap B) = 0\) y por lo tanto \(P(A \cup B) = P(A) + P(B)\).

7. Tu primer reto

Un equipo de investigadores está desarrollando un nuevo medicamento destinado a mejorar significativamente los síntomas de una enfermedad específica. En un pequeño ensayo clínico preliminar, seleccionan al azar a tres pacientes que padecen esta enfermedad y administran a cada uno el nuevo medicamento. Se considera un "éxito" si el paciente muestra una mejora significativa en los síntomas después de tomar el medicamento. Estudios previos sugieren que la probabilidad de éxito (mejora significativa) para cada paciente es del 60% (es decir, $p=0.6$).

Se te pide calcular lo siguiente:

  1. La probabilidad de que exactamente 2 de los 3 pacientes muestren una mejora significativa en los síntomas.
  2. La probabilidad de que como máximo 2 de los 3 pacientes muestren una mejora significativa en los síntomas.
Ensayo clínico.
Imagen de elaboración propia generada con DALL-E 3. Ensayo clínico. (CC0)

Pista 1

En este experimento, cada administración del medicamento a un paciente es un ensayo de Bernoulli independiente. Esto significa que el resultado (éxito o fracaso) de la administración del medicamento a un paciente no afecta el resultado de su administración a otro paciente. Debido a esta independencia, podemos multiplicar las probabilidades de eventos independientes para obtener la probabilidad de su intersección (ocurrencia conjunta).

Pista 2

Para un experimento que consta de tres administraciones independientes del medicamento, donde cada administración puede resultar en éxito (\(E\)) o fracaso (\(F\)), el espacio muestral (\(S\)) incluye todas las combinaciones posibles de éxitos y fracasos para los tres pacientes. Este espacio muestral se puede representar como:

\[ S = \{EEE, EEF, EFE, FEE, EFF, FEF, FFE, FFF\} \]

Cada elemento del espacio muestral representa un posible resultado del experimento, con la primera letra del elemento representando el resultado para el primer paciente, la segunda letra para el segundo paciente, y así sucesivamente. Por ejemplo, "EEF" significa que los dos primeros pacientes mostraron una mejora significativa (éxito) y el tercer paciente no (fracaso).

Pista 3

Para calcular la probabilidad de cada suceso compuesto, utilizamos el hecho de que la probabilidad de sucesos independientes que ocurren en secuencia es el producto de sus probabilidades individuales. Por ejemplo, para el suceso compuesto EEF, la probabilidad sería $p×p×(1−p)$, donde $p$ es la probabilidad de éxito (mejora significativa) para un ensayo individual.

Pista 4

Ahora que sabemos cómo calcular la probabilidad de cada suceso compuesto, debemos sumar las probabilidades de todos los sucesos compuestos que cumplan con nuestra condición (en este caso, exactamente 2 éxitos). Esto nos dará la probabilidad total de obtener exactamente 2 éxitos en los tres ensayos.

Para calcular la probabilidad de obtener como máximo 2 éxitos, sumaremos las probabilidades de obtener 0, 1 y 2 éxitos, aplicando el mismo principio de sucesos compuestos e incompatibles.

a) Para calcular la probabilidad de obtener exactamente 2 éxitos (mejoras significativas) en tres ensayos, identificamos primero los resultados específicos que satisfacen esta condición dentro del espacio muestral: EEF, EFE, y FEE.

La probabilidad de cada uno de estos eventos se calcula multiplicando las probabilidades de los eventos individuales que los componen, dada la independencia de cada ensayo. Con una probabilidad de éxito $p=0.6$ para cada paciente, obtenemos:

$\text{Probabilidad de EEF} = p \cdot p \cdot (1-p) = 0.6 \cdot 0.6 \cdot 0.4$

$\text{Probabilidad de EFE} = p \cdot (1-p) \cdot p = 0.6 \cdot 0.4 \cdot 0.6$

$\text{Probabilidad de FEE} = (1-p) \cdot p \cdot p = 0.4 \cdot 0.6 \cdot 0.6$

La probabilidad total de obtener exactamente 2 éxitos se encuentra sumando las probabilidades de estos sucesos incompatibles:

$\text{Probabilidad de exactamente 2 éxitos} = \text{Probabilidad de EEF} + \text{Probabilidad de EFE} + \text{Probabilidad de FEE}$

La probabilidad de obtener exactamente 2 éxitos es aproximadamente 43.2%

b) Para la probabilidad de obtener como máximo 2 éxitos, consideramos todos los eventos que no sean 3 éxitos (EEE), es decir, incluyendo 0, 1, y 2 éxitos. Esto incluye los eventos EFF, FEF, FFE, además de los ya calculados para exactamente 2 éxitos, y el evento sin éxitos FFF. Las expresiones para estos casos adicionales, usando la misma lógica y la probabilidad de fracaso $1−p=0.4$, son:

$\text{Probabilidad de FFF} = (1-p) \cdot (1-p) \cdot (1-p) = 0.4 \cdot 0.4 \cdot 0.4$

$\text{Probabilidad de EFF} = p \cdot (1-p) \cdot (1-p) = 0.6 \cdot 0.4 \cdot 0.4$

$\text{Probabilidad de FEF} = (1-p) \cdot p \cdot (1-p) = 0.4 \cdot 0.6 \cdot 0.4$

$\text{Probabilidad de FFE} = (1-p) \cdot p \cdot (1-p) = 0.4 \cdot 0.4 \cdot 0.6$

La probabilidad total de obtener como máximo 2 éxitos se calcula sumando las probabilidades de obtener 0, 1, y 2 éxitos:

$\text{Probabilidad de como máximo 2 éxitos} = \text{Probabilidad de FFF} + \text{Probabilidad de EFF} + \text{Probabilidad de FEF} + \text{Probabilidad de FEF} + \text{Probabilidad de exactamente 2 éxitos}$

Utilizando estos principios, calculamos la probabilidad de obtener como máximo 2 éxitos que es aproximadamente 78.4%.

Página 4 de 12

Obra publicada con Licencia Creative Commons Reconocimiento No comercial Compartir igual 4.0

Creado con eXeLearning (Ventana nueva)