Fundamentos de probabilidad
Un proceso es un experimento aleatorio si:
Ejemplo: lanzamiento de un dado
El espacio muestral, denotado por \(\Omega\), es el conjunto de todos los resultados posibles de un experimento aleatorio. Los elementos son los posibles resultados \(\omega\), de tal forma que:
\[ \Omega = \{\omega : \omega \text{ es un resultado posible del experimento}\} \]
1️⃣ Espacios muestrales discretos
Conjunto de resultados finito o infinito numerable.
\[ \Omega = \{\omega_1, \omega_2, \omega_3, \dots \} \]
2️⃣ Espacios muestrales continuos
Conjunto de resultados infinito no numerable, generalmente asociado a intervalos de números reales.
\[ \Omega \subseteq \mathbb{R} \]
\[ \Omega_1 = \{1,2,3,4,5,6\} \]
Tipo: Finito (discreto)
\[ \Omega_2 = \{0,1,2,3,\dots\} \]
Tipo: Infinito numerable (discreto)
\[ \Omega_3 = \{x \in \mathbb{R} : x > 0\} \]
Tipo: Infinito no numerable (continuo)
Sea \(\Omega\) el espacio muestral de un experimento aleatorio. Una σ-álgebra (sigma-álgebra) sobre \(\Omega\), denotada por \(\mathcal{F}\), es una colección de subconjuntos de \(\Omega\) que satisface:
Como consecuencia, también se cumple que:
\(\bigcap_{i=1}^{\infty} A_i \in \mathcal{F}\)
Los elementos de la σ-álgebra \(\mathcal{F}\) se denominan eventos.
Así, un evento es un subconjunto del espacio muestral:
\[A \subseteq \Omega, \quad A \in \mathcal{F}\]
\[\Omega = \{1,2,3,4,5,6\}\]
Evento: “obtener un número par” entonces \(A = \{2,4,6\}\)
Aquí, \(A \in \mathcal{F}\) es un evento.
La probabilidad de un evento puede interpretarse como la frecuencia relativa de ocurrencia en un gran número de repeticiones del experimento.
Si un experimento se repite \(n\) veces y el evento \(A\) ocurre \(n_A\) veces, entonces:
\[fr(A) = \frac{n_A}{n}\]
En el caso clásico con resultados equiprobables, se define:
\[P(A) = \frac{\text{número de casos favorables}}{\text{número de casos posibles}}\]
El complemento contiene todos los resultados en el espacio muestral \(\Omega\) que no están en el evento \(A\).
\[P(A^c) = 1 - P(A)\]
Ejemplo: Si \(A\) es el evento “el paciente presenta hipertensión”, \(A^c\) es el evento “el paciente no presenta hipertensión”.
La intersección representa la ocurrencia simultánea de dos eventos, \(A\) y \(B\). Matemáticamente, \(A \cap B\).
\[P(A \text{ y } B) = P(A \cap B)\]
Ejemplo: Si \(A\) es “paciente con diabetes” y \(B\) es “paciente con obesidad”, \(A \cap B\) son los pacientes que padecen ambas condiciones.
Dos eventos son mutuamente excluyentes (o disjuntos) si no pueden ocurrir al mismo tiempo. Su intersección es vacía (\(A \cap B = \emptyset\)).
\[ P(A \cap B) = 0\]
Ejemplo: Un test diagnóstico rápido cuyo resultado es “Positivo” o “Negativo”. No puede ser ambos simultáneamente.
La unión contiene todos los resultados que están en A, o en B, o en ambos. Se denota como \(A \cup B\).
\[P(A \cup B)=P(A)+P(B)−P(A \cap B)\]
Ejemplo: Pacientes que requieren derivación a “Servicio de Fisioterapia” (A) O a “Servicio de Traumatología” (B).
Se están analizando a 36 pacientes que ingresaron este mes a la unidad de cuidados intensivos, los cuales pueden presentar tres condiciones de salud, estos son pacientes con:
Los pacientes se han clasificado de acuerdo con las condiciones que presentan:
Encuentre: \(A \cap B\), \(B \cap C\), \(A \cup C\), \(B^c \cap A\), \(A \cap B \cap C\), \(B^c \cap A\), \((A \cup B) \cap C^c\)
Un espacio de probabilidad es la tripleta: \((\Omega, \mathcal{F}, P)\)
donde:
La función \(P : \mathcal{F} \to [0,1]\) satisface:
\[P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i)\] Por tanto,
\[0 \le P(A) \le 1\]
Sea \((\Omega, \mathcal{F}, P)\) un espacio de probabilidad y \(A, B \in \mathcal{F}\).
Si \(A \cap B = \varnothing\) (mutuamente excluyentes):
\[P(A \cup B) = P(A) + P(B)\]
Sea:
Probabilidad de interés: \(P(B)\)
Proporción de pacientes con resultado positivo.
Si en un ensayo clínico:
\[P(\text{mejoría}) = \frac{80}{100} = 0.8\]
Sea:
Probabilidad conjunta: \(P(A \cap B)\)
Pacientes que fuman y tienen enfermedad.
Si la probabilidad de complicación quirúrgica es: \(P(C) = 0.1\)
Entonces la probabilidad de que no se tengan complicaciones es: \[P(C^c) = 1 - P(C) = 0.9\]
Si un experimento se puede realizar en \(k\) etapas, y cada una se puede hacer de \(n_i\) formas diferentes, enonces el experimento completo se puede realizar de
\[n_1 \times n_2 \times \cdots \times n_k\]
formas distintas. Esto se conoce como regla de la multiplicación.
Un fisioterapeuta puede elegir:
¿Cuántos planes de tratamiento diferentes puede diseñar?
\[ 3 \times 2 \times 4 = 24 \]
Hay 24 posibles combinaciones de tratamiento.
Se usa cuando:
Ejemplo: Debe asignar
¿De formas de elegir los enfermeros para coordinar ambos turnos?
\(5 \times 4 = 20\)
Se usan cuando el orden importa
Ejemplos donde el orden importa:
Número de formas de ordenar n objetos:
\[n!\]
donde
\[n! = n \times (n-1) \times (n-2) \times \cdots \times 1\] Ejemplo: En una clínica hay 4 pacientes esperando fisioterapia. ¿De cuántas formas distintas pueden ser atendidos?
\[4! = 4 \times 3 \times 2 \times 1 = 24\]
Hay 24 formas diferentes de realizar la atención.
Se usan cuando el orden NO importa
Ejemplos:
El número de formas de elegir k elementos de n:
\[{n \choose k} = \frac{n!}{k!(n-k)!}\]
De 8 enfermeros se deben seleccionar 3 para un comité de calidad. ¿Cuántos comités diferentes son posibles?
\[{8 \choose 3} = \frac{8!}{3!5!} = 56\]
Hay 56 posibles grupos.
| Situación | Método |
|---|---|
| Proceso en varias etapas | Regla de multiplicación |
| Importa el orden | Permutaciones |
| No importa el orden | Combinatorias |
Ejemplos:
Un plan de rehabilitación incluye: 4 tipos de terapia, 3 ejercicios y 2 tipos de vendaje. ¿Cuántos planes diferentes pueden diseñarse?
En una sala hay 5 pacientes esperando atención. ¿De cuántas formas distintas pueden ser atendidos?
De 10 enfermeros, se deben elegir 4 para un equipo de investigación. ¿Cuántos equipos diferentes pueden formarse?
En fisioterapia hay 6 ejercicios disponibles. ¿De cuántas maneras se pueden elegir 2 ejercicios para una sesión?
Tres pacientes deben realizar pruebas en 3 equipos diferentes. ¿De cuántas maneras pueden asignarse?
Imagina que participas en un concurso de televisión. Se te presentan tres puertas:
Eliges la Puerta 1. El presentador, que sabe dónde está el auto, abre otra puerta y muestra una cabra.
¿Cambiarías a la otra puerta que quedó cerrada?
Supongamos que siempre eliges la Puerta 1 y el presentador siempre abre una puerta con cabra
\[P(\text{ganar} \mid \text{cambia de puerta}) = \frac{2}{3} \approx \mathbf{66.6\%}\]
\[P(\text{ganar} \mid \text{no cambiar de puerta}) = \frac{1}{3} \approx \mathbf{33.3\%}\]
💡 El presentador no actúa aleatoriamente: siempre muestra una cabra. Esto transfiere probabilidad a la otra puerta y es la esencia de la probabilidad condicional.
Sea \((\Omega, \mathcal{F}, P)\) un espacio de probabilidad y \(A, B \in \mathcal{F}\) con \(P(B) > 0\).
La probabilidad condicional de \(A\) dado \(B\) se define como:
\[\boxed{P(A \mid B) = \frac{P(A \cap B)}{P(B)}}\]
Interpretación: Se restringe el universo al evento \(B\) y se mide qué fracción de \(B\) corresponde a \(A\).
Ejemplo intuitivo: Si en una sala hay 100 pacientes, 40 son hipertensos (\(B\)) y de ellos 12 también son diabéticos (\(A \cap B\)), entonces:
\[P(\text{Diabético} \mid \text{Hipertenso}) = \frac{12}{40} = 0.30\]
De la definición de probabilidad condicional se obtiene directamente la regla del producto:
\[P(A \cap B) = P(A \mid B) \cdot P(B)\]
Y de manera análoga, como \(P(B \mid A) = \dfrac{P(A \cap B)}{P(A)}\), también se tiene:
\[P(A \cap B) = P(B \mid A) \cdot P(A)\]
Corolario
\[\boxed{P(A \cap B) = P(A \mid B) \cdot P(B) = P(B \mid A) \cdot P(A)}\]
Esta regla es muy útil para calcular probabilidades conjuntas cuando se conocen probabilidades condicionales.
Dos eventos \(A\) y \(B\) se denominan independientes si el hecho de que \(B\) ocurra no modifica la probabilidad de \(A\):
\[P(A \mid B) = P(A)\]
Sustituyendo en la regla del producto:
\[\boxed{P(A \cap B) = P(A) \cdot P(B)}\]
El grupo sanguíneo de un paciente y su preferencia por un tipo de analgésico son eventos independientes si conocer el grupo sanguíneo no cambia la probabilidad de preferir ese analgésico.
En cambio, fumar e hipertensión NO son independientes: los fumadores tienen mayor riesgo.
En un programa de tamizaje se aplica una prueba diagnóstica para detectar diabetes tipo 2:
| Parámetro | Definición | Valor |
|---|---|---|
| Prevalencia | \(P(D)\) | 0.10 |
| Sensibilidad | \(P(+\mid D)\) | 0.92 |
| Especificidad | \(P(-\mid D^c)\) | 0.88 |
Tasa de falsos negativos: \[P(-\mid D) = 1 - 0.92 = 0.08\]
Tasa de falsos positivos: \[P(+\mid D^c) = 1 - 0.88 = 0.12\]
Recuerda que: \[P(A \cap B) = P(A|B) \cdot P(B) = P(B|A) \cdot P(A)\]
En un estudio sobre enfermedad cardiovascular (ECV) en adultos:
Probabilidades condicionales conocidas:
\[P(ECV \mid F \cap H) = 0.45\] \[P(ECV \mid F \cap H^c) = 0.20\] \[P(ECV \mid F^c \cap H) = 0.18\] \[P(ECV \mid F^c \cap H^c) = 0.05\]
Visualización del riesgo cardiovascular
Con ambos factores el riesgo es 9 veces mayor que sin ninguno.
En un estudio con 1000 pacientes se analiza la relación entre vacunación y gripe en un determinado mes:
| Con gripe | Sin gripe | Total | |
|---|---|---|---|
| Vacunado | 20 | 480 | 500 |
| No vacunado | 80 | 420 | 500 |
| Total | 100 | 900 | 1 000 |
\[P(\text{Gripe} \mid \text{Vacunado}) = \frac{20}{500} = 0.04\]
\[P(\text{Gripe} \mid \text{No vacunado}) = \frac{80}{500} = 0.16\]
\[P(\text{Gripe}) = \frac{100}{1000} = 0.10\]
¿Son independientes vacunación y gripe?
\[P(\text{Gripe} \mid \text{Vacunado}) = 0.04 \neq P(\text{Gripe}) = 0.10\]
La vacunación y la gripe NO son eventos independientes.
La vacunación reduce el riesgo en un 75%:
\[RR = \frac{0.04}{0.16} = 0.25\]
Sea \(\{B_1, B_2, \ldots, B_k\}\) una partición de \(\Omega\) (eventos mutuamente excluyentes y exhaustivos). Para cualquier evento \(A\):
\[\boxed{P(A) = \sum_{i=1}^{k} P(A \mid B_i) \cdot P(B_i)}\]
Idea central: Cuando no es posible calcular \(P(A)\) directamente, se descompone el problema en escenarios \(B_i\) donde sí se conocen las probabilidades condicionales.
Condiciones de la partición:
Una red hospitalaria atiende pacientes provenientes de tres clínicas con diferente nivel de complejidad:
| Clínica | Proporción de pacientes | P(Complicación) |
|---|---|---|
| A — alta especialización | \(P(B_1) = 0.40\) | \(P(A\mid B_1) = 0.05\) |
| B — mediana complejidad | \(P(B_2) = 0.35\) | \(P(A\mid B_2) = 0.10\) |
| C — baja complejidad | \(P(B_3) = 0.25\) | \(P(A\mid B_3) = 0.20\) |
¿Cuál es la probabilidad de que un paciente tomado al azar de la red tenga complicaciones?
\[P(A) = P(A\mid B_1)\,P(B_1) + P(A\mid B_2)\,P(B_2) + P(A\mid B_3)\,P(B_3)\]
\[P(A) = (0.05)(0.40) + (0.10)(0.35) + (0.20)(0.25)\]
\[P(A) = 0.020 + 0.035 + 0.050\]
\[\boxed{P(A) = 0.105}\]
La probabilidad de complicaciones en la red es del 10.5%.
Los pacientes de un servicio de fisioterapia provienen de tres fuentes de remisión:
La probabilidad de requerir rehabilitación intensiva (\(R\)) según la fuente:
\[P(R\mid B_1)=0.15, \quad P(R\mid B_2)=0.40, \quad P(R\mid B_3)=0.70\]
¿Cuál es la probabilidad de que un paciente elegido al azar requiera de rehabilitación intensiva?
::: {.fragment}
\[P(R) = (0.15)(0.60)+(0.40)(0.30)+(0.70)(0.10)\] \[P(R) = 0.09+0.12+0.07 = \boxed{0.28}\]
El 28% de los pacientes del servicio requieren rehabilitación intensiva.
:::
Los diagramas de árbol son una herramienta visual que permiten organizar y calcular probabilidades con el Teorema de Probabilidad Total.
Sea \(\{B_1, B_2, \ldots, B_k\}\) una partición de \(\Omega\) con \(P(B_i) > 0\). Para cualquier evento \(A\) con \(P(A) > 0\):
\[\boxed{P(B_i \mid A) = \frac{P(A \mid B_i)\cdot P(B_i)}{P(A)} = \frac{P(A \mid B_i)\cdot P(B_i)}{\displaystyle\sum_{j=1}^{k} P(A \mid B_j)\cdot P(B_j)}}\]
Las tres piezas del teorema:
| Componente | Nombre | Significado |
|---|---|---|
| \(P(B_i)\) | Probabilidad a priori | Antes de observar \(A\) |
| \(P(A\mid B_i)\) | Verosimilitud | Qué tan probable es \(A\) en el escenario \(B_i\) |
| \(P(B_i\mid A)\) | Probabilidad a posteriori | Después de observar que \(A\) ocurrió |
💡 Bayes nos permite actualizar resultados con nueva evidencia. Es la base del razonamiento diagnóstico en ciencias como la medicina.
Retomando el ejemplo de complicaciones post-quirúrgicas:
\[P(B_1)=0.40 \quad P(B_2)=0.35 \quad P(B_3)=0.25\] \[P(A\mid B_1)=0.05 \quad P(A\mid B_2)=0.10 \quad P(A\mid B_3)=0.20\] \[P(A) = 0.105\]
Pregunta: Si un paciente presentó complicaciones, ¿cuál es la probabilidad de que proveniera de la Clínica C?
\[P(B_3 \mid A) = \frac{P(A\mid B_3)\cdot P(B_3)}{P(A)} = \frac{(0.20)(0.25)}{0.105} = \frac{0.050}{0.105} \approx \boxed{0.476}\]
La Clínica C concentra el 47.6% de las complicaciones, aunque solo aporta el 25% de los pacientes.
Una prueba diagnóstica para tuberculosis (TB) tiene las siguientes características:
| Parámetro | Definición | Valor |
|---|---|---|
| Prevalencia | \(P(TB)\) | 1% |
| Sensibilidad | \(P(+\mid TB)\) | 95% |
| Especificidad | \(P(-\mid TB^c)\) | 90% |
¿Cuál es la probabilidad de tener TB dado un resultado positivo? (Valor Predictivo Positivo — VPP)
Paso 1 — Probabilidad Total de resultado positivo:
\[P(+) = P(+\mid TB)\cdot P(TB) + P(+\mid TB^c)\cdot P(TB^c)\] \[P(+) = (0.95)(0.01)+(0.10)(0.99) = 0.0095+0.099 = 0.1085\]
Paso 2 — Teorema de Bayes:
\[P(TB\mid +) = \frac{P(+\mid TB)\cdot P(TB)}{P(+)} = \frac{(0.95)(0.01)}{0.1085} \approx \boxed{0.0875}\]
⚠️ Aunque la prueba es positiva, la probabilidad de realmente tener TB es solo del 8.75%. Esto se debe a la baja prevalencia (1%): la mayoría de los positivos son falsos positivos.
¿Qué sucede si aumenta la prevalencia?
Lección para la práctica clínica:
En poblaciones de baja prevalencia, un test positivo tiene bajo VPP → se requieren pruebas confirmatorias.
En poblaciones de alto riesgo (mayor prevalencia), el mismo test tiene mayor VPP → el resultado es más confiable.
Con Bayes se actualiza la probabilidad de enfermedad con base en los resultados de las pruebas.
Este material ha sido creado por Giovany Babativa-Márquez y es de libre distribución bajo la licencia Creative Commons Attribution-ShareAlike 4.0.
Cualquier copia parcial o total de este material, debe citar la fuente como:
Babativa-Márquez, J.G. Diapositivas del curso de Estadística Fundamental para Ciencias de la Salud. URL: https://jgbabativam.github.io/EstadFundSalud/
Diapositivas disponibles en GitHub.