Conceptos de Probabilidad - castillodcuire.files.wordpress.com · Si los eventos son...

51
Probabilidad Parte A Ing. Roque Castillo Investigación y Salud III Conceptos de

Transcript of Conceptos de Probabilidad - castillodcuire.files.wordpress.com · Si los eventos son...

Probabilidad Parte A

Ing. Roque Castillo Investigación y Salud III

Conceptos de

Introducción Definición 3.1 • El espacio muestral es el conjunto de todos

los resultados posibles. Al referirse a las probabilidades de los eventos, un evento es cualquier conjunto de resultados de interés.

• La probabilidad de un evento es la frecuencia relativa de este conjunto de resultados en un número indefinidamente grande (o infinito) de ensayos.

Introducción - Cáncer Cáncer

La probabilidad de desarrollar cáncer de mama a lo largo de 40 años en mujeres de 30 años que nunca han tenido cáncer de mama son aproximadamente 1/11. Esta probabilidad significa que en una muestra grande de mujeres de 30 años que nunca habían tenido pecho el cáncer, aproximadamente 1 de cada 11 desarrollará la enfermedad a los 70 años, y esta proporción se volverá cada vez más cercana a 1 de cada 11 a medida que aumente el número de mujeres muestreadas.

Ecuaciones 3.1

1) La probabilidad de un evento E, denotado por Pr(E), siempre satisface 0 ≤ Pr (E) ≤ 1.

2) Si los resultados A y B son dos eventos que no pueden ocurrir ambos al mismo tiempo, entonces Pr (A o B ocurre) = Pr (A) + Pr (B).

Ejemplo 3.6 Hipertensión Sea A el caso de que una persona tenga lecturas de presión sanguínea diastólica normotensiva (DBP) (DBP <90), y deje que B sea el evento en el que una persona tenga lecturas límite de DBP (90 ≤ DBP <95). Supongamos que Pr (A) = 0.7 y Pr (B) = 0.1. Sea Z el evento de que una persona tenga un DBP <95. Entonces Pr (Z) = Pr (A) + Pr (B) = 0.7 + 0.1= 0.8 porque los eventos A y B no pueden ocurrir al mismo tiempo.

Definición 3.2 Dos eventos A y B son mutuamente excluyentes si ambos no pueden suceder al mismo tiempo.

Ejemplo 3.7 Hipertensión Sea X la DBP, C sea el evento X ≥ 90, y D sea el evento 75 ≤ X ≤ 100. Los eventos C y D no son mutuamente excluyentes, ya que ambos ocurren cuando 90 ≤ X ≤ 100.

Notación Probabilística Común

Definición 3.3 El símbolo {} se usa como abreviatura de la frase "el evento".

Definición 3.4

A∪B es el evento que ocurre A o B, o ambos ocurren.

Ejemplo 3.8 Hipertensión Deje que los eventos A y B se definan como en el ejemplo 3.6: A = {X < 90}, B = {90 ≤ X <95}, donde X = DBP. Entonces A∪B = {X < 95}.

Ejemplo 3.9 Hipertensión Deje que los eventos C y D se definan como en el ejemplo 3.7: C = {X ≥ 90} D = {75 ≤ X ≤ 100} Entonces C∪D = {X ≥ 75}

A∪B sombreado

A∪B sombreado

Representación diagramática de A∪B: (a) A,B mutuamente excluyentes; (b) A,B no se excluyen mutuamente

Definición 3.5 A∩B es el evento en que ambos A y B ocurren simultáneamente. A∩B es representado gráficamente por la figura:

A∩B sombreado

Ejemplo 3.10 Hipertensión Deje que los eventos C y D se definan como en el ejemplo 3.7; es decir, C = {X ≥ 90} D = {75 ≤ X ≤ 100} Entonces C∩D = {90 ≤ X ≤ 100} Observe que A∩B no está bien definido para los eventos A y B en el Ejemplo 3.6 porque ambos A y B no pueden ocurrir simultáneamente. Esto es cierto para cualquier evento mutuamente exclusivo.

Definición 3.6 Ᾱ es el evento en el que A no ocurre. Se llama el complemento de A. Note que Pr (Ᾱ) = 1 - Pr (A), porque A ocurre solo cuando A no ocurre. El evento A se muestra en la figura:

Ejemplo 3.11 Hipertensión Deje que los eventos A y C se definan como en los Ejemplos 3.6 y 3.7; es decir, A = {X <90} C = {X ≥ 90} Entonces C = Ᾱ, porque C solo puede ocurrir cuando A no ocurre. Note que: Pr (C) = Pr (Ᾱ) = 1 - 0.7 = 0.3 Por lo tanto, si el 70% de las personas tienen DBP <90, entonces el 30% de las personas deben tener DBP ≥ 90.

Ley de Multiplicación de

Probabilidades

Ejemplo 3.12 Hipertensión, Genética Supongamos que estamos llevando a cabo un programa de detección de hipertensión en el hogar. Considere todos los posibles pares de mediciones de DBP de la madre y el padre dentro de una familia dada, suponiendo que la madre y el padre no están relacionadas genéticamente. Este espacio de muestra consta de todos los pares de números de la forma (X, Y) donde X> 0, Y> 0. Ciertos eventos específicos pueden ser de interés en este contexto. …

Ejemplo 3.12 … En particular, podríamos interesarnos si la madre o el padre son hipertensos, lo que se describe, respectivamente, por los eventos A = {DBP de la madre ≥ 90}, B = {DBP del padre ≥ 90}. Supongamos que sabemos que Pr (A) = 0.1, Pr (B) = 0.2. ¿Qué podemos decir sobre Pr (A∩B) = Pr(DBP de la madre ≥ 90 y DBP del padre ≥ 90) = Pr (tanto la madre como el padre son hipertensas)? No podemos decir nada a menos que estemos dispuestos a hacer ciertas suposiciones.

Definición 3.7 Dos eventos A y B son llamados eventos independientes si Pr (A∩B) = Pr (A) × Pr (B)

Posibles mediciones diastólicas de la presión arterial de la madre y el padre dentro de una familia dada

evento A = {DBP de la madre ≥ 90} evento B = {DBP del padre ≥ 90} evento A∩B = {DBP de ambos ≥ 90}

DBP de la madre

DBP

del p

adre

Ejemplo 3.13 Calcule la probabilidad de que tanto la madre como el padre sean hipertensos si los eventos del ejemplo 3.12 son independientes. Solución: Si A y B son eventos independientes, entonces Pr (A∩B) = Pr (A) × Pr (B) = 0.1 (0.2) = 0.02

Definición 3.8 Dos eventos A y B son son dependientes si Pr (A∩B) ≠ Pr (A) × Pr (B)

Ejemplo 3.14 Hipertensión, Genética Considere todas las posibles mediciones de DBP de una madre y su hijo primogénito. Deje A = {DBP de la madre ≥ 90} B = {DBP del primogénito ≥ 80} Supongamos que Pr(A∩B) = 0.05, Pr(A) = 0.1, Pr(B) = 0.2. Entonces Pr (A∩B) = 0.05 > Pr(A) × Pr(B) = 0.02 y los eventos A, B serían dependientes. Este resultado se esperaría porque la madre y el hijo primogénito ambos comparten el mismo ambiente y están relacionados genéticamente. En otras palabras, es más probable que el hijo primogénito tenga presión arterial elevada en hogares donde la madre es hipertensiva que en hogares donde la madre no es hipertensiva.

Ejemplo 3.15 Enfermedad de Transmisión Sexual Supongamos que dos médicos, A y B, evalúan a todos los pacientes que ingresan en una clínica por sífilis. Deje que los eventos A+ = {el doctor A haga un diagnóstico positivo} y B+ = {el doctor B haga un diagnóstico positivo}. Supongamos que el médico A diagnostica el 10% de todos los pacientes como positivos, el médico B diagnostica el 17% de todos los pacientes como positivos, y ambos médicos diagnostican el 8% de todos los pacientes como positivos.

Ejemplo 3.15 Enfermedad de Transmisión Sexual ¿Son los eventos A+, B+ independientes? Solución: se nos da que Pr (A+) = 0.1, Pr (B+) = 0.17 Pr (A+∩B+) = 0.08 Por lo tanto, Pr (A+∩B+) = 0.08 > Pr (A+) × Pr (B+) = (0.1) (.17) = 0.017 y por lo tanto, los eventos son dependientes. Este resultado se esperaría porque debería haber una similitud entre cómo dos médicos diagnostican a los pacientes con sífilis.

Ecuaciones 3.2

Ley de Multiplicación de Probabilidad Si A1, …, Ak son eventos mutuamente independientes, entonces Pr(A1∩ A2∩… ∩Ak)=Pr(A1) x Pr(A2) x…x Pr(Ak)

Ley de Adición de

Probabilidad

Ecuaciones 3.3

Ley de Adición de Probabilidad Si A y B son eventos cualesquiera (que no sean necesariamente excluyentes), entonces Pr(A∪B)=Pr(A) + Pr(B) - Pr(A∩B)

Representación diagramática de la ley de probabilidad de adición

Ejemplo 3.16 Enfermedad de Transmisión Sexual Considere los datos en el Ejemplo 3.15. Supongamos que un paciente es referido para pruebas de laboratorio adicionales si el médico A o B hace un diagnóstico positivo. ¿Cuál es la probabilidad de que un paciente sea referido para más pruebas de laboratorio?

Ejemplo 3.16 Enfermedad de Transmisión Sexual Solución: El evento de que cualquiera de los dos médicos realice un diagnóstico positivo puede representarse con A+∪B+. Lo sabemos Pr (A+) = 0.1, Pr (B+) = 0.17, Pr (A+∩B+) = 0.08 Por lo tanto, de la ley de probabilidad de adición, Pr (A+∪B+) = Pr (A+) + Pr (B+) - Pr (A+∩B+) = .1+ .17 - .08 Pr (A+∪B+) = 0.1 +0.17 – 0.08 = 0.19 Por lo tanto, el 19% de todos los pacientes serán referidos para más pruebas de laboratorio.

Casos especiales de la ley de adición

1) Si los eventos A y B son mutuamente exclusivos, entonces Pr (A∩B) = 0 y la ley de adición se reduce a Pr (A∪B) = Pr (A) + Pr (B).

2) Si los eventos A y B son independientes, entonces, por definición, Pr (A∩B) = Pr(A) × Pr (B) y Pr (A∪B) pueden reescribirse como

Pr (A) + Pr (B) - Pr (A) × Pr (B).

Ecuaciones 3.4

Ley de Adición de Probabilidad para Eventos Independientes Si dos eventos A y B son independientes, entonces Pr (A∪B) = Pr (A) + Pr (B) × [1 − Pr (A)]

Representación diagramática de la ley de probabilidad de adición para eventos independientes

Ejemplo 3.17 Hipertensión Mire el ejemplo 3.12, donde A={DBP de la madre ≥ 90},

B={DBP del padre ≥ 90}.

Pr(A) = 0.1, Pr(B) = 0.2, y supongamos que A y B son eventos

independientes. Supongamos que “hogar hipertenso" se

define como aquel en el que la madre o el padre es

hipertenso, con hipertensión definida para la madre y el

padre, respectivamente, en términos de eventos A y B. ¿Cuál

es la probabilidad de un hogar hipertenso?

Ejemplo 3.17 Hipertensión Solución:

Pr (hogar hipertenso) es

Pr (A∪B) = Pr(A) + Pr(B) × [1 - Pr(A)]

Pr (A∪B) = 0.1+ 0.2 (0.9) = .28

Por lo tanto, el 28% de todos los hogares serán

hipertensos.

Probabilidad Condicional

Probabilidad Condicional

Supongamos que queremos calcular la probabilidad de que varios eventos ocurran simultáneamente. Si los eventos son independientes, entonces podemos usar la ley de multiplicación de probabilidades para hacerlo. Si algunos de los eventos son dependientes, entonces se necesita una medida cuantitativa de dependencia para extender la ley de multiplicación al caso de eventos dependientes. Considere el siguiente ejemplo:

Ejemplo 3.18 Cancer Los médicos recomiendan que todas las mujeres mayores de 50 años se sometan a exámenes de detección de cáncer de mama. La prueba definitiva para identificar tumores de mama es una biopsia de mama. Sin embargo, este procedimiento es demasiado costoso e invasivo como para recomendarlo a todas las mujeres mayores de 50 años. En cambio, se alienta a las mujeres de este grupo de edad a realizarse una mamografía cada 1 a 2 años. Las mujeres con mamogramas positivos se analizan luego con una biopsia.

Ejemplo 3.18 Cancer Idealmente, la probabilidad de cáncer de mama entre las mujeres que tiene mamografias positivas sería 1 y la probabilidad de cáncer de mama entre las mujeres que tienes mamográficas negativas sería 0. Los dos eventos {mamograma positivo} y {cáncer de mama} serían completamente dependientes; los resultados de la prueba de detección determinarán automáticamente el estado de la enfermedad. El extremo opuesto se logra cuando los eventos {mamograma positivo} y {cáncer de mama} son completamente independientes.

Ejemplo 3.18 Cancer En este caso, la probabilidad de cáncer de mama sería la misma independientemente de si la mamografía es positiva o negativa, y la mamografía no sería útil en la detección de cáncer de mama y no debería utilizarse. Estos conceptos se pueden cuantificar de la siguiente manera. Deje A = {mamografía +}, B = {cáncer de mama}, y supongamos que estamos interesados en la probabilidad de cáncer de mama (B) dado que la mamografía es positiva (A). Esta probabilidad puede escribirse Pr(A∩B)/Pr(A).

Definición 3.9

La cantidad Pr(A∩B)/Pr(A) se define como

la probabilidad condicional de B dada A,

que se escribe Pr(B|A).

Ecuaciones 3.5

1) Si A y B son eventos independientes, entonces Pr(B|A) = Pr(B) = Pr(B|Ā).

2) Si dos eventos A, B son dependientes, entonces Pr(B|A) ≠ Pr(B ) ≠ Pr(B|Ā) y

Pr(A∩B) ≠ Pr(A) × Pr(B).

Definición 3.10 El riesgo relativo (RR) de B dado A es Pr(B|A) /Pr(B|Ā) Observe que si dos eventos A, B son independientes, entonces el RR es 1. Si dos eventos A, B son dependientes, entonces el RR es diferente de 1. Heurísticamente, cuanto más aumenta la dependencia entre eventos, mayor será el RR de 1.

Ejemplo 3.19 Cancer Supongamos que entre 100,000 mujeres con mamografías negativas, 20 seran diagnosticadas con cáncer de mama dentro de los 2 años, o Pr(B|Ā) = 20/105 = 0.0002, mientras que a 1 mujer de cada 10 con mamografías positivas se le diagnosticará cáncer de mama en 2 años, o Pr (B | A) = 0.1. Los dos eventos A y B serían altamente dependientes, porque RR = Pr(B|A) /Pr (B|Ā) = 0.1 / 0.0002 = 500

Ejemplo 3.19 Cancer En otras palabras, las mujeres con mamografías positivas tienen 500 veces más probabilidades de desarrollar cáncer de mama en los próximos 2 años que las mujeres con mamografías negativas. Este es el fundamento para usar la mamografía como una prueba de detección para el cáncer de mama. Si los eventos A y B fueran independientes, entonces el RR sería 1; las mujeres con mamografías positivas o negativas tendrían la misma probabilidad de tener cáncer de mama y la mamografía no sería útil como prueba de detección del cáncer de mama.

Ejemplo 3.20 Enfermedad de Transmisión Sexual Usando los datos del ejemplo 3.15, encuentre la probabilidad condicional de que el doctor B haga un diagnóstico positivo de sífilis dado que el médico A hace un diagnóstico positivo. ¿Cuál es la probabilidad condicional de que el doctor B haga un diagnóstico positivo de sífilis dado que el doctor A hace un diagnóstico negativo? ¿Cuál es el RR de B+ dado A+?

Ejemplo 3.20 Enfermedad de Transmisión Sexual Solución: 1) Pr(B+|A+) = Pr(B+∩A+)/Pr(A+) = 0.08 / 0.1 = 0.8 Por lo tanto, el doctor B confirmará el diagnóstico positivo del médico A el 80% del tiempo. 2) Pr(B+|A−) = Pr(B+∩A−)/Pr(A−) = Pr(B+∩A− )/0.9 Debemos calcular Pr(B+∩A−). Sabemos que si el médico B diagnostica a un paciente como positivo, entonces el médico A confirma o no confirma el diagnóstico.

Ejemplo 3.20 Enfermedad de Transmisión Sexual Solución: Así, Pr(B+) = Pr(B+∩A+) + Pr(B+∩A−) porque los eventos because the events B+∩A+ y B+∩A− son mutuamente excluyentes. Si restamos Pr(B+∩A+) de ambos lados de la ecuación, Pr(B+∩A−)= Pr(B+)− Pr(B+∩A+) = 0.17 − 0.08 = 0.09 Por lo tanto, Pr(B+∩A−)= 0.09/0.9 = 0.1 Por lo tanto, cuando el médico A diagnostique a un paciente como negativo, el doctor B contradirá el diagnóstico el 10% del tiempo.

Ejemplo 3.20 Enfermedad de Transmisión Sexual Solución: 3) El RR del evento B+ dado A+ es

Pr(B+|A+) / Pr(B+|A-) = 0.8 / 0.1 = 8 Esto indica que el médico B tiene 8 veces más probabilidades de diagnosticar a un paciente como positivo cuando el médico A diagnostica al paciente como positivo que cuando el médico A diagnostica al paciente como negativo. Estos resultados cuantifican la dependencia entre los diagnósticos de los dos médicos.

Bibliografía

Rosner, B. (2016). Fundamentals of Biostatistics (Octava ed.). Boston, USA: Cengage Learning.